Réflexion & Raisonnement
Certains modèles IA peuvent "réfléchir" avant de répondre, montrant leur processus de raisonnement interne par chaîne de pensée. AISCouncil supporte la réflexion étendue sur plusieurs fournisseurs, vous permettant de voir comment le modèle raisonne à travers des problèmes complexes.
Qu'est-ce que le Mode Réflexion ?
Quand le raisonnement est activé, le modèle génère un processus de "réflexion" interne avant de produire sa réponse finale. Cette sortie de réflexion montre le raisonnement étape par étape du modèle, qui peut inclure :
- La décomposition de problèmes complexes
- La considération de plusieurs approches
- L'auto-correction des erreurs
- Le travail à travers des calculs mathématiques
- L'évaluation des compromis
La sortie de réflexion est affichée dans une section réductible au-dessus de la réponse finale. Cliquez pour la développer et voir la chaîne de raisonnement complète.
Fournisseurs Pris en Charge
| Fournisseur | Implémentation | Modèles |
|---|---|---|
| Anthropic | Extended thinking (thinking.budget_tokens) | Claude Opus 4, Claude Sonnet 4, Claude 3.5 Sonnet |
| Google Gemini | ThinkingConfig (thinkingConfig.thinkingBudget) | Gemini 2.5 Pro, Gemini 2.5 Flash |
| OpenAI | Reasoning effort (reasoning_effort) | o1, o3, o3-mini, o4-mini |
| DeepSeek | Raisonnement intégré | DeepSeek R1, DeepSeek R1 (via OpenRouter) |
| OpenRouter | Transmet reasoning_effort au modèle sous-jacent | Tout modèle capable de raisonnement |
Niveaux d'Effort
Le menu déroulant d'effort de raisonnement contrôle combien de "réflexion" le modèle fait avant de répondre :
| Niveau | Budget de Jetons | Quand Utiliser |
|---|---|---|
| Défaut (Désactivé) | 0 | Réponses standard, questions simples |
| Faible | ~8 192 jetons | Raisonnement rapide, logique simple |
| Moyen | ~32 768 jetons | Complexité modérée, génération de code |
| Élevé | ~128 000 jetons | Analyse complexe, résolution de problèmes détaillée |
| Maximum (Max Modèle) | Sortie maximum du modèle | Profondeur de raisonnement maximale pour les problèmes les plus difficiles |
Les budgets de jetons sont approximatifs. "Faible", "Moyen" et "Élevé" correspondent à des comptes de jetons spécifiques. "Maximum (Max Modèle)" recherche dynamiquement la capacité de sortie maximum du modèle depuis le registre et alloue presque tout au raisonnement.
Comment Fonctionne "Maximum (Max Modèle)"
Quand vous sélectionnez "Maximum (Max Modèle)", la plateforme recherche la capacité de sortie maximum du modèle sélectionné depuis le registre de modèles communautaire au moment de l'appel. Par exemple :
- Claude Opus 4 : jusqu'à ~127 000 jetons de réflexion
- Gemini 2.5 Pro : jusqu'à ~64 512 jetons de réflexion
- Gemini 2.5 Flash : jusqu'à ~64 512 jetons de réflexion
Cela garantit que vous obtenez toujours la profondeur de raisonnement maximale que le modèle supporte, même quand les modèles sont mis à jour avec de nouvelles limites.
Budget Personnalisé
Pour Anthropic et Gemini, vous pouvez spécifier un budget de jetons numérique exact en entrant un nombre dans le champ de raisonnement. Par exemple, entrer 50000 alloue exactement 50 000 jetons pour la réflexion.
Où Configurer
Par Bot (Panneau de Configuration)
- Ouvrez le panneau de configuration (barre latérale droite)
- Dépliez Paramètres Avancés
- Trouvez le menu déroulant Effort de Raisonnement
- Sélectionnez votre niveau désiré : Défaut, Faible, Moyen ou Élevé
Par Profil (Paramètres)
- Ouvrez Paramètres > Profil
- Dépliez Paramètres Avancés pour le profil
- Définissez le menu déroulant Effort de Raisonnement
- Les options incluent : Défaut, Faible, Moyen, Élevé et Maximum (Max Modèle)
Par Membre de Conseil
- Ouvrez les paramètres du membre du conseil (dépliez une ligne de membre)
- Trouvez le menu déroulant Raisonnement
- Définissez indépendamment pour chaque membre du conseil
Dans un conseil, vous pouvez activer le raisonnement uniquement pour certains membres. Par exemple, donnez au président un effort de raisonnement "Élevé" tout en gardant les autres membres sur "Défaut" pour équilibrer coût et qualité.
Comment la Sortie de Réflexion Est Affichée
Pendant le streaming, quand un modèle est dans sa phase de réflexion, le chat affiche un indicateur "Réflexion...". Une fois la réflexion terminée et que le modèle commence sa réponse réelle, la sortie de réflexion apparaît comme une section de détails réductible :
[Réflexion (12 847 car.)] <-- cliquez pour développer
La réponse réelle du modèle apparaît ici...
En mode conseil, la sortie de réflexion de chaque membre est affichée dans sa propre section réductible dans la carte de réponse de ce membre.
Comportement Spécifique au Fournisseur
Anthropic (Extended Thinking)
- Utilise le paramètre
thinking:{ type: "enabled", budget_tokens: N } - Important : Anthropic exige
temperature: 1quand la réflexion étendue est activée. La plateforme gère cela automatiquement -- votre température configurée est remplacée. - La sortie de réflexion arrive via des événements
content_block_start(typethinking) etthinking_deltadans le flux SSE - Le paramètre
max_tokensest automatiquement augmenté pour accueillir à la fois les jetons de réflexion et de réponse
Google Gemini (ThinkingConfig)
- Utilise
generationConfig.thinkingConfig.thinkingBudget - Le
maxOutputTokensest automatiquement augmenté quand la réflexion est activée - La sortie de réflexion est incluse dans le flux de réponse Gemini
Compatible OpenAI (Reasoning Effort)
- Utilise le paramètre
reasoning_effortavec des valeurs de chaîne :"low","medium","high" - Les budgets numériques et
"max"sont mappés à"high"pour les API compatibles OpenAI - La sortie de raisonnement arrive via
delta.reasoning_contentdans le flux SSE - Fonctionne avec OpenAI, xAI (Grok), OpenRouter et autres fournisseurs compatibles OpenAI
Quand Utiliser le Mode Réflexion
| Tâche | Niveau Recommandé |
|---|---|
| Q&R simple, chat décontracté | Défaut (Désactivé) |
| Génération de code | Moyen |
| Débogage de code complexe | Élevé |
| Preuves mathématiques | Élevé |
| Analyse multi-étapes | Élevé |
| Synthèse de recherche | Moyen à Élevé |
| Écriture créative | Défaut ou Faible |
| Énigmes de raisonnement les plus difficiles | Maximum (Max Modèle) |
Implications de Coût
Les jetons de réflexion comptent dans les jetons de sortie et sont facturés en conséquence. Un modèle qui "réfléchit" pendant 100 000 jetons avant de produire une réponse de 2 000 jetons est facturé pour 102 000 jetons de sortie. Cela peut augmenter significativement les coûts, surtout aux niveaux Élevé et Maximum.
Multiplicateurs de coût approximatifs comparés au Défaut :
| Niveau | Multiplicateur de Coût Approximatif |
|---|---|
| Défaut | 1x |
| Faible | 2-4x |
| Moyen | 5-15x |
| Élevé | 15-50x |
| Maximum | 30-100x+ |
Le multiplicateur exact dépend de la complexité de la question. Des questions simples avec un raisonnement Élevé peuvent n'utiliser qu'une fraction du budget, tandis que des problèmes complexes peuvent utiliser l'allocation complète.
Commencez avec "Moyen" pour la plupart des tâches et n'augmentez à "Élevé" ou "Maximum" que quand vous avez besoin que le modèle travaille sur des problèmes particulièrement difficiles. L'amélioration de qualité de Faible à Moyen est généralement plus noticeable que d'Élevé à Maximum.