Réflexion & Raisonnement

Certains modèles IA peuvent "réfléchir" avant de répondre, montrant leur processus de raisonnement interne par chaîne de pensée. AISCouncil supporte la réflexion étendue sur plusieurs fournisseurs, vous permettant de voir comment le modèle raisonne à travers des problèmes complexes.

Qu'est-ce que le Mode Réflexion ?

Quand le raisonnement est activé, le modèle génère un processus de "réflexion" interne avant de produire sa réponse finale. Cette sortie de réflexion montre le raisonnement étape par étape du modèle, qui peut inclure :

La décomposition de problèmes complexes
La considération de plusieurs approches
L'auto-correction des erreurs
Le travail à travers des calculs mathématiques
L'évaluation des compromis

La sortie de réflexion est affichée dans une section réductible au-dessus de la réponse finale. Cliquez pour la développer et voir la chaîne de raisonnement complète.

Fournisseurs Pris en Charge

Fournisseur	Implémentation	Modèles
Anthropic	Extended thinking (`thinking.budget_tokens`)	Claude Opus 4, Claude Sonnet 4, Claude 3.5 Sonnet
Google Gemini	ThinkingConfig (`thinkingConfig.thinkingBudget`)	Gemini 2.5 Pro, Gemini 2.5 Flash
OpenAI	Reasoning effort (`reasoning_effort`)	o1, o3, o3-mini, o4-mini
DeepSeek	Raisonnement intégré	DeepSeek R1, DeepSeek R1 (via OpenRouter)
OpenRouter	Transmet reasoning_effort au modèle sous-jacent	Tout modèle capable de raisonnement

Niveaux d'Effort

Le menu déroulant d'effort de raisonnement contrôle combien de "réflexion" le modèle fait avant de répondre :

Niveau	Budget de Jetons	Quand Utiliser
Défaut (Désactivé)	0	Réponses standard, questions simples
Faible	~8 192 jetons	Raisonnement rapide, logique simple
Moyen	~32 768 jetons	Complexité modérée, génération de code
Élevé	~128 000 jetons	Analyse complexe, résolution de problèmes détaillée
Maximum (Max Modèle)	Sortie maximum du modèle	Profondeur de raisonnement maximale pour les problèmes les plus difficiles

info

Les budgets de jetons sont approximatifs. "Faible", "Moyen" et "Élevé" correspondent à des comptes de jetons spécifiques. "Maximum (Max Modèle)" recherche dynamiquement la capacité de sortie maximum du modèle depuis le registre et alloue presque tout au raisonnement.

Comment Fonctionne "Maximum (Max Modèle)"

Quand vous sélectionnez "Maximum (Max Modèle)", la plateforme recherche la capacité de sortie maximum du modèle sélectionné depuis le registre de modèles communautaire au moment de l'appel. Par exemple :

Claude Opus 4 : jusqu'à ~127 000 jetons de réflexion
Gemini 2.5 Pro : jusqu'à ~64 512 jetons de réflexion
Gemini 2.5 Flash : jusqu'à ~64 512 jetons de réflexion

Cela garantit que vous obtenez toujours la profondeur de raisonnement maximale que le modèle supporte, même quand les modèles sont mis à jour avec de nouvelles limites.

Budget Personnalisé

Pour Anthropic et Gemini, vous pouvez spécifier un budget de jetons numérique exact en entrant un nombre dans le champ de raisonnement. Par exemple, entrer 50000 alloue exactement 50 000 jetons pour la réflexion.

Où Configurer

Par Bot (Panneau de Configuration)

Ouvrez le panneau de configuration (barre latérale droite)
Dépliez Paramètres Avancés
Trouvez le menu déroulant Effort de Raisonnement
Sélectionnez votre niveau désiré : Défaut, Faible, Moyen ou Élevé

Par Profil (Paramètres)

Ouvrez Paramètres > Profil
Dépliez Paramètres Avancés pour le profil
Définissez le menu déroulant Effort de Raisonnement
Les options incluent : Défaut, Faible, Moyen, Élevé et Maximum (Max Modèle)

Par Membre de Conseil

Ouvrez les paramètres du membre du conseil (dépliez une ligne de membre)
Trouvez le menu déroulant Raisonnement
Définissez indépendamment pour chaque membre du conseil

astuce

Dans un conseil, vous pouvez activer le raisonnement uniquement pour certains membres. Par exemple, donnez au président un effort de raisonnement "Élevé" tout en gardant les autres membres sur "Défaut" pour équilibrer coût et qualité.

Comment la Sortie de Réflexion Est Affichée

Pendant le streaming, quand un modèle est dans sa phase de réflexion, le chat affiche un indicateur "Réflexion...". Une fois la réflexion terminée et que le modèle commence sa réponse réelle, la sortie de réflexion apparaît comme une section de détails réductible :

[Réflexion (12 847 car.)]     <-- cliquez pour développer

La réponse réelle du modèle apparaît ici...

En mode conseil, la sortie de réflexion de chaque membre est affichée dans sa propre section réductible dans la carte de réponse de ce membre.

Comportement Spécifique au Fournisseur

Anthropic (Extended Thinking)

Utilise le paramètre thinking : { type: "enabled", budget_tokens: N }
Important : Anthropic exige temperature: 1 quand la réflexion étendue est activée. La plateforme gère cela automatiquement -- votre température configurée est remplacée.
La sortie de réflexion arrive via des événements content_block_start (type thinking) et thinking_delta dans le flux SSE
Le paramètre max_tokens est automatiquement augmenté pour accueillir à la fois les jetons de réflexion et de réponse

Google Gemini (ThinkingConfig)

Utilise generationConfig.thinkingConfig.thinkingBudget
Le maxOutputTokens est automatiquement augmenté quand la réflexion est activée
La sortie de réflexion est incluse dans le flux de réponse Gemini

Compatible OpenAI (Reasoning Effort)

Utilise le paramètre reasoning_effort avec des valeurs de chaîne : "low", "medium", "high"
Les budgets numériques et "max" sont mappés à "high" pour les API compatibles OpenAI
La sortie de raisonnement arrive via delta.reasoning_content dans le flux SSE
Fonctionne avec OpenAI, xAI (Grok), OpenRouter et autres fournisseurs compatibles OpenAI

Quand Utiliser le Mode Réflexion

Tâche	Niveau Recommandé
Q&R simple, chat décontracté	Défaut (Désactivé)
Génération de code	Moyen
Débogage de code complexe	Élevé
Preuves mathématiques	Élevé
Analyse multi-étapes	Élevé
Synthèse de recherche	Moyen à Élevé
Écriture créative	Défaut ou Faible
Énigmes de raisonnement les plus difficiles	Maximum (Max Modèle)

Implications de Coût

avertissement

Les jetons de réflexion comptent dans les jetons de sortie et sont facturés en conséquence. Un modèle qui "réfléchit" pendant 100 000 jetons avant de produire une réponse de 2 000 jetons est facturé pour 102 000 jetons de sortie. Cela peut augmenter significativement les coûts, surtout aux niveaux Élevé et Maximum.

Multiplicateurs de coût approximatifs comparés au Défaut :

Niveau	Multiplicateur de Coût Approximatif
Défaut	1x
Faible	2-4x
Moyen	5-15x
Élevé	15-50x
Maximum	30-100x+

Le multiplicateur exact dépend de la complexité de la question. Des questions simples avec un raisonnement Élevé peuvent n'utiliser qu'une fraction du budget, tandis que des problèmes complexes peuvent utiliser l'allocation complète.

astuce

Commencez avec "Moyen" pour la plupart des tâches et n'augmentez à "Élevé" ou "Maximum" que quand vous avez besoin que le modèle travaille sur des problèmes particulièrement difficiles. L'amélioration de qualité de Faible à Moyen est généralement plus noticeable que d'Élevé à Maximum.

Qu'est-ce que le Mode Réflexion ?​

Fournisseurs Pris en Charge​

Niveaux d'Effort​

Comment Fonctionne "Maximum (Max Modèle)"​

Budget Personnalisé​

Où Configurer​

Par Bot (Panneau de Configuration)​

Par Profil (Paramètres)​

Par Membre de Conseil​

Comment la Sortie de Réflexion Est Affichée​

Comportement Spécifique au Fournisseur​

Anthropic (Extended Thinking)​

Google Gemini (ThinkingConfig)​

Compatible OpenAI (Reasoning Effort)​

Quand Utiliser le Mode Réflexion​

Implications de Coût​