Aller au contenu principal

Réflexion & Raisonnement

Certains modèles IA peuvent "réfléchir" avant de répondre, montrant leur processus de raisonnement interne par chaîne de pensée. AISCouncil supporte la réflexion étendue sur plusieurs fournisseurs, vous permettant de voir comment le modèle raisonne à travers des problèmes complexes.

Qu'est-ce que le Mode Réflexion ?

Quand le raisonnement est activé, le modèle génère un processus de "réflexion" interne avant de produire sa réponse finale. Cette sortie de réflexion montre le raisonnement étape par étape du modèle, qui peut inclure :

  • La décomposition de problèmes complexes
  • La considération de plusieurs approches
  • L'auto-correction des erreurs
  • Le travail à travers des calculs mathématiques
  • L'évaluation des compromis

La sortie de réflexion est affichée dans une section réductible au-dessus de la réponse finale. Cliquez pour la développer et voir la chaîne de raisonnement complète.

Fournisseurs Pris en Charge

FournisseurImplémentationModèles
AnthropicExtended thinking (thinking.budget_tokens)Claude Opus 4, Claude Sonnet 4, Claude 3.5 Sonnet
Google GeminiThinkingConfig (thinkingConfig.thinkingBudget)Gemini 2.5 Pro, Gemini 2.5 Flash
OpenAIReasoning effort (reasoning_effort)o1, o3, o3-mini, o4-mini
DeepSeekRaisonnement intégréDeepSeek R1, DeepSeek R1 (via OpenRouter)
OpenRouterTransmet reasoning_effort au modèle sous-jacentTout modèle capable de raisonnement

Niveaux d'Effort

Le menu déroulant d'effort de raisonnement contrôle combien de "réflexion" le modèle fait avant de répondre :

NiveauBudget de JetonsQuand Utiliser
Défaut (Désactivé)0Réponses standard, questions simples
Faible~8 192 jetonsRaisonnement rapide, logique simple
Moyen~32 768 jetonsComplexité modérée, génération de code
Élevé~128 000 jetonsAnalyse complexe, résolution de problèmes détaillée
Maximum (Max Modèle)Sortie maximum du modèleProfondeur de raisonnement maximale pour les problèmes les plus difficiles
info

Les budgets de jetons sont approximatifs. "Faible", "Moyen" et "Élevé" correspondent à des comptes de jetons spécifiques. "Maximum (Max Modèle)" recherche dynamiquement la capacité de sortie maximum du modèle depuis le registre et alloue presque tout au raisonnement.

Comment Fonctionne "Maximum (Max Modèle)"

Quand vous sélectionnez "Maximum (Max Modèle)", la plateforme recherche la capacité de sortie maximum du modèle sélectionné depuis le registre de modèles communautaire au moment de l'appel. Par exemple :

  • Claude Opus 4 : jusqu'à ~127 000 jetons de réflexion
  • Gemini 2.5 Pro : jusqu'à ~64 512 jetons de réflexion
  • Gemini 2.5 Flash : jusqu'à ~64 512 jetons de réflexion

Cela garantit que vous obtenez toujours la profondeur de raisonnement maximale que le modèle supporte, même quand les modèles sont mis à jour avec de nouvelles limites.

Budget Personnalisé

Pour Anthropic et Gemini, vous pouvez spécifier un budget de jetons numérique exact en entrant un nombre dans le champ de raisonnement. Par exemple, entrer 50000 alloue exactement 50 000 jetons pour la réflexion.

Où Configurer

Par Bot (Panneau de Configuration)

  1. Ouvrez le panneau de configuration (barre latérale droite)
  2. Dépliez Paramètres Avancés
  3. Trouvez le menu déroulant Effort de Raisonnement
  4. Sélectionnez votre niveau désiré : Défaut, Faible, Moyen ou Élevé

Par Profil (Paramètres)

  1. Ouvrez Paramètres > Profil
  2. Dépliez Paramètres Avancés pour le profil
  3. Définissez le menu déroulant Effort de Raisonnement
  4. Les options incluent : Défaut, Faible, Moyen, Élevé et Maximum (Max Modèle)

Par Membre de Conseil

  1. Ouvrez les paramètres du membre du conseil (dépliez une ligne de membre)
  2. Trouvez le menu déroulant Raisonnement
  3. Définissez indépendamment pour chaque membre du conseil
astuce

Dans un conseil, vous pouvez activer le raisonnement uniquement pour certains membres. Par exemple, donnez au président un effort de raisonnement "Élevé" tout en gardant les autres membres sur "Défaut" pour équilibrer coût et qualité.

Comment la Sortie de Réflexion Est Affichée

Pendant le streaming, quand un modèle est dans sa phase de réflexion, le chat affiche un indicateur "Réflexion...". Une fois la réflexion terminée et que le modèle commence sa réponse réelle, la sortie de réflexion apparaît comme une section de détails réductible :

[Réflexion (12 847 car.)]     <-- cliquez pour développer

La réponse réelle du modèle apparaît ici...

En mode conseil, la sortie de réflexion de chaque membre est affichée dans sa propre section réductible dans la carte de réponse de ce membre.

Comportement Spécifique au Fournisseur

Anthropic (Extended Thinking)

  • Utilise le paramètre thinking : { type: "enabled", budget_tokens: N }
  • Important : Anthropic exige temperature: 1 quand la réflexion étendue est activée. La plateforme gère cela automatiquement -- votre température configurée est remplacée.
  • La sortie de réflexion arrive via des événements content_block_start (type thinking) et thinking_delta dans le flux SSE
  • Le paramètre max_tokens est automatiquement augmenté pour accueillir à la fois les jetons de réflexion et de réponse

Google Gemini (ThinkingConfig)

  • Utilise generationConfig.thinkingConfig.thinkingBudget
  • Le maxOutputTokens est automatiquement augmenté quand la réflexion est activée
  • La sortie de réflexion est incluse dans le flux de réponse Gemini

Compatible OpenAI (Reasoning Effort)

  • Utilise le paramètre reasoning_effort avec des valeurs de chaîne : "low", "medium", "high"
  • Les budgets numériques et "max" sont mappés à "high" pour les API compatibles OpenAI
  • La sortie de raisonnement arrive via delta.reasoning_content dans le flux SSE
  • Fonctionne avec OpenAI, xAI (Grok), OpenRouter et autres fournisseurs compatibles OpenAI

Quand Utiliser le Mode Réflexion

TâcheNiveau Recommandé
Q&R simple, chat décontractéDéfaut (Désactivé)
Génération de codeMoyen
Débogage de code complexeÉlevé
Preuves mathématiquesÉlevé
Analyse multi-étapesÉlevé
Synthèse de rechercheMoyen à Élevé
Écriture créativeDéfaut ou Faible
Énigmes de raisonnement les plus difficilesMaximum (Max Modèle)

Implications de Coût

avertissement

Les jetons de réflexion comptent dans les jetons de sortie et sont facturés en conséquence. Un modèle qui "réfléchit" pendant 100 000 jetons avant de produire une réponse de 2 000 jetons est facturé pour 102 000 jetons de sortie. Cela peut augmenter significativement les coûts, surtout aux niveaux Élevé et Maximum.

Multiplicateurs de coût approximatifs comparés au Défaut :

NiveauMultiplicateur de Coût Approximatif
Défaut1x
Faible2-4x
Moyen5-15x
Élevé15-50x
Maximum30-100x+

Le multiplicateur exact dépend de la complexité de la question. Des questions simples avec un raisonnement Élevé peuvent n'utiliser qu'une fraction du budget, tandis que des problèmes complexes peuvent utiliser l'allocation complète.

astuce

Commencez avec "Moyen" pour la plupart des tâches et n'augmentez à "Élevé" ou "Maximum" que quand vous avez besoin que le modèle travaille sur des problèmes particulièrement difficiles. L'amélioration de qualité de Faible à Moyen est généralement plus noticeable que d'Élevé à Maximum.