Aller au contenu principal

Conseil LLM

La fonctionnalité Conseil LLM vous permet d'interroger plusieurs modèles IA simultanément et de combiner leurs réponses en une seule réponse de meilleure qualité. Au lieu de vous fier à un seul modèle, vous assemblez un conseil de 2 modèles ou plus qui délibèrent ensemble.

Qu'est-ce qu'un Conseil ?

Un conseil est un groupe de profils de modèles IA qui travaillent ensemble sur chaque message que vous envoyez. Chaque membre du conseil peut être un fournisseur, un modèle et un prompt système différents. Quand vous envoyez un message, tous les membres répondent, examinent optionnellement le travail des autres, et un président désigné synthétise la réponse finale.

Les conseils sont particulièrement puissants pour :

  • La recherche -- obtenir plusieurs perspectives sur un sujet
  • La revue de code -- faire vérifier le travail par différents modèles
  • La prise de décision -- peser des points de vue concurrents
  • L'assurance qualité -- détecter des erreurs qu'un seul modèle pourrait manquer

7 Styles de Conseil

Chaque style de conseil définit comment les modèles interagissent. Choisissez le style qui correspond le mieux à votre cas d'usage.

Conseil (Défaut)

Le pipeline de délibération standard en 3 phases :

  1. Phase 1 -- Diffusion : Votre message est envoyé à tous les membres en parallèle. Chaque modèle génère sa propre réponse indépendante.
  2. Phase 2 -- Revue par les Pairs : Chaque membre examine les réponses des autres membres et les classe de la meilleure à la pire avec raisonnement.
  3. Phase 3 -- Synthèse du Président : Un modèle président désigné lit toutes les réponses et revues par les pairs, puis produit un rapport final complet.

Idéal pour : Recherche, analyse, questions complexes où vous voulez une couverture approfondie.

Comparaison

Tous les modèles répondent en parallèle, et leurs réponses sont affichées côte à côte dans une grille. Il n'y a pas de vote, pas de revue par les pairs et pas d'étape de synthèse.

  • Phase 1 uniquement (diffusion)
  • Réponses affichées en colonnes
  • Pas de président, pas de réponse finale

Idéal pour : Comparer les capacités des modèles, tester des prompts sur plusieurs modèles, voir comment différents modèles abordent la même question.

Arène

Les modèles s'affrontent en duel. Tous les modèles répondent, puis la revue par les pairs détermine un gagnant. La meilleure réponse gagne.

Idéal pour : Trouver la seule meilleure réponse, benchmarking compétitif.

MoA (Mélange d'Agents)

Raffinement en couches où chaque modèle s'appuie sur la sortie du modèle précédent. Au lieu de réponses parallèles indépendantes, les modèles améliorent itérativement le travail des autres.

Idéal pour : Tâches qui bénéficient d'une amélioration itérative, comme l'écriture et l'édition.

Routeur

Routage intelligent qui choisit automatiquement le meilleur modèle pour chaque requête. Au lieu d'interroger tous les modèles, le routeur analyse votre message et l'envoie au seul modèle le plus approprié.

Idéal pour : Optimisation des coûts, routage de différents types de questions vers des modèles spécialisés.

Débat

Les modèles se voient assigner des côtés opposés (POUR et CONTRE) et défendent leurs positions :

  1. Arguments d'Ouverture : Chaque modèle défend son côté assigné
  2. Répliques : Les modèles répondent aux arguments du côté opposé (nombre de tours configurable)
  3. Verdict du Modérateur : Le président analyse les deux côtés équitablement et rend un verdict

Les côtés du débat sont assignés automatiquement (alternance) ou peuvent être définis manuellement par membre.

Idéal pour : Explorer des sujets controversés, tester des idées sous pression, trouver des faiblesses dans les arguments.

astuce

Vous pouvez définir le nombre de tours de débat dans les paramètres du conseil. Plus de tours signifie une argumentation plus approfondie mais des coûts API plus élevés.

Consensus

Les modèles votent pour la meilleure réponse sans étape de synthèse :

  1. Tous les modèles répondent indépendamment (diffusion)
  2. Chaque modèle examine et classe les autres réponses (revue par les pairs)
  3. La réponse avec le score de vote le plus élevé est sélectionnée comme réponse finale

Pas de synthèse par le président -- la réponse gagnante est utilisée telle quelle.

Idéal pour : Quand vous voulez le choix de la foule plutôt qu'un résumé synthétisé.

Créer un Conseil

Via l'Assistant (Nouveaux Utilisateurs)

  1. Quand l'assistant apparaît, choisissez Grappe à l'Étape 0
  2. Sélectionnez des modèles depuis l'onglet des préréglages ou ajoutez des modèles personnalisés
  3. Connectez les clés API pour chaque fournisseur (ignoré pour les modèles gratuits)
  4. Configurez les paramètres du conseil : nom, icône, style et résumé des membres
  5. Cliquez sur Prêt pour créer le conseil

Depuis les Paramètres (Utilisateurs Existants)

  1. Ouvrez Paramètres et allez à l'onglet Profil
  2. Ajoutez des membres en utilisant le sélecteur de profil (chaque membre référence un profil enregistré)
  3. Définissez le style de conseil depuis la grille de styles
  4. Configurez le président, le mode de vote et le nombre de tours
  5. Enregistrez le profil
info

Les membres du conseil sont toujours des références de profils. Créez d'abord des profils individuels (un par modèle), puis assemblez-les en un conseil. Cela vous permet de réutiliser le même profil dans plusieurs conseils.

Membres du Conseil

Chaque membre du conseil a ses propres paramètres qui peuvent remplacer les valeurs par défaut du conseil :

ParamètreDescription
ProfilQuel profil enregistré (fournisseur + modèle) utiliser
Prompt SystèmeRemplacer le prompt système par défaut du membre
TempératureRemplacer la température pour ce membre
Jetons MaxRemplacer les jetons de sortie maximum
Effort de RaisonnementDéfinir le niveau de réflexion/raisonnement (Désactivé, Faible, Moyen, Élevé, Maximum)
Côté du DébatPour le style débat : assigner Pour, Contre ou Auto

Les membres sont étiquetés A, B, C, etc. pour l'identification dans la sortie du conseil.

Rôle du Président

Le président est le modèle responsable de la synthèse de la réponse finale dans les styles conseil, arène et débat. Par défaut, le premier membre (A) est le président, mais vous pouvez changer cela dans les paramètres du conseil.

Le président reçoit :

  • Le message utilisateur original
  • Toutes les réponses des membres de la Phase 1
  • Tous les classements de revue par les pairs de la Phase 2
  • Des instructions pour produire un rapport de recherche complet
astuce

Choisissez votre modèle le plus capable comme président. Le président fait le travail le plus lourd -- il doit traiter toutes les autres réponses et produire une synthèse cohérente.

Modes de Vote

Quand la revue par les pairs est activée, les membres classent les réponses des autres. Le mode de vote détermine comment ces classements sont comptabilisés :

ModeComment Ça Marche
PondéréLes membres gagnent des points selon leur position de classement. La première place obtient N points, la deuxième N-1, etc.
PluralitéSeuls les votes de première place comptent. La réponse avec le plus de classements en première place gagne.

Les scores de vote sont affichés dans la sortie finale à côté de la réponse de chaque membre.

Estimation des Coûts

Exécuter un conseil multiplie l'utilisation de l'API par le nombre de membres et de phases. Avant d'envoyer un message, la plateforme estime le coût basé sur :

  • Le nombre de membres
  • Le nombre de phases (varie selon le style)
  • Les comptes de jetons attendus
  • La tarification par modèle depuis le registre

L'estimation de coût est affichée dans le pied de page de sortie du conseil après chaque réponse :

Appels API : 7 | Jetons : 24 531 | Coût estimé : 0,1847 $
avertissement

Les conseils avec beaucoup de membres et de modèles payants peuvent être coûteux. Le mode comparaison est le moins cher (Phase 1 uniquement), tandis que le conseil complet ou le débat avec plusieurs tours est le plus coûteux.

Streaming en Direct

La délibération du conseil se fait en streaming en temps réel. Pendant la Phase 1, vous voyez chaque réponse de membre apparaître dans une grille au fur et à mesure de sa génération. Les indicateurs de statut montrent quels membres sont en réflexion, en streaming, terminés ou en échec.

Pendant la Phase 3, la synthèse du président se fait en streaming jeton par jeton tout comme une réponse de chat normale.

Exemples de Cas d'Usage

StyleCas d'UsageExemples de Membres
ConseilRapport de recherche sur un sujet techniqueClaude (analytique) + GPT-4o (large) + Grok (contrariant)
ComparaisonTester un prompt sur plusieurs modèlesGemini Flash + Claude Haiku + GPT-4o mini
ArèneTrouver la meilleure solution de codeClaude Sonnet + GPT-4o + DeepSeek Coder
MoAPolir un article de blogGPT-4o (brouillon) + Claude (édition) + Gemini (polissage)
RouteurUsage quotidien mixteModèle math + Modèle code + Modèle créatif
DébatDevrions-nous utiliser les microservices ?2 modèles POUR + 2 modèles CONTRE
ConsensusQuel framework utiliser ?3-5 modèles divers votant

Conseils de Modèles Gratuits

Vous pouvez construire des conseils entièrement à partir de modèles gratuits (niveau gratuit OpenRouter, niveau gratuit Gemini). La plateforme gère automatiquement la limitation de débit pour les modèles gratuits en envoyant les requêtes séquentiellement au lieu d'en parallèle.

remarque

Les modèles gratuits ont des limites de débit plus faibles (généralement 8 requêtes par minute). L'exécution séquentielle signifie que la délibération du conseil prend plus de temps, mais fonctionne de manière fiable sans atteindre les limites de débit.