Conseil LLM

La fonctionnalité Conseil LLM vous permet d'interroger plusieurs modèles IA simultanément et de combiner leurs réponses en une seule réponse de meilleure qualité. Au lieu de vous fier à un seul modèle, vous assemblez un conseil de 2 modèles ou plus qui délibèrent ensemble.

Qu'est-ce qu'un Conseil ?

Un conseil est un groupe de profils de modèles IA qui travaillent ensemble sur chaque message que vous envoyez. Chaque membre du conseil peut être un fournisseur, un modèle et un prompt système différents. Quand vous envoyez un message, tous les membres répondent, examinent optionnellement le travail des autres, et un président désigné synthétise la réponse finale.

Les conseils sont particulièrement puissants pour :

La recherche -- obtenir plusieurs perspectives sur un sujet
La revue de code -- faire vérifier le travail par différents modèles
La prise de décision -- peser des points de vue concurrents
L'assurance qualité -- détecter des erreurs qu'un seul modèle pourrait manquer

7 Styles de Conseil

Chaque style de conseil définit comment les modèles interagissent. Choisissez le style qui correspond le mieux à votre cas d'usage.

Conseil (Défaut)

Le pipeline de délibération standard en 3 phases :

Phase 1 -- Diffusion : Votre message est envoyé à tous les membres en parallèle. Chaque modèle génère sa propre réponse indépendante.
Phase 2 -- Revue par les Pairs : Chaque membre examine les réponses des autres membres et les classe de la meilleure à la pire avec raisonnement.
Phase 3 -- Synthèse du Président : Un modèle président désigné lit toutes les réponses et revues par les pairs, puis produit un rapport final complet.

Idéal pour : Recherche, analyse, questions complexes où vous voulez une couverture approfondie.

Comparaison

Tous les modèles répondent en parallèle, et leurs réponses sont affichées côte à côte dans une grille. Il n'y a pas de vote, pas de revue par les pairs et pas d'étape de synthèse.

Phase 1 uniquement (diffusion)
Réponses affichées en colonnes
Pas de président, pas de réponse finale

Idéal pour : Comparer les capacités des modèles, tester des prompts sur plusieurs modèles, voir comment différents modèles abordent la même question.

Arène

Les modèles s'affrontent en duel. Tous les modèles répondent, puis la revue par les pairs détermine un gagnant. La meilleure réponse gagne.

Idéal pour : Trouver la seule meilleure réponse, benchmarking compétitif.

MoA (Mélange d'Agents)

Raffinement en couches où chaque modèle s'appuie sur la sortie du modèle précédent. Au lieu de réponses parallèles indépendantes, les modèles améliorent itérativement le travail des autres.

Idéal pour : Tâches qui bénéficient d'une amélioration itérative, comme l'écriture et l'édition.

Routeur

Routage intelligent qui choisit automatiquement le meilleur modèle pour chaque requête. Au lieu d'interroger tous les modèles, le routeur analyse votre message et l'envoie au seul modèle le plus approprié.

Idéal pour : Optimisation des coûts, routage de différents types de questions vers des modèles spécialisés.

Débat

Les modèles se voient assigner des côtés opposés (POUR et CONTRE) et défendent leurs positions :

Arguments d'Ouverture : Chaque modèle défend son côté assigné
Répliques : Les modèles répondent aux arguments du côté opposé (nombre de tours configurable)
Verdict du Modérateur : Le président analyse les deux côtés équitablement et rend un verdict

Les côtés du débat sont assignés automatiquement (alternance) ou peuvent être définis manuellement par membre.

Idéal pour : Explorer des sujets controversés, tester des idées sous pression, trouver des faiblesses dans les arguments.

astuce

Vous pouvez définir le nombre de tours de débat dans les paramètres du conseil. Plus de tours signifie une argumentation plus approfondie mais des coûts API plus élevés.

Consensus

Les modèles votent pour la meilleure réponse sans étape de synthèse :

Tous les modèles répondent indépendamment (diffusion)
Chaque modèle examine et classe les autres réponses (revue par les pairs)
La réponse avec le score de vote le plus élevé est sélectionnée comme réponse finale

Pas de synthèse par le président -- la réponse gagnante est utilisée telle quelle.

Idéal pour : Quand vous voulez le choix de la foule plutôt qu'un résumé synthétisé.

Créer un Conseil

Via l'Assistant (Nouveaux Utilisateurs)

Quand l'assistant apparaît, choisissez Grappe à l'Étape 0
Sélectionnez des modèles depuis l'onglet des préréglages ou ajoutez des modèles personnalisés
Connectez les clés API pour chaque fournisseur (ignoré pour les modèles gratuits)
Configurez les paramètres du conseil : nom, icône, style et résumé des membres
Cliquez sur Prêt pour créer le conseil

Depuis les Paramètres (Utilisateurs Existants)

Ouvrez Paramètres et allez à l'onglet Profil
Ajoutez des membres en utilisant le sélecteur de profil (chaque membre référence un profil enregistré)
Définissez le style de conseil depuis la grille de styles
Configurez le président, le mode de vote et le nombre de tours
Enregistrez le profil

info

Les membres du conseil sont toujours des références de profils. Créez d'abord des profils individuels (un par modèle), puis assemblez-les en un conseil. Cela vous permet de réutiliser le même profil dans plusieurs conseils.

Membres du Conseil

Chaque membre du conseil a ses propres paramètres qui peuvent remplacer les valeurs par défaut du conseil :

Paramètre	Description
Profil	Quel profil enregistré (fournisseur + modèle) utiliser
Prompt Système	Remplacer le prompt système par défaut du membre
Température	Remplacer la température pour ce membre
Jetons Max	Remplacer les jetons de sortie maximum
Effort de Raisonnement	Définir le niveau de réflexion/raisonnement (Désactivé, Faible, Moyen, Élevé, Maximum)
Côté du Débat	Pour le style débat : assigner Pour, Contre ou Auto

Les membres sont étiquetés A, B, C, etc. pour l'identification dans la sortie du conseil.

Rôle du Président

Le président est le modèle responsable de la synthèse de la réponse finale dans les styles conseil, arène et débat. Par défaut, le premier membre (A) est le président, mais vous pouvez changer cela dans les paramètres du conseil.

Le président reçoit :

Le message utilisateur original
Toutes les réponses des membres de la Phase 1
Tous les classements de revue par les pairs de la Phase 2
Des instructions pour produire un rapport de recherche complet

astuce

Choisissez votre modèle le plus capable comme président. Le président fait le travail le plus lourd -- il doit traiter toutes les autres réponses et produire une synthèse cohérente.

Modes de Vote

Quand la revue par les pairs est activée, les membres classent les réponses des autres. Le mode de vote détermine comment ces classements sont comptabilisés :

Mode	Comment Ça Marche
Pondéré	Les membres gagnent des points selon leur position de classement. La première place obtient N points, la deuxième N-1, etc.
Pluralité	Seuls les votes de première place comptent. La réponse avec le plus de classements en première place gagne.

Les scores de vote sont affichés dans la sortie finale à côté de la réponse de chaque membre.

Estimation des Coûts

Exécuter un conseil multiplie l'utilisation de l'API par le nombre de membres et de phases. Avant d'envoyer un message, la plateforme estime le coût basé sur :

Le nombre de membres
Le nombre de phases (varie selon le style)
Les comptes de jetons attendus
La tarification par modèle depuis le registre

L'estimation de coût est affichée dans le pied de page de sortie du conseil après chaque réponse :

Appels API : 7 | Jetons : 24 531 | Coût estimé : 0,1847 $

avertissement

Les conseils avec beaucoup de membres et de modèles payants peuvent être coûteux. Le mode comparaison est le moins cher (Phase 1 uniquement), tandis que le conseil complet ou le débat avec plusieurs tours est le plus coûteux.

Streaming en Direct

La délibération du conseil se fait en streaming en temps réel. Pendant la Phase 1, vous voyez chaque réponse de membre apparaître dans une grille au fur et à mesure de sa génération. Les indicateurs de statut montrent quels membres sont en réflexion, en streaming, terminés ou en échec.

Pendant la Phase 3, la synthèse du président se fait en streaming jeton par jeton tout comme une réponse de chat normale.

Exemples de Cas d'Usage

Style	Cas d'Usage	Exemples de Membres
Conseil	Rapport de recherche sur un sujet technique	Claude (analytique) + GPT-4o (large) + Grok (contrariant)
Comparaison	Tester un prompt sur plusieurs modèles	Gemini Flash + Claude Haiku + GPT-4o mini
Arène	Trouver la meilleure solution de code	Claude Sonnet + GPT-4o + DeepSeek Coder
MoA	Polir un article de blog	GPT-4o (brouillon) + Claude (édition) + Gemini (polissage)
Routeur	Usage quotidien mixte	Modèle math + Modèle code + Modèle créatif
Débat	Devrions-nous utiliser les microservices ?	2 modèles POUR + 2 modèles CONTRE
Consensus	Quel framework utiliser ?	3-5 modèles divers votant

Conseils de Modèles Gratuits

Vous pouvez construire des conseils entièrement à partir de modèles gratuits (niveau gratuit OpenRouter, niveau gratuit Gemini). La plateforme gère automatiquement la limitation de débit pour les modèles gratuits en envoyant les requêtes séquentiellement au lieu d'en parallèle.

remarque

Les modèles gratuits ont des limites de débit plus faibles (généralement 8 requêtes par minute). L'exécution séquentielle signifie que la délibération du conseil prend plus de temps, mais fonctionne de manière fiable sans atteindre les limites de débit.

Qu'est-ce qu'un Conseil ?​

7 Styles de Conseil​

Conseil (Défaut)​

Comparaison​

Arène​

MoA (Mélange d'Agents)​

Routeur​

Débat​

Consensus​

Créer un Conseil​

Via l'Assistant (Nouveaux Utilisateurs)​

Depuis les Paramètres (Utilisateurs Existants)​

Membres du Conseil​

Rôle du Président​

Modes de Vote​

Estimation des Coûts​

Streaming en Direct​

Exemples de Cas d'Usage​

Conseils de Modèles Gratuits​