Conseil LLM
La fonctionnalité Conseil LLM vous permet d'interroger plusieurs modèles IA simultanément et de combiner leurs réponses en une seule réponse de meilleure qualité. Au lieu de vous fier à un seul modèle, vous assemblez un conseil de 2 modèles ou plus qui délibèrent ensemble.
Qu'est-ce qu'un Conseil ?
Un conseil est un groupe de profils de modèles IA qui travaillent ensemble sur chaque message que vous envoyez. Chaque membre du conseil peut être un fournisseur, un modèle et un prompt système différents. Quand vous envoyez un message, tous les membres répondent, examinent optionnellement le travail des autres, et un président désigné synthétise la réponse finale.
Les conseils sont particulièrement puissants pour :
- La recherche -- obtenir plusieurs perspectives sur un sujet
- La revue de code -- faire vérifier le travail par différents modèles
- La prise de décision -- peser des points de vue concurrents
- L'assurance qualité -- détecter des erreurs qu'un seul modèle pourrait manquer
7 Styles de Conseil
Chaque style de conseil définit comment les modèles interagissent. Choisissez le style qui correspond le mieux à votre cas d'usage.
Conseil (Défaut)
Le pipeline de délibération standard en 3 phases :
- Phase 1 -- Diffusion : Votre message est envoyé à tous les membres en parallèle. Chaque modèle génère sa propre réponse indépendante.
- Phase 2 -- Revue par les Pairs : Chaque membre examine les réponses des autres membres et les classe de la meilleure à la pire avec raisonnement.
- Phase 3 -- Synthèse du Président : Un modèle président désigné lit toutes les réponses et revues par les pairs, puis produit un rapport final complet.
Idéal pour : Recherche, analyse, questions complexes où vous voulez une couverture approfondie.
Comparaison
Tous les modèles répondent en parallèle, et leurs réponses sont affichées côte à côte dans une grille. Il n'y a pas de vote, pas de revue par les pairs et pas d'étape de synthèse.
- Phase 1 uniquement (diffusion)
- Réponses affichées en colonnes
- Pas de président, pas de réponse finale
Idéal pour : Comparer les capacités des modèles, tester des prompts sur plusieurs modèles, voir comment différents modèles abordent la même question.
Arène
Les modèles s'affrontent en duel. Tous les modèles répondent, puis la revue par les pairs détermine un gagnant. La meilleure réponse gagne.
Idéal pour : Trouver la seule meilleure réponse, benchmarking compétitif.
MoA (Mélange d'Agents)
Raffinement en couches où chaque modèle s'appuie sur la sortie du modèle précédent. Au lieu de réponses parallèles indépendantes, les modèles améliorent itérativement le travail des autres.
Idéal pour : Tâches qui bénéficient d'une amélioration itérative, comme l'écriture et l'édition.
Routeur
Routage intelligent qui choisit automatiquement le meilleur modèle pour chaque requête. Au lieu d'interroger tous les modèles, le routeur analyse votre message et l'envoie au seul modèle le plus approprié.
Idéal pour : Optimisation des coûts, routage de différents types de questions vers des modèles spécialisés.
Débat
Les modèles se voient assigner des côtés opposés (POUR et CONTRE) et défendent leurs positions :
- Arguments d'Ouverture : Chaque modèle défend son côté assigné
- Répliques : Les modèles répondent aux arguments du côté opposé (nombre de tours configurable)
- Verdict du Modérateur : Le président analyse les deux côtés équitablement et rend un verdict
Les côtés du débat sont assignés automatiquement (alternance) ou peuvent être définis manuellement par membre.
Idéal pour : Explorer des sujets controversés, tester des idées sous pression, trouver des faiblesses dans les arguments.
Vous pouvez définir le nombre de tours de débat dans les paramètres du conseil. Plus de tours signifie une argumentation plus approfondie mais des coûts API plus élevés.
Consensus
Les modèles votent pour la meilleure réponse sans étape de synthèse :
- Tous les modèles répondent indépendamment (diffusion)
- Chaque modèle examine et classe les autres réponses (revue par les pairs)
- La réponse avec le score de vote le plus élevé est sélectionnée comme réponse finale
Pas de synthèse par le président -- la réponse gagnante est utilisée telle quelle.
Idéal pour : Quand vous voulez le choix de la foule plutôt qu'un résumé synthétisé.
Créer un Conseil
Via l'Assistant (Nouveaux Utilisateurs)
- Quand l'assistant apparaît, choisissez Grappe à l'Étape 0
- Sélectionnez des modèles depuis l'onglet des préréglages ou ajoutez des modèles personnalisés
- Connectez les clés API pour chaque fournisseur (ignoré pour les modèles gratuits)
- Configurez les paramètres du conseil : nom, icône, style et résumé des membres
- Cliquez sur Prêt pour créer le conseil
Depuis les Paramètres (Utilisateurs Existants)
- Ouvrez Paramètres et allez à l'onglet Profil
- Ajoutez des membres en utilisant le sélecteur de profil (chaque membre référence un profil enregistré)
- Définissez le style de conseil depuis la grille de styles
- Configurez le président, le mode de vote et le nombre de tours
- Enregistrez le profil
Les membres du conseil sont toujours des références de profils. Créez d'abord des profils individuels (un par modèle), puis assemblez-les en un conseil. Cela vous permet de réutiliser le même profil dans plusieurs conseils.
Membres du Conseil
Chaque membre du conseil a ses propres paramètres qui peuvent remplacer les valeurs par défaut du conseil :
| Paramètre | Description |
|---|---|
| Profil | Quel profil enregistré (fournisseur + modèle) utiliser |
| Prompt Système | Remplacer le prompt système par défaut du membre |
| Température | Remplacer la température pour ce membre |
| Jetons Max | Remplacer les jetons de sortie maximum |
| Effort de Raisonnement | Définir le niveau de réflexion/raisonnement (Désactivé, Faible, Moyen, Élevé, Maximum) |
| Côté du Débat | Pour le style débat : assigner Pour, Contre ou Auto |
Les membres sont étiquetés A, B, C, etc. pour l'identification dans la sortie du conseil.
Rôle du Président
Le président est le modèle responsable de la synthèse de la réponse finale dans les styles conseil, arène et débat. Par défaut, le premier membre (A) est le président, mais vous pouvez changer cela dans les paramètres du conseil.
Le président reçoit :
- Le message utilisateur original
- Toutes les réponses des membres de la Phase 1
- Tous les classements de revue par les pairs de la Phase 2
- Des instructions pour produire un rapport de recherche complet
Choisissez votre modèle le plus capable comme président. Le président fait le travail le plus lourd -- il doit traiter toutes les autres réponses et produire une synthèse cohérente.
Modes de Vote
Quand la revue par les pairs est activée, les membres classent les réponses des autres. Le mode de vote détermine comment ces classements sont comptabilisés :
| Mode | Comment Ça Marche |
|---|---|
| Pondéré | Les membres gagnent des points selon leur position de classement. La première place obtient N points, la deuxième N-1, etc. |
| Pluralité | Seuls les votes de première place comptent. La réponse avec le plus de classements en première place gagne. |
Les scores de vote sont affichés dans la sortie finale à côté de la réponse de chaque membre.
Estimation des Coûts
Exécuter un conseil multiplie l'utilisation de l'API par le nombre de membres et de phases. Avant d'envoyer un message, la plateforme estime le coût basé sur :
- Le nombre de membres
- Le nombre de phases (varie selon le style)
- Les comptes de jetons attendus
- La tarification par modèle depuis le registre
L'estimation de coût est affichée dans le pied de page de sortie du conseil après chaque réponse :
Appels API : 7 | Jetons : 24 531 | Coût estimé : 0,1847 $
Les conseils avec beaucoup de membres et de modèles payants peuvent être coûteux. Le mode comparaison est le moins cher (Phase 1 uniquement), tandis que le conseil complet ou le débat avec plusieurs tours est le plus coûteux.
Streaming en Direct
La délibération du conseil se fait en streaming en temps réel. Pendant la Phase 1, vous voyez chaque réponse de membre apparaître dans une grille au fur et à mesure de sa génération. Les indicateurs de statut montrent quels membres sont en réflexion, en streaming, terminés ou en échec.
Pendant la Phase 3, la synthèse du président se fait en streaming jeton par jeton tout comme une réponse de chat normale.
Exemples de Cas d'Usage
| Style | Cas d'Usage | Exemples de Membres |
|---|---|---|
| Conseil | Rapport de recherche sur un sujet technique | Claude (analytique) + GPT-4o (large) + Grok (contrariant) |
| Comparaison | Tester un prompt sur plusieurs modèles | Gemini Flash + Claude Haiku + GPT-4o mini |
| Arène | Trouver la meilleure solution de code | Claude Sonnet + GPT-4o + DeepSeek Coder |
| MoA | Polir un article de blog | GPT-4o (brouillon) + Claude (édition) + Gemini (polissage) |
| Routeur | Usage quotidien mixte | Modèle math + Modèle code + Modèle créatif |
| Débat | Devrions-nous utiliser les microservices ? | 2 modèles POUR + 2 modèles CONTRE |
| Consensus | Quel framework utiliser ? | 3-5 modèles divers votant |
Conseils de Modèles Gratuits
Vous pouvez construire des conseils entièrement à partir de modèles gratuits (niveau gratuit OpenRouter, niveau gratuit Gemini). La plateforme gère automatiquement la limitation de débit pour les modèles gratuits en envoyant les requêtes séquentiellement au lieu d'en parallèle.
Les modèles gratuits ont des limites de débit plus faibles (généralement 8 requêtes par minute). L'exécution séquentielle signifie que la délibération du conseil prend plus de temps, mais fonctionne de manière fiable sans atteindre les limites de débit.