Consejo de LLM
La característica de Consejo de LLM te permite consultar múltiples modelos de IA simultáneamente y combinar sus respuestas en una sola respuesta de mayor calidad. En lugar de depender de un modelo, ensamblas un consejo de 2 o más modelos que deliberan juntos.
¿Qué Es un Consejo?
Un consejo es un grupo de perfiles de modelos de IA que trabajan juntos en cada mensaje que envías. Cada miembro del consejo puede ser un proveedor, modelo y prompt de sistema diferente. Cuando envías un mensaje, todos los miembros responden, opcionalmente revisan el trabajo de los demás, y un presidente designado sintetiza la respuesta final.
Los consejos son especialmente poderosos para:
- Investigación -- obtener múltiples perspectivas sobre un tema
- Revisión de código -- hacer que diferentes modelos verifiquen el trabajo de los demás
- Toma de decisiones -- sopesar puntos de vista en competencia
- Aseguramiento de calidad -- detectar errores que un solo modelo podría pasar por alto
7 Estilos de Consejo
Cada estilo de consejo define cómo los modelos interactúan. Elige el estilo que mejor se adapte a tu caso de uso.
Consejo (Predeterminado)
El pipeline de deliberación estándar de 3 fases:
- Fase 1 -- Fan-Out: Tu mensaje se envía a todos los miembros en paralelo. Cada modelo genera su propia respuesta independiente.
- Fase 2 -- Revisión de Pares: Cada miembro revisa las respuestas de los otros miembros y las clasifica de mejor a peor con razonamiento.
- Fase 3 -- Síntesis del Presidente: Un modelo presidente designado lee todas las respuestas y revisiones de pares, luego produce un informe final comprehensivo.
Mejor para: Investigación, análisis, preguntas complejas donde quieres cobertura completa.
Comparar
Todos los modelos responden en paralelo, y sus respuestas se muestran lado a lado en una cuadrícula. No hay votación, no hay revisión de pares y no hay paso de síntesis.
- Solo Fase 1 (fan-out)
- Respuestas mostradas en columnas
- Sin presidente, sin respuesta final
Mejor para: Comparar capacidades de modelos, probar prompts entre modelos, ver cómo diferentes modelos abordan la misma pregunta.
Arena
Los modelos compiten cabeza a cabeza. Todos los modelos responden, luego la revisión de pares determina un ganador. La mejor respuesta gana.
Mejor para: Encontrar la mejor respuesta única, benchmarking competitivo.
MoA (Mixture of Agents)
Refinamiento en capas donde cada modelo construye sobre la salida del modelo anterior. En lugar de respuestas paralelas independientes, los modelos iterativamente mejoran el trabajo de los demás.
Mejor para: Tareas que se benefician de mejora iterativa, como escritura y edición.
Enrutador
Enrutamiento inteligente que elige el mejor modelo para cada consulta automáticamente. En lugar de consultar todos los modelos, el enrutador analiza tu mensaje y lo envía al único modelo más apropiado.
Mejor para: Optimización de costos, enrutamiento de diferentes tipos de preguntas a modelos especializados.
Debate
Los modelos son asignados a lados opuestos (A FAVOR y EN CONTRA) y argumentan sus posiciones:
- Argumentos de Apertura: Cada modelo argumenta su lado asignado
- Refutaciones: Los modelos responden a los argumentos del lado opuesto (número configurable de rondas)
- Veredicto del Moderador: El presidente analiza ambos lados justamente y entrega un veredicto
Los lados del debate se asignan automáticamente (alternando) o pueden establecerse manualmente por miembro.
Mejor para: Explorar temas controvertidos, probar ideas bajo estrés, encontrar debilidades en argumentos.
Puedes establecer el número de rondas de debate en la configuración del consejo. Más rondas significan argumentación más profunda pero mayores costos de API.
Consenso
Los modelos votan por la mejor respuesta sin un paso de síntesis:
- Todos los modelos responden independientemente (fan-out)
- Cada modelo revisa y clasifica las otras respuestas (revisión de pares)
- La respuesta con el puntaje de voto más alto se selecciona como respuesta final
Sin síntesis del presidente -- la respuesta ganadora se usa tal cual.
Mejor para: Cuando quieres la elección de la multitud en lugar de un resumen sintetizado.
Crear un Consejo
Usando el Asistente (Usuarios Nuevos)
- Cuando aparezca el asistente, elige Cluster en el Paso 0
- Selecciona modelos desde la pestaña de presets o agrega modelos personalizados
- Conecta claves API para cada proveedor (omitido para modelos gratuitos)
- Configura ajustes del consejo: nombre, icono, estilo y resumen de miembros
- Haz clic en Listo para crear el consejo
Desde Configuración (Usuarios Existentes)
- Abre Configuración y ve a la pestaña Perfil
- Agrega miembros usando el selector de perfil (cada miembro referencia un perfil guardado)
- Establece el estilo de consejo desde la cuadrícula de estilos
- Configura el presidente, modo de votación y número de rondas
- Guarda el perfil
Los miembros del consejo son siempre referencias a perfiles. Crea perfiles individuales primero (uno por modelo), luego ensámblalos en un consejo. Esto te permite reutilizar el mismo perfil en múltiples consejos.
Miembros del Consejo
Cada miembro del consejo tiene sus propias configuraciones que pueden anular los valores predeterminados del consejo:
| Configuración | Descripción |
|---|---|
| Perfil | Qué perfil guardado (proveedor + modelo) usar |
| Prompt de Sistema | Anula el prompt de sistema predeterminado del miembro |
| Temperatura | Anula la temperatura para este miembro |
| Tokens Máx | Anula tokens máximos de salida |
| Esfuerzo de Razonamiento | Establece nivel de pensamiento/razonamiento (Apagado, Bajo, Medio, Alto, Máximo) |
| Lado del Debate | Para estilo debate: asignar A Favor, En Contra o Auto |
Los miembros se etiquetan A, B, C, etc. para identificación en la salida del consejo.
Rol del Presidente
El presidente es el modelo responsable de sintetizar la respuesta final en estilos de consejo, arena y debate. Por defecto, el primer miembro (A) es el presidente, pero puedes cambiar esto en la configuración del consejo.
El presidente recibe:
- El mensaje de usuario original
- Todas las respuestas de los miembros de la Fase 1
- Todas las clasificaciones de revisión de pares de la Fase 2
- Instrucciones para producir un informe de investigación comprehensivo
Elige tu modelo más capaz como presidente. El presidente hace el trabajo más pesado -- necesita procesar todas las otras respuestas y producir una síntesis coherente.
Modos de Votación
Cuando la revisión de pares está habilitada, los miembros clasifican las respuestas de los demás. El modo de votación determina cómo se tabulan esas clasificaciones:
| Modo | Cómo Funciona |
|---|---|
| Ponderado | Los miembros ganan puntos según la posición de clasificación. Primer lugar obtiene N puntos, segundo obtiene N-1, etc. |
| Pluralidad | Solo los votos de primer lugar cuentan. La respuesta con más clasificaciones de primer lugar gana. |
Los puntajes de voto se muestran en la salida final junto a la respuesta de cada miembro.
Estimación de Costos
Ejecutar un consejo multiplica el uso de API por el número de miembros y fases. Antes de enviar un mensaje, la plataforma estima el costo basado en:
- Número de miembros
- Número de fases (varía por estilo)
- Conteos de tokens esperados
- Precios por modelo del registro
La estimación de costo se muestra en el pie de página de la salida del consejo después de cada respuesta:
Llamadas API: 7 | Tokens: 24,531 | Costo est.: $0.1847
Los consejos con muchos miembros y modelos pagados pueden ser costosos. El modo Comparar es el más barato (solo Fase 1), mientras que consejo completo o debate con múltiples rondas es lo más costoso.
Transmisión en Vivo
La deliberación del consejo se transmite en tiempo real. Durante la Fase 1, ves la respuesta de cada miembro aparecer en una cuadrícula a medida que se genera. Los indicadores de estado muestran qué miembros están pensando, transmitiendo, terminados o fallidos.
Durante la Fase 3, la síntesis del presidente se transmite token por token igual que una respuesta de chat regular.
Casos de Uso de Ejemplo
| Estilo | Caso de Uso | Miembros de Ejemplo |
|---|---|---|
| Consejo | Informe de investigación sobre un tema técnico | Claude (analítico) + GPT-4o (amplio) + Grok (contrario) |
| Comparar | Probando un prompt entre modelos | Gemini Flash + Claude Haiku + GPT-4o mini |
| Arena | Encontrar la mejor solución de código | Claude Sonnet + GPT-4o + DeepSeek Coder |
| MoA | Pulir una entrada de blog | GPT-4o (borrador) + Claude (edición) + Gemini (pulido) |
| Enrutador | Uso diario mixto | Modelo de matemáticas + Modelo de código + Modelo creativo |
| Debate | ¿Deberíamos usar microservicios? | 2 modelos A FAVOR + 2 modelos EN CONTRA |
| Consenso | ¿Qué framework usar? | 3-5 modelos diversos votando |
Consejos de Modelos Gratuitos
Puedes construir consejos completamente de modelos gratuitos (nivel gratuito de OpenRouter, nivel gratuito de Gemini). La plataforma maneja automáticamente la limitación de tasa para modelos gratuitos enviando solicitudes secuencialmente en lugar de en paralelo.
Los modelos gratuitos tienen límites de tasa más bajos (típicamente 8 solicitudes por minuto). La ejecución secuencial significa que la deliberación del consejo toma más tiempo, pero funciona de manera confiable sin alcanzar límites de tasa.