Saltar al contenido principal

Consejo de LLM

La característica de Consejo de LLM te permite consultar múltiples modelos de IA simultáneamente y combinar sus respuestas en una sola respuesta de mayor calidad. En lugar de depender de un modelo, ensamblas un consejo de 2 o más modelos que deliberan juntos.

¿Qué Es un Consejo?

Un consejo es un grupo de perfiles de modelos de IA que trabajan juntos en cada mensaje que envías. Cada miembro del consejo puede ser un proveedor, modelo y prompt de sistema diferente. Cuando envías un mensaje, todos los miembros responden, opcionalmente revisan el trabajo de los demás, y un presidente designado sintetiza la respuesta final.

Los consejos son especialmente poderosos para:

  • Investigación -- obtener múltiples perspectivas sobre un tema
  • Revisión de código -- hacer que diferentes modelos verifiquen el trabajo de los demás
  • Toma de decisiones -- sopesar puntos de vista en competencia
  • Aseguramiento de calidad -- detectar errores que un solo modelo podría pasar por alto

7 Estilos de Consejo

Cada estilo de consejo define cómo los modelos interactúan. Elige el estilo que mejor se adapte a tu caso de uso.

Consejo (Predeterminado)

El pipeline de deliberación estándar de 3 fases:

  1. Fase 1 -- Fan-Out: Tu mensaje se envía a todos los miembros en paralelo. Cada modelo genera su propia respuesta independiente.
  2. Fase 2 -- Revisión de Pares: Cada miembro revisa las respuestas de los otros miembros y las clasifica de mejor a peor con razonamiento.
  3. Fase 3 -- Síntesis del Presidente: Un modelo presidente designado lee todas las respuestas y revisiones de pares, luego produce un informe final comprehensivo.

Mejor para: Investigación, análisis, preguntas complejas donde quieres cobertura completa.

Comparar

Todos los modelos responden en paralelo, y sus respuestas se muestran lado a lado en una cuadrícula. No hay votación, no hay revisión de pares y no hay paso de síntesis.

  • Solo Fase 1 (fan-out)
  • Respuestas mostradas en columnas
  • Sin presidente, sin respuesta final

Mejor para: Comparar capacidades de modelos, probar prompts entre modelos, ver cómo diferentes modelos abordan la misma pregunta.

Arena

Los modelos compiten cabeza a cabeza. Todos los modelos responden, luego la revisión de pares determina un ganador. La mejor respuesta gana.

Mejor para: Encontrar la mejor respuesta única, benchmarking competitivo.

MoA (Mixture of Agents)

Refinamiento en capas donde cada modelo construye sobre la salida del modelo anterior. En lugar de respuestas paralelas independientes, los modelos iterativamente mejoran el trabajo de los demás.

Mejor para: Tareas que se benefician de mejora iterativa, como escritura y edición.

Enrutador

Enrutamiento inteligente que elige el mejor modelo para cada consulta automáticamente. En lugar de consultar todos los modelos, el enrutador analiza tu mensaje y lo envía al único modelo más apropiado.

Mejor para: Optimización de costos, enrutamiento de diferentes tipos de preguntas a modelos especializados.

Debate

Los modelos son asignados a lados opuestos (A FAVOR y EN CONTRA) y argumentan sus posiciones:

  1. Argumentos de Apertura: Cada modelo argumenta su lado asignado
  2. Refutaciones: Los modelos responden a los argumentos del lado opuesto (número configurable de rondas)
  3. Veredicto del Moderador: El presidente analiza ambos lados justamente y entrega un veredicto

Los lados del debate se asignan automáticamente (alternando) o pueden establecerse manualmente por miembro.

Mejor para: Explorar temas controvertidos, probar ideas bajo estrés, encontrar debilidades en argumentos.

consejo

Puedes establecer el número de rondas de debate en la configuración del consejo. Más rondas significan argumentación más profunda pero mayores costos de API.

Consenso

Los modelos votan por la mejor respuesta sin un paso de síntesis:

  1. Todos los modelos responden independientemente (fan-out)
  2. Cada modelo revisa y clasifica las otras respuestas (revisión de pares)
  3. La respuesta con el puntaje de voto más alto se selecciona como respuesta final

Sin síntesis del presidente -- la respuesta ganadora se usa tal cual.

Mejor para: Cuando quieres la elección de la multitud en lugar de un resumen sintetizado.

Crear un Consejo

Usando el Asistente (Usuarios Nuevos)

  1. Cuando aparezca el asistente, elige Cluster en el Paso 0
  2. Selecciona modelos desde la pestaña de presets o agrega modelos personalizados
  3. Conecta claves API para cada proveedor (omitido para modelos gratuitos)
  4. Configura ajustes del consejo: nombre, icono, estilo y resumen de miembros
  5. Haz clic en Listo para crear el consejo

Desde Configuración (Usuarios Existentes)

  1. Abre Configuración y ve a la pestaña Perfil
  2. Agrega miembros usando el selector de perfil (cada miembro referencia un perfil guardado)
  3. Establece el estilo de consejo desde la cuadrícula de estilos
  4. Configura el presidente, modo de votación y número de rondas
  5. Guarda el perfil
info

Los miembros del consejo son siempre referencias a perfiles. Crea perfiles individuales primero (uno por modelo), luego ensámblalos en un consejo. Esto te permite reutilizar el mismo perfil en múltiples consejos.

Miembros del Consejo

Cada miembro del consejo tiene sus propias configuraciones que pueden anular los valores predeterminados del consejo:

ConfiguraciónDescripción
PerfilQué perfil guardado (proveedor + modelo) usar
Prompt de SistemaAnula el prompt de sistema predeterminado del miembro
TemperaturaAnula la temperatura para este miembro
Tokens MáxAnula tokens máximos de salida
Esfuerzo de RazonamientoEstablece nivel de pensamiento/razonamiento (Apagado, Bajo, Medio, Alto, Máximo)
Lado del DebatePara estilo debate: asignar A Favor, En Contra o Auto

Los miembros se etiquetan A, B, C, etc. para identificación en la salida del consejo.

Rol del Presidente

El presidente es el modelo responsable de sintetizar la respuesta final en estilos de consejo, arena y debate. Por defecto, el primer miembro (A) es el presidente, pero puedes cambiar esto en la configuración del consejo.

El presidente recibe:

  • El mensaje de usuario original
  • Todas las respuestas de los miembros de la Fase 1
  • Todas las clasificaciones de revisión de pares de la Fase 2
  • Instrucciones para producir un informe de investigación comprehensivo
consejo

Elige tu modelo más capaz como presidente. El presidente hace el trabajo más pesado -- necesita procesar todas las otras respuestas y producir una síntesis coherente.

Modos de Votación

Cuando la revisión de pares está habilitada, los miembros clasifican las respuestas de los demás. El modo de votación determina cómo se tabulan esas clasificaciones:

ModoCómo Funciona
PonderadoLos miembros ganan puntos según la posición de clasificación. Primer lugar obtiene N puntos, segundo obtiene N-1, etc.
PluralidadSolo los votos de primer lugar cuentan. La respuesta con más clasificaciones de primer lugar gana.

Los puntajes de voto se muestran en la salida final junto a la respuesta de cada miembro.

Estimación de Costos

Ejecutar un consejo multiplica el uso de API por el número de miembros y fases. Antes de enviar un mensaje, la plataforma estima el costo basado en:

  • Número de miembros
  • Número de fases (varía por estilo)
  • Conteos de tokens esperados
  • Precios por modelo del registro

La estimación de costo se muestra en el pie de página de la salida del consejo después de cada respuesta:

Llamadas API: 7 | Tokens: 24,531 | Costo est.: $0.1847
aviso

Los consejos con muchos miembros y modelos pagados pueden ser costosos. El modo Comparar es el más barato (solo Fase 1), mientras que consejo completo o debate con múltiples rondas es lo más costoso.

Transmisión en Vivo

La deliberación del consejo se transmite en tiempo real. Durante la Fase 1, ves la respuesta de cada miembro aparecer en una cuadrícula a medida que se genera. Los indicadores de estado muestran qué miembros están pensando, transmitiendo, terminados o fallidos.

Durante la Fase 3, la síntesis del presidente se transmite token por token igual que una respuesta de chat regular.

Casos de Uso de Ejemplo

EstiloCaso de UsoMiembros de Ejemplo
ConsejoInforme de investigación sobre un tema técnicoClaude (analítico) + GPT-4o (amplio) + Grok (contrario)
CompararProbando un prompt entre modelosGemini Flash + Claude Haiku + GPT-4o mini
ArenaEncontrar la mejor solución de códigoClaude Sonnet + GPT-4o + DeepSeek Coder
MoAPulir una entrada de blogGPT-4o (borrador) + Claude (edición) + Gemini (pulido)
EnrutadorUso diario mixtoModelo de matemáticas + Modelo de código + Modelo creativo
Debate¿Deberíamos usar microservicios?2 modelos A FAVOR + 2 modelos EN CONTRA
Consenso¿Qué framework usar?3-5 modelos diversos votando

Consejos de Modelos Gratuitos

Puedes construir consejos completamente de modelos gratuitos (nivel gratuito de OpenRouter, nivel gratuito de Gemini). La plataforma maneja automáticamente la limitación de tasa para modelos gratuitos enviando solicitudes secuencialmente en lugar de en paralelo.

nota

Los modelos gratuitos tienen límites de tasa más bajos (típicamente 8 solicitudes por minuto). La ejecución secuencial significa que la deliberación del consejo toma más tiempo, pero funciona de manera confiable sin alcanzar límites de tasa.