Перейти к основному содержимому

LLM Совет

Функция LLM Совет позволяет запрашивать несколько AI моделей одновременно и комбинировать их ответы в единый, более качественный ответ. Вместо полагания на одну модель, вы собираете совет из 2 или более моделей, которые обсуждают вместе.

Что такое совет?

Совет — это группа профилей AI моделей, которые работают вместе над каждым сообщением, которое вы отправляете. Каждый член совета может быть разным провайдером, моделью и системным промптом. Когда вы отправляете сообщение, все члены отвечают, опционально рецензируют работу друг друга, и назначенный председатель синтезирует финальный ответ.

Советы особенно мощны для:

  • Исследований — получить несколько перспектив на тему
  • Ревью кода — разные модели проверяют работу друг друга
  • Принятия решений — взвесить конкурирующие точки зрения
  • Гарантии качества — поймать ошибки, которые одна модель может пропустить

7 стилей совета

Каждый стиль совета определяет, как модели взаимодействуют. Выберите стиль, который лучше подходит для вашего случая.

Council (по умолчанию)

Стандартный 3-фазный пайплайн обсуждения:

  1. Фаза 1 — Fan-Out: Ваше сообщение отправляется всем членам параллельно. Каждая модель генерирует свой независимый ответ.
  2. Фаза 2 — Peer Review: Каждый член рецензирует ответы других членов и ранжирует их от лучшего к худшему с обоснованием.
  3. Фаза 3 — Chairman Synthesis: Назначенный председатель читает все ответы и peer reviews, затем производит комплексный финальный отчёт.

Лучше для: Исследований, анализа, сложных вопросов, где нужно тщательное покрытие.

Compare

Все модели отвечают параллельно, и их ответы отображаются бок о бок в сетке. Нет голосования, нет peer review, нет шага синтеза.

  • Только фаза 1 (fan-out)
  • Ответы показаны в колонках
  • Нет председателя, нет финального ответа

Лучше для: Сравнения возможностей моделей, тестирования промптов на разных моделях, просмотра как разные модели подходят к одному вопросу.

Arena

Модели соревнуются head-to-head. Все модели отвечают, затем peer review определяет победителя. Лучший ответ побеждает.

Лучше для: Нахождения единственного лучшего ответа, конкурентного бенчмаркинга.

MoA (Mixture of Agents)

Многослойное уточнение, где каждая модель строится на выводе предыдущей модели. Вместо независимых параллельных ответов, модели итеративно улучшают работу друг друга.

Лучше для: Задач, которые выигрывают от итеративного улучшения, например написание и редактирование.

Router

Умная маршрутизация, которая автоматически выбирает лучшую модель для каждого запроса. Вместо запроса всех моделей, роутер анализирует ваше сообщение и отправляет его единственной наиболее подходящей модели.

Лучше для: Оптимизации стоимости, маршрутизации разных типов вопросов к специализированным моделям.

Debate

Модели назначаются на противоположные стороны (ЗА и ПРОТИВ) и аргументируют свои позиции:

  1. Открывающие аргументы: Каждая модель аргументирует свою назначенную сторону
  2. Реплики: Модели отвечают на аргументы противоположной стороны (настраиваемое количество раундов)
  3. Вердикт модератора: Председатель справедливо анализирует обе стороны и выносит вердикт

Стороны дебатов назначаются автоматически (по очереди) или могут быть установлены вручную для каждого члена.

Лучше для: Исследования спорных тем, стресс-тестирования идей, нахождения слабых мест в аргументах.

подсказка

Вы можете установить количество раундов дебатов в настройках совета. Больше раундов означает более глубокую аргументацию, но более высокие API-расходы.

Consensus

Модели голосуют за лучший ответ без шага синтеза:

  1. Все модели отвечают независимо (fan-out)
  2. Каждая модель рецензирует и ранжирует другие ответы (peer review)
  3. Ответ с наивысшим баллом голосования выбирается как финальный ответ

Нет синтеза председателя — выигрышный ответ используется как есть.

Лучше для: Когда вы хотите выбор толпы, а не синтезированную сводку.

Создание совета

Через мастер (новые пользователи)

  1. Когда мастер появится, выберите Cluster на шаге 0
  2. Выберите модели из вкладки пресетов или добавьте кастомные модели
  3. Подключите API-ключи для каждого провайдера (пропускается для бесплатных моделей)
  4. Настройте параметры совета: имя, иконка, стиль и сводка членов
  5. Нажмите Ready для создания совета

Из настроек (существующие пользователи)

  1. Откройте Settings и перейдите на вкладку Profile
  2. Добавьте членов через пикер профилей (каждый член ссылается на сохранённый профиль)
  3. Установите стиль совета из сетки стилей
  4. Настройте председателя, режим голосования и количество раундов
  5. Сохраните профиль
к сведению

Члены совета — это всегда ссылки на профили. Сначала создайте индивидуальные профили (по одному на модель), затем соберите их в совет. Это позволяет повторно использовать один и тот же профиль в нескольких советах.

Члены совета

Каждый член совета имеет свои настройки, которые могут перекрывать значения совета по умолчанию:

НастройкаОписание
ProfileКакой сохранённый профиль (провайдер + модель) использовать
System PromptПерекрыть системный промпт члена по умолчанию
TemperatureПерекрыть temperature для этого члена
Max TokensПерекрыть максимальные output tokens
Reasoning EffortУстановить уровень thinking/reasoning (Off, Low, Medium, High, Highest)
Debate SideДля стиля debate: назначить For, Against или Auto

Члены помечаются A, B, C и т.д. для идентификации в выводе совета.

Роль председателя

Председатель — это модель, ответственная за синтез финального ответа в стилях council, arena и debate. По умолчанию первый член (A) является председателем, но вы можете изменить это в настройках совета.

Председатель получает:

  • Оригинальное сообщение пользователя
  • Все ответы членов из фазы 1
  • Все ранжирования peer review из фазы 2
  • Инструкции произвести комплексный исследовательский отчёт
подсказка

Выберите вашу самую способную модель как председателя. Председатель делает самую тяжёлую работу — ему нужно обработать все другие ответы и произвести связный синтез.

Режимы голосования

Когда peer review включён, члены ранжируют ответы друг друга. Режим голосования определяет, как эти ранжирования подсчитываются:

РежимКак работает
WeightedЧлены зарабатывают очки на основе позиции ранжирования. Первое место получает N очков, второе N-1 и т.д.
PluralityУчитываются только голоса за первое место. Ответ с наибольшим количеством первых мест побеждает.

Очки голосования отображаются в финальном выводе рядом с ответом каждого члена.

Оценка стоимости

Запуск совета умножает использование API на количество членов и фаз. Перед отправкой сообщения платформа оценивает стоимость на основе:

  • Количество членов
  • Количество фаз (варьируется по стилю)
  • Ожидаемые количества токенов
  • Цены за модель из реестра

Оценка стоимости показывается в футере вывода совета после каждого ответа:

API calls: 7 | Tokens: 24,531 | Est. cost: $0.1847
warning

Советы со многими членами и платными моделями могут быть дорогими. Режим compare — самый дешёвый (только фаза 1), тогда как полный council или debate с несколькими раундами — самый дорогой.

Live Streaming

Обсуждение совета стримится в реальном времени. Во время фазы 1 вы видите, как ответ каждого члена появляется в сетке по мере генерации. Индикаторы статуса показывают, какие члены думают, стримят, закончили или упали.

Во время фазы 3 синтез председателя стримится токен за токеном, как обычный чат-ответ.

Примеры использования

СтильВариант использованияПример членов
CouncilИсследовательский отчёт на техническую темуClaude (аналитический) + GPT-4o (широкий) + Grok (контраргументирующий)
CompareТестирование промпта на разных моделяхGemini Flash + Claude Haiku + GPT-4o mini
ArenaНахождение лучшего решения кодаClaude Sonnet + GPT-4o + DeepSeek Coder
MoAПолировка поста в блогеGPT-4o (draft) + Claude (edit) + Gemini (polish)
RouterСмешанное ежедневное использованиеMath model + Code model + Creative model
DebateСтоит ли использовать микросервисы?2 модели ЗА + 2 модели ПРОТИВ
ConsensusКакой фреймворк использовать?3-5 разнообразных моделей голосуют

Советы из бесплатных моделей

Вы можете строить советы полностью из бесплатных моделей (бесплатный тариф OpenRouter, бесплатный тариф Gemini). Платформа автоматически обрабатывает rate limiting для бесплатных моделей, отправляя запросы последовательно вместо параллельно.

примечание

Бесплатные модели имеют более низкие rate limits (обычно 8 запросов в минуту). Последовательное выполнение означает, что обсуждение совета занимает больше времени, но работает надёжно без попадания в rate limits.