LLM Совет
Функция LLM Совет позволяет запрашивать несколько AI моделей одновременно и комбинировать их ответы в единый, более качественный ответ. Вместо полагания на одну модель, вы собираете совет из 2 или более моделей, которые обсуждают вместе.
Что такое совет?
Совет — это группа профилей AI моделей, которые работают вместе над каждым сообщением, которое вы отправляете. Каждый член совета может быть разным провайдером, моделью и системным промптом. Когда вы отправляете сообщение, все члены отвечают, опционально рецензируют работу друг друга, и назначенный председатель синтезирует финальный ответ.
Советы особенно мощны для:
- Исследований — получить несколько перспектив на тему
- Ревью кода — разные модели проверяют работу друг друга
- Принятия решений — взвесить конкурирующие точки зрения
- Гарантии качества — поймать ошибки, которые одна модель может пропустить
7 стилей совета
Каждый стиль совета определяет, как модели взаимодействуют. Выберите стиль, который лучше подходит для вашего случая.
Council (по умолчанию)
Стандартный 3-фазный пайплайн обсуждения:
- Фаза 1 — Fan-Out: Ваше сообщение отправляется всем членам параллельно. Каждая модель генерирует свой независимый ответ.
- Фаза 2 — Peer Review: Каждый член рецензирует ответы других членов и ранжирует их от лучшего к худшему с обоснованием.
- Фаза 3 — Chairman Synthesis: Назначенный председатель читает все ответы и peer reviews, затем производит комплексный финальный отчёт.
Лучше для: Исследований, анализа, сложных вопросов, где нужно тщательное покрытие.
Compare
Все модели отвечают параллельно, и их ответы отображаются бок о бок в сетке. Нет голосования, нет peer review, нет шага синтеза.
- Только фаза 1 (fan-out)
- Ответы показаны в колонках
- Нет председателя, нет финального ответа
Лучше для: Сравнения возможностей моделей, тестирования промптов на разных моделях, просмотра как разные модели подходят к одному вопросу.
Arena
Модели соревнуются head-to-head. Все модели отвечают, затем peer review определяет победителя. Лучший ответ побеждает.
Лучше для: Нахождения единственного лучшего ответа, конкурентного бенчмаркинга.
MoA (Mixture of Agents)
Многослойное уточнение, где каждая модель строится на выводе предыдущей модели. Вместо независимых параллельных ответов, модели итеративно улучшают работу друг друга.
Лучше для: Задач, которые выигрывают от итеративного улучшения, например написание и редактирование.
Router
Умная маршрутизация, которая автоматически выбирает лучшую модель для каждого запроса. Вместо запроса всех моделей, роутер анализирует ваше сообщение и отправляет его единственной наиболее подходящей модели.
Лучше для: Оптимизации стоимости, маршрутизации разных типов вопросов к специализированным моделям.
Debate
Модели назначаются на противоположные стороны (ЗА и ПРОТИВ) и аргументируют свои позиции:
- Открывающие аргументы: Каждая модель аргументирует свою назначенную сторону
- Реплики: Модели отвечают на аргументы противоположной стороны (настраиваемое количество раундов)
- Вердикт модератора: Председатель справедливо анализирует обе стороны и выносит вердикт
Стороны дебатов назначаются автоматически (по очереди) или могут быть установлены вручную для каждого члена.
Лучше для: Исследования спорных тем, стресс-тестирования идей, нахождения слабых мест в аргументах.
Вы можете установить количество раундов дебатов в настройках совета. Больше раундов означает более глубокую аргументацию, но более высокие API-расходы.
Consensus
Модели голосуют за лучший ответ без шага синтеза:
- Все модели отвечают независимо (fan-out)
- Каждая модель рецензирует и ранжирует другие ответы (peer review)
- Ответ с наивысшим баллом голосования выбирается как финальный ответ
Нет синтеза председателя — выигрышный ответ используется как есть.
Лучше для: Когда вы хотите выбор толпы, а не синтезированную сводку.
Создание совета
Через мастер (новые пользователи)
- Когда мастер появится, выберите Cluster на шаге 0
- Выберите модели из вкладки пресетов или добавьте кастомные модели
- Подключите API-ключи для каждого провайдера (пропускается для бесплатных моделей)
- Настройте параметры совета: имя, иконка, стиль и сводка членов
- Нажмите Ready для создания совета
Из настроек (существующие пользователи)
- Откройте Settings и перейдите на вкладку Profile
- Добавьте членов через пикер профилей (каждый член ссылается на сохранённый профиль)
- Установите стиль совета из сетки стилей
- Настройте председателя, режим голосования и количество раундов
- Сохраните профиль
Члены совета — это всегда ссылки на профили. Сначала создайте индивидуальные профили (по одному на модель), затем соберите их в совет. Это позволяет повторно использовать один и тот же профиль в нескольких советах.
Члены совета
Каждый член совета имеет свои настройки, которые могут перекрывать значения совета по умолчанию:
| Настройка | Описание |
|---|---|
| Profile | Какой сохранённый профиль (провайдер + модель) использовать |
| System Prompt | Перекрыть системный промпт члена по умолчанию |
| Temperature | Перекрыть temperature для этого члена |
| Max Tokens | Перекрыть максимальные output tokens |
| Reasoning Effort | Установить уровень thinking/reasoning (Off, Low, Medium, High, Highest) |
| Debate Side | Для стиля debate: назначить For, Against или Auto |
Члены помечаются A, B, C и т.д. для идентификации в выводе совета.
Роль председателя
Председатель — это модель, ответственная за синтез финального ответа в стилях council, arena и debate. По умолчанию первый член (A) является председателем, но вы можете изменить это в настройках совета.
Председатель получает:
- Оригинальное сообщение пользователя
- Все ответы членов из фазы 1
- Все ранжирования peer review из фазы 2
- Инструкции произвести комплексный исследовательский отчёт
Выберите вашу самую способную модель как председателя. Председатель делает самую тяжёлую работу — ему нужно обработать все другие ответы и произвести связный синтез.
Режимы голосования
Когда peer review включён, члены ранжируют ответы друг друга. Режим голосования определяет, как эти ранжирования подсчитываются:
| Режим | Как работает |
|---|---|
| Weighted | Члены зарабатывают очки на основе позиции ранжирования. Первое место получает N очков, второе N-1 и т.д. |
| Plurality | Учитываются только голоса за первое место. Ответ с наибольшим количеством первых мест побеждает. |
Очки голосования отображаются в финальном выводе рядом с ответом каждого члена.
Оценка стоимости
Запуск совета умножает использование API на количество членов и фаз. Перед отправкой сообщения платформа оценивает стоимость на основе:
- Количество членов
- Количество фаз (варьируется по стилю)
- Ожидаемые количества токенов
- Цены за модель из реестра
Оценка стоимости показывается в футере вывода совета после каждого ответа:
API calls: 7 | Tokens: 24,531 | Est. cost: $0.1847
Советы со многими членами и платными моделями могут быть дорогими. Режим compare — самый дешёвый (только фаза 1), тогда как полный council или debate с несколькими раундами — самый дорогой.
Live Streaming
Обсуждение совета стримится в реальном времени. Во время фазы 1 вы видите, как ответ каждого члена появляется в сетке по мере генерации. Индикаторы статуса показывают, какие члены думают, стримят, закончили или упали.
Во время фазы 3 синтез председателя стримится токен за токеном, как обычный чат-ответ.
Примеры использования
| Стиль | Вариант использования | Пример членов |
|---|---|---|
| Council | Исследовательский отчёт на техническую тему | Claude (аналитический) + GPT-4o (широкий) + Grok (контраргументирующий) |
| Compare | Тестирование промпта на разных моделях | Gemini Flash + Claude Haiku + GPT-4o mini |
| Arena | Нахождение лучшего решения кода | Claude Sonnet + GPT-4o + DeepSeek Coder |
| MoA | Полировка поста в блоге | GPT-4o (draft) + Claude (edit) + Gemini (polish) |
| Router | Смешанное ежедневное использование | Math model + Code model + Creative model |
| Debate | Стоит ли использовать микросервисы? | 2 модели ЗА + 2 модели ПРОТИВ |
| Consensus | Какой фреймворк использовать? | 3-5 разнообразных моделей голосуют |
Советы из бесплатных моделей
Вы можете строить советы полностью из бесплатных моделей (бесплатный тариф OpenRouter, бесплатный тариф Gemini). Платформа автоматически обрабатывает rate limiting для бесплатных моделей, отправляя запросы последовательно вместо параллельно.
Бесплатные модели имеют более низкие rate limits (обычно 8 запросов в минуту). Последовательное выполнение означает, что обсуждение совета занимает больше времени, но работает надёжно без попадания в rate limits.