У меня уже были AI-дебаты. Claude и GPT спорят, я выбираю победителя. Работало. Но через пару недель я заметил слепое пятно: два AI спорят в одной плоскости. Оба смотрят на проблему как архитекторы. Никто не спрашивает «а зачем это вообще?» или «а что через полгода?».
Параллельно нашёл у Серёжи Рис подход Board of Advisors. Пять AI-экспертов смотрят на задачу независимо, каждый из своей роли. Идея хорошая, но без столкновения позиций. Эксперты не спорят друг с другом, просто высказываются.
Два метода. У каждого свой минус. Дебаты без разнообразия взглядов. Совет экспертов без конфликта идей. Что если совместить?
Три варианта, один выбор
Когда стало ясно, что хочу гибрид, я сформулировал три варианта:
Вариант 1. Дебаты остаются как есть, совет экспертов добавляется отдельным шагом. Два процесса живут рядом. Просто, но не связано. Когда что вызывать — непонятно.
Вариант 2. Совет экспертов заменяет дебаты. Три эксперта спорят между собой. Но тогда теряется формат «два AI атакуют друг друга», а он работал.
Вариант 3. SCD. Spec, Consilium, Debate. Спека, консилиум, дебаты. Три шага подряд. Сначала пишу спеку. Потом три эксперта смотрят на неё параллельно, каждый из своей роли. Потом их выводы уходят в спор между Claude и GPT. Эксперты дают разнообразие. Спор даёт конфликт.
Выбрал третий.
Три эксперта, не пять
У Серёжи пять экспертов. У меня три. Архитектор, Прагматик, Скептик.
Почему не пять? Три роли покрывают все углы, которые мне нужны. Архитектор смотрит на систему целиком, думает про масштаб и связи. Прагматик спрашивает «а это реально сделать за разумное время?». Скептик ищет дыры, которые остальные двое пропустили.
Пять — это театр. Добавляешь «Визионера» и «Аналитика данных», получаешь пять абзацев вместо трёх, а содержание то же. Три роли конкретнее.
И ещё решение: роли, а не персоны. Не «Стив Джобс» и «Линус Торвальдс», а Архитектор и Скептик. Персоны превращают разговор в косплей. Роли держат фокус на задаче.
Мета: метод проверяет сам себя
Написал спеку SCD. Метод, который описывает как принимать решения. И надо его проверить. Чем? Им самим.
Запустил трёх экспертов по спеке самого метода. Архитектор оценивал структуру. Прагматик — реалистичность. Скептик...
Скептик сказал фразу, которая стоит всей сессии: «Моноклональный совет. Один мозг с тремя шляпами.»
И он прав. Три эксперта — это три субагента одной нейросети. Они не независимы. У них одна модель мира, одни и те же данные, одни и те же слепые пятна. Переодеваешь одного AI в три костюма и делаешь вид, что получил три разных мнения.
Не баг, а свойство.
Но. Спор между Claude и GPT — это уже два разных «мозга». Разные архитектуры, разные данные для обучения, разные слепые пятна. Консилиум — разнообразие ролей внутри одной модели. Дебаты — разнообразие самих моделей. Вместе — оба уровня.
Моноклональный совет перестаёт быть проблемой когда за ним идёт настоящий спор между разными моделями.
Stress Test: два вопроса к каждому решению
В процессе дебатов по спеке Claude предложил Stress Test, а GPT дополнил его Future Check. Два вопроса, которые каждое решение должно пройти.
Now Check. Работает ли это решение прямо сейчас, с текущими ресурсами, ограничениями, дедлайнами? Не в идеальном мире, а в реальном. С моей командой (я один + нейросети), с моими деньгами, с моим временем.
Future Check. Пять вопросов про дальний горизонт. Что случится через 6 месяцев? Что если нагрузка вырастет в 10 раз? Какие зависимости могут сломаться? Что если ключевой инструмент подорожает или исчезнет? Каких навыков потребует поддержка?
Каждое решение проверяется из двух точек времени. «Работает сейчас» не значит «будет работать потом». «Идеально через полгода» не значит «реально сделать сегодня».
Как выглядит весь процесс
Не отдельная методология. Decision gate внутри рабочего процесса. Вызывается когда решение дорогое: архитектура системы, выбор стека, структура данных.
- Spec. Формулирую задачу. Что нужно, какие ограничения, какой контекст
- Consilium. Три эксперта (Архитектор, Прагматик, Скептик) смотрят на спеку параллельно. Результат: synthesis-матрица — что сходится, что расходится, где конфликт
- Debate. Claude и GPT получают спеку + synthesis. Спорят 2-3 раунда. Обязательный вопрос: «Правильно ли вообще поставлена задача?»
- Stress Test. Now Check + Future Check
- Verdict. Я принимаю решение. Не AI, не эксперты, не спор. Я
Первый реальный тест
Утром 28 марта обнаружилось, что ролики MAKO набрали 0 просмотров. Аккаунты пустые: ни аватарки, ни bio, ни истории. Instagram не показывает контент с голых профилей.
Запустил консилиум. Первый прогон на живой задаче.
Архитектор: генерация, потому что шаблоны не масштабируются. Прагматик: шаблоны быстрее, но через неделю закончатся. Скептик: генерация создаёт иллюзию разнообразия, один и тот же AI генерит «разные» профили.
Скептик опять попал в точку. Но аргумент Прагматика перевесил: шаблоны — тупик. Выбрал генерацию.
Что дальше
Версия 0.2 зафиксирована. Три глобальных агента созданы. Консилиум вызывается одной командой.
Арка AI-дебатов: эксперимент → метод → SCD. Следующий шаг — набрать статистику. Сколько решений процесс меняет по сравнению с «просто спросить»? Через пару недель данных будет достаточно для выводов.
Пока одно могу сказать точно: моноклональный совет — не баг, если после него идёт настоящий спор.