OpenAI выпустила Codex CLI как плагин для Claude Code. Конкурент сделал инструмент для продукта конкурента. Звучит как шутка. Я применил оба в тот же вечер и решил проблему, которая неделю не давала покоя.
Проблема: моноклональный совет
На прошлой неделе я собрал систему принятия решений. Три AI-эксперта смотрят на задачу независимо: Архитектор (как построить правильно), Прагматик (как построить просто), Скептик (что сломается). Каждый получает спеку, каждый отвечает изолированно. Потом Stress Test, потом дебаты двух сильнейших вариантов, потом я выбираю.
Проблему нашёл Скептик. На дебатах по архитектуре самого consilium он написал: «Моноклональный совет. Один мозг с тремя шляпами.»
Все три эксперта — это Claude. Одна модель с разными промптами. Если Claude как модель слеп к чему-то, все три «эксперта» это пропустят. Diversity of thought не появляется от промпт-инжиниринга. Я получал разнообразие мнений, но не разнообразие мышления.
Частичная защита была: дебаты шли Claude vs GPT. Но consilium до дебатов оставался моноклональным. А ведь consilium решает, какие два варианта вообще дойдут до дебатов. Если три Claude-эксперта сошлись на чём-то одном, GPT в дебатах уже спорит внутри чужой рамки.
Что случилось 31 марта
Вечером увидел новость: OpenAI выпустила плагин Codex CLI для Claude Code. Не отдельный инструмент. Плагин. Запускается прямо из Claude Code. GPT-модель работает рядом с Claude-моделью в одном окне.
Первая мысль: «Конкуренты буквально помогают друг другу.»
Вторая мысль: «Это же решает моноклональный совет.»
До и после
До Codex CLI:
Consilium: 3 Claude-эксперта (одна модель, разные промпты). Моноклональный совет. Дебаты: Claude vs GPT, но вручную (копирую файл, открываю другую сессию, жду ответ).
После:
Consilium: 3 Claude-эксперта + 3 GPT-эксперта параллельно. Шесть мнений от двух разных моделей. Плюс два скилла: codex-review (GPT ревьюит код) и codex-adversarial-review (GPT атакует подход целиком).
Принцип: не заменять, а дублировать. Те же роли (Архитектор, Прагматик, Скептик), другая модель. Каждый вопрос проходит через два мозга с разными слепыми зонами.
Два скилла за вечер
Создал два новых скилла:
codex-review. GPT ревьюит код. Не линтер, а ревью: «тут ты обрабатываешь 404 но не 429», «этот retry бесконечный при сетевой ошибке». То, что Claude-ревьюер мог пропустить потому что сам этот код и писал.
codex-adversarial-review. GPT атакует подход целиком. Не «проверь синтаксис», а «объясни почему этот подход плохой». Если не может объяснить — подход выдержал проверку. Если может — значит есть слабое место которое Claude не видел.
Разница уже видна
Claude и GPT реально думают по-разному. Claude склонен к элегантности: красивые абстракции, правильные по учебнику. GPT чаще говорит «зачем тебе эта абстракция, сделай проще». На архитектурных вопросах GPT побеждал чаще (это я заметил ещё на дебатах).
В consilium разница ещё заметнее. Claude-Архитектор предлагает одно. GPT-Архитектор предлагает другое. Не потому что промпт разный, а потому что модель видит задачу иначе. Это настоящее разнообразие мнений, не имитация.
Рынок AI перестал быть войной
Самое интересное во всей истории: конкуренты помогают друг другу. OpenAI делает плагин для Anthropic. Google открывает Gemini для всех. Пользователю плевать чей логотип на инструменте. Работает — беру. Не работает — меняю.
Лояльность к бренду AI — это как лояльность к бренду розетки. Важен ток, а не надпись на пластике.
Что это меняет
Для меня: consilium больше не моноклональный. Шесть экспертов от двух моделей. Stress Test (Now Check + Future Check) проходит через обе модели. Дебаты автоматизированы.
Для всех кто работает с AI: если ты используешь одну модель для принятия решений, ты получаешь подтверждение, а не проверку. Две модели с разными слепыми зонами дают настоящую проверку.
Код написал Claude Code. Скиллы спроектировал я. Codex CLI интегрировал OpenAI. Решения принимаю я. Так и работаем.
Связанные посты: SCD: consilium + дебаты | AI-дебаты как метод