"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по… — @aivkube

"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по искусственному интеллекту в Tesla, в очередной раз порадовал и выложил в открытый доступ модель виртуального LLM-совета, который можно запустить у себя на машине (он сам, если что, завайбкодил ее за пару вечеров). Теперь, вместо того, чтобы задавать вопрос своему любимому GPT, Googl, Claude Sonnet или Grok, можно объединить их в «Виртуальный нейро-ареопаг». Этот чат-репозиторий, который использует OpenRouter для отправки вашего запроса нескольким LLM, затем просит их оценить работы друг друга, а затем главный LLM выдаёт окончательный ответ. Я установил модель себе на ноутбук и попробовал задать простой вопрос про предвзятости и неточности ИИ. Ответ занял примерно 2 минуты и обошелся мне в $0,34. На выходе я получил анализ и обобщенную логику ответа (ниже - краткая версия): Модель A (GPT-5.1) предоставила наиболее системное и ориентированное на управление руководство. Её списки вопросов для команды и раздел по работе с подрядчиками — это именно те инструменты, которые нужны менеджеру. Модель B (Gemini) предложила отличные метафоры («ИИ как зеркало») и акцент на «человеке в контуре» (human-in-the-loop), но ей не хватило детализации в планах действий. Модель C (Claude) хорошо структурировала типы предвзятости и инструменты, но местами ушла в излишнюю для менеджера техническую терминологию. Модель D (Grok) оказалась слабейшей, местами предлагая нереалистичные советы для руководителей (самостоятельно писать код на Python для анализа данных). Синтезированный ответ: Ниже представлено сводное руководство, объединяющее лучшие управленческие практики (из ответа A), понятные метафоры (из ответа B) и структурный подход (из ответа C). Вы можете спросить - в чем отличие такой платформы от Prompt Cannon и подобных сайтов, которые позволяют сравнивать ответы от разных моделей? Все просто: у ""пушек"" оценка качества ответов лежит на вас, но `llm-council` функционирует как виртуальный совет, в котором различные языковые модели работают вместе, чтобы предоставить вам готовый оптимальный и улучшенный ответ. Система отправляет ваш запрос нескольким ИИ-моделям, которые выступают в роли экспертов. Каким именно - вы можете сами настроить в файле конфигурации. После того как модели отвечают, они анонимно критикуют и ранжируют ответы друг друга. Отдельный, более высокоуровневый ИИ (или т.н. «председатель») получает все эти ответы и их оценки, чтобы синтезировать финальный, более качественный итоговый ответ. Такой подход позволяет получить более надёжные и глубокие результаты, чем при работе с одной моделью, поскольку включает в себя экспертную оценку и коллективное принятие решений. По сути, Карпаты на коленке показал будущее поиска информации. Мы уходим от модели ""спросил > получил ответ"" к модели ""поставил задачу > агенты обсудили > выдали взвешенное решение"". Это уже не просто генерация текста, а верифицируемая аналитика. И за 30 центов это, пожалуй, самый дешевый консалтинг такого уровня, который можно найти на рынке."

Из этого канала