"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по искусственному интеллекту в Tesla, в очередной раз порадовал и выложил в открытый доступ модель виртуального LLM-совета, который можно запустить у себя на машине (он сам, если что, завайбкодил ее за пару вечеров). Теперь, вместо того, чтобы задавать вопрос своему любимому GPT, Googl, Claude Sonnet или Grok, можно объединить их в «Виртуальный нейро-ареопаг». Этот чат-репозиторий, который использует OpenRouter для отправки вашего запроса нескольким LLM, затем просит их оценить работы друг друга, а затем главный LLM выдаёт окончательный ответ. Я установил модель себе на ноутбук и попробовал задать простой вопрос про предвзятости и неточности ИИ. Ответ занял примерно 2 минуты и обошелся мне в $0,34. На выходе я получил анализ и обобщенную логику ответа (ниже - краткая версия): Модель A (GPT-5.1) предоставила наиболее системное и ориентированное на управление руководство. Её списки вопросов для команды и раздел по работе с подрядчиками — это именно те инструменты, которые нужны менеджеру. Модель B (Gemini) предложила отличные метафоры («ИИ как зеркало») и акцент на «человеке в контуре» (human-in-the-loop), но ей не хватило детализации в планах действий. Модель C (Claude) хорошо структурировала типы предвзятости и инструменты, но местами ушла в излишнюю для менеджера техническую терминологию. Модель D (Grok) оказалась слабейшей, местами предлагая нереалистичные советы для руководителей (самостоятельно писать код на Python для анализа данных). Синтезированный ответ: Ниже представлено сводное руководство, объединяющее лучшие управленческие практики (из ответа A), понятные метафоры (из ответа B) и структурный подход (из ответа C). Вы можете спросить - в чем отличие такой платформы от Prompt Cannon и подобных сайтов, которые позволяют сравнивать ответы от разных моделей? Все просто: у ""пушек"" оценка качества ответов лежит на вас, но `llm-council` функционирует как виртуальный совет, в котором различные языковые модели работают вместе, чтобы предоставить вам готовый оптимальный и улучшенный ответ. Система отправляет ваш запрос нескольким ИИ-моделям, которые выступают в роли экспертов. Каким именно - вы можете сами настроить в файле конфигурации. После того как модели отвечают, они анонимно критикуют и ранжируют ответы друг друга. Отдельный, более высокоуровневый ИИ (или т.н. «председатель») получает все эти ответы и их оценки, чтобы синтезировать финальный, более качественный итоговый ответ. Такой подход позволяет получить более надёжные и глубокие результаты, чем при работе с одной моделью, поскольку включает в себя экспертную оценку и коллективное принятие решений. По сути, Карпаты на коленке показал будущее поиска информации. Мы уходим от модели ""спросил > получил ответ"" к модели ""поставил задачу > агенты обсудили > выдали взвешенное решение"". Это уже не просто генерация текста, а верифицируемая аналитика. И за 30 центов это, пожалуй, самый дешевый консалтинг такого уровня, который можно найти на рынке."
"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по…
Источник
https://t.me/aivkube/590Канал AI в кубе |AI³ | Сергей Долгов · опубликовано 25 нояб. 2025 г.
Из этого канала
- #594Если вы когда-нибудь озабочивались тем, чтобы перевести в текст реально БОЛЬШОЙ…
Если вы когда-нибудь озабочивались тем, чтобы перевести в текст реально БОЛЬШОЙ аудиофайл в текст, то рекомендую вам графическую оболочку от Кая Дрёге из…
- #595"🚀 О важности ТЗ 🚀 В крупных каналах все восхищаются тем, как быстро Банана…
"🚀 О важности ТЗ 🚀 В крупных каналах все восхищаются тем, как быстро Банана Времени создает изображения с любой точки и из любой эпохи.
- #596"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки,…
"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки, сгенерированные ИИ (например, в озере отражается голубое небо, хотя сверху оно…
- #589Маша Яроцка, энтузиаст спейстеха из Лиссабона, опубликовала пост о том, как в…
Маша Яроцка, энтузиаст спейстеха из Лиссабона, опубликовала пост о том, как в эпоху AI выявлять эмоционально насыщенные дипфейки, особенно те из них, которые…
- #587OpenAI опубликовали небольшой гайд на 20 страниц по работе человеческой команды…
OpenAI опубликовали небольшой гайд на 20 страниц по работе человеческой команды с агентами.