SakanaAI выпускают систему оркестрации агентов Sakana Fugu Это будет первый коммерческий пользовательский продукт стартапа. Буквально пару недель назад они также анонсировали B2B агента Sakana Marlin для работы над корпоративными отчетами и стратегиями. Понемногу выходят на рынок, в общем. Вся философия SakanaAI состоит в том, что самый мощный ИИ – это не монолитная модель, а совокупность разных движков. Все их исследования построены вокруг этой идеи, и теперь она воплощается в продукте. Устройство Fugu довольно занятное. Система сама по себе является небольшой языковой моделью, которая обучена вызывать другие LLM. То есть вместо того чтобы вручную прописывать механизмы, роли и рабочие процессы моделей (как это обычно делают), Sakana обучили модельку, которая хорошо умеет решать, кого вызвать, в какой роли и с какими подзадачами – и делает это адаптивно под конкретный запрос. Самое интересное: в какой-то момент обучения Fugu выяснила, что может вызывать саму себя, и научилась уходить в рекурсию. Получается, она как бы само-масштабируется на test-time, перечитывая собственные выходы и пересматривая стратегию координации агентов. Бенчмарки красивые. На SWE-Pro fugu-ultra (есть еще fugu-mini) достигает 54.2%. Для сравнения, Opus 4.6 берет 53.4. При этом очевидно, что качество работы Fugu будет еще расти, если добавить в пул модели помощнее, типа новой GPT-5.5 или Opus 4.7. Пока что Fugu выпустили в бету, записаться чтобы потестить можно тут. Что касается цены, Sakana не заставляют юзера платить сразу всем провайдерам, модели которых используются. Вы платите только Sakana, а дальше экономика на их стороне (они пишут, что так будет в десятки раз дешевле). P.S. Если интересно закопаться в механику, то почитайте вот эти две статьи: Trinity и Conductor. Это статьи Sakana с ICLR 2026, и лаба сама написала, что Fugu основана именно на них.
SakanaAI выпускают систему оркестрации агентов Sakana Fugu Это будет первый…
Из этого канала
- #9107"Помните разгромную аналитику от директора по ИИ в AMD, в которой она показала,…
"Помните разгромную аналитику от директора по ИИ в AMD, в которой она показала, что Claude Code стал работать хуже в марте? Anthropic только что признали, что…
- #9108Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят…
Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят сразу, и еще 30 – в будущем, при условии достижения определенных целей…
- #9109~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике…
~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике это небольшой процент.
- #9103DS Lab: что нового в нашей облачной IDE Продуктовая команда Data Secrets…
DS Lab: что нового в нашей облачной IDE Продуктовая команда Data Secrets продолжает активно развивать DS Lab и делать ее еще удобнее для гибкой аренды…
- #9099⚡️ Вышли новые модели от DeepSeek: DeepSeek-V4-Pro и DeepSeek-V4-Flash Обе…
⚡️ Вышли новые модели от DeepSeek: DeepSeek-V4-Pro и DeepSeek-V4-Flash Обе модели уже в опенсорсе и с контекстом до 1 миллиона токенов! – DeepSeek-V4-Pro: 1.6T…