Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini 3 и выбивает 46.4% на HLE Систему дотюнивали с помощью многоступенчатого RL, чтобы она точнее искала и меньше галлюцинировала на сложных запросах. В итоге на Humanity’s Last Exam скор относительно Gemini 3 Pro вырос на три процентных пункта, а на внутреннем бенчмарке DeepSearch QA – на десять. Этот внутренний бенчмарк, Google, кстати, опенсорснули (www.kaggle.com/benchmarks/google/dsqa). P.S. На графике обратите внимание, что GPT-5 Pro специально гоняют в несколько потоков (именно так из коробки работает Deep Research у Google и OpenAI), чтобы сравнение было честным.
Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini…
Из этого канала
- #8492Google выпустили статью про SIMA-2. Оказалось, что агент способен на…
Google выпустили статью про SIMA-2. Оказалось, что агент способен на самообучение. SIMA-2 – это ИИ-агент для игр.
- #8493Самая внезапная новость за неделю: Zoom (да, тот самый) выбил со своей…
Самая внезапная новость за неделю: Zoom (да, тот самый) выбил со своей моделькой SOTA результат на Humanity’s Last Exam Со скором 48.1% они опередили…
- #8494Google понемногу двигаются к тому, чтобы обучать роботов с помощью ИИ-моделей…
Google понемногу двигаются к тому, чтобы обучать роботов с помощью ИИ-моделей мира Они выпустили статью, в которой сделали первый большой шаг к соединению Veo…
- #8490Сегодня OpenAI исполняется ровно 10 лет О создании компании было объявлено 12…
Сегодня OpenAI исполняется ровно 10 лет О создании компании было объявлено 12 декабря 2015 года.
- #8489MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий…
MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий Компания предлагает готовые серверы с графическими ускорителями прямо у вас на…