Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini 3 и выбивает 46.4% на HLE Систему дотюнивали с помощью многоступенчатого RL, чтобы она точнее искала и меньше галлюцинировала на сложных запросах. В итоге на Humanity’s Last Exam скор относительно Gemini 3 Pro вырос на три процентных пункта, а на внутреннем бенчмарке DeepSearch QA – на десять. Этот внутренний бенчмарк, Google, кстати, опенсорснули (www.kaggle.com/benchmarks/google/dsqa). P.S. На графике обратите внимание, что GPT-5 Pro специально гоняют в несколько потоков (именно так из коробки работает Deep Research у Google и OpenAI), чтобы сравнение было честным.