Вот и Google написали, что тоже выиграли золотую медальку (PR коммитет одобрил вординг): https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/ Их результаты, в отличии от OpenAI, отсмотрены, оценены и одобрены координаторами IMO. Получилось тоже 5 задач из 6, и столько же баллов: 35 / 42. Решения были получены продвинутой версией Gemini Deep Think (аналог o3-pro у OpenAI) — режим рассуждений для решения сложных задач, включающий некоторые из новейших исследовательских методов, включая распараллеливание генерации цепочек рассуждений. Это позволяет модели одновременно исследовать и комбинировать несколько возможных решений, прежде чем дать окончательный ответ, а не следовать единой линейной цепочке рассуждений. Google дополнительно обучили эту версию Gemini новым методом RL, который позволяет использовать больше данных для многошагового рассуждения и доказательства теорем. А ещё модели/системе также предоставили доступ к тщательно отобранному корпусу высококачественных решений задач и добавили в промпт несколько отдельных инструкций специально для IMO. К сожалению, из текста не ясно, использовались ли инструменты (кроме поиска по базе ответов), от поиска в интернете до Python и Lean-движков. Хорошая новость: Google планирует сделать эту версию Deep Think доступной для группы доверенных тестировщиков, включая математиков, а после распространить ее среди подписчиков Google AI Ultra. (Текст в скобках удалить, оплата по реквизитам после публикации)