Gemini 2.5 Pro прошла Pokemon Blue Всего пару месяцев назад Claude посадили играть в покемонов, где модель успешно застряла на одном моменте. Cейчас у Gemini 2.5 Pro вышло пройти игру полностью. Достижение заметное, но не означает превосходство одной модели над другой — модели запускали в разных средах с разным доступом к инфе. К примеру, помимо картинки, Gemini получала некоторые данные напрямую из движка игры и имела несколько подсказок по прохождению в промпте, без этого у модели играть не выходит. Да и в тренировочных данных ллм было полно инфы и советов по прохождению, с новой игрой было бы сложнее. Вообще хотелось бы, чтобы это оформили в виде бенчмарка, но тут важно чтобы не пришли юристы Нинтендо и не засудили всех причастных. А как такое появится, там и до спидранов недалеко. @ai_newz
Gemini 2.5 Pro прошла Pokemon Blue Всего пару месяцев назад Claude посадили…
Из этого канала
- #3887Google выкатил на весь США свой новый режим поиска «AI Mode» – это новая…
Google выкатил на весь США свой новый режим поиска «AI Mode» – это новая вкладка вроде картинок, карт, а внутри что-то вроде поиска в чатгпт или перплексити, с…
- #3888Нейродайджест за неделю (#67) LLM - Qwen 3 — открытые гибридные ризонеры, SOTA…
Нейродайджест за неделю (#67) LLM - Qwen 3 — открытые гибридные ризонеры, SOTA в своих классах.
- #3889Radiance Fields and the Future of Generative Media Обзорная лекция от бати…
Radiance Fields and the Future of Generative Media Обзорная лекция от бати нерфов, Джона Баррона, где он проходится по своему ресёрчу и истории radiance…
- #3885"Сегодня день трудящихся, поэтому принес вам пример отличной карьеры трудяги.…
"Сегодня день трудящихся, поэтому принес вам пример отличной карьеры трудяги. Чел вырос с mid-level Research Scientist до Директора за 3.5 года! Еще и постит…
- #3876F Lite — 10B t2i на лицензированных данных Опенсорсная модель основанная на…
F Lite — 10B t2i на лицензированных данных Опенсорсная модель основанная на лицензированном датасете в 80 млн изображений.