К вопросу о прогрессе. Агент от SakanaAI занял уверенное первое место на соревновании по кодингу. В прошлом году на этом же конкурсе агент от OpenAI занял только второе место. В AtCoder Heuristic Contest в этом году принимало участие около 800 человек. ALE-Agent от японской лаборатории обошел всех и с приличным отрывом взял топ. Стоимость решения составила примерно $1300. При этом, что интересно: сами авторы оптимизационной задачи этого года предполагали классический подход с использованием отжига и конструктивных эвристик, но агент Sakana пошел другим путем. Он внезапно реализовал эвристику virtual power, и это позволило ему выходить из локальных оптимумов даже лучше, чем эксперты-люди. Агент представляет из себя достаточно хитрую обертку над (в данном случае) GPT‑5.2 high и Gemini 3 Pro high. Сами Sakana, в плане моделей, звезд с неба никогда не хватали, но научились грамотно работать с inference time scaling – и вот результат. Одним словом, молодцы. https://sakana.ai/ahc058/
К вопросу о прогрессе. Агент от SakanaAI занял уверенное первое место на…
Из этого канала
- #8604Очень интересная статья от MIT про дообучение моделей после деплоя Фанфэкт:…
Очень интересная статья от MIT про дообучение моделей после деплоя Фанфэкт: некоторые из авторов работают в OpenAI, так что читаем внимательно 🤨 Подход красиво…
- #8606Агент Axiom Prover решил 12 из 12 задач на самом сложном математическом…
Агент Axiom Prover решил 12 из 12 задач на самом сложном математическом экзамене в мире Возможно, вы помните, что это за система.
- #8607У Суцкевера «нашли» 4 миллиарда долларов в акциях OpenAI Все новые и новые…
У Суцкевера «нашли» 4 миллиарда долларов в акциях OpenAI Все новые и новые интересные детальки пазла несет нам иск Илона Маска против OpenAI.
- #8602Первые отзывы на ChatGPT Health полетели
Первые отзывы на ChatGPT Health полетели
- #8601Ученые из Университета Ватерлоо (Канада) впервые придумали способ безопасно…
Ученые из Университета Ватерлоо (Канада) впервые придумали способ безопасно сохранять и дублировать информацию в квантовых компьютерах Раньше это считалось…