Всего полгода назад, в июле 2025-го, на мировом чемпионате по программированию… — @seeallochnaya

Всего полгода назад, в июле 2025-го, на мировом чемпионате по программированию AHC (на оптимизационные задачи без чёткого верного решения) AI-системы уже показывали зубы: OpenAI заняли второе место, система от Sakana — 5-ое. Я писал про это вот тут. В прошедшем AHC058 (насколько я понимаю, менее крупное соревнование) агент ALE от Sakana AI занял чистое первое место, обойдя 804 живых участника, включая топовых грандмастеров. Это первый случай в истории, когда AI выиграл соревнование по оптимизации в реальном времени, участвуя на тех же условиях, что и люди — 4 часа на всю задачу. С технической точки зрения решение агента оказалось глубже задуманного авторами. Организаторы ожидали стандартную связку жадного алгоритма и имитации отжига, но агент реализовал по-другому — детали ищите в блоге. Авторы задач признали, что агент нашел алгоритмические пути, которые они сами не предусмотрели, эффективно закрыв разрыв в интуиции на основе экспериментов, которой раньше не хватало LLM при решении оптимизационных задач. Как мне кажется, это тесно связано с инсайтом, который я описывал для Gemini 3 Pro (и которым обладает GPT-5.2): возможность более эффективно учиться из обратной связи и улучшаться от итерации к итерации при решении какой-то задачи в несколько шагов. Это не ли не research taste? 😀 Победа обошлась примерно в $1,300 на API и потребовала суммарно около 4700 вызовов моделей GPT-5.2 и Gemini 3 Pro.

Из этого канала