Только что подвели результаты ICPC, финала студенческой олимпиады по программированию. Наши любимые слоны, LRM, тоже участвовали. Система от OpenAI решила все 12 задач из 12 и заняла абсолютное первое место. Система принимала официальное участие, то есть её решения оценивались так же, как у остальных участников, и лимиты по времени были те же — никаких запусков на кластере на неделю. Задачи были переданы модели в точно таком же виде, в котором студенты получают их в PDF. Система сама выбирала, какие решения отправлять — так как есть ограничение, и нельзя сделать 100500 посылок. Для самой сложной задачи, двенадцатой, которую не решила ни одна другая команда, система достигла успеха на 9ую попытку. OpenAI говорит, что система работала так: экспериментальная рассуждающая модель общего назначения, которую не тренировали специально на ICPC (скорее всего, та же модель, что выиграла золото на IOI и IMO, чуть дообученная за прошедшее время) и GPT-5 генерировали решения, и первая выбирала результаты. В таком формате GPT-5 сгенерировала правильные решения для 11 задач из 12. Второе место заняли ребята из СПбГУ — респект, решили 11 из 12 задач! Все остальные команды решили 10 и меньше. Дальше идёт система от Google DeepMind, которая решила «всего лишь» 10 задач (тоже выдающийся результат), включая самую сложную. Блогпост тут. 📈 no progress so far, only the walls
Только что подвели результаты ICPC, финала студенческой олимпиады по…
Из этого канала
- #2867Результат в одном эмоуте:
Результат в одном эмоуте:
- #2869Можете скринить: когда LLM-система решит какую-то из известных нерешённых задач…
Можете скринить: когда LLM-система решит какую-то из известных нерешённых задач (малоизвестные уже были), то скептики будут говорить «да там всего лишь…
- #2871Ну ладно, что олимпиады да олимпиады — OpenAI потребовался всего месяц на то,…
Ну ладно, что олимпиады да олимпиады — OpenAI потребовался всего месяц на то, чтобы прикрутить к GPT-5-Thinking выбор длительности размышлений, который вы…
- #2864Реструктуризация OpenAI в двух графиках OpenAI уже довольно долгое время ведёт…
Реструктуризация OpenAI в двух графиках OpenAI уже довольно долгое время ведёт диалог со всеми заинтересованными лицами о том, чтобы превратиться из…
- #2862SemiAnalysis — про xAI: — кластер Colossus 1, построенный за рекордные 122 дня…
SemiAnalysis — про xAI: — кластер Colossus 1, построенный за рекордные 122 дня и вмещающий примерно 200'000 H100/H200 и ~30'000 GB200, остаётся самым большим…