ИИ-система стартапа, существующего 4 месяца, решила 9/12 задач в одном из самых сложных в мире экзаменов по математике Putnam (полное название William Lowell Putnam Mathematical Competition) – это ежегодная очень сложная математическая олимпиада для студентов бакалавриата университетов США и Канады. Она считается сложнейшей на этом уровне. Средний результат часто составляет примерно 0–1 балл из 120. В этом году олимпиада проходила на этих выходных. А сегодня никому не известный очень молодой стартап Axiom объявил о том, что их система AxiomProver решила 9/12 задач конкурса (8 из них в течение самого соревнованию, и одну после его окончания). Это очень высокий результат. По прошлогодней шкале это было бы абсолютное первое место среди ~4000 участников + статус Putnam Fellow (топ‑10 за несколько лет). В этом году место пока неизвестно, потому что ранг зависит от общего распределения баллов. Интересно, что модель не просто доказала утверждения на естественном языке, а формализовала их в Lean. То есть каждое решение уже дано в виде машинно-проверяемого proof‑скрипта. Интересно, участвовали ли Google и OpenAI
ИИ-система стартапа, существующего 4 месяца, решила 9/12 задач в одном из самых…
Из этого канала
- #8451Продуктовая команда Data Secrets выходит из стелса Утро понедельника –…
Продуктовая команда Data Secrets выходит из стелса Утро понедельника – прекрасное время, чтобы поделиться с вами большими (и полезными!) новостями.
- #8452⚡️ Мы запускаем DS Lab – облачную IDE для удобной работы с мощным железом…
⚡️ Мы запускаем DS Lab – облачную IDE для удобной работы с мощным железом Почти каждый, кто когда-либо пытался арендовать GPU или другие ресурсы, сталкивался с…
- #8453Все, Google планируют становиться полноценным конкурентом Nvidia: к 2027 году…
Все, Google планируют становиться полноценным конкурентом Nvidia: к 2027 году они хотят произвести 5 миллионов чипов TPU Такие объемы однозначно намекают на…
- #8449Яков и Партнёры и Яндекс представили ежегодный аналитический репорт…
Яков и Партнёры и Яндекс представили ежегодный аналитический репорт «Искусственный интеллект в России — 2025: тренды и перспективы» Очень много любопытных…
- #8448Андрей Карпаты снова выдал красивую базу Он говорит, что нельзя забывать, что…
Андрей Карпаты снова выдал красивую базу Он говорит, что нельзя забывать, что LLM – симуляторы, а не самостоятельные сущности, и что это нужно учитывать при…