«Да лан, чё мелочиться?» — подумали в Epoch.AI и вместо FrontierMath Tier 5 выпустили FrontierMath OpenProblems. Как следует из названия, моделям здесь предстоит решить открытые задачи из области исследовательской математики, которые профессиональные математики пытались решить, но не смогли. Для облегчения оценки включили только те задачи, для которых предложенные решения могут быть проверены автоматически (что заведомо ограничивает набор). Всего сейчас 14 задач, но открыта форма для заявок на добавление, и, надеюсь, она не пройдет мимо математиков. Задачи охватывают широкий спектр математических дисциплин. Пилотный набор задач имеет уклон в сторону комбинаторики и теории чисел, где больше всего задач, поддающихся автоматической проверке. Математиков, предоставивших задачи, опросили оценить, сколько математиков работали над проблемой и сколько времени, по их прикидкам, потребуется для решения людьми. Эти данные вы можете найти на картинке — есть задачи, которые оценили в 3-10 лет 😅 Удачи OpenAI, Google и другим компаниям. Ждём прорывов — сейчас модели не решают ни одну из задач.
«Да лан, чё мелочиться?» — подумали в Epoch.AI и вместо FrontierMath Tier 5…
Из этого канала
- #3328Так получается старик-то был почти прав? Немного месяца мб попутал, но прав?
Так получается старик-то был почти прав? Немного месяца мб попутал, но прав?
- #3329"Подумал, что в миграции я relate (прямой перевод ""относить/связывать себя с""…
"Подумал, что в миграции я relate (прямой перевод ""относить/связывать себя с"" не кажется аналогичным по смыслу) к комикам, мигрировавшим из РФ в США и…
- #3330В декабре я писал, что у Anthropic очень сдержанные и неамбициозные планы по…
В декабре я писал, что у Anthropic очень сдержанные и неамбициозные планы по наращиванию затрат на вычислительные мощности: «Если вдруг через 3 года окажется…
- #3326Осенью Andrej Karpathy, ко-фаундер OpenAI, Director of AI в Tesla и человек, на…
Осенью Andrej Karpathy, ко-фаундер OpenAI, Director of AI в Tesla и человек, на Стенфордских курсах которого выросли многие специалисты, ходил на подкаст, где…
- #3325Dario Amodei, CEO Anthropic, выпустил новое длинное эссе: The Adolescence of…
Dario Amodei, CEO Anthropic, выпустил новое длинное эссе: The Adolescence of Technology https://www.darioamodei.com/essay/the-adolescence-of-technology…