Мы потихонечку входим в эпоху, где LLM настолько умны, что могут помогать в решении задач исследовательского уровня в математике и вносить meaningful contribution — по крайней мере если судить по ~~вайбам~~ выкладкам некоторых профессоров в твиттере. Я думаю, что момент, когда можно показать на конкретную работу и закричать «Оно! Видите? Ну вы видите?» ещё не наступил, но он витает в воздухе (даже несмотря на наличие FunSearch / AlphaEvolve). Всё больше и больше математиков из топовых университетов пишут про пользу моделей: тут помогли подкинули идею, там написали доказательство и сократили время, здесь помогли найти решение 30-летней давности для задачи, которая считалась нерешённой. Ernest Ryu, профессор математики в UCLA, пишет: — Я твёрдо убеждён, что мы находимся в переломном моменте в истории математики. В ближайшие годы использование больших языковых моделей в математических исследованиях станет обычной практикой, как и формализация доказательств в Lean, упрощённая благодаря LLM. В шахматах Magnus Carlsen сказал: «Был период, когда становилось очень явно видно, кто из игроков использовал [искусственный интеллект], а кто нет. Мы начали его применять и получили преимущество практически над всеми — это позволило нам намного глубже понять игру». То же самое произойдёт и в математике. Постепенно различные направления начнут собирать низко висящие плоды новой эпохи исследований с помощью LLM. Время от времени будут появляться результаты, явно достигнутые без участия LLM, и их будут отмечать как яркие вспышки человеческого гения. Я не знаю, каким будет финал. Сможет ли когда-нибудь LLM самостоятельно доказать важную нерешённую математическую проблему — покажет время. Но я уверен, что большие языковые модели значительно ускорят прогресс в математике. === Не думаю, что окно между «Ого, оно может вносить значимый вклад!» и «ого, я уже не могу вносить значимый вклад...» будет длинным (больше 10 лет).
Мы потихонечку входим в эпоху, где LLM настолько умны, что могут помогать в…
Из этого канала
- #3045Пару-тройку недель назад люди начали жаловаться, что Codex, кодинг агент +…
Пару-тройку недель назад люди начали жаловаться, что Codex, кодинг агент + модель от OpenAI, начали хуже работать.
- #3046Некоторые подробности 4-дневного увольнения Sam Altman осенью 2023-го года были…
Некоторые подробности 4-дневного увольнения Sam Altman осенью 2023-го года были раскрыты в среду на этой неделе в ходе суда, рассматривающего федеральный иск…
- #3047Но как он будет работать ночью, когда выключат свет? 🤔 Можно прочитать в…
Но как он будет работать ночью, когда выключат свет? 🤔 Можно прочитать в WhitePaper компании: ссылка Главная точка выгоды — энергия: по расчётам компании, за…
- #3043Интересная новость из свежей рассылки The Pragmatic Engineer: Во время моего…
Интересная новость из свежей рассылки The Pragmatic Engineer: Во время моего визита я встретился с Sulman Choudhry, который руководит направлениями инженерии и…
- #3042Вышел Cursor 2.0, и переход к новой мажорной версии сделан не просто так.…
Вышел Cursor 2.0, и переход к новой мажорной версии сделан не просто так. Теперь вдобавок к режиму IDE (среде разработки) добавлен режим Agent.