Сегодня ровно год с момента анонса первой рассуждающей модели компанией OpenAI. Тогда нам показали, что модель, обученная подумать перед ответом, достигает прорывных показателей, и этим можно управлять: дашь подумать подольше — ответ будет получше. OpenAI сказали сразу: это новая парадигма в масштабировании моделей; посмотрев на результаты и прикинув, что дальше, я с этим согласился и написал лонг: о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ. Ретроспективно оценивая последний год можно легко сказать, что это оказалось правдой. Прирост качества был настолько большим, что нерассуждающие модели использовать уже не хочется, и их релизы, например, GPT-4.5, могли вызвать разочарование. За год до этого две разные специализированные системы от Google смогли забрать серебро на международной олимпиаде по математике. В этом году из-за прогресса получилось выиграть золото — и моделью общего назначения, а не чем-то, что заточено только на геометрию или работу со специальным языком Lean4. Я рад, что за год получилось посмотреть на прогресс в масштабировании RL: o3, Grok 4 — в них объём вычислений, потраченных на RL, существенно превосходит оные в o1. Я ожидаю, что в следующий год мы ещё больше убедимся, как сильно подвинулась граница навыков моделей. А, и да... из всех топ-компаний только META не выпустила рассуждающую модель 😱😨
Сегодня ровно год с момента анонса первой рассуждающей модели компанией OpenAI.…
Из этого канала
- #2853Старый TED-talk от соавтора рассуждающих моделей из OpenAI:…
Старый TED-talk от соавтора рассуждающих моделей из OpenAI: https://youtu.be/MG9oqntiJKg (записи 6 месяцев, самому выступлению около 8).
- #2854Посмеялся с ситуации: — увидел рекламу — перешёл по ссылке — пролистал пост,…
Посмеялся с ситуации: — увидел рекламу — перешёл по ссылке — пролистал пост, кликнул по ссылке на бенчмарк компании — увидел, что GPT-5 в топе с большим…
- #2855Jupyter Agents: training LLMs to reason with notebooks Не статья, но блогпост…
Jupyter Agents: training LLMs to reason with notebooks Не статья, но блогпост от 🤗Huggingface про то, как они дообучали Qwen3-4b как Jupyter Agent — для…
- #2851Я подумал, что для обывателя эта сумма может быть непонятна. 300 миллиардов…
Я подумал, что для обывателя эта сумма может быть непонятна. 300 миллиардов долларов — это огромные деньги.
- #2850Две новости: — Microsoft заключили партнёрство с Nebius (заморская часть…
Две новости: — Microsoft заключили партнёрство с Nebius (заморская часть Yandex под контролем родившегося в Казахстане израильского предпринимателя Аркадия…