Смешное из подкаста с ex-CTO OpenAI, Greg Brockman. Он рассказал про времена, когда компания занималась разработкой ботов для DOTA 2: — Мы хотели разработать новые RL алгоритмы, потому что всем в тот момент времени было очевидно, что тогдашние методы не масштабировались. Все знали это. Я помню мой коллега сказал: «а почему это так? Кто-то проверял? Мы правда это знаем?». Я тогда ответил, мол, да, это наш бейзлайн, мы должны отмасштабировать текущий метод и отталкиваться от него. Я помню, как приходил в офис каждую неделю: они удваивали количество ядер на сервере, они играли больше игр, рейтинг агента рос и рос. Я говорил, что нужно продолжать, пока мы не упрёмся в стену. А потом уже можно пойти заняться интересными вещами. И мы так и не упёрлись в стену... (прим.: у них по итогу работал тот же метод, PPO, что они придумали ранее. И им же годы спустя дообучали LLM-ки следовать инструкциям. И, вероятно, им же — или его модификацией — учат агентов / рассуждения. GRPO от DeepSeek — это модификация PPO) Клип (не знал эту историю, решил поделиться)
Смешное из подкаста с ex-CTO OpenAI, Greg Brockman. Он рассказал про времена,…
Из этого канала
- #2794Получил 81 запрос, закрыл форму — всем спасибо! Вопросы отбирал вручную, после…
Получил 81 запрос, закрыл форму — всем спасибо! Вопросы отбирал вручную, после фильтрации на бредовость/адекватность/итд осталось 67 Все ответы уже…
- #2795Помните классику? Ученый на интервью: «Все мои суждения бессмысленны, если они…
Помните классику? Ученый на интервью: «Все мои суждения бессмысленны, если они вырваны из контекста».
- #2796Ночные новости одной строкой: — DeepSeek выпустили новую модель, V3.1. По…
Ночные новости одной строкой: — DeepSeek выпустили новую модель, V3.1. По размерам и форм-фактору как R1/V3, и она сочетает в себе обычную + рассуждающую…
- #2792В комментарии скинули смешной пост про абсурдность инвестиций в AI/датацентры,…
В комментарии скинули смешной пост про абсурдность инвестиций в AI/датацентры, и что якобы у компаний нет объяснения, как они отобьют затраты.
- #2791Пашка Дуров снова решил приколоться и удалить комментарии у поста выше 🦔 Ваши…
Пашка Дуров снова решил приколоться и удалить комментарии у поста выше 🦔 Ваши комментарии оставляйте под этим постом