3я версия вышла, 216 страничек теперь. LLM RLя больше стало https://arxiv.org/abs/2412.05265v3
3я версия вышла, 216 страничек теперь. LLM RLя больше стало…
Из этого канала
- #1106Кстати, вообще считаю что вайбкодинг это очень круто если понимаешь что…
Кстати, вообще считаю что вайбкодинг это очень круто если понимаешь что делаешь. Прямо быстро можно прототипчик сделать чего угодно.
- #1107Ребят, если что интересного увидите в презухе гугла, черкните в коменты плиз И…
Ребят, если что интересного увидите в презухе гугла, черкните в коменты плиз И надо будет посчитать количество упоминаний ИИ агентов
- #1108https://huggingface.co/mistralai/Devstral-Small-2505 Новая кодовая агентная…
https://huggingface.co/mistralai/Devstral-Small-2505 Новая кодовая агентная открытая моделька от мистраля.
- #1104у любителей ллмного RLя сегодня снова приподнятое настроение там потюнили квен…
у любителей ллмного RLя сегодня снова приподнятое настроение там потюнили квен coder 7б с PPO, чтобы он оптимизировал асемблерный код.
- #1103Обзор по thinkingу от Лилиан Венг Why We Think…
Обзор по thinkingу от Лилиан Венг Why We Think https://lilianweng.github.io/posts/2025-05-01-thinking/