Один раз исследователи не написали обзорку по агентам, больше их никто не видел Эти написали. И в основном они из salesforce (они иногда очень прикольные вещи делают 🥰) обозреваем A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems https://arxiv.org/abs/2504.09037
Один раз исследователи не написали обзорку по агентам, больше их никто не видел…
Из этого канала
- #1042так смешнее
так смешнее
- #1043Genius: Когда языковая модель начинает учиться сама Представьте: вы не даёте…
Genius: Когда языковая модель начинает учиться сама Представьте: вы не даёте модели ни правильных ответов, ни правил, ни внешнего оценщика.
- #1044Дополню ещё ссылкой на код, там ссылка на hf с модельками тоже есть…
Дополню ещё ссылкой на код, там ссылка на hf с модельками тоже есть https://github.com/xufangzhi/Genius
- #1039Ребята из OpenPipe выкладывают Agent Reinforcement Trainer (ART)…
Ребята из OpenPipe выкладывают Agent Reinforcement Trainer (ART) https://github.com/OpenPipe/ART Пишут что есть multi-turn.
- #1038Не кажется ли вам, что инновации ОпенАИ как бы подсократились в последнее…
Не кажется ли вам, что инновации ОпенАИ как бы подсократились в последнее время? Ресерч их как будто сжался