Тут толпа исследователей из разных компаний и универов сделалил большую обзорку по современным компонентам агентов Обучение, ризонинги, память, world models, много про RL, реварды, действия и вызов тулов, эволюционные системы, самоулучшение, сейфти и вообще куча всего 190 страниц текста и 74 страницы ссылок красота, стоит обратить внимание Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems https://arxiv.org/abs/2504.01990 Листик со ссылками https://github.com/FoundationAgents/awesome-foundation-agents
Тут толпа исследователей из разных компаний и универов сделалил большую обзорку…
Из этого канала
- #1017В nature решили вспомнить про Dreamer, прикольно…
В nature решили вспомнить про Dreamer, прикольно https://www.nature.com/articles/d41586-025-01019-w https://danijar.com/project/dreamerv3/ Кстати увидел, что…
- #1018Раз уж за дример пошло, то недавно натыкался на реп где чел реимплементнул его…
Раз уж за дример пошло, то недавно натыкался на реп где чел реимплементнул его https://github.com/InexperiencedMe/NaturalDreamer
- #1019Там еще один фреймворк делают чтобы ллмы RLем учить…
Там еще один фреймворк делают чтобы ллмы RLем учить https://github.com/agentica-project/rllm А еще потюнили 14B модельку (из Deepseek-R1-Distilled-Qwen-14B)…
- #1012Есть такой проектик tiny-grpo от ребят из open-thoughts:…
Есть такой проектик tiny-grpo от ребят из open-thoughts: https://github.com/open-thought/tiny-grpo типа минималистичный имплемент грпо.
- #1011Еще обзорок по тест-тайм скейлингам и мультиагентам ? Ни слова больше What,…
Еще обзорок по тест-тайм скейлингам и мультиагентам ? Ни слова больше What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models…