Раз уж за дример пошло, то недавно натыкался на реп где чел реимплементнул его https://github.com/InexperiencedMe/NaturalDreamer
Раз уж за дример пошло, то недавно натыкался на реп где чел реимплементнул его…
Из этого канала
- #1019Там еще один фреймворк делают чтобы ллмы RLем учить…
Там еще один фреймворк делают чтобы ллмы RLем учить https://github.com/agentica-project/rllm А еще потюнили 14B модельку (из Deepseek-R1-Distilled-Qwen-14B)…
- #1020На архив приедут аудио саммари…
На архив приедут аудио саммари https://blog.arxiv.org/2025/04/08/arxiv-pilots-audio-summaries-in-partnership-with-sciencecast/ Пока доступны для High Energy…
- #1021Учимся с GRPO генерить длинные тексты В работе тюнят Qwen-2.5 7B-Instruct-1M и…
Учимся с GRPO генерить длинные тексты В работе тюнят Qwen-2.5 7B-Instruct-1M и 3B. Представим что мы хотим научить ллмку книги писать.
- #1017В nature решили вспомнить про Dreamer, прикольно…
В nature решили вспомнить про Dreamer, прикольно https://www.nature.com/articles/d41586-025-01019-w https://danijar.com/project/dreamerv3/ Кстати увидел, что…
- #1013Тут толпа исследователей из разных компаний и универов сделалил большую обзорку…
Тут толпа исследователей из разных компаний и универов сделалил большую обзорку по современным компонентам агентов Обучение, ризонинги, память, world models,…