https://aweers.de/blog/2026/rl-for-llms/
0 viewsОткрыть в Telegram →
Из этого канала
- #6319A Multi-task Large Reasoning Model for Molecular Science…
A Multi-task Large Reasoning Model for Molecular Science https://arxiv.org/abs/2603.12808
- #6320Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights…
Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights https://arxiv.org/abs/2603.12228 https://www.alphaxiv.org/ru/overview/2603.12228
- #6321вот это кстати достаточно прикольно всего на 20б fineweb-edu потюнено и на…
вот это кстати достаточно прикольно всего на 20б fineweb-edu потюнено и на 8xh200
- #6317https://huggingface.co/GoedelMachines/Goedel-mHC-1B
https://huggingface.co/GoedelMachines/Goedel-mHC-1B
- #6316Привет, кто-то имеет опыт в настройке/сетапе команды агентов, скажем на…
Привет, кто-то имеет опыт в настройке/сетапе команды агентов, скажем на openclaw, для процесса разработки сайтов/приложений/чего-то еще? Или что-то близкое к…