Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights https://arxiv.org/abs/2603.12228 https://www.alphaxiv.org/ru/overview/2603.12228
Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights…
0 viewsОткрыть в Telegram →
Из этого канала
- #6321вот это кстати достаточно прикольно всего на 20б fineweb-edu потюнено и на…
вот это кстати достаточно прикольно всего на 20б fineweb-edu потюнено и на 8xh200
- #6325Никто ничего не постил тут про это
Никто ничего не постил тут про это
- #6326mHC же дипсиковская идея?
mHC же дипсиковская идея?
- #6319A Multi-task Large Reasoning Model for Molecular Science…
A Multi-task Large Reasoning Model for Molecular Science https://arxiv.org/abs/2603.12808
- #6318https://aweers.de/blog/2026/rl-for-llms/
https://aweers.de/blog/2026/rl-for-llms/