ребятки напомню про проекты наши и что к ним можно присоединиться. PRы приветствуются, любые полезные идеи приветсвуются прямо сейчас больше всего развивается студия для трена моделек (претрен, сфт, грпо) https://github.com/researchim-ai/models-at-home и https://github.com/researchim-ai/re-rl - это библиотека для синтетических данных Если проекты вам нравятся то можно прожать звездочки на гитхабе, было бы славно
ребятки напомню про проекты наши и что к ним можно присоединиться. PRы…
0 viewsОткрыть в Telegram →
Из этого канала
- #6018Deep Learning for Molecules & Materials https://dmol.pub/
Deep Learning for Molecules & Materials https://dmol.pub/
- #6019https://github.com/researchim-ai/vending-env накидал енв по статье…
https://github.com/researchim-ai/vending-env накидал енв по статье https://t.me/researchim/93/6015 думаю может быть пригодно для наших задач) может потреним…
- #6023Rubric-Based Rewards for RL https://cameronrwolfe.substack.com/p/rubric-rl
Rubric-Based Rewards for RL https://cameronrwolfe.substack.com/p/rubric-rl
- #6016https://github.com/thomasip1/vending-rl-env
https://github.com/thomasip1/vending-rl-env
- #6015Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents…
Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents https://arxiv.org/abs/2502.15840 https://www.alphaxiv.org/overview/2502.15840