Rubric-Based Rewards for RL https://cameronrwolfe.substack.com/p/rubric-rl
Rubric-Based Rewards for RL https://cameronrwolfe.substack.com/p/rubric-rl
0 viewsОткрыть в Telegram →
Из этого канала
- #6024в https://github.com/researchim-ai/models-at-home обнова заехала с обучающей…
в https://github.com/researchim-ai/models-at-home обнова заехала с обучающей инфой) Скоро будет больше
- #6025Завтра покрутим вендинг-енв мне интересно что получится
Завтра покрутим вендинг-енв мне интересно что получится
- #6026https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpu…
https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpuin12hours
- #6019https://github.com/researchim-ai/vending-env накидал енв по статье…
https://github.com/researchim-ai/vending-env накидал енв по статье https://t.me/researchim/93/6015 думаю может быть пригодно для наших задач) может потреним…
- #6018Deep Learning for Molecules & Materials https://dmol.pub/
Deep Learning for Molecules & Materials https://dmol.pub/