QED-Nano: Teaching a Tiny Model to Prove Hard Theorems https://huggingface.co/spaces/lm-provers/qed-nano-blogpost#introducing-qed-nano-a-4b-model-for-olympiad-level-proofs
QED-Nano: Teaching a Tiny Model to Prove Hard Theorems…
0 viewsОткрыть в Telegram →
Из этого канала
- #6008интересно на мелких размерах такое повторить бы (всм еще более мелких)…
интересно на мелких размерах такое повторить бы (всм еще более мелких) https://t.me/researchim/3/6007
- #6009симулятор нефтянки и атомного реактора добавлять надо! ни у кого еще таких…
симулятор нефтянки и атомного реактора добавлять надо! ни у кого еще таких енвов не было правда мб это тоже в отдельный агенточный енв лучше
- #6010https://github.com/zeroclaw-labs/zeroclaw с 0 до 5к звезд на гитхабе за 2 дня
https://github.com/zeroclaw-labs/zeroclaw с 0 до 5к звезд на гитхабе за 2 дня
- #6006Какие енвы еще можно добавить в re-rl? https://github.com/researchim-ai/re-rl я…
Какие енвы еще можно добавить в re-rl? https://github.com/researchim-ai/re-rl я давно хотел lean добавить теперь он есть в целом наверное можно идти в…
- #6003CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and…
CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and Multi-Step Agentic Tool Use https://arxiv.org/abs/2602.12268…