[2601.20614] Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation https://arxiv.org/abs/2601.20614
[2601.20614] Harder Is Better: Boosting Mathematical Reasoning via…
0 viewsОткрыть в Telegram →
Из этого канала
- #5849[2601.22149] DynaWeb: Model-Based Reinforcement Learning of Web Agents…
[2601.22149] DynaWeb: Model-Based Reinforcement Learning of Web Agents https://arxiv.org/abs/2601.22149
- #5852еще на 100к семплов потюнел)
еще на 100к семплов потюнел)
- #5853вот 45к семплов сет
вот 45к семплов сет
- #5847https://huggingface.co/Qwen/Qwen3-ASR-1.7B
https://huggingface.co/Qwen/Qwen3-ASR-1.7B
- #5846недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой…
недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой огромный. Гигу можно на cpu крутить. vibe voice еще не тестил