ресечим/делаем (c) AI@researchim· 1 565 subs

[2601.20614] Harder Is Better: Boosting Mathematical Reasoning via…

30 янв. 2026 г.0 viewsОткрыть в Telegram →

[2601.20614] Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation https://arxiv.org/abs/2601.20614

Источник

https://t.me/researchim/5848

Канал ресечим/делаем (c) AI · опубликовано 30 янв. 2026 г.

Из этого канала

#5849[2601.22149] DynaWeb: Model-Based Reinforcement Learning of Web Agents…
[2601.22149] DynaWeb: Model-Based Reinforcement Learning of Web Agents https://arxiv.org/abs/2601.22149
#5852еще на 100к семплов потюнел)
еще на 100к семплов потюнел)
#5853вот 45к семплов сет
вот 45к семплов сет
#5847https://huggingface.co/Qwen/Qwen3-ASR-1.7B
https://huggingface.co/Qwen/Qwen3-ASR-1.7B
#5846недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой…
недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой огромный. Гигу можно на cpu крутить. vibe voice еще не тестил