Вау! https://qwenlm.github.io/blog/qwen3/
Из этого канала
- #3602Qwen3 models are supporting 119 languages and dialects. И наконец-то есть…
Qwen3 models are supporting 119 languages and dialects. И наконец-то есть полный список этих языков с разбивкой на семьи.
- #3603Хороший толк для прослушивания во время утренней прогулки. Сотрудники…
Хороший толк для прослушивания во время утренней прогулки. Сотрудники Антропика, работающие над вопросами model welfare и наличия сознания у моделей,…
- #3604Мне кажется, одним из следующих больших майлстоунов в обучении фронтирных…
Мне кажется, одним из следующих больших майлстоунов в обучении фронтирных моделей будет обучение на большом, актуальном и курируемом массиве учебной и научной…
- #3592Новые оптимизаторы -- это вообще интересная тема, там тоже постоянно что-то…
Новые оптимизаторы -- это вообще интересная тема, там тоже постоянно что-то появляется, и какая-то новая теория в том числе.
- #3591Muon Optimizer Accelerates Grokking Amund Tveit, Bjørn Remseth, Arve Skogvold…
Muon Optimizer Accelerates Grokking Amund Tveit, Bjørn Remseth, Arve Skogvold Статья: https://arxiv.org/abs/2504.16041 Любопытная история про гроккинг, здесь…