magma_adamw еще тестить буду но оно сходится, вопрос в скорости и до чего опустится
magmaadamw еще тестить буду но оно сходится, вопрос в скорости и до чего…
0 viewsОткрыть в Telegram →
Из этого канала
- #6156https://github.com/vukrosic/muon-llm-research
https://github.com/vukrosic/muon-llm-research
- #6158Discovering Multiagent Learning Algorithms with Large Language Models…
Discovering Multiagent Learning Algorithms with Large Language Models https://arxiv.org/abs/2602.16928 https://www.alphaxiv.org/ru/overview/2602.16928
- #6159Меня зовут Эдуард. Я работаю там, где изобретательство встречается с изучением…
Меня зовут Эдуард. Я работаю там, где изобретательство встречается с изучением мира и этикой обитания.
- #6154с мюоном пока чот непонятное, оно вообще не сходится
с мюоном пока чот непонятное, оно вообще не сходится
- #6153VESPO: Variational Sequence-Level Soft Policy Optimization for Stable…
VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training https://arxiv.org/abs/2602.10693…