https://github.com/researchim-ai/models-at-home мейн немножко обновил, завез sdpo. пока все в тестовом режиме. rlная часть завтра еще будет перерабатываться немного. Кстати ребятки если есть желание то присоединяйтесь к разработке моделек дома или https://github.com/researchim-ai/re-rl Идеи приветствуются, пуши приветствуются) Ну и звездочки тоже классно было бы
https://github.com/researchim-ai/models-at-home мейн немножко обновил, завез…
0 viewsОткрыть в Telegram →
Из этого канала
- #5896Рад поделиться тем, что у нас с ребятами вышла папира VLA для роботов на HF:…
Рад поделиться тем, что у нас с ребятами вышла папира VLA для роботов на HF: https://huggingface.co/papers/2602.00919 Сейчас мы топ-2, но боремся с KIMI-2.5…
- #5899если ты побольше в этом посте распишешь про суть то я бы просто в канал…
если ты побольше в этом посте распишешь про суть то я бы просто в канал репостнул я итак могу канеш но люди не поймут прикола
- #5900SWE-Universe: Scale Real-World Verifiable Environments to Millions…
SWE-Universe: Scale Real-World Verifiable Environments to Millions https://arxiv.org/abs/2602.02361
- #5894завтра буду перерабатывать интерфейс работы с ревардами. мне не нравится…
завтра буду перерабатывать интерфейс работы с ревардами. мне не нравится нынешний конструктор правил в целом-то он норм но мб хочется дать простопользователю…
- #5893Quartet II Выложили препринт новой статьи про претрен LLMок в NVFP4. Качество…
Quartet II Выложили препринт новой статьи про претрен LLMок в NVFP4. Качество лучше и кернелы быстрее. Статью лайкать на HF Daily Papers.