кстати у нас в студию для трена моделек дома в веб-интерфейсе заезжают новые фичи https://github.com/researchim-ai/models-at-home Это приложение для тех кто с наимаеньшими усилиями хотел бы начать тюнить модельки. Таков замысел Нужен правда поставить docker и git Сейчас можно делать претрен, sft и грпо небольших моделек. Кстати grpo поддерживает lora и это довольно экономично выходит по памяти. 1.5b моделька в sdpo (grpo с модификациями из одной новой статьи) с лорой ~12bg vram (там 2 экземпляра модельки грузится) на 2к контекста на gsm8k-ru. на вид обучается быстрее обычного grpo вполне можно потестить скоро еще больше обновлений. хочу затащить страничку для работы с данными и генережкой семплов из https://github.com/researchim-ai/re-rl и другие енвайроменты ну и пока что там страничка с ллмами только. в дальнейшем планирую разделы из других областей для/мля с возможностью тюнинга моделек или трена с 0 под разные задачи а следить за проектами и за ИИнформацией можно в https://t.me/researchim
кстати у нас в студию для трена моделек дома в веб-интерфейсе заезжают новые…
Из этого канала
- #1292там походу надвигается волна китайских релизов сейчас GLM-5 744B 40A…
там походу надвигается волна китайских релизов сейчас GLM-5 744B 40A https://z.ai/blog/glm-5 прикольно что челы сориентировались в ситуации и сразу говорят мол…
- #1294еще одни пошли - MiniMax M2.5 как и у всех - больше агенточного, больше рля (в…
еще одни пошли - MiniMax M2.5 как и у всех - больше агенточного, больше рля (в 2026 все хотят делать рл) 229B и как я понял 10A (экономично по сравнению с…
- #1295на прошлой неделе прикручивал lean в re-rl…
на прошлой неделе прикручивал lean в re-rl https://github.com/researchim-ai/re-rl для генережки данных, чтобы можно было генерить пары (состояние, тактика) для…
- #1290А вот и он: https://www.ikot.blog/anthropic-take-home-for-dummies Это мой…
А вот и он: https://www.ikot.blog/anthropic-take-home-for-dummies Это мой первый блог на английском языке, спасибо Gemini 3 Pro за помощь в переводе.
- #1289Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace…
Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace вышел ТехРепорт по VLA, которая работает на разных роботах в том числе и нашем…