Сумбурных домашних апдейтов: - добавлена возможность продолжать трен с последнего чекпоинта если он был остановлен; - добавлены датасеты которые можно выкачать в нужном количестве - свои для претрена, свои для sft; а еще начата работа по нодовому редактору для того чтобы можно было визуально собирать свои вариации моделек; (пока еще в процессе разработки) Собрал граф модельки, запустил трен, проверил. Главное чтобы была свобода для исследований Напомню что модельки дома https://github.com/researchim-ai/models-at-home это студия для того чтобы тренить и тюнить модельки у себя дома. Идея в том чтобы как можно больше людей могли быстрее и проще вливаться в построение нейронок, даже если они поначалу плохо представляют себе что это. Пока так) Чем дальше делаю, тем больше хочется всего добавить, пока все это очень интересно Сейчас вот лмки добавляются Это конечно пока не релиз, там все в активной разработке и допиле. Но вроде шевелится) Т.к. планируется что это будет еще и учебная штука, то попозже планирую завозить туда побольше полезной инфы и мб некоторый учебник делать Давно ничего не писал, в основном этой штукой занимаюсь когда время есть чтобы попробовать нужны компьютер с видеокартой (8гб в целом пойдет), git и docker тут можно следить за проектом https://t.me/researchim хотя я думаю что и в канал буду много писать про этот проект
Сумбурных домашних апдейтов: - добавлена возможность продолжать трен с…
Из этого канала
- #1267С Новым Годом ребятки! Всего только хорошего! 🥰🥳🥰 Чтобы чисто кайфовали весь…
С Новым Годом ребятки! Всего только хорошего! 🥰🥳🥰 Чтобы чисто кайфовали весь следующий год и дальше :)
- #1268Автор собрал и описал в одном посте все улучшайки GRPO…
Автор собрал и описал в одном посте все улучшайки GRPO https://cameronrwolfe.substack.com/p/grpo-tricks
- #1269а там кстати дипсики R1 статью апдейтнули 4 числа еще 22 -> 86 страниц…
а там кстати дипсики R1 статью апдейтнули 4 числа еще 22 -> 86 страниц подробностей насыпали DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via…
- #1263🎄 Релизим 67 074 траектории Qwen3-Coder с OpenHands + 2 RFT чекпоинта. > Мы…
🎄 Релизим 67 074 траектории Qwen3-Coder с OpenHands + 2 RFT чекпоинта. > Мы выкладываем: 67 000+ траекторий по 3 800 решенным задачам в 1 800+ Python…
- #1262день сменяется ночью новый проект в ресечим…
день сменяется ночью новый проект в ресечим https://github.com/researchim-ai/models-at-home выходят новые модельки от ОпенАИ, от Гугла Настало время и своей…