А в студии модельки дома https://github.com/researchim-ai/models-at-home заехало много апдейтов * например unsloth для тюнинга лор в грпо * можно тюнить 1.5b квен на фуле на 2х 3090 с 8k контекстом в sft например на таком датасете для математики https://huggingface.co/datasets/attn-signs/gromov-max/ Дальше займусь инструкциями и документациями. Там может не все быть понятно, поэтому будем пояснять что и как Пока что это еще не релиз, но он уже на горизонте Как только внутри будет документация более понятная и все протесчено, то релизнемся и я буду много об этой штуке писать. Планы большие на эту вещь) И с каждым днем все больше идей чего там внутрь можно засунуть. Пока только начинаем Кстати я студией уже 1.5 месяца занимаюсь (первый пост https://t.me/AGI_and_RL/1262) и все еще кайфую, значит правильно все делается Следить за проектом и задавать вопросики можно в https://t.me/researchim
А в студии модельки дома https://github.com/researchim-ai/models-at-home…
Из этого канала
- #1278все будут. 🐺🐻🐂🐅
все будут. 🐺🐻🐂🐅
- #1283На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме…
На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме совсем оборзели.
- #1284В модельках дома большие апдейты - завезен английский язык, куча багов…
В модельках дома большие апдейты - завезен английский язык, куча багов пофикшена. https://github.com/researchim-ai/models-at-home И докручивается…
- #1275очередная обзорная статья на агенточную тему, давно не скидывал за 2025 много…
очередная обзорная статья на агенточную тему, давно не скидывал за 2025 много всего понаписали/навайбресерчили Agentic Reasoning for Large Language Models…
- #1274держу в курсе: а у нас в модельки дома заезжает потихонечку grpo…
держу в курсе: а у нас в модельки дома заезжает потихонечку grpo https://github.com/researchim-ai/models-at-home напомню это визуальная студия чтобы тюнить…