Ребятки, у нас промежуточный апдейт мейна! https://github.com/researchim-ai/models-at-home заехал анслот) чтобы активировать надо в GRPO вкладке выбрать Training Backend: Unsloth и lora/qlora завтра буду еще полировать и инфы забью и прочего и багов мб пофикшу каких) unsloth это для тех особенно у кого ну ресурсов немного в single-gpu режиме он мощней всего Но я с ним пока незакончил. я все же хочу его нормально в DDP с vllm поднять
Ребятки, у нас промежуточный апдейт мейна!…
0 viewsОткрыть в Telegram →
Из этого канала
- #5717кстати, когда более-менее все норм будет, то начну версионирование уже. пока…
кстати, когда более-менее все норм будет, то начну версионирование уже. пока рано)
- #5719Щас прорабатываю вопросы инференса моделей после всех стадий трейна. не до…
Щас прорабатываю вопросы инференса моделей после всех стадий трейна. не до конца проработано было.
- #5720Кстати. Вопрос инференса в целом большой. У нас студия для трена моделек в…
Кстати. Вопрос инференса в целом большой. У нас студия для трена моделек в первую очередь.
- #5714охота сверху иметь сводную табличку которая бы показывала основные аспекты…
охота сверху иметь сводную табличку которая бы показывала основные аспекты перед запуском. делаю часто когда трен ставишь надо все по конфигам перепроверить
- #5713можно еще лору протестить) это легче и быстрее должно быть, но уже не фултюн…
можно еще лору протестить) это легче и быстрее должно быть, но уже не фултюн весов