На GPU Mode недавно вышла 3-х часовая лекция про RL, Агентов и фреймворк для создания и работы со средами OpenEnv. Выступают рассказчики из unsloth, лицехватс и разработчики торча. Довольно содержательно и познавательно. В частности, разбираются характерные нюансы и проблемы обучения с подкреплением.
На GPU Mode недавно вышла 3-х часовая лекция про RL, Агентов и фреймворк для…
Из этого канала
- #5724На м4 маке 64 гб можно запустить трейн? Если да, я бы потестировал
На м4 маке 64 гб можно запустить трейн? Если да, я бы потестировал
- #5725Можно но не нужно, Mac только для инференца
Можно но не нужно, Mac только для инференца
- #5726Лучше GLM-4.7 flash запусти и скажи своё мнение)
Лучше GLM-4.7 flash запусти и скажи своё мнение)
- #5721в смысле как есть lm studio это чат с модельками. мы тоже можем сделать свой.…
в смысле как есть lm studio это чат с модельками. мы тоже можем сделать свой. но пока не знаю стоит ли это развивать. но думаю что позже
- #5720Кстати. Вопрос инференса в целом большой. У нас студия для трена моделек в…
Кстати. Вопрос инференса в целом большой. У нас студия для трена моделек в первую очередь.