AMD выложили 3B модельки трененые на MI300X https://rocm.blogs.amd.com/artificial-intelligence/introducing-instella-3B/README.html https://github.com/AMD-AIG-AIMA/Instella https://huggingface.co/amd/Instella-3B-Instruct Надеюсь на обычных карточках тоже норм тюниться можно будет скоро. Хотя мб и щас можно там в репе инструкции лежат, но под mi300x
AMD выложили 3B модельки трененые на MI300X…
Из этого канала
- #982хотел полистать серваки, открыл первый а там RL-агенты 🕺🕺🕺 Сразу понял что день…
хотел полистать серваки, открыл первый а там RL-агенты 🕺🕺🕺 Сразу понял что день будет отличным
- #986Учим модельки решать интегралы через декомпозицию задач и обучение на более…
Учим модельки решать интегралы через декомпозицию задач и обучение на более простых вариантах. С RLем конечно же.
- #987Там походу на редите засветились 4090 96гб Нада 😱…
Там походу на редите засветились 4090 96гб Нада 😱 https://www.reddit.com/r/LocalLLaMA/s/gHde13Isqx
- #980Квены дают QwQ-32B. Моделька с размышлениями, которую можно у себя развернуть.…
Квены дают QwQ-32B. Моделька с размышлениями, которую можно у себя развернуть. Контекст 131,072 токенов https://qwenlm.github.io/blog/qwq-32b/…
- #979reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю…
reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю Барто и Ричард Саттон получают премию Тьюринга за RL 🥳🕺🥰…