Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

AMD выложили 3B модельки трененые на MI300X…

6 мар. 2025 г.2 108 views11 forwardsОткрыть в Telegram →

AMD выложили 3B модельки трененые на MI300X https://rocm.blogs.amd.com/artificial-intelligence/introducing-instella-3B/README.html https://github.com/AMD-AIG-AIMA/Instella https://huggingface.co/amd/Instella-3B-Instruct Надеюсь на обычных карточках тоже норм тюниться можно будет скоро. Хотя мб и щас можно там в репе инструкции лежат, но под mi300x

Источник

https://t.me/AGI_and_RL/981

Канал Агенты ИИ | AGI_and_RL · опубликовано 6 мар. 2025 г.

Из этого канала

#982хотел полистать серваки, открыл первый а там RL-агенты 🕺🕺🕺 Сразу понял что день…
хотел полистать серваки, открыл первый а там RL-агенты 🕺🕺🕺 Сразу понял что день будет отличным
#986Учим модельки решать интегралы через декомпозицию задач и обучение на более…
Учим модельки решать интегралы через декомпозицию задач и обучение на более простых вариантах. С RLем конечно же.
#987Там походу на редите засветились 4090 96гб Нада 😱…
Там походу на редите засветились 4090 96гб Нада 😱 https://www.reddit.com/r/LocalLLaMA/s/gHde13Isqx
#980Квены дают QwQ-32B. Моделька с размышлениями, которую можно у себя развернуть.…
Квены дают QwQ-32B. Моделька с размышлениями, которую можно у себя развернуть. Контекст 131,072 токенов https://qwenlm.github.io/blog/qwq-32b/…
#979reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю…
reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю Барто и Ричард Саттон получают премию Тьюринга за RL 🥳🕺🥰…