ресечим/делаем (c) AI@researchim· 1 565 subs

ребятки во всю делаю дизайн ревардов в grpo скоро апдейтик уже инференс…

24 янв. 2026 г.0 viewsОткрыть в Telegram →

ребятки во всю делаю дизайн ревардов в grpo скоро апдейтик уже инференс пофикшен вроде система конечно постепенно усложняется, но с ллм рлем прям очень просто сделать нельзя пока

Источник

https://t.me/researchim/5738

Канал ресечим/делаем (c) AI · опубликовано 24 янв. 2026 г.

Из этого канала

#5739ну это все потом очень сильно тестить будем и мне щас нужно на разных сетах…
ну это все потом очень сильно тестить будем и мне щас нужно на разных сетах потеститься
#5740Я недавно увидел проект Heretic ( https://github.com/p-e-w/heretic ), и там они…
Я недавно увидел проект Heretic ( https://github.com/p-e-w/heretic ), и там они интересную вещь делают - обучают только attn.oproj и mlp.downproj Т.е, чтобы…
#5741"На моменте PreTraining, модель скорее всего выучивает все свои знания, на SFT…
"На моменте PreTraining, модель скорее всего выучивает все свои знания, на SFT она просто выучивает ""стиль"" предсказания следующего токена, в нужной манере…
#5737🗣 Qwen3-TTS - мощный open-source релиз (voice design + клонирование голоса)…
🗣 Qwen3-TTS - мощный open-source релиз (voice design + клонирование голоса) Qwen официально выпустили Qwen3-TTS и полностью открыли всю линейку моделей - Base…
#5736я тестирую falcon-h1r-7b последнюю неделю, по ощущению 10/10 локальная модель,…
я тестирую falcon-h1r-7b последнюю неделю, по ощущению 10/10 локальная модель, я только не тестил еще с вызовом функции, но генерит адекватный текст и быстрый