Сегодня мы выложили улучшенную версию RefalMachine/RuadaptQwen3-4B-Instruct 🎉… — @AGI_and_RL

Сегодня мы выложили улучшенную версию RefalMachine/RuadaptQwen3-4B-Instruct 🎉 Модель стала лучше по всем фронтам: 1️⃣ На бенчмарке по каждой категории рост, в частности, на математике. 2️⃣ Стабильность модели повысилась (меньше циклов). 3️⃣ На арене также наблюдается рост (при снижении средней длины ответа!). Текущая версия (v2) на данный момент вероятно SoTA для русского языка среди всех тюнов и/или адаптаций 4B модели (на основании нашего бенчмарка). От исходной версии присутствуют небольшие отставания, однако на арене RuadaptQwen3-4B-Instruct стабильно обходит Qwen3-4B, а скорость генерации русскоязычного текста существенно лучше. Бенч можно посмотреть по ссылке (там без арены) https://huggingface.co/datasets/RefalMachine/llmtf_open_benchmark Улучшения связаны с более качественным post-training, включая использование нового SFT датасета (T-Wix), а также добавление preference-tune шага. Веса в основном репозитории и GGUF также обновлены: https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct https://huggingface.co/RefalMachine/RuadaptQwen3-4B-Instruct-GGUF

Из этого канала