Выложили QVikhr-3-1.7B на основе Qwen-3-1.7B, лучшая в классе и обгоняет лучшие модели. Ризонинг прямо сейчас выключен, будет позже. Но и без него модель обходит стандартную модель с включенным ризонингом. А самое главное, можно запустить на CPU и не страдать от низкой скорости TPS (Token per second). 🔗 Карточка модели: https://huggingface.co/Vikhrmodels/QVikhr-3-1.7B-Instruction-noreasoning 🔗 GGUF (скоро): https://huggingface.co/Vikhrmodels/QVikhr-3-1.7B-Instruction-noreasoning-GGUF ⚖️ Лицензия: apache-2.0 👥 Авторы: @LakoMoorDev @nlpwanderer
Выложили QVikhr-3-1.7B на основе Qwen-3-1.7B, лучшая в классе и обгоняет лучшие…
Из этого канала
- #1122Чот призадумался с обновой R1 от дипсика, а наступят ли времена когда…
Чот призадумался с обновой R1 от дипсика, а наступят ли времена когда опенсурсные модельки будут обходить закрытые? Что думаете? Условно я NewCompanyName, хочу…
- #1123Прочитал безумно интересную статью о новом алгоритме для перемножения матрицы…
Прочитал безумно интересную статью о новом алгоритме для перемножения матрицы на неё же, но перевёрнутую – транспонированную.
- #1124В нвидии не смогли принять что ллмный РЛ ВСЁ и поресечили на тему того, чтобы…
В нвидии не смогли принять что ллмный РЛ ВСЁ и поресечили на тему того, чтобы RL не схлопывал pass@k у базовой модельки.
- #1120https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B Пробуем
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B Пробуем
- #1119Квены 2.5 можно подтюнить RLем с неправильными и рандомными наградами и они…
Квены 2.5 можно подтюнить RLем с неправильными и рандомными наградами и они неплохо бустанутся.