https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B Пробуем
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B Пробуем
Из этого канала
- #1121Выложили QVikhr-3-1.7B на основе Qwen-3-1.7B, лучшая в классе и обгоняет лучшие…
Выложили QVikhr-3-1.7B на основе Qwen-3-1.7B, лучшая в классе и обгоняет лучшие модели. Ризонинг прямо сейчас выключен, будет позже.
- #1122Чот призадумался с обновой R1 от дипсика, а наступят ли времена когда…
Чот призадумался с обновой R1 от дипсика, а наступят ли времена когда опенсурсные модельки будут обходить закрытые? Что думаете? Условно я NewCompanyName, хочу…
- #1123Прочитал безумно интересную статью о новом алгоритме для перемножения матрицы…
Прочитал безумно интересную статью о новом алгоритме для перемножения матрицы на неё же, но перевёрнутую – транспонированную.
- #1119Квены 2.5 можно подтюнить RLем с неправильными и рандомными наградами и они…
Квены 2.5 можно подтюнить RLем с неправильными и рандомными наградами и они неплохо бустанутся.
- #1118Хм, похоже в Дипмаинде что-то крутое сделали... 😑 На самом деле я и сам…
Хм, похоже в Дипмаинде что-то крутое сделали... 😑 На самом деле я и сам попадаюсь на видосики которые сгенерены с veo 3, иногда правда сложно понять что это…