Qwen 3 выйдет на следующей неделе Об этом сообщают китайские СМИ. Команда Qwen точно хочет успеть релизнуть свою модель до Llama Con, который пройдёт 29 апреля. Судя по всему, семейство Qwen 3 целится сразу во все сегменты рынка и включает в себя сильно больше размеров — будут как и MoE модели, которые часто поражают своими размерами, так и мобильная моделька всего на 600m. Над поддержкой везде работают заранее — код для моделей уже смержили в трансформеры пару дней назад. Хотя вот удивительно, что Qwen2.5 до сих пор не поддерживается в LMDeploy, в одном из самых быстрых inference движков. Компания лишь недавно релизнула свою первую омни модель — Qwen 2.5 Omni 7B, так что Qwen 3 вряд-ли будет омнимодальным на релизе. А вот релизнуться сразу с VLM моделями им ничего не мешает. Про ризонеры пока что ничего не ясно, кроме того что они точно будут. @ai_newz
Qwen 3 выйдет на следующей неделе Об этом сообщают китайские СМИ. Команда Qwen…
Из этого канала
- #3800"Для Gemma 3 вышли официальные квантизированные версии Квантизация это сейчас…
"Для Gemma 3 вышли официальные квантизированные версии Квантизация это сейчас стандарт, мало кто будет запускать модели локально в нативных bf16 — большая…
- #3801Midjourney v7 🥳 Долгожданная седьмая версия самого эстетичного генератора…
Midjourney v7 🥳 Долгожданная седьмая версия самого эстетичного генератора картинок вышла в релиз этим утром.
- #3805Вот как работает режим Draft в MJ v7: Он понимает не только английский, но и…
Вот как работает режим Draft в MJ v7: Он понимает не только английский, но и другие языки.
- #3797Разработчики из ШАДа и Yandex B2B Tech создали реально работающий инструмент…
Разработчики из ШАДа и Yandex B2B Tech создали реально работающий инструмент для экологов-практиков.
- #3796ПРОЕКТ: МоЧА Да, первого апреля только такие новости, но это настоящая... (Пощу…
ПРОЕКТ: МоЧА Да, первого апреля только такие новости, но это настоящая... (Пощу с небольшим опозданием) Можно сказать, это убийца Hedra.