Пока DeepSeek лагает под нагрузкой, давайте поговорим про Qwen У компании за последние пару дней было несколько релизов, но я подождал китайского нового года и собрал всё ➖ Qwen 2.5-VL - обновлённая визуальная модель в размерах 3B, 7B и 72B. Из интересностей - возможность парсить документы в HTML и базовый компьютер юз - до клода и оператора далековато (модель попадает в лупы даже на официальных демо, правда выбирается из них). ➖ Компания сильно обновила свой чат интерфейс, там есть теперь генерация картинок с видео и поиск по интернету. ➖ Релизнули Qwen 2.5-1M - 7B и 14B модели с миллионом токенов контекста, непонятно как их sparse attention влият на качество. Много тестов пока нет - все играются с R1 и на Qwen внимания не обращают. Веса Qwen-2.5-VL Веса Qwen-2.5-1M chat.qwenlm.ai @ai_newz