🔥Qwen 3.5 Medium - GOAT опенсорсных LLM В линейке 3.5 cильно качнули метрики по сравнению с 3.0 hybrid architecture that fuses linear attention (via Gated Delta Networks) with a sparse mixture-of-experts По скорости тоже бустанули за счет архитектуры: Qwen3.5-397B-A17B в 3.5x (7.2x) быстрее чем Qwen3-235B-A22B на декодинге с с контекстом в 32k (256k) токенов. Qwen3.5-35B-A3B теперь превосходит Qwen3-235B-A22B-2507 и Qwen3-VL-235B-A22B, что ещё раз подтверждает, что лучшего качества можно достичь не только за счет большего числа параметров, но и благодаря более удачной архитектуре, качеству данных и RL. > Веса на HF > Блогпост @ai_newz
🔥Qwen 3.5 Medium - GOAT опенсорсных LLM В линейке 3.5 cильно качнули метрики по…
Из этого канала
- #4443"Ранние тесты Nano Banana 2 В соцсетях форсят тесты Nano Banana 2 в 4K.…
"Ранние тесты Nano Banana 2 В соцсетях форсят тесты Nano Banana 2 в 4K. Кажется, это более быстрая версия на базе превью Gemini 3.1 Flash Image (NB Pro…
- #4447Вот кстати мой тест NB 2 vs NB Pro Текстуры чутка получше, да. Но вот накосячил…
Вот кстати мой тест NB 2 vs NB Pro Текстуры чутка получше, да. Но вот накосячил с количеством людей в кадре и расположением доски - она висит посреди комнаты.
- #4450🔥 Nano Banana 2 🔥 Вот и вышла нано-банана 2, о которой я писал ночью. Как и…
🔥 Nano Banana 2 🔥 Вот и вышла нано-банана 2, о которой я писал ночью. Как и всегда бафнули текст, консистентность и понимание промпта.
- #4438Magnific Video Upscale Это геймчейнджер, товарищи. Такой же, как когда-то…
Magnific Video Upscale Это геймчейнджер, товарищи. Такой же, как когда-то Magnific сделал для картинок.
- #4436Попы на нейростероидах Кажется, массовое внедрение LLM добралось и до самых…
Попы на нейростероидах Кажется, массовое внедрение LLM добралось и до самых консервативных мест.