Обновлённый Qwen 30B-A3B Instruct Влезающая в одну видеокарту MoE модель с 256к контекста, по многим бенчам обгоняет DeepSeek V3-0324 и GPT 4o-0327. Это не гибридная модель, ризонинг версию выкатят чуть позже. Боюсь представить какие там будут результаты, если обычный Instruct так сильно всё рвёт. Веса @ai_newz
Обновлённый Qwen 30B-A3B Instruct Влезающая в одну видеокарту MoE модель с 256к…
Из этого канала
- #4067Визуальные промпты для Veo 3 Зацените лайфхаки от Google Labs. Недавно в VEO 3…
Визуальные промпты для Veo 3 Зацените лайфхаки от Google Labs. Недавно в VEO 3 появилась возможность подавать на вход картинки.
- #4076Runway релизунули Aleph — in-context видеоредактор. Aleph может изменять…
Runway релизунули Aleph — in-context видеоредактор. Aleph может изменять ракурсы камеры, добавлять и удалять объекты, менять окружение и время суток,…
- #4077Gemini Deep Think завезли в Ultra подписку Оптимизированная версия модели,…
Gemini Deep Think завезли в Ultra подписку Оптимизированная версия модели, выигравшей золото на IMO.
- #4064Для подписчиков Claude введут недельные лимиты Изменение войдёт в силу через…
Для подписчиков Claude введут недельные лимиты Изменение войдёт в силу через месяц — 28 августа и будет касаться как подписчиков Plus так и подписчиков Max.
- #4060GLM 4.5 — китайский опенсорс продолжает доминировать Очередная очень сильная…
GLM 4.5 — китайский опенсорс продолжает доминировать Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах.