DeepSeek V4 вышла в превью! 🐳 Это самая большая открытая модель, по бенчам обгоняет Kimi K2.6 и очень близко подбирается к закрытым моделям. Идёт в двух вариантах — Pro с 1.6T-A49B параметров и Flash с 284B-A13B. Модели поддерживают миллион токенов контекста, а новая схема аттеншна позволяет уменьшить KV кэш в 10 раз на контексте в миллион токенов. Цена - $0.14/$0.28 за миллион токенов Flash, как у DeepSeek V2 и $1.74/$3.48 у Pro. Модели уже доступны в чате, Instant это Flash, а Expert это Pro. С моделью релизнули подробнейший техрепорт. Веса Техрепорт @ai_newz
DeepSeek V4 вышла в превью! 🐳 Это самая большая открытая модель, по бенчам…
Из этого канала
- #4550Anthropic выпустили постмортем о деградациях Claude Code Компания признала три…
Anthropic выпустили постмортем о деградациях Claude Code Компания признала три проблемы с начала весны которые влияли на качество кода.
- #4551Нейродайджест за неделю (#115) OpenAI - GPT 5.5 — OpenAI выкатили новую модель,…
Нейродайджест за неделю (#115) OpenAI - GPT 5.5 — OpenAI выкатили новую модель, причём впервые с 4o поменяли базовую модель.
- #4552Очередное напоминание что арена — мусор если речь идёт об оценке LLM (и не…
Очередное напоминание что арена — мусор если речь идёт об оценке LLM (и не только LLM) Ну и давайте воспользуемся поводом чтобы обсудить методы оценки моделей.
- #4545OpenAI показали GPT 5.5 Раскатывают уже сегодня на всех подписчиков. Модель…
OpenAI показали GPT 5.5 Раскатывают уже сегодня на всех подписчиков. Модель заметно умнее на токен чем конкуренты, но и цена заметно выросла — теперь в API…
- #4544А вот и веса Qwen 3.6 27B выложили Модель, очевидно, заметно лучше 35B-A3B, но…
А вот и веса Qwen 3.6 27B выложили Модель, очевидно, заметно лучше 35B-A3B, но и заметно медленнее.