🐳DeepSeek V3.1 Очередной апдейт V3 линейки, на той же архитектуре, но на этот раз апдейтнули и base модель. Похоже модель гибридная — ризонер и инстракт в одном флаконе. Заметного прироста в интеллекте не замечено, но модель теперь тратит в разы меньше токенов. Это крайне полезно В чём-то релиз по духу похож на DeepSeek V2.5, вышедшего почти год назад — тогда линейку DeepSeek Coder смержили в основную. Так что есть нехилые шансы что свидетели релиза R2 его так и не дождутся. Пока ждём пейпера, анонса и окончательного релиза весов, модель уже можно попробовать в чате. chat.deepseek.com @ai_newz
🐳DeepSeek V3.1 Очередной апдейт V3 линейки, на той же архитектуре, но на этот…
Из этого канала
- #4118Детали DeepSeek V3.1 Самый сильный прирост заметен в агентных бенчах и…
Детали DeepSeek V3.1 Самый сильный прирост заметен в агентных бенчах и использованию инструментов.
- #4121Если вам не хватало странного в жизни — PewDiePie выпустил видео, где он…
Если вам не хватало странного в жизни — PewDiePie выпустил видео, где он собирает сервер для локального инференса LLM своими руками.
- #4122GigaAM: эффективный метод предобучения для распознавания речи Исследователи из…
GigaAM: эффективный метод предобучения для распознавания речи Исследователи из Сбера представили новый подход к обучению моделей распознавания речи, который…
- #4116Две AI/ML-вакансии в продуктовой компании Команда, развивающая AI-продукт с MAU…
Две AI/ML-вакансии в продуктовой компании Команда, развивающая AI-продукт с MAU 40 млн, ищет двух специалистов: Lead и Engineer. 1.
- #4114"Как вы уже слышали, недавно у меня произошла трансформация Staff Research…
"Как вы уже слышали, недавно у меня произошла трансформация Staff Research Scientist Meta → CEO GenAI стартапа, который я основал.