DeepSeek V3.1 Terminus Судя по названию, это — последний релиз из линейки V3, как V2.5-1210 была для линейки V2. Между релизом V2.5-1210 и V3 прошло две недели, так что думаю что V4 тоже можно ждать в течении пары недель. DeepSeek обычно релизят модели перед важными китайскими праздниками, а 1 октября — день образования КНР. По сравнению с V3.1, Terminus выросла по агентским бенчам и HLE, на остальных бенчах изменения незначительные. Из приятного — модель теперь реже срывается на китайский и выдаёт случайные символы в своём выводе. Веса @ai_newz
DeepSeek V3.1 Terminus Судя по названию, это — последний релиз из линейки V3,…
Из этого канала
- #4180Нейродайджест за неделю (#87) LLM - Tongyi DeepResearch — Теперь у нас есть…
Нейродайджест за неделю (#87) LLM - Tongyi DeepResearch — Теперь у нас есть Deep Research дома.
- #4181Kling 2.5 Turbo бросает вызов Veo 3 Вышла новая версия китайской модельки под…
Kling 2.5 Turbo бросает вызов Veo 3 Вышла новая версия китайской модельки под скромным номером 2.5, что как бы намекает — это ещё не революция, и нам стоит…
- #4185ChatGPT Pulse Теперь ChatGPT может проактивно ресёрчить топики которые считает…
ChatGPT Pulse Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро.
- #4178Следующим шагом для робота будет научиться бить в ответ. Жаль этого парня. --…
Следующим шагом для робота будет научиться бить в ответ. Жаль этого парня. -- Видео без ускорения.
- #4176"Grok 4 Fast — быстрый и эффективный Гибридная модель с 2 миллиона токенов…
"Grok 4 Fast — быстрый и эффективный Гибридная модель с 2 миллиона токенов контекста, скоростью доходящей до 300 токенов в секунду и очень хорошими результаты…