Когда же уже R2 наконец?! DeepSeek-V3.1 → DeepSeek-V3.1-Terminus ✨ What’s improved? 🌐 Language consistency: fewer CN/EN mix-ups & no more random chars. 🤖 Agent upgrades: stronger Code Agent & Search Agent performance. https://x.com/deepseek_ai/status/1970117808035074215?t=zuXvRjUBudH5diKElMnijg&s=19
Когда же уже R2 наконец?! DeepSeek-V3.1 → DeepSeek-V3.1-Terminus ✨ What’s…
Из этого канала
- #4057Что почитать в дороге
Что почитать в дороге
- #4058Что-то интересное: Happy to release Meta Code World Model (CWM), a…
Что-то интересное: Happy to release Meta Code World Model (CWM), a 32-billion-parameter dense LLM that enables novel research on improving code generation…
- #4059Sakana опять что-то прикольное сделала. We’re excited to introduce…
Sakana опять что-то прикольное сделала. We’re excited to introduce ShinkaEvolve: An open-source framework that evolves programs for scientific discovery with…
- #4053Мы уже писали про варианты JEPA, например, JEPA для time series…
Мы уже писали про варианты JEPA, например, JEPA для time series (https://t.me/gonzoMLpodcasts/513) или для видео, типа V-JEPA (https://t.me/gonzoML/3501) и…
- #4040 Самодистилляция: Ещё более удивительно, что авторы показывают, как…
Самодистилляция: Ещё более удивительно, что авторы показывают, как самодистилляция (тоже упоминалась в канале не раз, один из интересных кейсов тут…