Детали апдейта DeepSeek-V3.1 подъехали https://api-docs.deepseek.com/news/news250821
Детали апдейта DeepSeek-V3.1 подъехали…
Из этого канала
- #3983Недавно упоминали термодинамические вычисления, и тут образовалась подборка…
Недавно упоминали термодинамические вычисления, и тут образовалась подборка авторазборов статей по теме: Thermodynamic Natural Gradient Descent, также может…
- #3984More FP4 training is coming!
More FP4 training is coming!
- #3985FP4 All the Way: Fully Quantized Training of LLMs [Статья][Анонимный не…
FP4 All the Way: Fully Quantized Training of LLMs [Статья][Анонимный не анонимный репозитрий] 📘 Введение Висело оно у меня давно в бэклоге, но в кулуарах…
- #3977Михаил Бронштейн и ко написали практически учебник про геометрическое глубокое…
Михаил Бронштейн и ко написали практически учебник про геометрическое глубокое обучение. Выглядит очень достойно.
- #3976Вы наверное уже видели. Claim: gpt-5-pro can prove new interesting mathematics.…
Вы наверное уже видели. Claim: gpt-5-pro can prove new interesting mathematics. Proof: I took a convex optimization paper with a clean open problem in it and…