Пока готовлю обзор статьи от DeepSeek — держите саммари интервью с Ilya (в целом, интервью вышло не самым интересным, наверное, самый большой апдейт для меня — что теперь SSI может выпустить/показать что-то до достижения суперинтеллекта)
Пока готовлю обзор статьи от DeepSeek — держите саммари интервью с Ilya (в…
Из этого канала
- #3142сиол где обзор на дипсик
сиол где обзор на дипсик
- #3143DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning В…
DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning В DeepSeekMath-V1 был представлен GRPO — алгоритм, приведший к появлению рассуждающих моделей.
- #3144На этих данных запустили RL-тренировку рассуждениям поверх…
На этих данных запустили RL-тренировку рассуждениям поверх DeepSeek-V3.2-Exp-SFT с целью научить модель предсказывать оценку эксперта, глядя на уже написанное…
- #3140В твиттере наткнулся на очень интересную статистику по длительности выполнения…
В твиттере наткнулся на очень интересную статистику по длительности выполнения задач на SWE-Bench Verified и качеству разных моделей в этих срезах.
- #3139😳 ещё DeepMind свой фильм выложили (про путь компании и CEO Demis Hassabis к…
😳 ещё DeepMind свой фильм выложили (про путь компании и CEO Demis Hassabis к Нобелевской премии) https://www.youtube.com/watch?v=d95J8yzvjbQ