2025 LLM Year in Review by Andrej Karpathy https://karpathy.bearblog.dev/year-in-review-2025/
2025 LLM Year in Review by Andrej Karpathy…
Из этого канала
- #4433"В последние полгода происходит тотальная джепизация планеты. Вот свежая NEPA.…
"В последние полгода происходит тотальная джепизация планеты. Вот свежая NEPA. Next-Embedding Prediction Makes Strong Vision Learners Sihan Xu, Ziqiao Ma,…
- #4437Universal Reasoning Model Zitian Gao, Lynx Chen, Yihao Xiao, He Xing, Ran Tao,…
Universal Reasoning Model Zitian Gao, Lynx Chen, Yihao Xiao, He Xing, Ran Tao, Haoming Luo, Joey Zhou, Bryan Dai Статья: https://www.arxiv.org/abs/2512.14693…
- #4438Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий…
Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий токен и предыдущий токен) поверх фич, уже прошедших гейт: Hconv = σ(Wdwconv…
- #4430Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а…
Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а эко-графика Потому что текст из LLM и генеративные АИ-картинки оставляют намного…
- #4426Очередная новая JEPA, теперь vision-language. VL-JEPA: Joint Embedding…
Очередная новая JEPA, теперь vision-language. VL-JEPA: Joint Embedding Predictive Architecture for Vision-language Delong Chen, Mustafa Shukor, Théo…