"В последние полгода происходит тотальная джепизация планеты. Вот свежая NEPA. Next-Embedding Prediction Makes Strong Vision Learners __Sihan Xu, Ziqiao Ma, Wenhao Chai, Xuweiyi Chen, Weiyang Jin, Joyce Chai, Saining Xie, Stella X. Yu__ Статья: https://arxiv.org/abs/2512.16922 Код: https://github.com/sihanxu/nepa Модель: https://sihanxu.github.io/nepa Сайт: https://sihanxu.github.io/nepa Ревью: https://arxiviq.substack.com/p/next-embedding-prediction-makes-strong # TL;DR ЧТО сделали: Авторы представили NEPA (Next-Embedding Predictive Autoregression) — фреймворк для self-supervised обучения визуальных трансформеров (ViT). Идея заключается в предсказании эмбеддинга *следующего* патча изображения при условии знания предыдущих. В отличие от стандартных генеративных подходов, NEPA работает полностью в непрерывном латентном пространстве, не используя дискретные токенизаторы (как в VQ-VAE) или попиксельную реконструкцию (как в MAE). ПОЧЕМУ это важно: Этот подход фактически унифицирует цели обучения визуальных и языковых моделей. NEPA доказывает, что чистый objective ""предсказания следующего токена"" отлично работает на непрерывных визуальных репрезентациях без костылей вроде momentum encoders или майнинга негативных пар для контрастивного обучения. Это масштабируемая и простая парадигма, которая достигает SOTA результатов (85.3% Top-1 на ImageNet-1K с ViT-L), показывая, что каузального моделирования достаточно для выучивания надежной визуальной семантики. Подробнее: https://t.me/gonzo_ML_podcasts/1797"
"В последние полгода происходит тотальная джепизация планеты. Вот свежая NEPA.…
Из этого канала
- #4437Universal Reasoning Model Zitian Gao, Lynx Chen, Yihao Xiao, He Xing, Ran Tao,…
Universal Reasoning Model Zitian Gao, Lynx Chen, Yihao Xiao, He Xing, Ran Tao, Haoming Luo, Joey Zhou, Bryan Dai Статья: https://www.arxiv.org/abs/2512.14693…
- #4438Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий…
Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий токен и предыдущий токен) поверх фич, уже прошедших гейт: Hconv = σ(Wdwconv…
- #4439Результат: бьют HRM и TRM на Sudoku, ARC-AGI-1 и ARC-AGI-2. В предыдущих…
Результат: бьют HRM и TRM на Sudoku, ARC-AGI-1 и ARC-AGI-2. В предыдущих работах ещё был Maze-Hard, здесь не сделали.
- #44322025 LLM Year in Review by Andrej Karpathy…
2025 LLM Year in Review by Andrej Karpathy https://karpathy.bearblog.dev/year-in-review-2025/
- #4430Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а…
Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а эко-графика Потому что текст из LLM и генеративные АИ-картинки оставляют намного…