Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а не финальные представления. Тогда ещё и выборочная сложность сильно лучше. Learn from your own latents and not from tokens: A sample-complexity theory __Daniel J. Korchinski, Alessandro Favero, Matthieu Wyart__ Paper: https://arxiv.org/abs/2605.27734v1 Review: https://arxiviq.substack.com/p/learn-from-your-own-latents-and-not Code: N/A Model: N/A # TL;DR Что сделали: Представили математическую теорию, показывающую, что если обучать нейросети предсказывать собственные скрытые представления (латенты — внутренние абстрактные описания данных, которые модель строит сама), а не исходные токены (кусочки слов или пиксели), это резко снижает выборочную сложность. Выборочная сложность (sample complexity) — это объём данных, который требуется модели для успешного обучения. Авторы доказали, что популярные алгоритмы вроде data2vec выполняют этот иерархический поиск автоматически, делая сложные многослойные архитектуры избыточными. Почему это важно: Современным генеративным моделям требуются триллионы слов или миллиарды картинок, чтобы освоить базовую грамматику и устройство мира — на порядки больше, чем человеческому ребёнку. Объяснив математически, почему предсказание собственных абстракций решает эту проблему, авторы дают готовый ориентир для создания мощного ИИ на гораздо меньших массивах данных. Предсказывать латенты тут: https://t.me/gonzo_ML_podcasts/3849
Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а…
Из этого канала
- #5475"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением…
"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением решёток (Дима Игнатов будет счастлив!).
- #5479Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов.…
Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов. Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols…
- #5489Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку…
Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку про латенты такой модели — они с точностью до поворота восстанавливают истинные…
- #5467Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема…
Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема про рекуррентный ризонинг, теперь применённая к диффузионным моделям.
- #5464У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и…
У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и слушают 😿 Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer?…