"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением решёток (Дима Игнатов будет счастлив!). Щёлкает sudoku-extreme моделью на 800k параметров. ""Лучше маленький, но с решёткой, чем большой но с галлюцинациями"" Lattice Deduction Transformers __Liam Davis, Leopold Haller, Alberto Alfarano, Mark Santolucito__ Paper: https://arxiv.org/abs/2605.08605 Review: https://arxiviq.substack.com/p/lattice-deduction-transformers Code: N/A Model: N/A # TL;DR Что сделали: Авторы представили «дедуктивный решётчатый трансформер» (Lattice Deduction Transformer) — особый вид рекуррентной нейросети-трансформера, которая решает сложные логические головоломки. Для этого она проецирует свои внутренние состояния на строго описанную математическую систему координат, называемую решёткой, объединяя глубокое обучение с классическими алгоритмами поиска. Почему это важно: Этот подход доказывает, что специализированные нейросети всего на 800 тысяч параметров могут безошибочно решать сложнейшие задачи на логическое рассуждение. Они превосходят даже передовые коммерческие LLM (большие языковые модели, обученные на гигантских объёмах текста) вроде Claude 4.6 или GPT-5.4, которые набирают в этих тестах ровно 0%, при этом их обучение обходится в крошечную долю от стоимости обучения гигантов. Решётничать тут: https://t.me/gonzo_ML_podcasts/3863"
"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением…
Из этого канала
- #5479Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов.…
Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов. Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols…
- #5489Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку…
Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку про латенты такой модели — они с точностью до поворота восстанавливают истинные…
- #5472Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а…
Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а не финальные представления. Тогда ещё и выборочная сложность сильно лучше.
- #5467Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема…
Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема про рекуррентный ризонинг, теперь применённая к диффузионным моделям.
- #5464У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и…
У агентов всё как у людей, кто громче и самоувереннее кричит, того мнение и слушают 😿 Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer?…