Это что-то очень прикольное! Вычисление — это постоянное обновление латентов. Нейрокомпьютер на базе диффузионки. Так, глядишь, и термодинамическое железо массово выстрелит! Neural Computers __Mingchen Zhuge, Changsheng Zhao, Haozhe Liu, Zijian Zhou, Shuming Liu, Wenyi Wang, Ernie Chang, Gael Le Lan, Junjie Fei, Wenxuan Zhang, Yasheng Sun, Zhipeng Cai, Zechun Liu, Yunyang Xiong, Yining Yang, Yuandong Tian, Yangyang Shi, Vikas Chandra, 💪 Jürgen Schmidhuber__ Paper: https://arxiv.org/abs/2604.06425 Code: https://github.com/metauto-ai/NeuralComputer Blog: https://metauto.ai/neuralcomputer/index_eng.html Review: https://arxiviq.substack.com/p/neural-computers # TL;DR ЧТО сделали: Исследователи из Meta AI и KAUST предлагают новую архитектурную парадигму под названием нейрокомпьютер (Neural Computer, NC). Она объединяет вычисления, память и операции ввода-вывода в единое выученное скрытое состояние во время выполнения. Вместо того чтобы рассматривать ИИ как агента, который манипулирует внешней операционной системой, они встроили компьютер прямо в веса диффузионного трансформера (на базе Wan2.1). Идея проверена на двух прототипах: `NC_{CLIGen}` для работы с терминалом и `NC_{GUIWorld}` для графических интерфейсов десктопа. ПОЧЕМУ это важно: Работа намечает фундаментальный сдвиг от модульного стека железа и софта фон Неймана к единому «нейросетевому латентному стеку». Если этот тренд сохранится, будущие системы не будут программироваться явно кодом, а будут настраиваться дифференцируемым образом. Доказав, что базовые примитивы (например, выравнивание ввода-вывода и управление на коротких горизонтах) могут возникать исключительно из наблюдения за интерфейсными трейсами, авторы рисуют путь к полностью нейросетевым компьютерам (Completely Neural Computers, CNC), которые смогут заменить традиционные цифровые вычислительные платформы. Для практиков: Для техлидов и исследователей эта статья подсвечивает критическую развилку в дизайне ИИ-систем. Пока индустрия вливает огромные ресурсы в агентов, использующих внешние инструменты, эта работа предлагает альтернативу, где модель сама впитывает в себя среду исполнения. Подробные абляции показывают, что модели умеют очень точно рендерить интерфейсы и реагировать на ввод пользователя. Однако вскрывается и серьёзное ограничение: текущие реализации на базе видеомоделей — это великолепные рендереры, но пока ещё очень хрупкие рассуждающие модели при решении задач с нативной символьной логикой. Рендерить тут: https://t.me/gonzo_ML_podcasts/3121
Это что-то очень прикольное! Вычисление — это постоянное обновление латентов.…
Из этого канала
- #5133Ещё одна работа про анализ ИИ-автоматизации. Crashing Waves vs. Rising Tides:…
Ещё одна работа про анализ ИИ-автоматизации. Crashing Waves vs. Rising Tides: Preliminary Findings on AI Automation from Thousands of Worker Evaluations of…
- #5138"Дорожная карта развития железа для ИИ на ближайшие 10 лет. Хотим ускорения в…
"Дорожная карта развития железа для ИИ на ближайшие 10 лет. Хотим ускорения в 1000 раз: 10x от инноваций в алгоритмах, 20x от архитектурных улучшений и…
- #5145В продолжение темы про Thrust2 и ThrustSSC. Bloodhound LSR/SSC…
В продолжение темы про Thrust2 и ThrustSSC. Bloodhound LSR/SSC (https://en.wikipedia.org/wiki/BloodhoundLSR) -- машина с реактивным двигателем Rolls-Royce…
- #5121Drop-in замена индексатора для разреженного внимания в трансформерах типа…
Drop-in замена индексатора для разреженного внимания в трансформерах типа DeepSeek. Ускорение в 3.75 раза на инференсе.
- #5118"Иметь заалайненную ""безопасную"" для чата LLM недостаточно, использование…
"Иметь заалайненную ""безопасную"" для чата LLM недостаточно, использование агентов увеличивает поверхность атаки.