Заменяем тензорный лифтинг на геометрические методы. Очередной заход на замену квадратичного внимания на линейное не-внимание. Attention Is Not What You Need: Grassmann Flows as an Attention-Free Alternative for Sequence Modeling __Zhang Chong__ Статья: https://arxiv.org/abs/2512.19428 Ревью: https://arxiviq.substack.com/p/attention-is-not-what-you-need Код: отсутствует Модель: отсутствует # TL;DR ЧТО сделали: Автор представил архитектуру Causal Grassmann, заменяющую стандартный механизм self-attention размером `L × L` на слой геометрического смешивания. Вместо вычисления глобальной матрицы весов, модель проецирует скрытые состояния в низкоразмерное пространство, рассматривает пары токенов как 2D-плоскости на многообразии Грассмана и кодирует их взаимодействие через координаты Плюккера. ПОЧЕМУ это важно: Работа ставит под сомнение догму о необходимости мягкого внимания (soft attention) для моделирования последовательностей. Ограничение взаимодействий конечномерным многообразием `Gr(2, r)` позволяет достичь линейной сложности `O(L)` и предлагает путь к математически обоснованной интерпретируемости, уходя от непрозрачного «тензорного лифтинга» (tensor lifting), свойственного трансформерам. Подробнее: https://t.me/gonzo_ML_podcasts/1970
Заменяем тензорный лифтинг на геометрические методы. Очередной заход на замену…
Из этого канала
- #4525Продолжение темы про эволюцию кода. Теперь Sakana опубликовала работу на базе…
Продолжение темы про эволюцию кода. Теперь Sakana опубликовала работу на базе старого доброго Redcode. https://pub.sakana.ai/drq/
- #4526А вот другой заход на то, что внимание и все эти огромные матрицы не нужны!…
А вот другой заход на то, что внимание и все эти огромные матрицы не нужны! Здесь переходим к спайкам и отказываемся от линейной алгебры в пользу Lookup…
- #4531Если ещё не видели фильм про DeepMind, то он неплохой. Показывает людей за…
Если ещё не видели фильм про DeepMind, то он неплохой. Показывает людей за всеми их достижениями.
- #4518"Ай молодец, хорошо нагаллюцинировал! ""Работа даёт теоретический пинок…
"Ай молодец, хорошо нагаллюцинировал! ""Работа даёт теоретический пинок любителям «инженерного шаманизма».
- #4514Адаптировали локальный алгоритм обучения Forward-Forward от Хинтона к…
Адаптировали локальный алгоритм обучения Forward-Forward от Хинтона к свёрточным сетям.