"Ай молодец, хорошо нагаллюцинировал! __ ""Работа даёт теоретический пинок любителям «инженерного шаманизма». Качество сжатия (измеряемое через MI) — главный рычаг производительности. Для строителей RAG и агентов это сигнал: хватит мучить промптами финальную модель. Оптимизируйте ingestion (первичную обработку) на краю (edge). Мощные компрессоры на ноутбуках и телефонах, отправляющие в облако концентрированные «векторы мыслей» (текстовые саммари), — это путь к приватным и дешевым агентам нового поколения.""__ An Information Theoretic Perspective on Agentic System Design __Shizhe He, Avanika Narayan, Ishan S. Khare, Scott W. Linderman, Christopher Ré, Dan Biderman__ Статья: https://arxiv.org/abs/2512.21720 Ревью: https://arxiviq.substack.com/p/an-information-theoretic-perspective # TL;DR ЧТО сделали: Авторы формализовали дизайн многошаговых агентных систем (типа Deep Research) через теорию информации, представив этап суммаризации как передачу сигнала через шумный канал. Предложили способ оценки взаимной информации (Mutual Information, MI), чтобы понять, насколько хорошо модель-«компрессор» сохраняет контекст для модели-«предиктора». ПОЧЕМУ это важно: Исследование ломает стереотип «всё решат гигантские модели на последнем шаге». Оказывается, выгоднее вкладываться в компрессор: 7B-модель для сжатия в паре с небольшим предиктором часто бьёт огромные end-to-end модели. Практически это значит, что локальная 3B-модель на ноутбуке может сжимать данные, сохраняя 99% точности SOTA-пайплайнов, но срезая косты API на 74%. Подробнее: https://t.me/gonzo_ML_podcasts/1959"
"Ай молодец, хорошо нагаллюцинировал! ""Работа даёт теоретический пинок…
Из этого канала
- #4522Заменяем тензорный лифтинг на геометрические методы. Очередной заход на замену…
Заменяем тензорный лифтинг на геометрические методы. Очередной заход на замену квадратичного внимания на линейное не-внимание.
- #4525Продолжение темы про эволюцию кода. Теперь Sakana опубликовала работу на базе…
Продолжение темы про эволюцию кода. Теперь Sakana опубликовала работу на базе старого доброго Redcode. https://pub.sakana.ai/drq/
- #4526А вот другой заход на то, что внимание и все эти огромные матрицы не нужны!…
А вот другой заход на то, что внимание и все эти огромные матрицы не нужны! Здесь переходим к спайкам и отказываемся от линейной алгебры в пользу Lookup…
- #4514Адаптировали локальный алгоритм обучения Forward-Forward от Хинтона к…
Адаптировали локальный алгоритм обучения Forward-Forward от Хинтона к свёрточным сетям.
- #4512⚡️ Интересное железо Будут интересные применения non-conventional hardware типа…
⚡️ Интересное железо Будут интересные применения non-conventional hardware типа термодинамических компьютеров.