"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом… — @gonzo_ML

"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом году перед ICLR. Многомерные пространства рулят, а идея со случайным вращением просто красивая. И вообще случайные вектора — это сила. Пользуясь случаем хочу порекомендовать книгу ""High-Dimensional Probability"" Романа Вершинина про многомерную вероятность, в этом году вышло второе издание. Доступно на сайте автора: https://www.math.uci.edu/~rvershyn/papers/HDP-book/HDP-2.pdf (но я как обычно купил бумажную копию). Курс лекций Романа также выложен на ютуб: https://www.youtube.com/playlist?list=PLPjEEUWIWhQV7X6dXfrVP3w0KBBLBVJ0j TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate __Amir Zandieh, Majid Daliri, Majid Hadian, Vahab Mirrokni__ Paper: https://arxiv.org/abs/2504.19874v1 Review: https://arxiviq.substack.com/p/turboquant-online-vector-quantization Code: N/A + Unofficial Model: N/A # TL;DR ЧТО сделали: Исследователи из Google и NYU представили TurboQuant — двухэтапный алгоритм векторного квантования, не зависящий от данных (data-oblivious). Он достигает почти оптимальных показателей искажения за счёт случайного вращения многомерных векторов для создания стабильного бета-распределения, применения оптимального скалярного квантования и использования однобитного скетча на остатках для гарантии несмещённой оценки скалярного произведения. ПОЧЕМУ это важно: Для AI-инфраструктуры, упирающейся в память, традиционная офлайн-предобработка и зависящие от данных кодовые книги (как в k-means) создают серьёзное узкое горлышко. Для практиков: Алгоритм работает ""из коробки"" как векторизованная альтернатива индексации с нулевым оверхедом, позволяя агрессивно сжимать KV-кэши LLM и масштабные векторные базы данных без просадок качества в long-context задачах или RAG-пайплайнах. Квантовать тут: https://t.me/gonzo_ML_podcasts/3627"

Из этого канала