"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом году перед ICLR. Многомерные пространства рулят, а идея со случайным вращением просто красивая. И вообще случайные вектора — это сила. Пользуясь случаем хочу порекомендовать книгу ""High-Dimensional Probability"" Романа Вершинина про многомерную вероятность, в этом году вышло второе издание. Доступно на сайте автора: https://www.math.uci.edu/~rvershyn/papers/HDP-book/HDP-2.pdf (но я как обычно купил бумажную копию). Курс лекций Романа также выложен на ютуб: https://www.youtube.com/playlist?list=PLPjEEUWIWhQV7X6dXfrVP3w0KBBLBVJ0j TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate __Amir Zandieh, Majid Daliri, Majid Hadian, Vahab Mirrokni__ Paper: https://arxiv.org/abs/2504.19874v1 Review: https://arxiviq.substack.com/p/turboquant-online-vector-quantization Code: N/A + Unofficial Model: N/A # TL;DR ЧТО сделали: Исследователи из Google и NYU представили TurboQuant — двухэтапный алгоритм векторного квантования, не зависящий от данных (data-oblivious). Он достигает почти оптимальных показателей искажения за счёт случайного вращения многомерных векторов для создания стабильного бета-распределения, применения оптимального скалярного квантования и использования однобитного скетча на остатках для гарантии несмещённой оценки скалярного произведения. ПОЧЕМУ это важно: Для AI-инфраструктуры, упирающейся в память, традиционная офлайн-предобработка и зависящие от данных кодовые книги (как в k-means) создают серьёзное узкое горлышко. Для практиков: Алгоритм работает ""из коробки"" как векторизованная альтернатива индексации с нулевым оверхедом, позволяя агрессивно сжимать KV-кэши LLM и масштабные векторные базы данных без просадок качества в long-context задачах или RAG-пайплайнах. Квантовать тут: https://t.me/gonzo_ML_podcasts/3627"
"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом…
Из этого канала
- #5383В дополнение
В дополнение
- #5384A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог]…
A First Comprehensive Study of TurboQuant: Accuracy and Performance [Блог] Казалось бы, уже стоило бы забить на этот несчастный TurboQuant, но кому-то он все…
- #5385🔬 Метод В оригинальной работе метод был из себя весь такой замечательный, но…
🔬 Метод В оригинальной работе метод был из себя весь такой замечательный, но замерялся на сравнительно простых задачах, без интеграций с эффективными…
- #5372Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with…
Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver Ziyu Ma, Shidong Yang, Yuxiang Ji, Xucong Wang, Yong Wang, Yiming Hu,…
- #5366Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in…
Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models Hamid Kazemi, Atoosa Chegini, Maria Safi Статья:…