И снова BLT, но теперь быстрый! Fast Byte Latent Transformer __Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, Gargi Ghosh, Luke Zettlemoyer, Christopher Potts, Xiaochuang Han, Srinivasan Iyer__ Статья: https://arxiv.org/abs/2605.08044v1 Ревью: https://arxiviq.substack.com/p/fast-byte-latent-transformer # TL;DR ЧТО сделали: Авторы представили три метода генерации — BLT Diffusion (BLT-D), BLT Self-speculation (BLT-S) и BLT Diffusion+Verification (BLT-DV) — для параллельного декодирования байтов в иерархических языковых моделях. Используя поблочную дискретную диффузию и внутреннее спекулятивное декодирование, они обходят узкое место строгой авторегрессионной побайтовой генерации. ПОЧЕМУ это важно: Байтовые архитектуры по своей природе решают проблемы сабворд-токенизации (например, уязвимость к состязательным атакам и неравенство языков), но до сих пор страдали от медленного инференса. Снижая затраты на пропускную способность памяти (memory bandwidth) до 92% в некоторых конфигурациях, эти методы делают foundation модели без токенизатора вычислительно конкурентоспособными для реального применения. Для практиков: Фреймворк BLT-S позволяет ускорить инференс и снизить нагрузку на память без потери качества, используя саму модель в качестве генератора черновиков (drafts). Пока нет оптимизированных CUDA-ядер, это скорее концепт, но в перспективе — это готовый рецепт для деплоя байтовых моделей в продакшен. Ускорять инференс здесь: https://t.me/gonzo_ML_podcasts/3597
И снова BLT, но теперь быстрый! Fast Byte Latent Transformer Julie Kallini,…
Из этого канала
- #5366Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in…
Слаб наш алайнмент! A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models Hamid Kazemi, Atoosa Chegini, Maria Safi Статья:…
- #5372Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with…
Эволюцию скиллов подвезли. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver Ziyu Ma, Shidong Yang, Yuxiang Ji, Xucong Wang, Yong Wang, Yiming Hu,…
- #5377"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом…
"Этой работе уже год, но мы её не разбирали, а она неожиданно выстрелила в этом году перед ICLR.
- #5359Картинка с геораспределением аффилиаций на последнем ICLR 2026…
Картинка с геораспределением аффилиаций на последнем ICLR 2026 https://x.com/konstantdobler/status/2053098441069216113 Сейчас по сети ходит также другая…
- #5357И снова про рекурсии :) Пользуясь случаем, поздравляю Лёшу Досовицкого и всю…
И снова про рекурсии :) Пользуясь случаем, поздравляю Лёшу Досовицкого и всю команду. Ещё и Питера Норвига привлекли! https://www.recursive.com/