"__""Думать надо, когда надо. А когда не надо, думать не надо."" __ -- Тони Роббинс А вообще забавно, что в LLM появляются механизмы прерываний, как в своё время в процессорах. Think Anywhere in Code Generation __Xue Jiang, Tianyu Zhang, Ge Li, Mengyang Liu, Taozhi Chen, Zhenhua Xu, Binhua Li, Wenpin Jiao, Zhi Jin, Yongbin Li, Yihong Dong__ Статья: https://arxiv.org/abs/2603.29957v2 Код: https://github.com/jiangxxxue/Think-Anywhere Ревью: https://arxiviq.substack.com/p/think-anywhere-in-code-generation # TL;DR ЧТО сделали: Исследователи из Пекинского университета и Tongyi Lab (Alibaba) представили THINK-ANYWHERE — новый механизм рассуждений, который позволяет LLM динамически ставить генерацию на паузу и запускать обдумывание на любом токене при написании кода. Это отход от доминирующей парадигмы, где модель генерирует единый, исчерпывающий блок размышлений строго до начала вывода кода. ПОЧЕМУ это важно: Такой подход гораздо точнее имитирует мышление человека при программировании, когда проблемы и корнер-кейсы часто всплывают уже в процессе реализации. Запуская ризонинг именно в узких местах с высокой энтропией, модель бьёт SOTA по точности на бенчмарках кодогенерации и, что парадоксально, сокращает общее количество сгенерированных токенов, оптимизируя вычисления во время инференса. Для практиков: Динамическое распределение токенов ризонинга позволяет снизить задержку при генерации и экономить бюджет токенов. Подход можно адаптировать под разные домены (отлично работает даже на математике), но для запуска потребуется качественный SFT-прогрев, чтобы научить базовую модель правильно использовать теги прерывания. Думать тут: https://t.me/gonzo_ML_podcasts/3237 Не думать тут: https://t.me/gonzo_ML_podcasts/3250"
"""Думать надо, когда надо. А когда не надо, думать не надо."" -- Тони Роббинс…
Из этого канала
- #5194Growing Neural Cellular Automata Alexander Mordvintsev, Ettore Randazzo, Eyvind…
Growing Neural Cellular Automata Alexander Mordvintsev, Ettore Randazzo, Eyvind Niklasson, Michael Levin Интерактивная статья + ссылки на код:…
- #5195Правило обновления можно воспринимать как геном клетки и он у всех клеток будет…
Правило обновления можно воспринимать как геном клетки и он у всех клеток будет общим.
- #5196Третий эксперимент про регенерацию — если повредить финальное состояние модели…
Третий эксперимент про регенерацию — если повредить финальное состояние модели (пять разных способов), восстановит ли модель его? Ящерица, неожиданно, делает…
- #5173Про многоэтапную верификацию CUA (Computer Use Agent). The Art of Building…
Про многоэтапную верификацию CUA (Computer Use Agent). The Art of Building Verifiers for Computer Use Agents Corby Rosset, Pratyusha Sharma, Andrew Zhao,…
- #5171Про будущее математики от Теренса Тао. Также в тему свежая статья из Quanta…
Про будущее математики от Теренса Тао. Также в тему свежая статья из Quanta Magazine: “The AI Revolution in Math Has Arrived” Mathematical methods and human…