"""Думать надо, когда надо. А когда не надо, думать не надо."" -- Тони Роббинс… — @gonzo_ML

"__""Думать надо, когда надо. А когда не надо, думать не надо."" __ -- Тони Роббинс А вообще забавно, что в LLM появляются механизмы прерываний, как в своё время в процессорах. Think Anywhere in Code Generation __Xue Jiang, Tianyu Zhang, Ge Li, Mengyang Liu, Taozhi Chen, Zhenhua Xu, Binhua Li, Wenpin Jiao, Zhi Jin, Yongbin Li, Yihong Dong__ Статья: https://arxiv.org/abs/2603.29957v2 Код: https://github.com/jiangxxxue/Think-Anywhere Ревью: https://arxiviq.substack.com/p/think-anywhere-in-code-generation # TL;DR ЧТО сделали: Исследователи из Пекинского университета и Tongyi Lab (Alibaba) представили THINK-ANYWHERE — новый механизм рассуждений, который позволяет LLM динамически ставить генерацию на паузу и запускать обдумывание на любом токене при написании кода. Это отход от доминирующей парадигмы, где модель генерирует единый, исчерпывающий блок размышлений строго до начала вывода кода. ПОЧЕМУ это важно: Такой подход гораздо точнее имитирует мышление человека при программировании, когда проблемы и корнер-кейсы часто всплывают уже в процессе реализации. Запуская ризонинг именно в узких местах с высокой энтропией, модель бьёт SOTA по точности на бенчмарках кодогенерации и, что парадоксально, сокращает общее количество сгенерированных токенов, оптимизируя вычисления во время инференса. Для практиков: Динамическое распределение токенов ризонинга позволяет снизить задержку при генерации и экономить бюджет токенов. Подход можно адаптировать под разные домены (отлично работает даже на математике), но для запуска потребуется качественный SFT-прогрев, чтобы научить базовую модель правильно использовать теги прерывания. Думать тут: https://t.me/gonzo_ML_podcasts/3237 Не думать тут: https://t.me/gonzo_ML_podcasts/3250"

Из этого канала