"Прикольная работа про модель мира/нейро-дебаггер питона. Модели не обязательно запускать реальный интерпретатор, она может сделать нужные выводы ""в голове"". Towards a Neural Debugger for Python __Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve__ Статья: https://arxiv.org/abs/2603.09951 Ревью: https://arxiviq.substack.com/p/towards-a-neural-debugger-for-python # TL;DR ЧТО сделали: Авторы формулируют интерактивный дебаг как марковский процесс принятия решений. Они обучают языковые модели предсказывать промежуточные состояния программы в зависимости от стандартных действий дебаггера (например, `step_into`, `breakpoint`). Для этого собрали пайплайн данных, который превращает плоские трейсы выполнения питоновского кода в иерархические деревья. Это позволяет модели выполнять как прямой прогон кода, так и инверсный вывод состояния. ПОЧЕМУ это важно: Текущие модели, умеющие работать с выполнением кода, потребляют линейные неинтерактивные трейсы, что совершенно не отражает то, как разработчики на самом деле ищут баги. Дав модели интерактивный контроль над симулируемым выполнением, эта работа закладывает фундамент ""модели мира"" (world model) для агентных систем написания кода. Теперь агенты могут шагать по коду, реверс-инжинирить инпуты и итеративно исправлять ошибки — и всё это без необходимости дёргать реальный рантайм. Дебажить тут: https://t.me/gonzo_ML_podcasts/2780"
"Прикольная работа про модель мира/нейро-дебаггер питона. Модели не обязательно…
Из этого канала
- #4964"Респект FAIR, выкатили работу про очень мультиязычный перевод! Omnilingual MT:…
"Респект FAIR, выкатили работу про очень мультиязычный перевод! Omnilingual MT: Machine Translation for 1,600 Languages The Omnilingual MT Team, Belen…
- #4968Новый GTC удивителен не железными анонсами про Vera Rubin и Groq, а NemoClaw…
Новый GTC удивителен не железными анонсами про Vera Rubin и Groq, а NemoClaw Слушать можно сразу саммари:…
- #4969Но и других интересных картинок вам до кучи. Про движение к опенсорсу и…
Но и других интересных картинок вам до кучи. Про движение к опенсорсу и коалицию по продвижению открытых моделей тоже интересно.
- #4949Новая работа про attention sinks и огромные активации. Этой теме также была…
Новая работа про attention sinks и огромные активации. Этой теме также была посвящена работа команды Qwen с NeurIPS 2025 Best Paper Award.
- #49404️⃣ LLM находят типы рёбер, недоступные бейзлайнам. Rule-based стратегии…
4️⃣ LLM находят типы рёбер, недоступные бейзлайнам. Rule-based стратегии находят максимум 2 из 4 типов рёбер.