Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System… — @gonzo_ML

Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents __Bing Xu, Terry Chen, Fengzhe Zhou, Tianqi Chen, Yangqing Jia, Vinod Grover, Haicheng Wu, Wei Liu, Craig Wittenbrink, Wen-mei Hwu, Roger Bringmann, Ming-Yu Liu, Luis Ceze, Michael Lightstone, Humphrey Shi__ Статья: https://arxiv.org/abs/2601.16238 Ревью: https://arxiviq.substack.com/p/vibetensor-system-software-for-deep Код: https://github.com/NVLabs/vibetensor # TL;DR ЧТО сделали: Исследователи из NVIDIA представили VibeTensor — полностью функциональный программный стек для глубокого обучения, сгенерированный ИИ-агентами. Вместо написания разрозненных скриптов, агенты построили полноценную среду выполнения, включающую ядро на C++20, Python-обвязку в стиле PyTorch, кастомный CUDA-аллокатор с кэшированием и движок автограда в reverse-mode. Система способна обучать небольшие модели (minGPT, ViT) на GPU H100, доказывая, что агенты могут управлять сложными абстракциями с сохранением состояния на стыке разных языков. ПОЧЕМУ это важно: Это переход от генерации кода для изолированных функций к архитектуре системного уровня. Работа доказывает, что современные агенты способны справляться с управлением памятью, конкурентностью и интероперабельностью (C++/Python/CUDA), если зажать их в тиски строгих тестов. Однако выявлен уникальный вид отказа — «эффект Франкенштейна»: сгенерированные подсистемы работают корректно по отдельности, но при интеграции производительность радикально падает, так как агенты не видят глобальной картины. Подробнее: https://t.me/gonzo_ML_podcasts/2222

Из этого канала