Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents __Bing Xu, Terry Chen, Fengzhe Zhou, Tianqi Chen, Yangqing Jia, Vinod Grover, Haicheng Wu, Wei Liu, Craig Wittenbrink, Wen-mei Hwu, Roger Bringmann, Ming-Yu Liu, Luis Ceze, Michael Lightstone, Humphrey Shi__ Статья: https://arxiv.org/abs/2601.16238 Ревью: https://arxiviq.substack.com/p/vibetensor-system-software-for-deep Код: https://github.com/NVLabs/vibetensor # TL;DR ЧТО сделали: Исследователи из NVIDIA представили VibeTensor — полностью функциональный программный стек для глубокого обучения, сгенерированный ИИ-агентами. Вместо написания разрозненных скриптов, агенты построили полноценную среду выполнения, включающую ядро на C++20, Python-обвязку в стиле PyTorch, кастомный CUDA-аллокатор с кэшированием и движок автограда в reverse-mode. Система способна обучать небольшие модели (minGPT, ViT) на GPU H100, доказывая, что агенты могут управлять сложными абстракциями с сохранением состояния на стыке разных языков. ПОЧЕМУ это важно: Это переход от генерации кода для изолированных функций к архитектуре системного уровня. Работа доказывает, что современные агенты способны справляться с управлением памятью, конкурентностью и интероперабельностью (C++/Python/CUDA), если зажать их в тиски строгих тестов. Однако выявлен уникальный вид отказа — «эффект Франкенштейна»: сгенерированные подсистемы работают корректно по отдельности, но при интеграции производительность радикально падает, так как агенты не видят глобальной картины. Подробнее: https://t.me/gonzo_ML_podcasts/2222
Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System…
Из этого канала
- #4660Ещё одна работа про агентов для автоматизации ИИ-исследований (ИИИ). Эта прям…
Ещё одна работа про агентов для автоматизации ИИ-исследований (ИИИ). Эта прям заземляет всё на практику, чтобы агенты делали код, который работает и работает…
- #4663"JIT-подход к моделированию мира “Just in Time” World Modeling Supports Human…
"JIT-подход к моделированию мира “Just in Time” World Modeling Supports Human Planning and Reasoning Tony Chen, Sam Cheyette, Kelsey R Allen, Joshua B…
- #4666Поговорили с Иваром Максутовым из Постнауки за жизнь и AI.…
Поговорили с Иваром Максутовым из Постнауки за жизнь и AI. https://www.youtube.com/watch?v=VS64H5FYlqI
- #4655Новый энкодер DeepSeek-OCR-2
Новый энкодер DeepSeek-OCR-2
- #4654Добавил в новость про китайские модели упоминание DeepSeek-OCR-2. Новый энкодер…
Добавил в новость про китайские модели упоминание DeepSeek-OCR-2. Новый энкодер у них и правда интересный, не растр сканирует как все, а объекты, и…