Там это... Ребята из Саканы выложили своего оптимизатора торч кода для видеокарт. The AI CUDA Engineer: Agentic CUDA Kernel Discovery, Optimization and Composition https://sakana.ai/ai-cuda-engineer/ Это фреймворк с ллмкой и эволюционкой который транслирует торч в оптимизированные куда кернелы. Ну и написали, что иногда код на выходе получается 10x-100x быстрее. Выложили статью с примерами кернелов. Ребятки в интернете додумались прогнать кернелы через o3-mini и спросить, есть ли там проблемы. o3-mini проблемы нашла. Суть была в том, что AI CUDA Engineer также генерит и тестовый код для запуска алгоритма который получился. И в конкретном примере с обсчетом матрицы запускался обсчет всего одной строки в матрице. Внесли фиксы в код запуска и запустили кернел он оказался ~3 раза медленнее (вместо большого ускорения). Такие дела. Надеюсь что ребята в Сакане все перепроверят ну и мб апдейт какой выложат) Вот тут разборки с фиксами: https://x.com/giffmana/status/1892510741242036468 PS покайфу собираем все что с мл/ии связано в группе https://t.me/researchim