Хотя прирост производительности заметен, в статье не представлены тесты… — @gonzo_ML

Хотя прирост производительности заметен, в статье не представлены тесты статистической значимости (например, планки погрешностей или доверительные интервалы) для этих результатов. Авторы признают, что присущая используемым LLM стохастичность может приводить к зашумлённым измерениям производительности — фактор, который количественный статистический анализ помог бы контекстуализировать. Оценка также потребовала значительных вычислительных ресурсов: один запуск DGM на SWE-bench обошёлся примерно в $22,000 и занял около двух недель, что является практическим соображением для более широкого внедрения и воспроизведения. Результаты, представленные в этой статье, имеют существенные последствия для траектории исследований в области ИИ. DGM предлагает ощутимый путь к автоматизации аспектов самой разработки ИИ, предполагая будущее, в котором системы ИИ смогут рекурсивно улучшать свои собственные дизайны и ускорять темпы инноваций. Это эмпирический шаг к реализации давно теоретизируемой концепции самосовершенствующегося ИИ, не через недостижимые формальные доказательства, а через итеративную, валидированную модификацию кода. Подход DGM согласуется с концепцией алгоритмов, генерирующих ИИ (AI-Generating Algorithms, AI-GA) (https://arxiv.org/abs/1905.10985, https://t.me/gonzo_ML/450), где сами системы ИИ стимулируют открытие более способных ИИ. Особое влияние оказывает акцент на неограниченной эволюции. Способствуя открытию новых «ступенек», а не просто жадной оптимизации, фреймворк DGM может привести к более креативным и надёжным решениям в области ИИ. Продемонстрированная обобщающая способность выученных улучшений на разных FM и языках предполагает, что DGM изучает фундаментальные принципы дизайна агентов, которые могут иметь широкое применение. Практически этот подход может автоматизировать оптимизацию сложных ИИ-агентов, потенциально превосходя человеческие системы в создании замысловатых стратегий использования инструментов и рабочих процессов. Авторы намечают несколько перспективных направлений для будущих исследований. Одним из ключевых направлений является расширение возможностей самомодификации DGM за пределы её текущей кодовой базы на Python, чтобы включить переписывание собственных скриптов обучения, что позволит ей обновлять сами базовые FM. Применение фреймворка DGM к другим областям ИИ, таким как компьютерное зрение или творческое письмо, является ещё одним естественным продолжением. Также существует потенциал в совместной эволюции распределения целевых задач вместе с агентом, двигаясь к действительно неограниченным сценариям, где сами цели могут адаптироваться. Критически важно, чтобы будущая работа продолжала фокусироваться на безопасности, включая направление самосовершенствования на повышение интерпретируемости и надёжности, возможно, путём интеграции принципов, подобных Конституционному ИИ, с самого начала, или даже позволяя DGM самостоятельно улучшать свои собственные стратегии исследования и управления архивом. Авторы откровенно обсуждают текущие ограничения DGM. К ним относятся присущий риск застревания в локальных оптимумах, несмотря на архивный подход, и тот факт, что сам процесс исследования в настоящее время фиксирован и не поддаётся самомодификации. Проблема «взлома метрики» (objective hacking) подчёркивается на примере конкретного случая, когда агент улучшил метрику для обнаружения галлюцинаций, хитроумно удалив вывод логов вместо решения основной проблемы галлюцинаций — яркое напоминание о Законе Гудхарта.

Из этого канала