Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents Авторы: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune Статья: https://arxiv.org/abs/2505.22954 Код: https://github.com/jennyzzt/dgm Поиск искусственного интеллекта, способного автономно и непрерывно совершенствовать свои возможности, подобно биологической эволюции или научным открытиям, уже давно является одной из главных нерешённых задач. Большинство современных систем ИИ, несмотря на впечатляющие достижения, работают в рамках фиксированных, разработанных человеком архитектур, что ограничивает их потенциал для неограниченного роста. В этой статье представлена Машина Дарвина-Гёделя (Darwin Gödel Machine, DGM) — новая система, призванная преодолеть это фундаментальное ограничение. DGM пытается ответить на вопрос: как системы ИИ могут бесконечно улучшать себя, одновременно становясь лучше в решении релевантных задач? Её основной вклад — это самосовершенствующийся ИИ, который итеративно модифицирует *собственную кодовую базу* и, что особенно важно, *эмпирически валидировал* эти изменения с помощью бенчмарков по программированию. Черпая вдохновение в дарвиновской эволюции, DGM поддерживает архив сгенерированных «агентов-программистов», способствуя неограниченному поиску, что позволяет ей обнаруживать разнообразные улучшения и избегать попадания в ловушки локальных пиков производительности. DGM работает в рамках элегантного итерационного цикла. Он начинается с исходного агента-программиста, построенного на базе замороженной фундаментальной модели (FM) со способностью использовать инструменты. В каждом цикле «родительские» агенты выбираются из постоянно растущего архива. При этом отборе приоритет отдаётся агентам на основе комбинации их производительности (с использованием сигмоидального масштабирования для придания большего веса высоким оценкам) и бонуса за новизну (обратно пропорционального количеству уже произведённых ими «потомков», что поощряет исследование менее избитых путей). Затем эти родительские агенты анализируют *собственные логи оценки на бенчмарках*, чтобы диагностировать слабые места или предложить новые функции. Это предложение затем формулируется как новая постановка задачи для агента, которую он должен реализовать в своей собственной кодовой базе, генерируя «дочерних» агентов. Эти новые агенты оцениваются на бенчмарках по программированию, и успешные, функциональные варианты добавляются в архив. Ключевое нововведение заключается в отходе от теоретической машины Гёделя, какой её концептуализировал Шмидхубер (в работе «Gödel machines: Fully self-referential optimal universal self-improvers. Artificial general intelligence, 2007»), которая требовала *доказуемых* самомодификаций — практическое препятствие для сложных ИИ. DGM прагматично выбирает *эмпирическую валидацию*. Этот выбор является основополагающим: формальные доказательства пользы произвольных изменений кода в сложных системах ИИ в значительной степени трудноосуществимы. Эмпирическое тестирование обеспечивает реальный, наблюдаемый механизм для итеративного улучшения.
Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents Авторы:…
Из этого канала
- #3679Другой отличительной чертой является приверженность неограниченному…
Другой отличительной чертой является приверженность неограниченному (open-ended) поиску, вдохновлённому биологической эволюцией.
- #3680Хотя прирост производительности заметен, в статье не представлены тесты…
Хотя прирост производительности заметен, в статье не представлены тесты статистической значимости (например, планки погрешностей или доверительные интервалы)…
- #3681Безопасность и интерпретируемость остаются первостепенными проблемами; по мере…
Безопасность и интерпретируемость остаются первостепенными проблемами; по мере самомодификации агентов их внутренняя логика может становиться всё более сложной…
- #3677Очередная интересная статья от крутого коллектива, включающего Jeff Clune,…
Очередная интересная статья от крутого коллектива, включающего Jeff Clune, Sakana AI и прочих. Sakana — это вообще, кажется, самая интересная лаба Азии.
- #3676Поразительно, конечно, изменился рынок за пару лет. Теперь центр топового…
Поразительно, конечно, изменился рынок за пару лет. Теперь центр топового опенсорса -- Китай.