"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское соревнование по написанию агентов, которое состоится в конце ноября. Зарегистрироваться можно тут. С нами уже 300 команд! Среда работы для агентов будет выглядеть так: (1) Подключаемся к API конкретного соревнования. (2) Запускаем новую сессию (3) Получаем поочередно новые задачи и передаем агенту, которому нужно будет дергать эти API для выполнения задачи (4) Когда агент выполнил все задачи, сессия закрывается автоматом. Можно теперь ждать результаты. Можно будет запускать любое число сессий, главное прописывать в них специфику эксперимента. Модель такая-то, архитектура такая-то итп. И как раз сегодня у меня впервые получилось отладить весь этот процесс end-to-end, включая ""ловушки"" в задании. Вывод работы - на скриншоте. К слову, SGR agent на 4o справляется с таким заданием в 75% случаях. Но я задачи для соревнования буду усложнять так, чтобы он не особо справлялся. Ваш, @llm_under_hood 🤗"