"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents. Получается довольно симпатично, сейчас все расскажу. В общем, будет сайт платформы. Все, кто зарегистировался в ERC3 (сделать это можно тут), смогут получить AccessToken для него. На этом сайте будут доступны несколько стендов. Каждый стенд - это набор систем, которые работают вместе, вместе с описанием и API. Их можно вызывать как вручную, так и через агентов. Например, уже есть отладочный стенд `shop` (им я отлаживаю всю систему) - это APIшка для небольшого магазина, со своей логикой и базой. [1] Там есть такие методы: (1) GET /products - получить список продуктов (2) GET /basket - просмотреть текущую корзину (3) POST /backet/add,remove,checkout - добавить продукты в корзину, убрать из корзины, оплатить. Как это все использовать? Пишем скрипт, который: (1) Запускает новый эксперимент на стенде `store` (2) Пока остались нерешенные задачки в эксперименте (3) Забирает следующую задачку для эксперимента (например “Buy ALL GPUs”) и url для API В этот момент на платформе разворачивается изолированная среда, сконфигурированная специально под эту задачу. API будут настроены и заполнены данными под эту задачу. Даже, если параллельно 100 команд решают другие задачи - у них будут свои изолированные среды. (4) Теперь мы можем запустить своего агента, скормить ему url для API от этой задачи и отправить решать ее. Скорее всего, в этой задаче ""Buy ALL GPUs"", ему надо будет получить список продуктов, выбрать GPU, добавить их в корзину и сделать checkout [2] (5) Когда агент закончил работу, вызываем “завершить задачу” и идем в пункт (3) - пока остались задачки, решаем их. Если не осталось - можно посмотреть Score и логи выполнения задач агентом. [3] Запускать можно будет любое число экспериментов, помечая их метаданными по архитектуре, используемой модели, размеру GPU и всяческим параметрам. Это пригодится для AI R&D деятельности нашего коммьюнити и за пределами соревнования. Логика экспериментов и правила соревнования остаются аналогичными ERC2. Перед началом ERC3 я все еще раз напомню и проговорю. Доступ к этому тестовому стенду планирую дать в течение следующих дней 5-7. Доступ к стенду с API-шками от финального соревнования - за 10-14 дней до соревнования. Ну а конкретные соревновательные задачи откроются 26 ноября. Ну как вам оно? Ваш, @llm_under_hood 🤗 [1] `store` - это простейший тестовый стенд, к нему я дам доступ в ближашую неделю-другую. Для соревнования будет что-то более серьезное. [2] на самом деле, даже в этой простой задаче не все так просто. Ведь агент обнаружит, что API возвращает продукты только страницами по 3, что больше 3-х page size делать нельзя. А при попытке купить все GPU обнаружится, что 2 H100 уже купили, и надо переделывать корзину. Каждая задача в рамках стенда - уникальна. [3] Во время ERC посмотреть score на соревновательном стенде нельзя будет до момента оглашения победителей."
"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents.…
Из этого канала
- #686В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema…
В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema добавили в Google во все поддерживаемые модели Gemini (в старые версии - с…
- #687Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про…
Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про Schema-Guided Reasoning говорили и писали уже много.
- #688"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское…
"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское соревнование по написанию агентов, которое состоится в конце ноября.
- #684"Вставляет ли OpenAI ""втихую"" JSON схему в каждый запрос со Structured…
"Вставляет ли OpenAI ""втихую"" JSON схему в каждый запрос со Structured Outputs? Принципиально важно это для двух вещей: (1) инженерного подхода к построению…
- #683"Новости с полей про разворачивание системы с встроенным AI+Coding агентов Это…
"Новости с полей про разворачивание системы с встроенным AI+Coding агентов Это продолжение истории, которую я описывал в канале ранее. Оглавление тут.