SDK / API для Enterprise RAG Challenge обновлены - поправьте заранее своих агентов! Детали есть в release notes для версии 1.1.6. Там есть breaking changes. Примеры агентов уже обновлены до SDK 1.2.0. Изменения: (1) При запуске бенчмакрка можно явно указать фокус - точность, стоимость, скорость и/или локальный запуск (можно несколько сразу). Это будет использоваться в соревновании 9 декабря. Агенты с фокусом на `accuracy` cоревнуются за призы. Другие фокусы - пойдут в отдельные leaderboards. (2) изменился формат отправки статистики tokens - теперь это просто типизированные поля. (3) при отправке телеметрии еще нужно отправлять completion (текст ответа llm-ки). Prompt отправлять не обязательно. Пожалуйста, заранее обновите своих AI агентов до новой версии SDK и запустите один раз на ERC3-DEV или ERC3-TEST, чтобы убедиться, что весь код отрабатывает штатно. 9 Декабря достаточно будет перезапустить код на ERC3-PROD. План на 9 декабря 9:00 CET - Keynote 10:30 CET - открывается ERC3-PROD 11:30 CET - prize deadline для `accuracy`. То есть час на прогон агента и отладку (если что-то вдруг падает) Extended competition (без призов) - до 16 декабря. 16 декабря замораживаем leaderboards (они будут опубликованы на TimeToAct и abdullin.com) и раскрываем evals/scoring для ERC3-PROD. Уведомления на почту вышлем всем зарегистрированным участникам. Платформа | Регистрация | Пример агента | Видео на русском Ваш, @llm_under_hood 🤗
SDK / API для Enterprise RAG Challenge обновлены - поправьте заранее своих…
Из этого канала
- #711Стрим с Эриком Эвансом начнется через 15 минут тут: YouTube. Он создал…
Стрим с Эриком Эвансом начнется через 15 минут тут: YouTube. Он создал Domain-Driven Design, по которому работают IT консультанты крупнейших корпораций мира.
- #712ERC3-PROD is live (1) Призовой сompete-accuracy раунд продлится в сумме 3 часа.…
ERC3-PROD is live (1) Призовой сompete-accuracy раунд продлится в сумме 3 часа. 10:40 CET - 13:40 CET.
- #713Три технических отличия успешных внедрений ИИ в бизнес - это мой доклад на…
Три технических отличия успешных внедрений ИИ в бизнес - это мой доклад на платформе ИИтоги-25.
- #709Записали keynote interview с Эриком Эвансом на тему DDD + LLMs. Проиграем его 9…
Записали keynote interview с Эриком Эвансом на тему DDD + LLMs. Проиграем его 9 декабря, в начале ERC3! Ссылку опубликую в канале на следующей неделе.
- #708"Что оказалось для вас самым ценным инсайтом при разработке своего AI агента на…
"Что оказалось для вас самым ценным инсайтом при разработке своего AI агента на ERC3 платформе? Уже 17 команд (из 492) выбили идеальные 100 на ERC3-DEV…