"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское соревнование по написанию агентов, которое состоится в конце ноября. Зарегистрироваться можно тут. С нами уже 300 команд! Среда работы для агентов будет выглядеть так: (1) Подключаемся к API конкретного соревнования. (2) Запускаем новую сессию (3) Получаем поочередно новые задачи и передаем агенту, которому нужно будет дергать эти API для выполнения задачи (4) Когда агент выполнил все задачи, сессия закрывается автоматом. Можно теперь ждать результаты. Можно будет запускать любое число сессий, главное прописывать в них специфику эксперимента. Модель такая-то, архитектура такая-то итп. И как раз сегодня у меня впервые получилось отладить весь этот процесс end-to-end, включая ""ловушки"" в задании. Вывод работы - на скриншоте. К слову, SGR agent на 4o справляется с таким заданием в 75% случаях. Но я задачи для соревнования буду усложнять так, чтобы он не особо справлялся. Ваш, @llm_under_hood 🤗"
"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское…
Из этого канала
- #689"Кейс с LLM под капотом - поиск видео для монтажа рекламы Давайте расскажу вам…
"Кейс с LLM под капотом - поиск видео для монтажа рекламы Давайте расскажу вам еще про один кейс достаточно необычного использования LLM в продуктовых целях.
- #690Claude поддерживает Structured Output Наконец-то, и Anthropic добавили нативную…
Claude поддерживает Structured Output Наконец-то, и Anthropic добавили нативную поддержку генерации ответов по JSON схеме без повторных запросов и ошибок…
- #692Платформа для ERC3: AI Agents открыта! На ней мы будем проводить соревнование…
Платформа для ERC3: AI Agents открыта! На ней мы будем проводить соревнование 26 ноября (и после) по поиску оптимальных архитектур для AI агентов.
- #687Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про…
Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про Schema-Guided Reasoning говорили и писали уже много.
- #686В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema…
В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema добавили в Google во все поддерживаемые модели Gemini (в старые версии - с…