А вы знаете, что пост про демку бизнес-ассистента с SGR под капотом - это самый тщательно скрываемый секрет нашего коммьюнити? Если верить статистике Telegram, этот пост люди пересылали в личке разы чаще, чем все остальные посты, но никто не шарил этот пост публично. Правда секретом это будет оставаться не так долго. Следующий ERC (это наш формат соревнований) точно будет про Enterprise Reasoning Challenge, где командам нужно будет построить агента или мультиагентную систему, которые смогут использовать предоставленные им API, чтобы распутывать корпоративные задачки. Все как в SGR демке, только чуть масштабнее. Событие планируется осенью/зимой. Точные сроки зависят от того, как быстро раскачаются отделы маркетинга в TimeToAct и IBM. Тестовый прогон будет точно этой осенью. Формат проведения будет примерно аналогичен прошлому Enterprise RAG Challenge: команды со всего мира, небольшой призовой фонд, максимально открытые исходники и публичный сравнительный анализ результативности различных архитектур. Возможно, все вместе сможем обнаружить новые паттерны в построении агентских систем для бизнеса. Ваш, @llm_under_hood 🤗
А вы знаете, что пост про демку бизнес-ассистента с SGR под капотом - это самый…
Из этого канала
- #639"Попробовал в деле Schema Guided Reasoning - перевёл на неё скрипт составления…
"Попробовал в деле Schema Guided Reasoning - перевёл на неё скрипт составления протокола встречи по транскрипту встречи. Результаты: 1.
- #640⬆️ Я всегда очень рад читать такие отзывы! Здорово, что решения работают и…
⬆️ Я всегда очень рад читать такие отзывы! Здорово, что решения работают и помогают вам делать продукты с LLM под капотом точнее, умнее и быстрее.
- #641"Валерий Ковальский (@neuraldeep) поделился опытом использования SGR-подходов в…
"Валерий Ковальский (@neuraldeep) поделился опытом использования SGR-подходов в обзоре ""SGR vs Tools: когда использовать Schema-Guided Reasoning, а когда…
- #637Какая самая маленькая LLM, которая может управлять бизнес-агентами? Участники…
Какая самая маленькая LLM, которая может управлять бизнес-агентами? Участники сообщества и курса решили выяснить это и допилили SGR демку до состояния, что она…
- #636Бенчмарк новых моделей: Grok, Opus 4.1, Mistral Medium 3.1 Elon Musk что-то…
Бенчмарк новых моделей: Grok, Opus 4.1, Mistral Medium 3.1 Elon Musk что-то делает правильно.