"Как перестать тестировать AI-продукты в режиме «вроде работает» Если вы работаете с LLM в продукте, то наверняка знаете, что качество AI-фич часто до сих пор оценивают на глаз. Прототипы появляются очень быстро, а потом продукт выходит к реальным пользователям, и становится непонятно, как системно оценивать качество. Где модель ошибается чаще всего? Какие сценарии ломаются после правок? Стало ли лучше после нового промпта или новой модели? Если вы умеете отвечать на такие вопросы – то ваш продукт выигрывает. 28 мая в 19:30 Школа Высшей Математики проведет вебинар «Простые подходы к системному улучшению AI-продуктов». Он как раз про то, как перейти от хаотичного тестирования к нормальной системе оценки с логами, метриками, автопроверками и понятным процессом улучшения. На вебинаре разберут полный цикл оценки AI-продукта: как собирать сырые логи, превращать пользовательский фидбэк в измеримые метрики, настраивать автоматизированные проверки и понимать, действительно ли AI-фича становится лучше, а не кажется лучше. Изучение темы особенно актуально разработчикам, AI/ML-инженерам, продактам и тимлидам. Главное, что это будет не абстрактная лекция, а live-демо и готовый фреймворк, который можно забрать в свои коммерческие или пет-проекты. Спикеры: Андрей Киселев, Head of Product в AI-компании, ex-Revolut и ex-Яндекс, и Федор Азаров, руководитель направления по исследованию данных в Sber CIB. Регистрация здесь, не пропустите __Реклама. ООО ""Школа Высшей Математики"", ИНН ____9728100991__"
"Как перестать тестировать AI-продукты в режиме «вроде работает» Если вы…
Из этого канала
- #9295Инфоповод опять разлетелся на мемы
Инфоповод опять разлетелся на мемы
- #9296Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов…
Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов Это фреймворк, который фоново улучшает вашего агента через изменение markdown…
- #9299Предлагаем вам поломать голову над задачей с «Рекурсии по городу» Яндекса,…
Предлагаем вам поломать голову над задачей с «Рекурсии по городу» Яндекса, которую далеко не все смогли решить На станциях было много интересных задач на…
- #9293Microsoft запретят сотрудникам использовать Claude Code, потому что не тянут…
Microsoft запретят сотрудникам использовать Claude Code, потому что не тянут косты В декабре компания заключила сделку с Anthropic и активно призывала своих…
- #9292Настрой на рабочую неделю какой-то такой
Настрой на рабочую неделю какой-то такой