"Как перестать тестировать AI-продукты в режиме «вроде работает» Если вы… — @data_secrets

"Как перестать тестировать AI-продукты в режиме «вроде работает» Если вы работаете с LLM в продукте, то наверняка знаете, что качество AI-фич часто до сих пор оценивают на глаз. Прототипы появляются очень быстро, а потом продукт выходит к реальным пользователям, и становится непонятно, как системно оценивать качество. Где модель ошибается чаще всего? Какие сценарии ломаются после правок? Стало ли лучше после нового промпта или новой модели? Если вы умеете отвечать на такие вопросы – то ваш продукт выигрывает. 28 мая в 19:30 Школа Высшей Математики проведет вебинар «Простые подходы к системному улучшению AI-продуктов». Он как раз про то, как перейти от хаотичного тестирования к нормальной системе оценки с логами, метриками, автопроверками и понятным процессом улучшения. На вебинаре разберут полный цикл оценки AI-продукта: как собирать сырые логи, превращать пользовательский фидбэк в измеримые метрики, настраивать автоматизированные проверки и понимать, действительно ли AI-фича становится лучше, а не кажется лучше. Изучение темы особенно актуально разработчикам, AI/ML-инженерам, продактам и тимлидам. Главное, что это будет не абстрактная лекция, а live-демо и готовый фреймворк, который можно забрать в свои коммерческие или пет-проекты. Спикеры: Андрей Киселев, Head of Product в AI-компании, ex-Revolut и ex-Яндекс, и Федор Азаров, руководитель направления по исследованию данных в Sber CIB. Регистрация здесь, не пропустите __Реклама. ООО ""Школа Высшей Математики"", ИНН ____9728100991__"

Из этого канала