Как проверять качество AI чатботов, которые интегрируются в бизнес? Вот примерно так, как на этом скриншоте. Список вопросов текстом слева и автоматические оценки справа. При необходимости - возможность зайти в каждый тест и посмотреть, что там было неправильно. Если командам разработки подготовить тесты/evals в таком формате (что не требует навыков в AI), тогда для самих разработчиков все становится кристально понятно, а процесс повышения качества превращается в увлекательную игру. __А как вы тестируете качество чатботов?__ Ваш, @llm_under_hood 🤗 PS: про мой подход к тестированию, см в истории про спасение проекта с LLM под капотом.