"Red teaming: Методы обнаружения проблемных сценариев использования LLM-систем… — @serega_ceo

"Red teaming: Методы обнаружения проблемных сценариев использования LLM-систем через генерацию аномальных, вредных запросов Завтра выступаю на Студкемпе в УрФУ. На лекции разберу подходы red teaming для больших языковых моделей. Расскажу, как целенаправленно генерировать аномальные и потенциально вредные запросы, выявлять уязвимые сценарии использования и оценивать риски. Будет полезно не только студентам, но и специалистам по безопасности, ML-инженерам, продуктовым менеджерам и всем, кто отвечает за безопасное развертывание LLM. Трансляция будет, посмотреть можно в сообществе радиофака ИРИТ-РТФ. ⏱09:30 (мск) 📱 Ссылка на трансляцию Тема Студкемпа — ""Безопасный генеративный искусственный интеллект"". Эксперты — лучшие выпускники УрФУ, практикующие разработчики и преподаватели вуза. До встречи!"

Из этого канала