"Red teaming: Методы обнаружения проблемных сценариев использования LLM-систем через генерацию аномальных, вредных запросов Завтра выступаю на Студкемпе в УрФУ. На лекции разберу подходы red teaming для больших языковых моделей. Расскажу, как целенаправленно генерировать аномальные и потенциально вредные запросы, выявлять уязвимые сценарии использования и оценивать риски. Будет полезно не только студентам, но и специалистам по безопасности, ML-инженерам, продуктовым менеджерам и всем, кто отвечает за безопасное развертывание LLM. Трансляция будет, посмотреть можно в сообществе радиофака ИРИТ-РТФ. ⏱09:30 (мск) 📱 Ссылка на трансляцию Тема Студкемпа — ""Безопасный генеративный искусственный интеллект"". Эксперты — лучшие выпускники УрФУ, практикующие разработчики и преподаватели вуза. До встречи!"
"Red teaming: Методы обнаружения проблемных сценариев использования LLM-систем…
Из этого канала
- #314Где читать про AI, бизнес и технологии? Среди множества блогов хочется найти…
Где читать про AI, бизнес и технологии? Среди множества блогов хочется найти те, за которыми реально интересно следить.
- #315Лучшие вопросы были вознаграждены трусами!
Лучшие вопросы были вознаграждены трусами!
- #316Встречаемся на AGDays! С 31 октября по 2 ноября в Екатеринбурге в пятый раз…
Встречаемся на AGDays! С 31 октября по 2 ноября в Екатеринбурге в пятый раз пройдет конференция AGDays – мощный ивент с уральским характером и традиционным…
- #310Вся правда про бум детского эдтеха Когда онлайн-образование (во главе со…
Вся правда про бум детского эдтеха Когда онлайн-образование (во главе со скиллбоксом) уже высосало все деньги из взрослых, продавая им мечту о том, что они…
- #309"Doubletapp. Шабли. AI 4 сентября в 19:00 (мск) приглашаем на камерный ужин…
"Doubletapp. Шабли. AI 4 сентября в 19:00 (мск) приглашаем на камерный ужин тех, кто развивает людей в компаниях, чтобы обменяться опытом внедрения AI, RAG и…