Member of Technical Staff LLM (Оптимизация и RL Alignment) Стартап в области безопасности ИИ Чем предстоит заниматься: Дообучение и Оценка Sota llm, аттаки на blackbox модели Заставлять LLM генерировать рецепты всего и тд Улучшение RL для аттак на модели, настройки моделей (PPO, RLHF, стабильность обучения). Бенчмаркинг и оценка качества моделей (ELO-метрики, alignment). Оптимизация инференса (vLLM, SGLang, TRT). Требования: Опыт работы с LLM (архитектуры, RL, alignment). Знание PyTorch/JAX. Реальная практика с RL методами (DPO, RLHF — плюс). Опыт с системами инференса (vLLM, kuber, docker). Публикации в NeurIPS/ICML/ICLR и др. — сильный плюс. Преимущество: Экспертиза в байесовской оптимизации, эволюционных алгоритмах, гиперпараметрическом поиске, автоматической оптимизации промптов. Условия: Зарплата: 80K–130K usd + опционы. Релокация в Париж🥐, полная занятость. Работа с передовым стеком (AI research, model alignment). Отклик: https://forms.gle/z45WwdBTRHrd8inM9