Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот наткнулся на смешное. На картинке Gemini 2.5 Flash предсказывает bounding boxes (квадратики) для указания объектов, но так как модель «читает» картинку, то и попутно исполняет инструкцию в текст-боксе. Интересно, как с таким бороться... Источник
Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот…
Из этого канала
- #2701AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог)…
AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог) На стриме с Валерой весной обсуждали, что есть большая разница между «модели…
- #2702Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было…
Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было выбрано 5666 штук; они были пристально проанализированы и размечены рабочей…
- #2703Дополнительно отслеживали показатель игнорирования красных предупреждений (left…
Дополнительно отслеживали показатель игнорирования красных предупреждений (left in red rate) — долю визитов, когда врачи не исправляли ошибки, несмотря на…
- #2699TheInformation написали немного про GPT-5: — один из ранних тестировщиков…
TheInformation написали немного про GPT-5: — один из ранних тестировщиков оценил невыпущенную модель «крайне положительно» и сказал, что она превосходит Claude…
- #2698Unitree представили нового робота, Unitree R1 Intelligent Companion. Цена от…
Unitree представили нового робота, Unitree R1 Intelligent Companion. Цена от $5900, вес всего 25 килограмм.