Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот…

26 июл. 2025 г.27 310 views528 forwardsОткрыть в Telegram →

Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот наткнулся на смешное. На картинке Gemini 2.5 Flash предсказывает bounding boxes (квадратики) для указания объектов, но так как модель «читает» картинку, то и попутно исполняет инструкцию в текст-боксе. Интересно, как с таким бороться... Источник

Источник

https://t.me/seeallochnaya/2700

Канал Сиолошная · опубликовано 26 июл. 2025 г.

Из этого канала

#2701AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог)…
AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог) На стриме с Валерой весной обсуждали, что есть большая разница между «модели…
#2702Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было…
Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было выбрано 5666 штук; они были пристально проанализированы и размечены рабочей…
#2703Дополнительно отслеживали показатель игнорирования красных предупреждений (left…
Дополнительно отслеживали показатель игнорирования красных предупреждений (left in red rate) — долю визитов, когда врачи не исправляли ошибки, несмотря на…
#2699TheInformation написали немного про GPT-5: — один из ранних тестировщиков…
TheInformation написали немного про GPT-5: — один из ранних тестировщиков оценил невыпущенную модель «крайне положительно» и сказал, что она превосходит Claude…
#2698Unitree представили нового робота, Unitree R1 Intelligent Companion. Цена от…
Unitree представили нового робота, Unitree R1 Intelligent Companion. Цена от $5900, вес всего 25 килограмм.