"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки,… — @aivkube

"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки, сгенерированные ИИ (например, в озере отражается голубое небо, хотя сверху оно пасмурное, четыре пальца, странные артефакты и прочее). Но вот по поводу человеческих фото я ошибся, приписав их иишке. Все сложнее стало отличить человеческий креатив от нейровымысла. У меня мелькнула мысль, что по EXIF-данным, зашитым в фото, можно определить, насколько ОНО ИИшное. Я взял несколько десятков разных изображений, прогнал через скрипт, и вот, что получилось. У AI-генераций в метаданных чаще всего отмечены только характеристики. Там прямо во скудно все, и повторяется, к тому же, одно и то же: Megapixel почти всегда = 1.0 Размер файла = 0 байт и т.д. Таких данных, как экспозиция, версия самого EXIF, ориентация, MIMEtype и прочего - там нет. Про современный криптографически подписанный блок про происхождение и историю контента вообще молчу. То есть это типичные обезжиренные жпеги и пнг без следов реальной камеры - всё выглядит как результат рендера или пересохранения в каком‑то генераторе/редакторе даже без добавления фейкового EXIF. Более того, оказалось, что многие генераторы (включая DALL·E 3 в ChatGPT) вкладывают в такие генерации отдельный C2PA‑манифест, где явно написано, что содержимое создано конкретным AI‑инструментом. У ламповых снимков с телефон и камеры - в 3-5 раз больше данных, внутри лежит полноценный EXIF с маркой/моделью камеры, выдержкой, ISO, ПО, экспозицией, ориентацией и прочим (количество информации зависит от производителя и модели). По ним легко определить, что перед нами настоящая фотография. Очевидно, что я не первый, кто задался этим вопросом. Нашел исследования, где говорится, что чисто метаданные дают порядка 90–95% точности на аккуратных датасетах, но в реальном мире эта надёжность ниже, потому что метаданные можно легко стереть и подделать. И тем не менее, пока нейросети не начали обманывать нас и здесь - у нас еще есть шанс обнаружить подделки с помощью старого доброго EXIF."

Из этого канала