"🚀 О важности ТЗ 🚀 В крупных каналах все восхищаются тем, как быстро Банана Времени создает изображения с любой точки и из любой эпохи. Вот, например, можно посмотреть глазами простого наземного лейтенанта, как Гагарин отправился покорять космос. И если бы я не родился и не прожил какое-то время на Байконуре, я бы, скорее всего, не сразу сообразил, что не так с этой псевдофотографией/фотогенерацией, созданной ради хайпа админом одного канала-миллионника с помощью ИИ. Но мой глаз в ленте мгновенно зацепился за нее. И вот почему. Небольшой экскурс: в 1960-м году произошла Неделинская катастрофа. Тогда маршал Неделин, боявшийся не успеть отчитаться перед Хрущевым, заставил команду Янгеля осуществить испытания ракеты Р-16 без исправления явных ошибок безопасности. Эту историю мне рассказывал мой дед, а я вам приведу цитату из Википедии: Подавая пример бесстрашия, маршал Неделин сидел на стуле на так называемой «нулевой отметке» — примерно в семнадцати метрах от подножия ракеты. Рядом с ним находились заместитель министра общего машиностроения, главные конструкторы систем ракеты и их заместители. Система пиромембран была ещё не до конца отработана. В момент предполагаемого старта произошел взрыв и расходившиеся от ракеты концентрические волны пламени распространялись с огромной скоростью и поглощали всё на своём пути. Тогда погибло более 120 человек и с тех пор по правилам ближайшая точка, где могут находиться люди, лежит не ближе 1,8 км от места старта. То есть не могло в 1961 году быть такой композиции. __Когда мне было 6 лет, дед в первый раз привез меня на запуск. На безопасном расстоянии в 4 километра ракета казалась муравьем. Но эти несколько минут я запомнил на всю жизнь: гром от старта был такой силы, что мне казалось, что небо разрывается на части. Это было в миллион раз громче, чем стоять на концерте ____🎸____Сепультуры под колонкой. Представьте, что 200 реактивных истребителей взлетают одновременно с одного пятачка земли - и это только звук. Земля ходит под ногами ходуном, как при землетрясении. Страшно. Очень. __ Но нейронка этого не знает. Ее генерация выглядит как милое фото из моего детства, снятое в 80х. Вот только по промпту на ней должна быть изображена не ракета ""Союз"", а ""Восток"". Грузовики на переднем плане - это гибрид ""Урала"" и ""Студебеккера"", хотя должны быть ""ЗИЛы"". Фермы из другой эпохи. Короче, проще сказать, что здесь криво. По сути перед нами изображение за секунду до той самой катастрофы. __Интересно, что когда я показывал этот кейс на вчерашнем занятии в ____💙____💙____💙____, то студенты буквально за минуту перечислили эти характеристики, хотя никто из них на Байконуре не жил. Это вселяет уверенность в людей)__ ""Душнила"" - скажете вы и, конечно, будете правы. Но если закопаться в суть проблемы, то окажется, что проблема несовпадения в том, что в обучающей выборке у нейронки гораздо больше фотографий позднего периода, чем архивных снимков старта Гагарина. Так что даже одного только грамотного промпта недостаточно если вы хотите получить качественный результат. Автор картинки понадеялся, что ИИ сам залезет в Вики, сопоставит факты и поймет: ага, это Гагарин, значит ракета ""Восток 8К72К"". Но нейросети (особенно диффузионные) обладают нулевым кругозором и мыслят образами, а не фактами. Для них ""Байконур + Ракета"" = ""Среднестатистическая картинка ракеты на Байконуре"" (строго говоря, это верно и для большинства людей). А в интернете 90% фото — это современные ""Союзы"". Модель всегда тяготеет к современности, потому что таких данных больше. Если вам нужна история, вам нужно силой выбивать ллмку из этого состояния. Чтобы убрать анахронизмы, нужно не только сказать, что рисовать, но и чего не рисовать (это задается негативным промптом). Так что в подавляющем числе случаев мы можем сносно управлять только первыми двумя и последним параметрами. Вот почему важно давать корректные структурные промпты и почему `никогда не стоит давать ИИ загадки`. За исключением ситуаций, когда вы хотите ее на чем-то подловить."
"🚀 О важности ТЗ 🚀 В крупных каналах все восхищаются тем, как быстро Банана…
Источник
https://t.me/aivkube/595Канал AI в кубе |AI³ | Сергей Долгов · опубликовано 26 нояб. 2025 г.
Из этого канала
- #596"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки,…
"В новом хайповом онлайн-тесте ""AI or not"" мне удалось угадать все картинки, сгенерированные ИИ (например, в озере отражается голубое небо, хотя сверху оно…
- #598"Небольшой конфуз случился у Microsoft, которые выкатили агентскую модель…
"Небольшой конфуз случился у Microsoft, которые выкатили агентскую модель Fara-7B для управления ПК.
- #599"Поздравляю всех с очередной пятницей! За прошлую неделю в канале появилось…
"Поздравляю всех с очередной пятницей! За прошлую неделю в канале появилось 300+ новых подписчиков, чему я безумно рад! Спасибо, что доверили свое внимание…
- #594Если вы когда-нибудь озабочивались тем, чтобы перевести в текст реально БОЛЬШОЙ…
Если вы когда-нибудь озабочивались тем, чтобы перевести в текст реально БОЛЬШОЙ аудиофайл в текст, то рекомендую вам графическую оболочку от Кая Дрёге из…
- #590"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по…
"Андрей Карпаты, легенда ИИ, сооснователь OpenAI и бывший директор по искусственному интеллекту в Tesla, в очередной раз порадовал и выложил в открытый доступ…