И еще в продолжении темы про новый роман Пелевина, есть есть очень… — @cdo_club

И еще в продолжении темы про новый роман Пелевина, есть есть очень примечательный блок про его рассуждение на тему ИИ и творчества. Приведу тут его дисциляцию # Может ли ИИ творить искусство Когда спрашивают, заменит ли искусственный интеллект творца — настоящего художника, писателя, композитора, — ответ кажется делом времени и масштаба моделей. На самом деле он лежит глубже: в структурной асимметрии между тем, что делает большая языковая модель, и тем, что делает гений. Эти два процесса не просто непохожи. Они *противоположны*. Языковая модель устроена так, чтобы предсказывать. Она оценивает вероятностное распределение следующего токена при заданном контексте и выбирает наиболее правдоподобный вариант — с поправкой на стохастичность, но с общим вектором в сторону вероятного. Каждое сгенерированное слово — это статистический максимум по корпусу обучения. Творчество же двигается в обратную сторону. Гениальное высказывание потому и гениально, что оно маловероятно. До того, как Малевич нарисовал чёрный квадрат, чёрный квадрат был невозможным следующим жестом в живописи. После — стал необходимым. Здесь и кроется ловушка, в которую попадают сторонники тезиса «ИИ скоро научится». С точки зрения чистой статистики гениальность неотличима от абракадабры. Фраза Кручёных «Дыр бул щыл убеш щур» по своей информационной энтропии практически совпадает с любой случайной последовательностью слогов. Если стихи Кручёных и манифесты футуристов не входили в обучающий корпус, модель оценит обе строки как равно невозможные и одинаково их отвергнет. Это значит: формальный язык вероятностей не различает прорыв и шум. Различение проходит по другому слою — по слою смысла. И вот ключевой пункт. Гений производит не информацию. Он не создаёт сообщений, уменьшающих неопределённость уже существующей модели мира. Он создаёт новое пространство представлений — или, как минимум, новую систему связей между уже существующими. Это операция другого порядка. Информационная энтропия здесь не применима, потому что меняется не вероятность исходов в данном пространстве событий, а сама размерность пространства. Из этого следует более общая претензия к теории информации в применении к языку. Шенноновская энтропия работает с синтаксическими вероятностями — и принципиально не учитывает то, что составляет настоящую «энергию» слова: смысл, прагматику, эстетическую ценность, новизну, уместность. Эти параметры субъективны, не поддаются строгой формализации и не моделируются. Клише в нужном месте может быть жестом гения. Абракадабра — тоже. В другом месте — это просто клише и просто абракадабра. Граница проходит не по тексту, а по контексту, который модель не видит. Отсюда — известный эффект. Замкнутую языковую модель, обучающуюся на собственных генерациях, ждёт смысловая смерть: рост энтропии смысла при сохранении или даже снижении информационной энтропии. Текст останется грамотным, гладким, синтаксически безупречным — и при этом постепенно лишится сцепления с реальностью. Это то, что в литературе по машинному обучению называется *model collapse*: модель, которой скармливают выхлоп других моделей, вырождается так же, как вырождаются коровы, в чей корм добавляют костную муку других коров. Каннибализм данных производит ту же патологию, что и каннибализм биологический. Прикладной вывод для людей, работающих со словом: настраивать собственную внутреннюю модель имеет смысл на корпусе великих книг — но в зрелости тренироваться нужно на сыром массиве реальности, а не на чужих готовых формулировках. Тот, кто читает только современников, обречён воспроизводить их статистическое среднее.

Из этого канала