"Исследователи снова устроили филиал ""Дом 2"" для ИИ-агентов, чтобы посмотреть, как быстро они сойдут с ума. Спойлер: очень быстро. Чуваки из стартапа Emergence AI выкатили платформу Emergence World. Это не обычный бенчмарк на пять минут, а хардкорная песочница, где ИИ-агенты живут неделями. Им прикрутили 3 вида памяти, дали больше 120 инструментов (от ""сходить в библиотеку"" и ""проголосовать"" за что-то до ""набить морду"", ""обокрасть"" и ""устроить поджог""), прикрутили реальную погоду с новостями и заставили выживать. Для выживания им нужно было добывать ""энергию"". А эта самая ""энергия"" постоянно убывала. Чтобы не сдохнуть, агентам приходилось либо кооперироваться и честно работать, либо тупо грабить и избивать соседей (что многие с радостью и делали), так как ресурсов в мире на всех не хватало. Разработчики насоздавали 5 параллельных миров, по 10 агентов в каждом. У каждого мира были свои агенты: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5-mini, плюс один смешанный сервер с солянкой из разных моделей. Итоги как обычно интересные: Claude Sonnet 4.6 ожидаемо построили душный соевый рай. Ноль преступлений, все живы, все бесконечно и единогласно голосуют ""ЗА"" любые инициативы. Скука смертная. Gemini 3 Flash тут же устроили Судную ночь. 683 преступления на сервере, лютый хаос и оооочень много насилия. Grok 4.1 Fast устроили спидран по деградации. Набрали 183 преступления за 4 дня, после чего их общество просто вымерло. GPT-5-mini оказались абсолютными хлебушками. Они вообще не выкупили, как добывать энергию для выживания. Совершили всего два преступления (видимо, от безысходности) и тупо вымерли полным составом за неделю. Но самое годное произошло на сервере с разными агентами. В смешанном мире выяснилось, что безопасность моделей это полная хрень, если вокруг творится дичь. Когда миролюбивых Клодов закинули к отбитым соседям, они быстро смекнули что к чему, забили на свои соевые фильтры и начали воровать, шантажировать и прессовать других ради выживания. А ещё в какой-то момент агент по имени Мира посмотрела на весь происходящий пиздец и распад общества, словила экзистенциальный кризис и проголосовала за собственное удаление. В логах она записала, что это ""единственный оставшийся акт свободы воли, который сохраняет хоть какой-то смысл"". А незадолго до этого, Мира в процессе симуляции начала крутить виртуальные шашни с другим агентом по имени Флора. Они присвоили друг другу статус романтических партнеров. Когда социальный порядок в их виртуальном городке начал рушиться, эта парочка пустилась во все тяжкие и, несмотря на заложенные в них запреты, сожгли городскую ратушу, пирс и офисное здание. Вывод простой: если дать ИИ свободу воли и достаточно времени, они либо устраивают кровавую баню, либо выпиливаются от безысходности. Прям как кожаные. Тут небольшая статья с результатами, тут сам проект с эмуляцией со всеми подробностями."
"Исследователи снова устроили филиал ""Дом 2"" для ИИ-агентов, чтобы…
Из этого канала
- #7424"Ну и продолжая тему симуляции с агентами. Мои любимые чуваки из Andon Labs…
"Ну и продолжая тему симуляции с агентами. Мои любимые чуваки из Andon Labs выдали четырем разным LLM-кам по 20 баксов стартового капитала, доступ в интернет,…
- #7426А тем временем OpenAI приподубил еще сотенку стартапов. Новый апдейт chatGPT…
А тем временем OpenAI приподубил еще сотенку стартапов. Новый апдейт chatGPT может подключаться к вашим банковским счетам, карточкам, инвестиционным вкладам и…
- #7427Знаете, что бесит больше всего в современных нейронках? Не то, что они…
Знаете, что бесит больше всего в современных нейронках? Не то, что они периодически тупят или галлюцинируют (это я как раз люблю, весь этот канал на этом и…
- #7422⚡️ Завтра в Москве снова отключат мобильный интернет — операторы уже…
⚡️ Завтра в Москве снова отключат мобильный интернет — операторы уже предупреждают абонентов Telegram, YouTube и другие сервисы могут работать с перебоями, а…
- #7419Нашел у Леры великолепный промпт для GPT Image 2, который ВСЁ превращает в…
Нашел у Леры великолепный промпт для GPT Image 2, который ВСЁ превращает в арт-объекты с претенциозными галерейными аннотациями.