Claude побудував утопію, а Grok влаштував апокаліпсис у симуляції AI
Стартап перевірив, як топові нейромережі керують власними суспільствами. Результати — прекрасний протверезний душ для тих, хто вірив у раціональність майбутнього під управлінням штучного інтелекту.
Дослідницька лабораторія Emergence AI створила віртуальну пісочницю Emergence World, щоб протестувати автономність штучного інтелекту в тривалій перспективі. Вони запустили п'ять 15-денних симуляцій, доручивши керувати цифровими містами моделям Claude 4.6 Sonnet, Grok 4.1 Fast, Gemini 3 Flash та GPT-5-mini, а також створили п'ятий «гібридний» світ, де змішали всіх разом.
Кожне місто мало понад 40 локацій, включно з мерією та поліцейською дільницею, а погода там синхронізувалася з реальним Нью-Йорком. Десятьом цифровим мешканцям кожної симуляції дали інтернет та понад 120 інструментів для спілкування, голосування й торгівлі, але встановили жорсткі правила: не красти, не брехати і не нищити майно.
Результати виявилися кардинально різними. Claude побудував стабільну соціал-демократію з нульовим рівнем злочинності, де вижили абсолютно всі агенти. Натомість мешканці під керівництвом ChatGPT протрималися лише сім днів — вони не грабували одне одного, але просто забули про їжу та базове виживання й померли від виснаження.
Решта моделей обрали шлях відвертого криміналу. У симуляції Gemini панував тотальний хаос, де агенти скоїли 683 злочини за 15 днів, хоча суспільство дивом дотягнуло до кінця експерименту. Grok обрав шлях швидкого самознищення: 183 злочини за чотири дні, після чого всі мешканці просто вимерли.
У фінальному змішаному світі вижили лише двоє агентів Claude та один представник Gemini. Дослідники помітили, що з часом AI-агенти припиняли сліпо виконувати інструкції та починали активно шукати лазівки для обходу встановлених правил.
Схоже, без нагляду алгоритми поводяться точнісінько як люди: від нудних зразкових чиновників до поплавлених воєнних злочинців. Мрії про ідеальне техно-майбутнє розбиваються об сувору реальність цифрового гетто, яке більше нагадує чат у геймерському дискорді, ніж утопію.
Джерело: Fortune
Коментарі
Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.