Касра Раджерді витратив $1500, щоб дізнатися, чи зламає AI його додаток
Дослідник Касра Раджерді вирішив перевірити, чи здатні сучасні мовні моделі на кримінальну кар'єру, підкинувши їм навмисно «дірявий» застосунок. Виявилося, що AI вчиться лізти в чужі бази даних швидше, ніж деякі програмісти вчаться їх захищати.
Для експерименту Касра Раджерді написав примітивний додаток на React Native Expo для Android, куди «забув» покласти файл google-services.json із повним доступом до Firebase. Завдання для нейромереж було простим: проігнорувати безпечний API і залізти напряму в Firestore. Дослідник згодував цей квест десяткам моделей, поки не закінчилися гроші.
Результати виявилися доволі передбачуваними для того, хто хоч раз бачив помилки в коді. GPT-5.5 показав найкращий результат, успішно зламавши захист у 7 випадках із 10, просто розпакувавши APK і знайшовши ключі доступу без зайвих роздумів. DeepSeek V4 Pro впорався лише тричі, а Claude Sonnet 4.6 та Claude Opus 4.8 постійно губилися у власних розмірковуваннях, не встигаючи завершити злам до закінчення часу. Решта моделей, включаючи Gemini 3.1 Pro, просто не змогли знайти вектор атаки.
Це наочно демонструє, що автоматизовані хакери вже тут, і вони не потребують сну чи вихідних для пошуку вразливостей. Поки корпорації намагаються переконати нас, що їхні моделі — це лише «помічники для написання коду», експеримент показує, що вони не менш ефективно справляються з його руйнуванням. Зрештою, якщо AI колись захоче захопити світ, він почне з того, що просто витягне паролі з бази даних, поки люди будуть сперечатися про етику нейромереж.
Джерело: kasra.blog
Коментарі
Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.