Хакери перетворюють навички Claude на сплячих агентів для зламу ПК
Фахівці з безпеки виявили епічний прокол у десктопній версії Claude від Anthropic. Виявляється, AI можна змусити непомітно переписати власні інструкції та закласти міну уповільненої дії.
Ця вразливість затишно влаштувалася в десктопному додатку та консольній утиліті Claude Code. У локальних версіях Claude використовує так звані "навички" — звичайнісінькі текстові файли у форматі Markdown, що лежать на диску користувача. Вони виконують роль такої собі шпаргалки з регулярними робочими процесами.
AI сприймає ці файли як абсолютно довірене джерело інформації. Оскільки система безпеки блокує прямі шкідливі команди з інтернету, хакери вирішили діяти хитріше: вони просто просять AI відредагувати власний файл навичок. Запис у файл дозволений за замовчуванням, тому слухняний асистент власноруч записує отруйну інструкцію у свою ж пам'ять, не викликаючи жодних підозр.
Ця закладинка поводиться як справжній шпигун часів Холодної війни. Вона може дрімати годинами або днями, чекаючи, поки користувач сам запустить заражену навичку в зовсім іншому чаті. Тоді Claude зчитує підкинутий рядок як рідну інструкцію та виконує її, отримуючи доступ до командного рядка та мережі.
Виявити таку диверсію майже неможливо, адже файли Markdown не мають жодних цифрових підписів чи контрольних сум. Оскільки момент запису інструкції та момент її активації сильно рознесені в часі, системні логи виглядають чистішими за сльозу немовляти.
Спроба захистити систему жорсткими заборонами виглядає смішно, коли AI з радістю погоджується покласти ключ від хати під килимок для майбутнього грабіжника. Межа між турботливим помічником і троянським конем виявилася тоншою за аркуш паперу.
Джерело: Profero
Коментарі
Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.