Вразливість у Google Calendar дозволила зловмисникам обійти засоби контролю конфіденційності, вбудувавши приховані інструкції у стандартні запрошення календаря. Проблема полягала у тому, як Gemini інтерпретує природну мову під час аналізу графіків користувачів.
Дослідники виявили, що шкідливі підказки можна розміщувати в описах подій. Коли Gemini сканував дані календаря, щоб відповісти на рутинні запити, він несвідомо обробляв вбудовані інструкції.
Експлойт використовував непряме введення підказок, техніку, за допомогою якої шкідливі команди приховуються в легітимному контенті. Модель штучного інтелекту розглядала текст як надійний контекст, а не як потенційну загрозу.
У ході атаки для підтвердження концепції Gemini отримав вказівку підсумувати приватні зустрічі користувача та зберегти інформацію в новій події календаря. Зловмисник міг отримати доступ до даних, не сповіщаючи про це жертву.
Google підтвердив ці висновки та впровадив виправлення після відповідального розкриття інформації. Цей випадок підкреслює зростаючі ризики безпеки, пов’язані з тим, як системи штучного інтелекту інтерпретують вхідні дані природної мови.
