Как обмануть всевидящее око: 3 забавных трюка, которые сведут с ума любой ИИ / forpes.ru

Главная
Как обмануть всевидящее око: 3 забавных трюка, которые сведут с ума любой ИИ

Как обмануть всевидящее око: 3 забавных трюка, которые сведут с ума любой ИИ +12

24.09.2025 10:15

asomegoodboy 0 1700 Источник

Представьте, что вы показали другу фотографию кошки. Он сразу её узнает. Вы можете добавить к фото пару лишних пикселей, сделать её чуть ярче или даже наклеить на уголок стикер — ваш друг всё равно скажет: «Да это же кошка!». Его мозг гибок и основан на здравом смысле.

А теперь представьте, что ваш друг — это искусственный интеллект. Самый современный, натренированный на миллионах изображений. И вот вы показываете ему фото той же кошки. Он уверенно заявляет: «Это кошка. Точность: 99,9%». Вы добавляете к изображению один-единственный пиксель, подобранный особым образом. ИИ вдруг задумывается и выдаёт: «Со стопроцентной уверенностью заявляю, что это авокадо».

Это не баг и не фантастика. Это — adversarial-атака, или «состязательная атака». По сути, это оптическая иллюзия, созданная специально для машинного разума. И она раскрывает глубинную, почти философскую правду: ИИ видит мир не как мы. Для него картинка — это не образ, а просто гигантская таблица чисел, где каждое число — это яркость пикселя. Его гениальность — это умение находить в этой таблице хрупкие статистические закономерности. И эти закономерности можно сломать, едва к ним прикоснувшись.

Давайте заглянем в лабораторию хакеров ИИ и посмотрим на три самых наглядных примера, которые больше похожи на сцены из шпионского боевика.

❯ Пример 1: Панда, которая стала гиббоном. Классика жанра

Сценарий: 2013 год. Исследователи показывают нейросети изображение панды. Алгоритм, не моргнув (потому что у него и нет век), выдаёт: «Большая панда. 99,7%».

Атака: Тогда ученые создают едва заметное для человеческого глаза «возмущение» — специальный цифровой шум, который выглядит как помехи на старом телевизоре. Они накладывают его на фото панды. Для нас изображение практически не изменилось. Панда осталась пандой.

Результат: ИИ смотрит на эту «зашумленную» панду и выдаёт: «Белорукий гиббон. 99,9%».

Почему это работает (или «В чём магия?»): Этот шум — не случайность. Он был просчитан алгоритмом-злоумышленником, который знает внутреннюю кухню целевой нейросети. Этот шум — не что иное, как целенаправленный сдвиг в том самом массиве чисел, который представляет из себя изображение. Он смещает математические признаки ровно настолько, чтобы они пересекли невидимую для нас границу принятия решений в «мозгу» ИИ. Нейросеть по-прежнему «видит» панду, но её внутренняя математика выдаёт абсурдный результат. Это как подменить табличку с цифрой на весах: сами гири те же, но результат иной.

❯ Пример 2: Стоп-знак, который говорит «Едем дальше!»

Этот пример уже не из каких-то статей, а из реального мира.

Сценарий: Беспилотный автомобиль приближается к перекрёстку. Его камера видит стоп-знак и готовится к остановке.

Атака: Злоумышленник (или исследователь, проверяющий безопасность) подходит к знаку и наклеивает на него несколько небольших чёрных и белых прямоугольников. Со стороны это выглядит как вандализм или безобидные стикеры. Для водителя-человека знак однозначно читается как «STOP».

Результат: ИИ беспилотного автомобиля обрабатывает изображение и... проезжает перекрёсток на полной скорости. Его система сообщает: «Обнаружен знак: ограничение скорости 45 миль в час».

Почему это работает: Наклейки расположены не хаотично. Они стратегически расположены, чтобы атаковать ключевые опорные точки, по которым нейросеть опознаёт знак. Алгоритм может искать восьмиугольную форму, белую окантовку, большое красное поле и буквы S-T-O-P. Наклейки нарушают эту геометрию: они могут «скруглить» углы восьмиугольника, создав иллюзию круглого знака скорости, или сформировать внутри белые пятна, которые ИИ интерпретирует как цифры «4» и «5». Он не читает знак, он сопоставляет геометрические шаблоны. И эти шаблоны были успешно подменены.

❯ Пример 3: Очки-призраки, стирающие тебя из системы

Самый футуристичный и пугающий пример, который доказывает, что атаковать можно не только картинки, но и системы реального времени.

Сценарий: Вы проходите мимо камеры видеонаблюдения с функцией распознавания лиц. Система фиксирует ваше лицо, сравнивает с базой данных и идентифицирует вас.

Атака: Вы надеваете самую обычную оправу для очков. Но на её дужки нанесён не обычный рисунок, а хаотичный, контрастный узор, напоминающий абстрактный пиксель-арт. Со стороны вы выглядите просто как человек в стильных очках.

Результат: Для камеры вы становитесь невидимкой. В лучшем случае система не обнаружит на видео ни одного лица. В худшем (и более интересном) — она с высочайшей уверенностью примет вас за совершенно другого человека, например, за Милу Кунис или Элайджу Вуда (именно такие примеры были в реальных исследованиях (ссылка на исследование)).

Почему это работает: Этот узор — это не просто картинка, это математическое заклинание. Он был сгенерирован другой нейросетью так, чтобы создавать в системе распознавания невыносимо мощный adversarial-сигнал. Этот сигнал «перегружает» алгоритм, подавляя настоящие черты лица и заставляя нейросеть обращать внимание только на него. Он действует как цифровая дымовая шашка, скрывающая вашу личность от всевидящего ока.

❯ Что же со всем этим делать? Ведь это же просто игры!

За этими забавными примерами скрывается фундаментальная проблема безопасности. Adversarial-атаки — это проверка на прочность для любой AI-системы, от медицинских диагностических программ до систем управления критической инфраструктурой.

Учёные и инженеры уже ведут контригру, и это напоминает digital-арms race:

Adversarial-тренировка: Это как вакцина. ИИ специально «прививают», скармливая ему во время обучения тысячи подобных обманок. Так он учится быть более устойчивым и не обращать внимания на мелкие помехи.
Детекторы атак: Создаются системы-«сторожа», которые пытаются уловить подвох еще до того, как данные попадут в основную модель. Их задача — заподозрить неладное: «Хм, этот пиксельный шум выглядит слишком уж подозрительно и целенаправленно».
Поиск новых архитектур: Идёт работа над созданием принципиально иных нейронных сетей, которые по своей природе будут более robust (устойчивыми) к таким вмешательствам.

❯ Заключение: Блестящий идиот в цифровой шкатулке

Adversarial-атаки — это важнейшее напоминание о природе современного ИИ. Он — brilliant idiot (блестящий идиот). Он может обыграть чемпиона мира в шахматы, но не поймёт шутку про то, что нельзя останавливаться на стоп-знаке, потому что «тебе просто надо было остановиться, чувак, это же перекрёсток!». Ему не хватает контекста, здравого смысла и целостного восприятия мира.

Изучая, как его обмануть, мы не просто ищем дыры в безопасности. Мы, по сути, проводим психоанализ машинному разуму, пытаясь понять, как он на самом деле «мыслит». И каждый такой трюк с пандой-гиббоном или стоп-знаком — это маленький шаг к тому, чтобы однажды создать по-настоящему надёжного, понятного и, кто знает, может быть даже мудрого искусственный интеллект.

Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩

? Читайте также:

Перед оплатой в разделе «Бонусы и промокоды» в панели управления активируйте промокод и получите кэшбэк на баланс.

Комментарии (0)

ferosod
24.09.2025 10:19
#28875862
И она reveals глубинную, почти философскую правду: ИИ видит мир не как мы.

Не забывайте вычитывать тексты, сгенерированные ИИ.
1. 0x22
  24.09.2025 10:19
  #28876130
  Возможно они вычитывают, но видят мир всё же как ИИ.
1. hira
  24.09.2025 10:19
  #28876202
  Да уж:
  
  надёжного, понятного и, кто знает, может быть даже мудрого искусственный интеллект.
1. RulenBagdasis
  24.09.2025 10:19
  #28877846
  Смотря какой fabric смотря сколько details (с)

kabashin
24.09.2025 10:19
#28876078
Правильно я понял, что нет универсального "шумного" рисунка для разных сетей. Исследователи подбирали конкретный рисунок для конкретно натренированной сетки? И для взлома , например, биометрии банка или фейс проверки в метро, нужен свой человек внутри системы ?
1. koshak_DAZ
  24.09.2025 10:19
  #28877528
  Именно. Прямо в статье указано: "... атаковать ключевые опорные точки, по которым нейросеть опознаёт..." - для этого как и раз и надо знать, что за точки, каковы их характеристики, каков их вес в вычислении результата.

kuza2000
24.09.2025 10:19
#28876184
Если изображение подавать не сразу с камеры, а подмешать слабый случайный шум - такие трюки уже не будут работать?

JBFW
24.09.2025 10:19
#28876196
Ну это из серии "если покрасить панду в черный цвет - вы ее не узнаете" - потому что вы представляете себе панду как медведя в очках, а не вот это вот.

У ИИ могут быть другие ассоциации, если знать какие - можно обмануть.

xti032w0rk
24.09.2025 10:19
#28877078