На протяжении нескольких месяцев ученые экспериментировали со состязательными (созданными нейронной сетью) изображениями. Их целью было выявить такие принты, которые при наложении поверх объекта не позволяли камерам распознать ни человека, ни объект.
Исследования проводились на основе алгоритма YOLOv2 (You Only Look Once), который позволяет производить быструю обработку изображений. Принцип его работы следующий: получая изображение, в ответ он выдает кадр, на котором обнаруженные объекты заключены в прямоугольники. Указывается также вероятность того, что объект классифицирован верно.
Алгоритм работы
Рассмотрим метод обмана нейросети, основанный на создании состязательных изображений. Сначала алгоритму YOLOv2 отправляется база изображений, на которых он должен распознать людей. Далее вступает в дело нейросеть, созданная исследователями. Она генерирует так называемый «патч», или принт, который генерируется случайным образом при помощи операций над изображением из базы данных (изменение масштаба и контрастности, наложение шума). Затем этот патч накладывается на области, в которых YOLOv2 обнаружила объекты, и полученные картинки вновь отправляются алгоритму. Эти действия повторяются вновь и вновь, при постоянной фиксации изменения вероятности для обнаруженных объектов. Процесс продолжается до тех пор, пока YOLOv2 окончательно не перестает распознавать объекты на картинках.
Таким образом, на выходе получаются универсальные принты, благодаря которым можно обмануть алгоритмы обнаружения объектов в различных условиях.
Оценка результатов
Авторы протестировали работу технологии на датасете Inria. Примеры приведены на фото ниже. На них наглядно видно, как появлении на изображении сгенерированного нейросетью принта позволяет обмануть алгоритм, скрыв от него объекты.