无论是在Snapchat侦测人的脸部,或是辅助自动驾驶车避开道路上的障碍,当中使用的人工智能系统都是基于计算机视觉算法,来区分不同类型的物体。但是,科学家日前已研发出一种新技术可混淆这些算法,从而阻止人工智能识别图像内容。
由德国弗莱堡大学(University of Freiberg)和博世人工智能中心(Bosch Center for Artificial Intelligence)的科学家研发的这项新技术进一步显示,可通过有效遮盖视觉系统的方式,阻止机器识别特定类别的物体,例如道路上的行人。
与其他近期研究一样,该技术是利用噪音策略性地淹没图像,从而削弱人工智能识别物体的能力,但同时保持图像看起来仍然完美无缺。这种“整体干扰”(universal perturbation)由算法生成,可运用于任何类型的图像、画面或电脑视觉系统。
这个过程并不是阻止算法识别整个图像,而是一种被称作“语义分割”(semantic segmentation)的处理过程,该技术将图像分割成多个像素组,以便识别场景中不同类型的对象。这使得研究人员能够在人工智能进行识别时,将画面中的特定物体阻挡在识别范围之外,同时让画面中的剩余部分保持原状,让视觉系统更难检测到干扰过程。
研究人员在报告中写道:“这个实验的主要目的是揭示,现有的‘语义分割’在面对对手时是何等脆弱。”
研究人员已经在“城市景观”(Cityscapes)数据集中成功测试了这个方法,该数据库含有来自44个不同城市的3475个图像。尽管该实验显示这类目标混淆是可以实现的,但同时研究人员指出,该技术目前还无法运用于实际领域之中。现实情况下,骇客首先需要在计算机视觉算法能够检查图像之前,将噪声注入由摄像机或感应器捕捉到的数位图像中。