IEEE x ATEC
IEEE x ATEC科技思享会是由专业技术学会IEEE与前沿科技探索社区ATEC联合主办的技术沙龙。邀请行业专家学者分享前沿探索和技术实践,助力数字化发展。
在社会数字化进程中,随着网络化、智能化服务的不断深入,伴随服务衍生出的各类风险不容忽视。本期分享会的主题是《网络欺诈的风险与对抗》。五位嘉宾将从不同的技术领域和观察视角,围绕网络欺诈场景下的风险及对抗技术展开分享。
以下是张曼老师的演讲。
演讲嘉宾 | 张 曼
IEEE WIE北京分会主席
北京邮电大学人工智能学院研究员、博士生导师
大家好,主持人好,各位嘉宾好。很荣幸在科技思享会上给大家做一个简单的分享。在网络时代的各种应用中,大家都不可避免地需要确认身份。我们今天介绍的内容就是人工智能用于这个身份识别,也就是生物特征识别技术,以及这项技术在这个时代遇到的新的机遇、挑战和新的安全问题。
相信大家在生活中,听说过、甚至可能遇到过身份失窃,或者会被别人假冒。比如假冒某人身份,给其家人打电话说住院了急需用钱、需要汇款,以及新闻中我们会看到一些恐怖分子冒用身份实施恐怖行为。这种身份的失窃和假冒,会给个人造成巨大的经济损失,也威胁着国家安全,我们需要寻找更加安全、可靠、简单、便捷的身份认证方式。
随着智能化的发展,人与人在网络上的接触日益增加,网络身份认证也更加频繁,在网页上、智能家居、智能汽车等各个方面都有这种互联网身份认证需求。
在智能化网络时代的身份认证,我们就需要用到生物特征识别技术,如指纹、人脸、虹膜……为智能设备、智能网络、智能服务、智能安防等提供自动精准的身份标识。
生物特征是人体天然的密码,这张图上的绿色框线圈出的是生理特征,即身体的一部分(如指纹、人脸、静脉、虹膜、静脉等),红色框线圈出的是行为特征(如步态、签名、语音等),它是我们习惯性的动作。我们利用人体固有的生理特征、行为特征,来识别人的身份,叫做生物特征识别。生物特征应该是长时间之内是不变的,并且随身携带,比如“出门忘了带手”是不可能发生的。它比起传统的密码、钥匙,会更加方便安全和可靠。
我们列出的这些用于身份识别的生物特征,是比较常见的。它主要有以下特点。第一是普遍性,大部分人都应该有这个生物特征。第二是唯一性,每一个人都是不一样的,才能用来认证身份。第三是稳定性,他在很长一段时间,甚至人的整个生命周期内都是不变的。第四是可采集性,这不得不提到大家熟知的DNA,DNA做身份识别确实很准确,但如果我回家开个门还需要拔根头发或者抽管血来验一下DNA,这样的身份认证方式是非常不方便的。那么DNA,就不适用于我们日常的身份识别。另外,就是安全性和用户的可接受性,用于身份识别的生物特征应该不能够被篡改,而且用户操作方便,能够接受才可以。
生物特征识别技术和我们公众的个人利益是息息相关的,它也是我们国家信息化建设重大战略需求的具体体现。我们国家近些年来就已经发布了很多的政策来支持生物特征识别技术的发展,比如十三五规划、“互联网+”人工智能三年行动实施方案。在2017年的《新一代人工智能发展规划》中,也提到了我们国家要大力地发展生物特征识别技术。
近几年,工信部也发布了一系列文件来支持生物特征识别的发展。当然他们会更加侧重于生物特征识别技术的产业和应用。比如提到了拓展生物特征识别技术在安防、金融一些重点领域的应用;支持构建基于商用密码、指纹识别、人脸识别等技术的网络身份认证体系,这也就将生物识别技术和网络安全有机地结合到一起。
整个生物特征识别的产业发展正在以一个非常快的速度在增长,大约每年27%的增幅,预计到2023年全球的生物特征识别市场将超过400亿的美元。
我们在生活当中会看到非常多的生物特征识别的应用。比如手机、门锁用指纹、人脸来解锁;智能汽车驾驶座有人脸识别的模块,可以识别出你的身份,并将汽车自动调整成自己所喜欢的参数,从而有非常舒适的驾驶体验。除此之外,在一些国家的管理,如出入境管理、社会福利、生产管理、金融安全等等,几乎每一个领域都能看到生物识别的应用场景。
第二部分来谈一谈生物特征识别在新的时代所遇到的新的机遇和新的挑战。刚才我们说到,现在是一个智能化时代,也是一个网络的时代,很多事情都需要在网络上完成。在看不见摸不着的时候,我们对身份认证的要求更加高了。这个时代为生物特征识别技术提供了新的机遇,同时也提出了非常多的挑战。比如,原来我们进行生物特征识别,是需要人来配合机器,摆一个非常板正的姿势来拍一张图像,对用户来讲非常不方便。如何使用户舒适且快捷地进行生物特征识别认证。是一个我们目前面临的新的挑战。
第二个是鲁棒性问题,现在有非常多的身份认证需求、非常多的传感器,就拿摄像头来说,不同的厂家有很多的不同的型号,不同的参数等等。那么它们拍摄的图像一定会有非常大的差异。再加上一些外部的影响,比如光照、噪声等,也会影响到认证结果。怎样在多元化的数据中快速准确地进行身份认证,也是一个新的挑战。
最后是泛在网络环境下,怎么样来保证生物识别系统的安全性,下面来一一进行讲解。
首先是便捷性。在生物特征识别技术发展初期,我们是用一个非常笨重的机器来读取,但现在正逐步往便携式、移动式的方向发展。比如在手表上、眼镜上嵌入非常小的生物识别模块等,这种小巧精致,经济时尚的设备,能够让用户在整个穿戴过程中的认证体验非常好。同时,对图像的质量,以及轻量级计算提出了非常高的要求。
第二个难点是在复杂场景中的生物特征识别,这也是行业公认的一个难题。2013年,IEEE TPAMI(人工智能领域顶级期刊)前主编Anil K.Jain写了一篇生物特征识别综述,里面描述了这个生物特征识别技术已经解决的问题、没有解决的问题,以及未来发展中可能遇到的一些问题等等。但是实际上他所提到的一些解决的问题,并非完全解决。在这种受控场景中,人脸识别、指纹识别能够达到将近100%的准确率。但是一旦到了这种复杂场景、非受控场景,图像会有一些背景的变化、姿态的变化,有形变、有噪声等等影响。那么就会对识别系统的鲁棒性提出非常大的挑战。
在生物特征识别的过程中,传统的视觉感知处理流程是先对输入的图像对做一个定位和分割,提取其中的特征,通过特征的表达、分类,最终得到识别结果。这种传统的处理方式,需要有经验的人手工来设置一些生物特征提取算法,它缺少了和环境信息的交互以及一些知识库的决策支持。现在,我们用到的是基于深度网络的生物特征识别方法,这是一种端到端的模式识别方法,我们输入一个图像,系统自动输出结果,可以是有效区域标注,也可以是识别的结果等等。把特征提取和模式分类的两个小阶段,集合到一个非线性影射的深度模型里去,从而对大数据的语义理解产生了变革性的思路,即从大数据中来直接挖掘其中包含的语义信息。
再举一个例子,就是我们这种复杂背景下的人形分割。原来我们训练进行检测和分割的小模块,可能会受噪声、光照、姿态影响。而我们基于深度学习的方法可以设定不同模块的大小,它可以由粗到精,输入到不同的深度神经网络。最后再来对它的分割结果进行一个融合,能够得到精度比较高的人形分割结果。
我们提出了泛在网络采集的虹膜图像数据驱动的方式。原来我们需要对虹膜有效的纹理区域,先进行一个定位和分割,把虹膜纹理区域的光斑、眼睫毛区域去掉,最后得到它有效的纹理区域,然后再在它的纹理区域上,进行特征提取、进而比对等等。而使用数据驱动的自动学习方法,当输入一张虹膜图像,系统可自动地把它的概念要素等,直接从网络当中输出。我们既可以输出有效的虹膜纹理区域,也可以输出人员身份和相关标签。 这种数据驱动的自动学习方法,比传统的纹理分析,精度能够得到有效的提升。
在步态识别领域当中,最近也有非常多深度学习的应用。步态就是利用人走路的姿势进行身份的识别。左边这张图是一个人走路的步态序列图的示意。下面是他在不同状态下的走路姿态。原来我们是用步态能量图进行分类来进行步态识别,外界干扰会影响识别精度,导致无法进行大规模实战应用。现在用了基于深度学习的方法,我们可以首先对步态特征进行能量图的提取,再将它投入到我们的深度神经网络当中,最后得到一个比对的数值。然后,经过基于深度学习研发之后,我们的步态识别的算法得到了非常大的提升,现在已经在安防领域得到了应用。
第三部分就是这个生物特征识别领域常见的一些安全问题。不同模态的生物特征识别,它的流程都是相似的。它在这个生物特征识别系统的每一个环节都有可能遭受到安全的攻击。
首先第一个就是假体攻击,之前就有人用这个小熊软糖或者透明胶带获取到别人的指纹信息,骗过了指纹的读取器。还有人用静态的人脸照片,通过了人脸识别系统。
为了应对这样的风险,我们的方案主要是在生物特征识别系统当中加一些活体检测的模块,比如说虹膜识别当中,虹膜中间瞳孔的特性是对光照的敏感性,光照暗的时候瞳孔就会张大,光照弱的时候瞳孔就会缩小,我们通过环境光的变化、瞳孔缩放,来验证该虹膜是不是来自真实的人体。
第二个就是人脸的活体检测。相信大家都遇到过,比如在健康宝、支付宝登录注册的时候,让用户眨眨眼、张张嘴,或者念一段话,这种系统来引导用户做出一些特定的动作,其实就是在对这个用户进行一个活体检测,确定用户是不是来自于一个活的人体。除此之外,还可以使用多模态融合的方式,比如说想要仿造生物特征数据,仿造一个相对容易,如果需要仿造一个人所有的生物特征数据,基本上是不可能的。这种多模态的融合认证就可以在很大程度上来保障安全性。
第二个安全问题是数据泄露的问题,大家可能也都看过一些新闻,人脸图像、生物特征图像遭到了泄露,引起非常大的恐慌。
除了一些比较常用的信息安全、网络安全的方法,比如在可信执行环境中进行数据加密、本地存储方案之外,目前在生物特征识别领域,提到比较多的是联邦学习。联邦学习有一个非常有意思的解释:这个图上,羊相当于我们要训练的模型,草相当于训练模型需要的数据,原来我们的训练需要把数据聚集到一起训练模型,相当于把草聚到一起给羊吃饱。把所有数据聚集到一起,势必会有一定的数据泄露风险。联邦学习让草还呆在原来的地方,羊去不同的地方吃草。相当于模型在不同的数据库训练,羊在这里吃点、那里吃点,最终还给主人一个吃饱的羊,主人不去关心吃了什么草,只要吃饱就行。同理,在生物识别当中,我们只需要最终得到一个训练好的模型,至于他用到什么样的数据进行训练,我们不去过多关注,也不会隐含数据泄漏风险,这个是生物特征识别领域中比较火的话题。
最后就是“伪造”的问题。大家可能看过,视频、图像的篡改、伪造、自动生成等等技术,这些技术如果仅仅用于娱乐还是挺好玩的。但是一旦被滥用,它一定会威胁到个人和企业的合法权益,甚至危害到公共安全和国家安全。比如恶意地伪造一些国家领导人,或者恶意入侵用户系统等等,都是非常危险的事情。
现在我们也在研究面向开放环境的人脸鉴别。我们通过人脸的局部特征和全局特征的多流感知特征融合的方法来区分当前图像到底是真实的图像还是伪造的图像。
国家出台了很多的法律来保障我们的这项技术安全健康地发展。如前几年颁布的《网络安全法》,《个人信息保护法》等等。在法律的要求下,相关机构也制定了很多的国家标准。比如像《信息安全技术》,《个人信息安全规范》。在《个人信息安全规范》的大框架下,对人脸、步态、声纹、基因等又做了细化的要求,现在已经到了报批的阶段,预计会很快实行。
最后,再做一个小结,今天的分享当中提到的生物特征识别技术,为我们保障社会稳定和公共安全,以及为网络上方便快捷的认证,提供了一种便捷可靠的身份认证方式。我们在工作、生活等很多场合都能够见到生物特征识别技术的身影。
当然,不同的生物特征模态,一定是有不同的特点和不同的适用场景。比如指纹识别就适用于近距离的场所进行接触式的识别。步态识别适用于远距离的识别,我们可以采用多模态的方式,使应用场景更加丰富。这就好比一个人在成长过程中,如果只摄入一种食物,身体上摄入的维生素就比较单一,我们需要摄取多样的蔬菜和水果来获取全面的维生素,生物特征识别系统也是需要用多种模态进行融合,最终能提升精度,拓展应用场景。
右上方这张图就是一个人脸、手形、指纹多模态融合的一个系统。或者用一种模态的不同信息也可以进行融合,比如每个人有10个指头,我把10个指头的指纹来进行一个融合,这样子也能够有效地提升识别精度和安全性。
生物特征识别技术,在我们的实际应用当中,目前还是面临着非常多的挑战。便捷性、鲁棒性、安全性等等,也都是未来重要的发展方向。生物识别安全和隐私问题,得到了高度的关注,也需要我们从技术、法律层面提供多方面、综合的解决方案。
以上就是我的分享,谢谢大家。
雷峰网(公众号:雷峰网)