近日,平安科技人脸识别团队在国际权威人脸识别公开测试集LFW(Labeled Faces in the Wild)中,获得在无限制条件下人脸验证测试(Unrestricted,Labeled Outside Data Results)0.9960±0.0031的成绩。
目前,很多成果在 LFW 人脸数据集上的准确率都停留在 99.5% 左右,平安科技团队的成绩意味着人工智能技术之人脸识别又获得了突破,人脸识别、人工智能作用于金融业有了更稳固的保障。
据雷锋网了解,这项技术,来自于平安科技人工智能实验室,以及大数据平台等团队。这次测试结果的发布,是平安科技的领先技术在国际学术层面的一次亮相。
日前,雷锋网与平安科技智能引擎部总经理兼大数据首席总监、“”国家特聘专家肖京博士,以及平安科技人工智能实验室主任、首席AI科学家刘飞进行了对话,谈及平安科技在人工智能研发和应用的进展与未来思考。
刘飞
一般来说,在LFW做到99.5%以后,就表明了有基本的人脸识别算法能力,但商用级人脸识别的挑战与LFW还不太一样。与实验室稳定的环境条件不同,实际应用环境中各种不确定因素比如,在手机采集照片去比对身份证照片,但这个身份证照片的分辨率是被压缩过的,而且还带有一些水印等情况,都是对技术的考验。而商用级的人脸识别应用,已经基于这些不确定因素而进行开发。
早在2013年,平安就针对人脸识别方面开始做了一个前期的调研。从2014年开始,平安科技组建了自己的人工智能实验室团队,开始研究算法和核心技术应用。
这个目前不到50人的实验室团队,以深度学习为主,负责研究解决集团业务中包括机器视觉、自然语言领域的问题,以及研发计算机认知领域的新事物。
在2015年,肖京博士也加盟平安科技,负责平安科技大数据分析挖掘,及人工智能在风险管控、欺诈识别、互联网健康医疗、智能运营以及个性化精准营销等金融业务场景的研发及应用。
目前,人眼识别准确率的极限是97.53%,2016年开始,平安科技的人脸识别技术的精准度在很多测试条件下已达99%以上。从核心技术研究到产品、工程、技术的实现,再应用到业务层面,平安科技只用了一年的时间。当前,该项技术已应用于108个场景,超过1.03亿+使用人次。
刘飞表示,人脸并不是稳定的生物特征,在年龄、妆容等因素影响下识别精度也随之受到影响。目前,基于平安体系内多年积累的大数据资源,平安人脸识别技术自优化的架构可以应对人脸随年龄的增加而发生的变化,包括大家关心的同卵双生双胞胎问题,只要对应照片被收录,同样可以被识别。
人脸识别技术作为人工智能核心一环,目前已经应用到金融、安防、身份识别类等严肃应用上,以金融业为例,包括刷脸开卡、刷脸取款,保险中理赔对象识别等等。
AI技术的成熟运用,是“未来银行”、“新金融”的基础。比如,人脸识别技术全球首发应用于平安普惠小额贷款 “平安i贷2.0”的融资场景。用户通过“平安i贷”APP申请贷款时,只需要打开手机摄像头,由系统拍摄并抓取用户若干面部影像,再进行检测,即可远程完成身份核实,最快实现3分钟放贷。自开通以来,通过“刷脸”完成的业务量已达日均三万。
人工智能在综合金融的大规模应用,关键在于安全、准确、高效,某些规则性问题下,效率和成效甚至比人做得更出色,比如人脸识别。然而,这背后的摸索,如同黑暗隧道中前行时看到的曙光。
现在平安科技的人脸识别技术准确率达到了99.6%,对于最后的极限,刘飞说,在拥有足够多的数据量以后,我们完全有可能往更极限的目标靠近。
但是,在很多场景下采集数据是很难的。刘飞说,“理论上说如果有更多的数据就能怎么样,但在理论上就做不到。比如自动驾驶的领域,它为了做到足够安全,需要捕捉事故现场的特征,但是你不可能去制造事故。”
所以,平安科技在研究的是,如何通过较少的样本来达到更高的精度。刘飞表示,如果要用比较少的数据也能训练出很高水平的话,法宝在于算法。“我们最近就有一个让人兴奋的研究课题,也是最近这几年在学术界也有提及的,叫‘one-shot learning’技术。”“one-shot learning”技术,可以在一个单点领域有足够高效、深入的应用。
与此同时,和大家都希望部署的大规模神经网络不同,平安也在追求的是,做一个精致小巧的网,它能够应用到更加多样的平台上,同时精度不被损失。“事实上,我们觉得数据还可以再少一些。我们现在是百万级的数据,但实际上已经可以做到只需要几十万的数据,训练出99%以上的精度。”
刘飞表示,其实我们现在的人工智能技术在解决当前的问题是相对分立和孤立的,人脸识别通过图象就解决了身份识别的问题,而至于其它的方向,比如识别一个目标物体,一个电话、一辆汽车,它又是一个问题。目前人工智能,包括深度学习的介入,还是正在解决这些单独的问题,甚至还用不同的方法解决单个问题。
比如前文提及的“one-shot learning”技术,事实上,该技术可以在一个单点领域有足够高效、深入的应用,但对于广泛的应用来说,用处并不大。
“以往的神经网络无非就是前波网络、反向传播网络这两个网络,但也是分别在不同的领域解决问题。”刘飞介绍,在实际业务中,如果能够把无论是语音方面的东西,还是在人脸和其它的特征方面,结合起来,然后又重新用在非常复杂的安全领域下,也是非常有前景的。
“人工智能界还需要一些比较通用的方法,使得人工智能的技术基于某一个单一方案解决更多的问题。比如现在在研究的多任务网络。一个神经网络能不能解决多个不同的问题?包括静态和动态,”
然而,不同的任务的数据参数都会不同,因此,多任务网络将如何实现?其实这门学科也是有历史的,它叫AGI(通用人工智能)。
刘飞说:“现在大家普遍的融合方法,是把几个不同任务的神经网络浅显地综合在一起,过程中训练、研发还是单独的。比如对卷积神经网络的应用。”
然而,让刘飞觉得兴奋的是,这两年学术上的突破并不在这方面,“大家发现谁对反向传播网络有很大贡献的话,那个成果非常值得骄傲,是非常超前的。”
据雷锋网了解,现在典型的反向神经传播网络LSTM,是用在了语音识别领域;还有最近一年左右所涌现出来的生成对抗网络(GANs),也是瞄准在反向传播网络。
不过,“当然不是说我们马上就可以找到一种方式把它们都糅合在一起,但从2006年到现在,所有的生物学习获得突破的问题解决的时候,都是一些在于反向传播的突破。如果把这些基础性的理论问题和相应的工程实践解决好的话,可能我们未来会重新看待和设计用来解决不同领域的神经网络的问题。”
到了今天,我们看到的“刷脸”只是人工智能技术应用的冰山一角。刘飞指出,由于监管滞后、传统行业规范的约束,以及人工智能本身的不可解释性等原因,当前许多超前的技术储备尚未能面世。举例来说,平安科技AI实验室中,科学家们尝试通过对人类维持最低只有30毫秒的微表情的研究,拓展人工智能在情感判断、服务决策和判断等应用。“这个还很任重道远,但是这样的课题已经在前几年就被提出来,它还在发展,而且这个发展的过程会很快。”
肖京
除了算法上的摸索,平安科技造的另一个轮子是大数据挖掘。这两件事,都并非一蹴而就的。
据了解,平安4年前开始做数据的集中。四年前,正是大数据火热的时候。肖京博士表示,此前数据存储在各个不同孤岛上,很分散,缺乏强关联的线索,导致数据缺乏利用的价值,比如需要更精准地识别欺诈时,无法关联起来的数据无法发挥逻辑分析的作用。
“人工智能的技术是基于数据的,有数据才有可为。对于金融业来说,现在已经进入到深度人工智能的阶段,让数据发挥最大的价值。”
刘飞也解释称,即便更少的数据、更高的精度成为可能,但我们也不能否认数据的重要性。“当领域进入差异化发展的时候,一方面数据可带来算法前瞻的预言,帮助做出差异化的算法成果,同时借助数据规模又能够较早地投入商用。而能够较早地商用就意味着,又能帮助我们发现别人还没有机会发现的问题,从而优化算法,反复来训练。”
而做数据集中,这就需要先搭建清洗、整合等一系列的底层数据应用以及平台。这些做完了以后,最重要还是要挖掘数据的价值。做这么多事情,所花的力气也可想而知。对平安来说,其无非是坚持向数字化转型。目前第一步,是赶上了大数据、AI的列车,通过挖掘数据的价值,来提升客户的体验,扩大自身服务能力。
平安科技成立于2008年,目前已拥有超过4000名IT技术人员和IT管理人员。平安科技的成立,是平安集团向IT专业化领域迈进,向“科技金融”模式探索的开始,也是今日其技术自主、能够率先利用目前最为先进的AI技术创造价值的前提。刘飞向雷锋网表示,“平安建立人工智能实验室,涉及深度学习领域时间不算太晚,我们在人才队伍、基础设施的投入方面也不小,我们也有做大规模深度学习研究的庞大GPU计算集群,研发自己的计算平台。”
肖京博士表示,IT企业的发展要经历几个阶段——第一个是信息化;第二个是数据化,信息流通以后有数据的接入,才有更好的方法能够利用好这些信息;第三个是智能化,有了大量的数据以后怎么才能让我们的决策变得更加的智能。
肖京说道,“在大数据的时代,我们需要有一些机器学习的深度智能的方法,以服务那些缺乏强关联数据的长尾用户。这不是以往基于对明确的业务规则的利用、简单的统计分析技术能够完成的。”
平安集团拥有金融业全牌照,业务包括传统金融业的证券、保险、银行、理财、征信,同时包括互联网金融领域的陆金所,互联网银行橙子银行,以及医疗保险领域的平安好医生等。根据肖京介绍,平安科技作为技术输出,其人工智能技术已应用在平安诸多业务当中,包括金融最核心的大数据征信、风险控制、欺诈识别、市场投资分析等,以及如今最时尚的精准营销,以及机器学习辅助的精准医疗,用于指定个性化保费等。
人脸识别作为人工智能在图像领域中比较成熟的应用,已经让许多人惊叹不已。但刘飞表示,“人工智能会推动行业变革和发展的现象,现在只是露了冰山一角。以前没有人工智能的时候,一些互联网金融业务无法开展,现在有了这个技术之后就可以在安全、可控、有保证的情况下开展起来了,这可能就会改变原来延续了几十年的行业。”