【编者按】宫雅卓,聚虹光电创始人,上海交大博士,主攻生物识别领域,尤其在虹膜识别领域有15年的专研。本文是宫老师受邀为雷锋网独家分析,有兴趣可移步其微信公众号:jh-irisian。
(庭审现场,原被告双方都由代理律师出庭。法院供图)
人脸识别在科技圈热门已久,支付宝的人脸支付、微软辨别年龄的网站How-Old.net、周鸿祎奇酷手机的人脸识别……最近,赵薇的老公黄有龙被告上法庭,原因竟是其司机靳某骗过公证处的人脸识别系统,以委托人的身份卖掉了赵薇家一处千万的豪宅,而整个过程黄有龙并不知情,是遭人“冒充”。这条新闻,让“人脸识别”也登上了娱乐版的头条。人脸识别的准确性和安全性,再次成为大家热议的焦点。
99%的识别率如何实现?
2014年7月,香港中文大学汤晓鸥教授的三个人脸识别算法分别占据了全球最具权威的人脸识别数据库LFW(Labeled Faces in the Wild)的前三名,其中DeepID2更是以99.15%的识别率高居榜首。人脸识别率突破99%的大关,一时间成为业界讨论的热点。
(LFW:人脸识别准确率最高的六家公司 2014.7)
不过,这一世界记录现在已被百度打破。在人脸识别技术领域两个最具权威的国际评测平台FDDB与LFW中,百度都获得了第一名,领先于国内同行。
(LFW:人脸识别系统的平均精度和误差 2015.10)
LFW全部人脸系统检测结果可以参看这里
这似乎意味着,人脸识别的准确率超越了99%,识别精度趋于完美。
如果人脸识别的准确率真有那么高,那司机冒充黄有龙通过人脸识别的案件也就不会发生了。
而人脸识别如此高的准确率又是如何测评出来的呢?
目前国际上有两套最为常用的人脸评测数据集,人脸检测数据集FDDB和无约束人脸识别LFW。
FDDB(Face Detection Data Set and Benchmark)是由马萨诸塞大学计算机系维护的一套公开数据库,能为来自全世界的人脸识别研究者,提供一个标准的人脸检测评测平台。它使用5171张自然环境下各种姿态的人脸照片,从中选取2845张图片作为测试集,根据人脸检测准确率召回率曲线图得出最终结论。如下图所示,横轴表示误检人脸数,纵轴表示检出率。曲线越陡峭,曲线上的点越接近(0,1),表示检测器性能越好。
(FDDB:人脸检测准确率召回率曲线图 2014.11)
LFW(Labeled Faces in the Wild)则由美国马萨诸塞大学阿默斯特分校进行维护。它从雅虎上提取6000张表情、光线、方向各不相同的人脸照片,考察各个深度学习系统的人脸识别能力。LFW好比一个题库,各个前来跑分的人脸识别系统则是参加考试的学生。测试中,LFW给出一对照片,让人脸识别系统判断两张照片是不是同一个人,并给出“是”或“否”的答案。99%的准确率,意味着该人脸识别系统在提供的所有题目中答对了99%。
无论是LFW,还是FDDB,都只是一个实验室级别、学术性质的测试工具。在千人样本量下,人脸识别系统的确能取得99%的准确率。然而,在样本量可能达到十万级、百万级的实际商业场景的应用下,在数据库评测时取得了高准确率的系统,并不一定能复制同样的成功,其误识率将直线上升,甚至有可能根本没法用。在真实复杂场景的测试中,十万分之一的误识率下,人脸识别98%的准确率甚至会直线下降到70%左右。
人脸识别在实际应用中的重重障碍之一:相似性
人脸识别技术其实被高估了,它远远达不到指纹或虹膜等生物识别技术那么高的准确度。在人脸识别系统中,对相似度高的脸容易出现识别误差。不说双胞胎了,人脸识别系统能分得清王珞丹和白百合吗?(想要知道区分方法或想要测试一下,可以点这里看看。
人脸识别在实际应用中的重重障碍之二:不稳定性
赵薇老公的案件中,该公证处采用的人脸识别系统,参照的是黄有龙第二代身份证照片。撇开法院判决司机靳某和黄有龙照片分值超过0.6不谈,照片本身的时效性也是一个问题。我国身份证要求20年更换一次照片,但是20岁和40岁的你,恐怕没那么相同。
出演《泰坦尼克号》时莱昂纳多·迪卡普里奥刚刚20岁,他在影片中俊美的扮相让人印象深刻。而如今二十多年过去,莱昂纳多迈入中年,他的面部轮廓也发生了改变,下巴也留了胡子。乍看之下,判若两人。
(莱昂纳多·迪卡普里奥:年轻与中年的照片对比)
年龄是影响人脸识别的重要因素。皮肤无可避免地会松弛、衰老,就算是绝色美人,年老后的脸蛋线条也会发生不可逆的变化。而且,人的面貌可以轻易地通过化妆改变。一位年轻的女性,精心装扮后的面部和身份证上的照片也许很不一样。此外,识别时所必须的光线,增加了用户的使用成本。因此,光线、化妆、年龄都会影响一个人的面部特征及其识别准确性。
人脸识别在实际应用中的重重障碍之三:可复制性
人脸识别无需用户配合便能采集到照片,几乎毫无困难。这让人脸成为有“最高易用性”的生物特征。然而,随之而来的风险同样不容小觑。
人脸每天都暴露在外,通过拍照完全可以获取一个人的面部特征,直接用照片或者通过3D打印复制人脸便能欺骗摄像头,进行盗窃。
除了人脸的平面照片,动态的人脸视频也很容易盗取。
近日,一则“最新诈骗”在朋友圈疯传。诈骗者以免费领一壶油或一个充电宝为名,让受骗人扫描二维码关注微信,填写身份证号和手机号,还要录制受骗人点头视频。受骗者以为得到了免费的午餐,却不知道他们的个人信息和点头视频会被用犯罪分子用来开户贷款。
尽管这则消息的真实性还有待商榷,但却无意中指出了人脸识别的风险。人脸虽然很方便,但涉及到财产和支付问题,还是应该谨慎对待。
在上述人脸识别的三个漏洞中,相似性其实是由人脸自身的特征决定的。人脸的特征点最少为5个,最多也不过25个。同为生物特征识别,指纹的特征点大约在50个左右。而虹膜的特征点则可达244个独立的自由维度,是目前世界上最精确的生物识别技术。
稳定性虽然取决于外部环境,同时也受年龄影响。就如面部在不同的年龄阶段会呈现不同的面貌,像 “乡音无改鬓毛衰”。暴露在外的身体特征如指纹,会出现干燥、剥皮、皱褶等现象,这时候就需要重新注册或使用替代方案了。虹膜是人体唯一暴露在外的内部器官,和手指与面部不同的是,不会被环境与年龄影响。
独特性决定了一种生物特征是否准确,稳定性则决定了这种特征能否被用作生物识别使用。不过,任何一种生物识别系统最不容忽视的问题,是可复制性。
在众多欺骗手段中,假体欺骗的问题最严重。使用照片、视频可以骗过人脸系统;购买指纹套、利用高清晰的指纹照片倒模,可以瞒过指纹检测。只要是外部特征,几乎都存在被盗取的风险。如果想要安全与方便兼得,不妨尝试些其他的生物特征。
至少,在赵薇老公的房产案中,公证处识别率为98.3%的人脸识别系统都出了错,我是不敢用人脸识别了。