这个春天,人脸识别遇到了点小麻烦。
一场疫情让国人带上了口罩,没人会想到,首先受到影响的竟是苹果手机用户。
由于苹果从iPhone X就已经开始使用Face ID进行手机解锁,Face ID采用的又是安全性很高的3D人脸识别技术,近期,不少苹果手机用户表示“带上口罩后,手机都不好使了”,网上甚至出现大量教学视频,教学如何训练你的iPhone,让你的iPhone认识戴口罩的你。
训练结果因人而异,也有博主表示,训练数百次也没能让自己的“傻儿子”认识戴口罩的自己。
那么,当人脸识别不再能识别到你的脸,它还会认识你吗?
近年来,随着人脸识别技术成熟度不断提高,相关产品在国内诸如酒店登记、车站人群筛查、公司考勤等场景应用已经十分广泛。以公司考勤为例,据2018年相关产业调研数据显示,人脸识别考勤机出货量已突破百万。
然而,在2020年,一场疫情让国民纷纷戴上了口罩。口罩成为国民“刚需”后,开始频频脱销,而年后复工的你发现,你家公司门口那台你原以为很高科技的人脸识别考勤机已经完全不认识戴着口罩的你。
事实上,佩戴口罩属于大面积遮挡问题,在人脸识别领域是一个公认的难题,难点主要有三个:
第一,人脸识别算法主要依据人脸面部特征进行身份判定,佩戴口罩会使下巴、嘴部、鼻子等用于识别的脸部特征大量丢失;
第二,当前人脸识别算法使用的深度学习技术依赖海量的训练数据,短期内难以收集到大量佩戴口罩照片,并进行人工标注;
第三,人脸识别系统一般包含人脸识别、跟踪、活体检测、识别等多个模块,佩戴口罩影响的不仅仅是人脸检测模块的工作情况,而是对系统中每个模块都带来了很大的影响。
人脸识别技术之所有在国内普及速度如此之快,是因为其后有大批互联网公司在推动。BAT在此之前其实都有相关专利在手,疫情期间,也可见腾讯优图推出的“口罩佩戴识别专用AI”、商汤科技公布的“读取眼部、嘴部和鼻部周围240个面部特征点的人脸识别算法”,以及百度视觉团队推出的“戴口罩人脸识别算法”。
当人脸识别,识别的不再是人脸……
1月21日,从北京回到广州的钟南山参加了当地首场新冠肺炎疫情新闻发布会,会上钟南山表示,新冠肺炎已经出现人传人。
也是在这一天,百度视觉团队开始研发“戴口罩人脸识别算法”。
首先,针对遮挡带来的信息丢失问题,百度视觉团队发现,人脸各个区域包含的用于身份识别的信息量不是均匀分布的,眼部区域相比其他位置包含了更多的身份信息,所以只要让算法更加关注对眼部区域的特征学习,就能将佩戴口罩、帽子等遮挡带来的信息丢失对算法识别率的影响降到最低。
基于这一发现,通过采用基于空间位置的注意力机制特征学习方法,充分获取戴口罩人脸的身份信息。
基于空间位置的注意力机制特征学习
其次,针对缺乏戴口罩训练数据的问题,百度算法团队通过人工生成的方式来解决。
传统直接在人脸上叠加口罩图片的方法,由于人脸姿态变化和不同场景采集图像的分布差异等问题,无法真实模拟实际场景中的戴口罩人脸图片,实验结果表明效果提升非常有限。因此,百度视觉团队采用了基于人脸关键点的三维图像融合技术,不仅解决了人脸姿态变化带来的口罩形变和遮挡问题,同时生成的照片更加自然、真实,最终,通过收集市面上各种颜色、大小和样式的口罩图片,与之前积累的未佩戴口罩人脸图片进行融合,快速合成了各种场景、海量真实的戴口罩训练照片。
合成口罩图片
最后,在人脸识别系统的各个环节,针对戴口罩问题,百度算法团队做了一系列的优化。
例如检测算法采用了百度最新的PyramidBox-lite检测算法,并加入超过10万张口罩人脸数据训练,在准确率不变的情况下,召回率提升了30%;口罩分类算法基于人脸关键点网络抽取具有丰富面部语义信息的人脸特征表示,并基于该特征进行口罩遮挡判断,通过PaddleSlim进行模型压缩,模型大小压缩超过3倍。
显然,“戴口罩人脸识别算法”识别的已经不再是人脸,而是“身份信息”相对更为集中的、没有被遮挡的眼部,这样势必会降低人脸识别算法的准确率,为了保证“戴口罩人脸识别算法”的准确率,算法团队也需要花大功夫进一步优化算法。
2月21日,百度视觉团队完成“戴口罩人脸识别算法”的研发和优化,该算法随后也被应用到了百度园区中。
同样被应用到百度自家园区的还有其针对多人、戴口罩、远距离的人脸检测近日推出的“企业AI入场解决方案”。
计算机视觉作为当下拥有高商用价值的人工智能技术之一,除被互联网巨头厂商紧盯外,也可见众多AI独角兽企业的步步紧逼。
目前来看,衡量计算机视觉能力强弱可以参照两方面实力,一方面是技术研发能力,另一方是技术商业化能力。
技术研发能力上,百度早在2016年对外开放了其深度学习平台飞桨(PaddlePaddle),在IDC 2019年发布的《深度学习框架和平台市场份额》分析报告中,飞桨平台在国内市场排名第三,与谷歌、Facebook一起坐拥近80%的国内市场份额。
百度在计算机视觉方面的技术能力及相关产品皆基于这一平台打造,在此次“戴口罩人脸识别算法”研发过程中,使用基于百度飞桨(PaddlePaddle)的大规模分类库PLSC,实现了快速对数百万ID的训练数据进行训练;采用飞桨模型压缩库PaddleSlim进行模型搜索与压缩,产出了高性能的人脸识别模型;使用飞桨PaddleLite,实现了云端和移动端的快速部署。并且在2月13日,百度在业内首个宣布开源基于飞桨的口罩人脸检测及分类模型, 该模型可以有效检测密集人流区域中的所有人脸,并判断其是否佩戴口罩,目前已通过飞桨 PaddleHub 对外开源。
此外,计算机视觉顶级学术会议CVPR 2020在近日公布了收录的论文,录取率创下新低,相比去年下降3%,仅有22%,但百度仍有22篇论文入选,其中针对人脸识别和检测被收录的论文提出了在线高质量锚点挖掘策略HAMBox、从单幅图像预测高精度可操控人脸三维模型、大尺度高精度人脸三维模型数据库FaceScape、基于神经网络架构搜索同时搜索适合人脸检测的特征提取器和特征金字塔的BFBox等模型和方法。
技术商业化能力上,此次百度研发的“戴口罩人脸识别算法”也已经与科升智能、十牛信息、华捷电子、智体科技联合在诸如城中村出租屋门禁改造、智慧校园、公共交通人脸识别、出租车驾驶行为分析等应用场景中。此外,在线下门店无感刷脸购物、智慧社区刷脸门禁、企业员工刷脸考勤等应用场景,也已有超过100家开始使用。
由此可见,百度视觉技术及其研发团队,俨然成了别人家的孩子,也正是这些别人家的孩子正在助推计算机视觉在各产业领域持续商业化。
2020年,人脸识别技术已经嵌入到生活中各个方面,解锁手机时需要刷脸、在线支付时需要刷脸、上班打卡时需要刷脸、乘机过安检时需要刷脸;人脸识别技术也在各方面悄悄影响着这个社会,抓捕嫌犯时会用到人脸识别技术筛选罪犯、酒店入住时需用人脸识别技术验证身份。
虽然当下的用户的交互习惯仍停留在按键、触屏、语音交互方式上,“解锁”习惯仍停留在密码、指纹等识别方式上,但是由于人脸识别的便利度和安全性,未来终将会是一个“靠脸吃饭”的时代。
在这之前,如何将视觉算法的复杂环境适应能力、成熟度、安全性做到极致,仍要靠各家的研发团队以及开源力量的长期打磨。雷锋网雷锋网雷锋网