雷锋网按:21日,《麻省理工科技评论》发布全球十大突破性技术榜单,百度以人脸识别技术获得提名。百度深度学习实验室主任林元庆会后举行了一场媒体沟通会,详细阐述了百度在人工智能,特别是人脸识别方面的技术突破和应用落地,并透露了百度国家级人工智能实验室的部分计划。雷锋网对沟通会内容进行了整理。
其实人脸识别在2016年还是非常突破性的,中国有很多公司,包括百度,也花了非常大的研发的力量和市场推广在人脸识别上面。2016年我们看到技术报告和市场报告很多,技术上的一个标志性事件就是通过2016年的技术积累,2017年年初的时候百度大脑在在《最强大脑》第一期赢了。人脸识别技术甚至在一些极端的情况下,我们能做得比最优秀的人更好,之前是没有过这样的实验,从科学的角度来看,这是第一次有这么一个实验。
应用的话,我们2016年在百度已经开始落地非常多的人脸识别相关的应用,特别是我们去年在高精度的1:N的人脸识别上,我们的系统是确实扎扎实实的是行业首创。如果有媒体朋友最近去百度,能体验到我们百度员工刷脸进楼,我们在百度科技园跟百度大厦大部分员工已经注册了,已经一万多人,应该很快会到五万人,百度全体员工会注册。这个就是我拿一张人脸,要跟库里的一万多人去比较,这个技术比传统上的银行用的1:1的人脸识别要难很多。
百度这种系统基本上需要做到接近于0的误过率,简单来说就是,不是百度的人,一定不能让他进。这个要求非常严格。比如这里站了一个保安,你得跟他说,你要非常严格,不是百度的人千万不能让他进。现在这个系统实际里面大家都感觉确实非常成熟,我们的技术已经能做到非常好的识别。是就是,不是就不是。这个还是做得非常好。
其实这个系统就是因为过去这几年,特别是去年,我们在人脸识别上取得非常大的技术的突破。今年应该至少会有一百个以上的4A、5A的景区启用百度的人脸识别系统,这是已经在谈的,我们在非常积极的推进这个事情。这也是同样的。不要再刷身份证了,你只要注册完之后,就可以直接往里面走,是1:N的人脸识别。
这个技术我们确实是行业首创,我们能做到刷脸,不用再掏证件了。掏证件是我要看你是谁,我从库里取完照片,再看是不是这个人。我们能做到1:N的人脸识别。我们已经运营了半年左右的乌镇的进出西栅景区的人脸识别系统,也都是1:N的人脸识别。
今天来MIT Technology Review,公布十大突破技术的时候,我们还是蛮兴奋的,因为刷脸是其中的一个,基本上这个技术都是中国的公司做的,包括百度、face++,他们其实没有提到,中国还有好多家初创公司在做人脸识别,这些都是非常优秀的公司。我们也非常高兴,觉得十大突破技术,基本上全部是中国公司产生的技术。
我还想提醒一下大家,去年百度的语音识别,同样入选了MIT十大突破技术。从2016年来看,语音识别技术确实在百度里面取得非常大的商业化的发展,比如说最近成立的度秘事业部,语音交互变成了一个非常非常重要的领域。今年是人脸识别。我们希望到了明年,再回头看,能有非常好的商业化,希望技术能够真正改变大家的生活。
刷脸为什么这么重要呢?其实不单单是刷脸支付,应该是负责广义上的刷脸,或者身份认证,其实是涉及到生活的方方面面。包括我们互联网上的各种活动,特别是互联网金融,包括银行、保险,有很多很多的都会涉及到身份认证的问题。首先你要知道这个款是贷给谁的,包括进出景区,你去旅游,慢慢的也会在中国变得非常普及。今年至少有一百家以上的TOP景区可以刷脸进景区。
大家也看到很多报道,比如火车站、机场,现在也在非常积极的跟我们合作,希望以后这些场所的身份认证变得无形,这才是最理想的。刚才有嘉宾说,支付的最高境界就是不要支付。以后身份认证的最高境界就是不要认证,你直接走就可以了。百度也在非常积极的跟手机厂商合作,要落地各个方面人脸识别的技术。因为百度的判断是,我们觉得我们很多的人脸识别技术,在手机上是非常好的应用场景。我们现在跟国内主流的手机厂商也合作,我们希望把我们的人脸识别能够落到手机上,未来就像指纹一样是开机密码,指纹已经做得很成功了,但是指纹安全性也算比较低的,人脸安全性要高很多。
大家如果注意到,像《最强大脑》第二期是声纹识别,像我们做的身份认证,会是一整套的解决方案,有声纹识别、人脸识别,甚至更多的信息,我们希望把身份认证做得非常好。我大概就讲这些。大家如果有问题,可以随意讨论。
以下为林元庆媒体沟通会的Q&A环节,雷锋网做了不改变原意的整理。
问:商业化今年有没有收入上面的KPI?大概能达到什么等级?
林元庆:现在人脸识别的主要的工作,包括它的商业化,我们其实没有一定要做到多少。百度的话,KPI也是有的,但我们更多时候还是focus在过程、产品支持。人脸识别我们没有说我们一定要收入多少,我们还是更看重过程,看过程怎么做。比如商业化方向,我们是怎么布局的,最后能做到什么样子。其实很多技术都在探索,定高了很难实现,定低了还是觉得很容易的。像我们这种部门,是非常少直接用KPI的。
问:现在百度的人脸识别技术,有没有一个计划,怎么跟百度内部做一个落地的结合?
林元庆:人脸识别的商业化,我们内部定了四个大方向。
第一个是闸机的情况,就是1:N的高精度识别。因为跟市场上的竞争者相比,我们确实是有非常独特的优势的地方。技术的壁垒非常高。我们要落地到景区,还会落地到百度这样的大企业、写字楼,这是第一个方向,1:N的人脸闸机。
第二个大方向是交通,简单来说交通就是铁路、机场。
第三个大方向是银行,银行是百度非常看重的,百度金融服务事业部群组的消费金融服务就在使用。现在很多的现金贷、远程的身份认证也已经应用了我们的人脸识别技术。其实还有很多,包括百度钱包等等很多业务都上线了。现在身份认证在金融的第一个应用,内部迭代就是在百度金融,还有泰康、银行等等,像泰康身份认证已经上线了,评价非常高。还有很多客户,金融从场景来看可能是最重要的。
第四个大方向是手机,这跟老百姓的生活非常密切相关。我们跟手机厂商在合作,具体的产品形态现在还不知道
这四个方向基本上都是非常互联网化的。可能很多同学一提人脸识别,就提到安防,但是我们更多聚焦在互联网相关的方向上,包括出行也是与互联网非常相关的。
这是我们现在想的四个大方向,以后可能会变,我们在这四个大方向在非常大的发力,并不是说只做这四个大方向,其他不做,我们还是要服务于需求。
问:最近在国际人工智能大会AAAI上,包括谷歌在内的一些大佬提出了这样的观点:关于人工智能在业界的实践,从实际应用的角度来看,关键性的应用几乎不允许发生错误,一旦发生故障,可能造成人员和财产损失。所以对整体的系统,包括硬件和软件的可靠性要求非常高,实现的难度也会越来越大。所以如果把这个问题套用到人脸识别技术上,要特别注意的事项是什么?您可不可以举例来回答这个问题?
林元庆:你说得非常对,现在很多机器学习的模型都是基于统计的,因此有时候会出错,这是难免的。因此要不断地去提高系统的精度。
人脸识别,我举一个例子,比如我们现在装在百度的人脸闸机系统。半年之前,就开始了两条线,先试。刚开始问题挺多的,比如说识别的精度、对光线的影响等等很多方面,甚至有很多机制,还发生了不是百度的人,结果放进去了的情况。只要发生一个case,行政就找到我们,说这样不行,不是百度的人进来,有明显的安全隐患。在那之后,我们花了非常大的力气调我们的系统。现在我们这个系统非常非常精准,不是百度的人,是绝对进不去的,在一些应用的特别指标上会非常非常严格。其实我们是非常喜欢这样的应用的,要有一定的技术门槛才能做得好。像这种情况,其实是没有选择的,必须沉下心来,把技术做好。
有一些系统上,包括自动驾驶,还包括银行的应用,比如我们的身份认证,绝对不是只靠一个人脸,还要做很重要的活体识别等各方面,可能还会用到大数据,甚至用声纹识别,用多模态的,来保证这个识别非常可靠。这些方面都需要每个方面的机构一起做得特别好。
2008年世博会的时候,就听说过可以人脸闸机,刷脸进世博会了,但是现在很多地方都不能刷脸进园区。比如去古北水镇,古北水镇就是刷指纹的。我们上次去参加一个会议,一百多人,进门的时候就一个多小时,因为按指纹挺麻烦的,还要查身份证。十年之前就已经在说人脸识别了,为什么现在古北水镇很高端的景区还是没有应用?人工智能很多技术,其实做一套系统很容易,但是要做一套真的是很多人都在用的系统,这个本身就是有非常高的技术门槛。
问:您刚才提到了人脸识别百度这边有四个大的落地方向,李彦宏提到互联网时代,软硬件结合是明显的趋势,主要讲人脸识别,再加上比如图像、语音等相关的人工智能,都结合在一起来看,您觉得现在还有哪些应用空间是待开发的?包括百度在这方面哪些打算在内部有一些应用,在外部是怎么打算通过一些合作的方式落地到不同的行业?
林元庆:我先提一下软硬结合。刚才我们提到人脸识别,进景区的闸机,其实我们也需要在硬件上一体化的来做优化,比如说很多景区可能到了下午阳光就非常晒,摄像头会受影响,我们能不能开发出来足够好的摄像头,把主要的曝光集中在人脸上。现在人工智能技术很多要落地的话,很多的系统都需要考虑软硬结合,把性能给真正的发挥出来。
你们可能听说过,百度原来觉得不需要做硬件,也尽量不做硬件,但是现在我们其实挺强调软硬结合的。因为这也是应用驱动的,我们也不是一成不变的。像人工智能这些,特别是我们提供最后的解决方案,像智能驾驶,很多硬件的东西肯定是需要进来一起优化的。在新的条件下,软硬结合是人工智能时代应该要做的事情。
你刚才提到百度除人脸识别以外的技术,人工智能技术能够发挥非常好的效应,非常重要在于它能够进到某个行业、提升某个行业、升级某个行业。在百度已经做得比较成功的是人工智能去升级搜索、人工智能去升级金融行业,比如我刚才提的身份认证,互联网金融。还有一个是百度现在正在布局的是智能驾驶行业,不只是一个单个的模块进去,而希望是一整套的,甚至是几百人的,非常大的团队投入进去。
我们很多时候看的更多是这样子的人工智能应用,比如我们最近投入比较大的力量在做的,用人工智能来升级旅游行业。我们希望人工智能会是一条线,把很多跟旅游有关的东西串起来,从买票开始,就提交了人脸,到了景区直接刷人脸闸机就进了景区,进了景区之后你可能需要地图导航,就为你提供景区内的地图导航。现在地图这块,户外地图大家都做得还不错,但景区里面是百度做得最好(其实我们说做得最好还是比较初级的,还有很多景区没有cover,或者cover不够好)。智能导航、智能导游还能做什么,比如进了景区,你需要问洗手间在哪,你可以打开地图直接问;比如去爬香山,你想知道到底哪条路可以到香山,你可以问;你看到一个牌匾,觉得非常有意思,你可以拍照,可以搜索,这个牌匾是康熙提的,康熙到底在什么时候提的……你都上网去问,它把信息告诉你,而且可以把搜到的信息读给你。再比如到了景区,中午想吃饭了,我们还可以为你打开糯米,并希望糯米能够知道你喜欢吃哪一样菜,我们可以给你做菜品级别的搜索,而不是餐馆级别的,这方面百度也花了非常大的力量,从2016年就开始在做了。随便举个例子,比如你最喜欢的是剁椒鱼头,我可以告诉你在景区方圆五公里之内,剁椒鱼头哪一家做得最好,甚至还可以地图给你导到那里。这都是可以一条线、一条龙的帮你实现。
我刚才举的这些例子,其实是我们实实在在在跟旅游部门合作,我们希望有非常好的落地。这样子的话,大家的生活就很智能。很多人都要用到地图、语音识别,还有大数据,我把很多很多都打包起来为你服务。就像李彦宏提到的连接服务,我们希望用人工智能做到非常好的连接服务。
问:主要目前聚焦在跟互联网密切相关的,百度之所以在人脸识别相关的落地聚焦在互联网相关,而不是说有一些会到安防或者一些传统行业,原因是什么?
林元庆:还是同样的理念。我们很希望人工智能技术真的能够落地,去提高老百姓的生活。这是我们的立意之所在。我们人脸识别服务,首先要做的就是看看我们的技术能不能提高大家的生活水平和质量,有一些是需要论证,让这个东西变得很容易,比如出去玩,会涉及到交通,还有银行,还有我每天都在用的手机……我们希望落在这些产品上,这也是我们的竞争优势之所在。做安防可能也会有,但是应该会非常非常少。
问:您刚才说人脸识别还没有做到百分之百的准确度、精确度,那能够做到非常准确可能也不完全百分之百可能,有哪些障碍在阻碍它的精确度?
林元庆:做人工智能的这些业务,其实非常重要的是需要技术的落地,我记得在一些公开场合也说过,形成闭环是非常重要的。我们算一个数据,研发第一步的技术,做第一代的产品,产品到给用户,用户产生数据,数据回来进一步提高技术,提高更多的数据、更好的算法……算法并非不变,很多时候算法是和技术是一起发展的,这才是非常好的正循环,这是非常非常重要的。
在人工智能技术的发展上,做一个技术,和把这个技术做到极致,是两个不同的目标。如果只是做一套人脸识别系统,那我就只要数据算好了,随便一搭就能出来一套系统。但如果你真的想把这个数据做到极致,要做得非常非常好,闭环是必要的,没有这个闭环是做不下去的。
比如百度人脸闸机非常严格,偶尔也会有人看身份证或者工卡进去,但由于闸机性能做得比较好,一旦发生情况,后面的系统立马就更新,非常快把这些情况解决掉。因此这个系统越来越聪明,可能过了一段时间就不会再有任何问题了。
问:这个技术已经提了十年了,但是现在很多景区的闸机还没有铺开,阻碍没有铺开的原因是什么?
林元庆:还是技术。其实还是蛮难的,你做不到就是做不到。我们当时在乌镇落地,乌镇的景区还不太放心,他们又找了一家,基本上一个地方布了两台,差不多一个礼拜那台就拿走了,技术差别不是一点点。你们如果有去乌镇,可以亲身体验一下,就在西栅景区,去年刚布上去,当时有些媒体报道,也有视频。现在是每天都在运行的。乌镇跟古北水镇是一个老板,他们非常急切推动我们把相同的系统铺在古北水镇,现在在推进做更大的系统,还没有彻底落下来。
问:之前春运的时候,刷脸的技术,这个技术没有用百度的,而是国外的公司,我想问一下为什么没有用百度的技术?这个技术跟百度的区别,下一阶段能不能做到用我们的技术?
林元庆:其实目前的情况是,铁道部用了很多家公司的技术,都在上面去试,最后希望看谁的最好。确实,百度是去年在乌镇才做了第一个商业化。我们内部用得非常好,但是全网的内容搜索,落地的,做得确实不够多。
《最强大脑》的节目组,他们原来是找的别的公司,我说你们为什么不来找百度,这个很奇怪,你们难道没有想到吗?我说最起码你得来找一下,看我们有没有技术。他们节目说我们根本没有听到百度做人脸识别,因为我们在这方面的宣传还是太少了。因此,铁路那个现在做的都是1:1的人脸识别,我们肯定能做得很好,这是没有什么争议的。只是我们的商业化在这方面有一点滞后,后面的话我相信百度的技术一定会应用在铁路平台上面,只是时间的问题。
问:现在国内做人脸识别技术和应用的厂商其实很多,从百度的角度来看,百度的人脸识别的技术和应用有哪些独到的地方,哪些地方是其他应用和技术所不具备的?
林元庆:刚才有提到了高精度的1:N的人脸识别,能商业化的布到景区里,现在应该是没有别人能做得到。规模比较大的1:N的识别,N可能是几万,或者是说十万,难度还是比较大。1:N的识别原来是有过的,比如抓罪犯的场景,布一个摄像头,和十万的黑名单对比,人走过来,看到这个人跟黑名单里有点像,但后面得让人再来看一下,因为不能保证这个人就是他。而在我们场景,一个人走过来的时候,我要非常高精度的知道你就是你,他就是他。1:N不是初创,但高精度的1:N(N是万或者十万的级别),这是初创的,对技术的要求非常高。目前我相信在中国甚至在世界上,也只有我们能做到,因为美国的很多大厂商、大景区都在找我们,希望用百度的人脸识别系统。如果技术达不到,是很难做到的,就像刚才举的例子,你也可以去部署一个系统,但可能比较难用,所以后来景区就不用了。
国内的初创公司,这几年也做得很不错,比如银行的应用,1:1的人脸识别,他们还是有相当的竞争力的。但即使这样情况,我们也会想一些办法,因为百度是一个互联网公司,人脸只是一个点,我们还有很多点可以跟别的公司谈合作,这些是我们百度的优势。
技术是很重要的,好几个月之前,我在微信朋友圈就提出,百度进入人脸识别行业,走的是技术路线。
问:除了1:N的应用方式,那其他的技术上有没有一些比较独到之处?
林元庆:其实1:N反映的是在人脸识别上能做到非常高精度,但有一些情况精度做得不够高,产品也可以用。比如银行的系统,是半自动的,如果识别不好会有人工干预,现在这是一个普遍情况。我们去做的话,有可能人工干预会非常少,别的公司去做可能需要人工干预多一些。
其实1:N不是说我们凭空就做上来,很深刻的方面就是,我们确实在人脸识别技术上,在它的后端,人脸的特征能够体现的更好,1:1跟1:N其实是一样的,但是能做到1:N,就是人脸识别的特征非常好。
问:昨天(2月20日)百度牵头成立国家级的AI实验室,是跟高校合作,您正好是负责这一项目的,我想问一下这个项目具体到高校和百度这边的分工到底是什么样子的?到您本人这边,会负责具体的什么内容?这是第一次一个企业和高校,而且是国家发改委级别的,想听听您对这件事的看法。
林元庆:因为是昨天的新闻,我们牵头的深度学习技术和应用国家工程实验室,落地在百度。我没有仔细去查,应该是BAT的唯一一家深度学习国家工程实验室,我们觉得非常幸运,牵头单位非常重要,因为是联合的,要真正落在那儿,真正follow你的战略。是我去答辩的,竞争非常激烈,特别是因为百度不是高校,也不是国营单位,我们拿到这个非常感谢国家的信任。我们内部也有非常大的计划,要在这个平台上做,今天也借这个机会跟媒体朋友说一下。
我们下周四还有一个揭牌仪式,李彦宏会参加。我记得我第一次跟陆奇汇报的时候,说我们很快就get到深度学习的平台,我顺便提了一下,会有一个国家级的深度学习平台工程实验室会落在百度,他非常兴奋,因为这是一个非常大的事情。我们会做在人工智能行业非常有意义的事情。
在这个平台上我们会:
第一、开放深度学习的平台,是一个开源的深度学习平台,我们已经做了;
第二,我们要在这个平台上开源非常大集群的服务器的集群,就是GPU的,或者FPGA的。
我们不光开放深度学习的平台,还要开放计算资源,我们的平台要跟计算资源做非常好的优化。大家如果想去run深度学习的程序,只需要一个账号,就可以到这个平台上。因为是国家的平台,我们基本上是免费提供给大家用的。
我们现在联合单位主要是清华,清华的计算机系、电子系、自动化系三个系都参加了。我们会跟他们一起来看,现在这个行业、这个领域里非常重要的是哪些研究课题,然后我们会一起去定一些方向,在这些方向上,百度会去收集数据(因为百度有很多很多数据,不够我们再收集)。我们会把数据放在这个平台上,因此我们会把一大批对这些非常前沿的问题、很重要的问题感兴趣的科研人员、学生、甚至包括实验室,吸引到这个平台上,一起来攻关一些非常核心的课题。我们会把研究的课题、大数据放在这。大家经常说的深度学习主要三个要素,算法、大计算、大数据,都会在这个平台上做非常大的开发。
百度经常会提到,我们还经常关注大应用,因为我们觉得闭环很重要。我们研发出来的技术如果不错,百度会很支持在百度的平台上立刻用出来。我们希望在这个平台上去搭建一个非常好的生态体系,简单说就是人工智能研发的,从算法开始,到计算、数据、应用的非常好的生态系统。作为一个国家级平台,我们会在社会上非常开放的跟这些高校或者是初创公司进行合作,希望把它做成一个大事情。
问:应用层面,比如说具体的方向能聚焦一下吗?
林元庆:经常会有朋友问我,人工智能下一步到底发展在哪,其实在百度里最成功的应用就是搜索跟广告,第二是是金融,第三个就是EDU,就是智能驾驶。现在这些技术其实还用在很多很多别的方面,包括我刚才举的旅游的例子。现在很多的技术,在百度非常多的平台上应用,内部比较成熟之后,会往外走。
问:现在这个实验室要承担国家人工智能的课题吗?
林元庆:因为刚刚批下来,这方面还没有规划,后面应该也是需要去承担国家一些重要课题的。现在虽然刚开始,但是我们觉得非常重要的一个就是要做一个很开放的平台。
问::这个跟之前的“两会”提案有关系吗?就是中国大脑。
林元庆:对,这就是中国大脑一个具体的落地,这是非常好的问题。
问:中国大脑除了这个实验室的落地以外,还有其他的是吗?还是只有这个实验室?
林元庆:这个实验室是一个非常重要的落地。我们可能后续也可能会承担一些国家的项目,会有更多落地。目前,我相信这是最重要的一个落地。
百度的人工智能架构、布局及技术
问:能介绍一下百度人工智能的架构和团队,他们之间是什么样的关系?怎么协调的?
林元庆:基本上三个层次,中间那个层次是AI的基础技术,就是语音、图像、NLP、大数据,还有预测和推荐,都跟大数据有关,还有跟智能驾驶有关,等等,六大块形成了百度的人工智能基础技术。基本每一块都有一个实验室在做,比如说语音是AI lab。百度研究院现在是四个实验室,IDL这个层面上就是图像、视频,第二个lab是语音的,还有大数据的。NLP更大一部分是海峰老师的搜索部,还有跟自动驾驶有关的。
从中间来看,百度的人工智能基础技术布局是非常全面的,基本上核心的人工智能技术在百度的层面上都有很强的体系。再底层是深度学习平台PaddlePaddle、大数据、大规模计算。最顶层是各种各样的应用,比如度秘、图片搜索……非常非常多,可能应该是上百种的跟人工智能有关的产品,有的是几乎全套。因此你能看到我们说百度是人工智能,可能外部不理解,从内部看是非常容易理解的。
从大的层面来看,第一波人工智能在搜索和广告上的应用,还有现在的金融。(百度没有几个事业群组,大搜索是一个事业群组,金融事业部也是很重要的,为什么做金融?非常重要就是人工智能,人工智能可以做新的互联网效益的金融。)这些最大的业务群组,都是在干人工智能的事情。
问:去年的时候,有人统计过李彦宏提人工智能提了500多次,百度世界大会提到,人工智能是百度核心中的核心,为什么今年他在年初的内部演讲,四个大方向,把人工智能排在最后。
林元庆:前面那三个都是应用,后面人工智能是贯穿前面的。没有人工智能,前面三个都不用谈了,是因为前面那三个,内容分发、连接服务、金融创新,这三个都严重依赖人工智能。
问:您能不能通俗解释一下什么是算法,它的关键和核心是什么?为什么百度的算法比别人的算法好?
林元庆:我举一个例子。比如我把这张人脸输入进来,算法是我在这个人脸上做一些计算。
五年、十年之前的技术是,大家都是用人为的去设计一些特征,去找通过多少维的特征算出来,比如1千个特征,然后再去做比对。人工定位这是眼睛、这是鼻子、这是嘴巴……嘴角长这个样子,眼睛放在这里……最后我综合这些信息:你的眼睛长这样,嘴巴长这样……这成为一个一千维的特征,最后表达成一千个数据。比如嘴巴,第一维上是0.1,如果特别尖的嘴角就是1,如果不那么尖、比较圆就是0.5,最后是一个类似打分的东西,这些叫特征向量。这些特征向量,最后就可以拿去做人脸识别了。一张新的照片来,就可以按照这个标准来比对,每个部分的分数是多少。
但是基于深度学习的算法不是这么简单来算的,可能需要通过数据不断的去学。基于深度学习,基于非常多的数据,它觉得哪一种特征是特别有用的,就去调整,看这个东西应该怎么算,算出来才有用。我举一个比较极端的例子,假定这个算法发现,所有人的嘴角都是尖的,这个特征就没有用了,就扔掉了。要去发现一些特别有用的特征,这些就是为什么深度学习变得特别有用,就是说它能够去海量的数据里面学一些特别有用的特征。
问:所以算法的强弱取决于什么呢?
林元庆:算法的强弱取决于两点:
一点是你要去设计比较好的计算方法,如果在深度学习里面,你要设计你的这些位置、这些线是怎么连的,因为整体最后是非常非常大的,就反映出来深度学习的一些架构。
第二,你是不是有足够的数据,能把这个算法给训练出来比较好的项目。如果数据很小,就看到一个人嘴角是尖的,你就以为大家嘴角都是尖的,这就不行。当然这里面也有很多技术能够让你进行海量的数据训练。比如如果算法特别慢,可能算一万个数据得一天,连一个数据就得几万天,这就是做不出来的。
问:其实这个人脸识别技术的精确程度已经达到非常高了,但是2015年的时候,在出席一个会议的时候,银监会的领导就表态说,我们觉得它还不能百分之百的放心,所以从政策方面就没有给它放开,在这块你们是不是取得了一些什么样的突破,现在有没有新的进展?第二个问题,你刚才提到声纹识别,就是现在的应用和尝试的情况是怎样的?
林元庆:最开始的时候我也提到了,其实在几年之前,人脸识别已经做得比普通人好,去年我们把它提到了新的高度,能够比最强大脑的选手还要好,这是很难的。最强大脑的三期节目我一直在后台,因为整个技术人脸、声纹都是我自己在盯的,我也亲身感觉到最强大脑的选手有多厉害。原来只是说我们比普通大脑好,但是现在我们在最强大脑的节目里,比非常优秀的人类还要好,是往前进了一大步。
其实证监会的这些东西也有很多问题需要去解决。我曾经听一个银行的领导跟我讲,现在国内有很多黑产,特别是针对金融,所以单靠一个技术是不会全部覆盖的,我相信人脸识别跟很多技术是一样的,得有一个过程,很多时候因为有别的因素很难一步到位。
声纹的话,我们已经在百度用到了,比如现金贷和身份认证场景,除了人脸识别还会走一下声纹识别。
声纹这块我们可能后续在度秘的场景,比如唤醒,会快速往前推进。我们要知道谁在跟度秘说话,你说完这段话之后,我知道是你说的,几个人说完之后,我就能记住这个话是某某说的,那个话是某某说的。
问:刚才您也谈到会软硬件结合来做,为什么不是以SDK的形式来做?还有一个问题,有个关于错时识率的问题,现在错识率会做到千万分之一的级别?
林元庆:我先回答软硬件的问题,为什么做软硬件结合,而不是做SDK。我们景区的场景,就是跟一些硬件厂商一起做软件开发、硬件开发。我们每天跟他们在一起做测试,一起提高,出一个最后的方案,这样更有利于我们充分的发挥算法的优势。当然我们也不排除一些服务是用了SDK的形式,我们的SDK给他让他去用,但很多时候我们还是希望跟他们一起配合。我们下一步往回走了一点,还是在做SDK,也做软硬结合。
像手机的情况就是纯SDK的形式,就是软件的形式。刚才说的闸机的情况,非常极端的情况,可能会做一些硬件。
我们一方面是在优化算法,让它很容易用,我们特别看重的是多规模、大规模的高效计算。还有一个是国家工程实验室这个非常重要的平台,我们现在的计划也会把这些推到中国的高校里,高校里都会有机器学习的课,你上了这个课,做作业就直接用这个平台做就可以了。我们还是蛮开放的。
第二个攻击的问题,是人脸识别里面非常重要的问题。刚才在下面有一个嘉宾说了,如果指纹丢了,你可能还有九个手指,但是人脸丢了,就没有办法了。其实人脸识别里非常重要的就是需要做很好的防攻击,比如百度闸机,我们和吴恩达录了一个视频,他先过了闸机,让我拿着他的工卡,我把他的工卡这么拿看能不能过得去,百度的系统是拒绝的。因为那识别出那不是真人。人脸识别里面,这叫活体检测,我们的活体检测出那不是活的,是个死的,是个工卡,因此就不让过。活体检测在人脸识别当中是非常重要的一个技术,像银行系统,人脸识别都是要配很好的活体识别的技术,就像防计算机病毒那样,要不断提高。
还有一个很重要的,就是我们现在会把这个精度做得非常高,甚至希望有一天能够识别现在的人跟半年之前的人的区别。这说的是很极端的情况,如果你的系统真的做得非常好,这些是有可能做到的。