如果没有2005年的爆红,这些数以万计的陌生人或许就不会站在雨里,为台上的偶像李宇春“打 call”,而李宇春也不会在走红12年后,为台下的这些人创作一首给他们的歌——《今天雨,可是我们在一起》。
2005年,除了李宇春夺冠,其实还有两件事在被庆祝着:一件是英特尔正在庆祝自己入华20周年,还专门成立了一支投资基金,规划了一系列投资计划;另一件是中国计算机界正在筹备人工智能诞生50周年的纪念活动,彼时的人工智能还坐在冷板凳上。
12年后,这几条线有了一个交点:李宇春为自己的粉丝写了一首歌,歌曲的 MV 由英特尔提供技术,而这个技术就是现今掀起巨浪的人工智能。
雷锋网了解到,在这支 MV 中,为了表达歌曲传达的情绪,有很多雨水贴在面部、鲤鱼游过面部的画面场景,这些图案特效需要经过影视后期的设计和加工,更需要在英特尔3D人脸面部表情捕捉技术基础上,与面部进行贴合。在英特尔于成都举办的品牌之夜活动上,雷锋网编辑也体验了该技术,通过面部表情的变化,该技术可以即时在脸上贴合一些“奇怪的东西”,比如恶魔、蜘蛛、雨水等。
英特尔3D人脸面部表情捕捉技术,能够实现人脸的自动检测与识别,定位人脸的78个关键点,快速重建3D人脸,并且实时跟踪面部表情变化,从而将预先设计好的特效素材附着在3D人脸上,重新渲染到MV视频中。
有一点不同的是,以往的表情捕捉技术需要在人脸做标记点,需要较为复杂的传感器,而应用了深度学习算法后的技术,则不需要上述两点,更为智能。
做到这一点其实依靠的还是机器学习,英特尔中国研究院王山东表示,基于大数据,通过数十万张人脸的数据库,实现了一个低精度的视频、摄像头捕捉到的照片或视频都能够精准的识别人脸,随着人脸数据库,精度会上升。这项技术能够应用于任何3D特效公司。
除此之外,我们还和英特尔中国研究院院长宋继强,就英特尔在人工智能领域的研究与布局聊了聊。以下为采访的Q&A 部分,雷锋网在不更改原意的基础上,做了调整:
记 者:英特尔在 AI 方面的布局依据什么思路?
宋继强:人工智能本身范围非常广,看你怎么去定义,如果只是深度学习,就很窄了。如果说把其他经验借鉴进去,比如规则、推理、机器人等,这些都算在广义的人工智能领域。
英特尔的布局首先是解决训练的问题。训练现在是依赖云端的,像英特尔®至强®处理器、英特尔®至强融合™处理器,还有收购的 Nervana,刚才我讲到灵活的多任务处理的结构,英特尔®至强®处理器、英特尔®至强融合™处理器便能给予的,如果针对于某些密集的训练需要的专业加速,比如深度学习相关的,那就是 Nervana 的 Lake Crest 可以给出来。目前来讲,训练比较流行的是深度学习算法,它能把一个模型训练到解决某类问题。比如,训练好之后就可以做语音识别、人脸识别、或者物体检测,有不同的功能。
训练好之后,会面临一个问题就是部署,部署实际上不涉及训练,它就是要快、成本低,功耗低。英特尔收购的另外一些公司,比如说 Altera,它的 FPGA 实际上是一种低成本、低功耗的硬件加速单元,它是用来覆盖哪些市场容量不是很大的情况,市场容量大的时候 FPGA 的性价比就没那么强,这种情况下开始有 ASIC 的方案出来,像 Movidius,就是我们收购的在前端非常小的功耗要求下,能够把带深度学习能力的计算视觉算法加速。
记 者:英特尔中国研究院主要负责什么?
宋继强:英特尔中国研究院主要做视觉相关的人工智能的核心算法,包括人脸识别技术、情绪识别、场景理解。今天的体验英特尔3D人脸面部表情捕捉技术是人脸技术的延伸,人脸技术已经做了10年多了,现在也做物体的识别检测和深度神经网络的压缩,压缩主要是在一些部署的时候前端的硬件资源是有限的,内存有限,计算能力有限,所以我们把训练出来很大一个模型压缩到原来的1%,但是保持工作时候(例如推理的时候)的精度,这是很重要的技术。
情绪的识别,就是表情的识别,目前也是学术界比较流行的叫情感计算主要的基础。不光是看到这里有人,这是谁?要开始去理解人的情感。
还有一个技术是做场景的理解,让计算机去看一个视频的场景,能产生文字,等于说加标注或者是加解说词,这个是非常有用的技术,对无人驾驶、机器人、智能家居都非常有用,可以把场景的情况语义化,因为我们知道其实文字具有很多种技术,可以接着开始往后做,更多一些怎么去理解,怎么去做意图分析,怎么给人提供相应的服务,怎么去给场景进行一些意外的检测,这个是学术界很热的。叫做 Visual Understanding。这三块是基于视觉的人工智能技术。
另外一块,是我们研究院最重要的跟人工智能相关的研究,就是机器人——家用机器人,我们的目标是推出一套基于异构计算平台的家用机器人开发平台,这种平台可以帮助很多研究的团队(不具备完整的平台搭建能力),推出这个以后他们可以基于这上面做他们想做的,我们把基础的运动能力、感知能力和加速放在上面,这个平台基于酷睿级别的CPU加 FPGA,也可以选择性加上 Movidius 神经计算棒推出去。
记 者:中国研究院的研究人员有多少?
宋继强:大概全职有60几位,实习生有20几个,加上 supporting,不到100吧。
记 者:英特尔中国研究院是除了美国以外最大的?
宋继强:对,英特尔研究院一共800人左右,有600人是美国本土的,分成四大块研究方向,是英特尔关注的:
第一块是电路和架构
第二块是系统和软件研究
第三块是5G,甚至更前沿的无线通信研究
第四块是安全技术和隐私管理技术
这是美国的四大function lab。
在海外有两个是称为地区性的研究院,一个在中国,另一个在欧洲。欧洲是组合的,一部分在爱尔兰,一部分在德国,目前有40多人,那边可以调用欧洲的大学资源,研发很先进,有很多研发投入。英特尔中国研究院,也利用中国的人才和中国的一些产业政策,我们做的结果是希望能够辐射到全球的。
记 者:阿里成立了达摩院,英伟达宣称攫取了人工智能行业80%以上的利润,听上去这些公司都是显得更前沿,对此您怎么看?
宋继强:英特尔研究一直是前沿的,我们没有讲太多,比如最近我们将神经元芯片、神经拟态芯片、量子计算方面的东西,我们在前沿的领域已经有不错的工作,有一些是在世界领先的。
目前人工智能市场不大,在英特尔看来目前的投入都比较及时,并且能在未来产生商业价值的时候我们的产品已经存在。目前整个数据中心中,跑人工智能占比较小。但是其未来三年增速可能是12倍。面对这样的增速,我们就有应对方案。此外,海量数据不光是在服务器做训练,做存储(英特尔有3D XPoint),做通讯有很好的方案。在前端,很多客户遇到的问题,部署时,如果使用GPU是不可取的,功耗高;在前端需要价格低、功耗低,在部署层面上如何更好的做推理,同样需要多样化方案。这一块英特尔已经看到市场上的产品,例如收购的 Movidius,在市场上推动其快速迭代,FGPA 也在推动在这些领域的进入。英特尔接收到全球的动态,在多种方案上进行推动。
记 者:人工智能芯片市场怎么样?
宋继强:人工智能目前是属于婴儿期,是英特尔的普遍认知,未来10-20年都是产业向上发展的,现在判断什么是最后的芯片方案为时过早。芯片需要靠应用去确定,在应用落实前无法判断什么是最终的芯片方案。
目前人工智能热在于深度学习在学术界的突破产生的。深度学习在学术界使用的GPU方案去做,当算法都迭代完毕,主要看谁的芯片最厉害的时候。但是无法判断未来演进方向,包括一些指标仍然在不断引进。这个指标里面,离谁是最后的赢家,还有一段距离。
记 者:收购和投资小厂的时候有什么标准?怎么判断?
宋继强:和英特尔有战略相关性的才会去投,其次技术必须是领先的。
记 者:英特尔与 Facebook 合作开发人工智能芯片将在年底推出,该芯片会有哪一些突破?
宋继强:去年我们有讲 Lake Crest 芯片架构,目前应该是一脉相承,既提供了很多的并行张量计算单元,都是用块去计算的,提高了很多高密度计算,而且计算扩展性也很好。一个芯片一代可能只是一个PFlops的运算,如果需要多的话,可以通过几个芯片去组成阵列,继续增加你的运算资源。
芯片和芯片之间的运算必须保持高带宽,低延迟,专门设计了 cell 通路,保证芯片之间通讯足够快,带宽足够高。在扩展芯片支持尺寸的时候不会带来额外的一些代价,这些是他们设计的要点,而且在计算能力方面领先。而且上面有一套软件,这个软件帮助用户拆分数据流里面放在不同应用领域加速。有一套软硬件集合的方案,基于这些应用优先考量。Facebook有很多种不同的社交数据,这些不同测试应用,看这个芯片到底怎么样才能够优化。今年底出一个测试点,在过一段时间正式点,正式出来是选择很好的合作伙伴,可以让我们通过训练来迭代。