2018 年 3 月 31 日,由雷锋网主办的 AI 盛会 ——【 2018 中国人工智能安防峰会】,在深圳科兴科学园国际会议中心正式落幕。
在下午的演讲环节,地平线副总裁张永谦登台讲述了地平线在安防和泛安防领域的进展。他表示,地平线定位为AI 领域的赋能者,在范安防领域,以 AI 芯片为核心,针对不同行业,不同时间段以及不同能力的客户,也可以提供不同的交付层次,从芯片的解决方案到智能摄相机的平台,而最终目标是帮助行业客户打造自己的行业应用,从而实现 AI 的民主化,大家百花齐放,互利共赢。
地平线基于自主研发的嵌入式人工智能视觉处理器旭日 1.0 打造出来的智能摄像头,以芯片为支撑实现实时大规模的人脸抓拍,可应用于地铁站、火车站、机场等处。地平线采用一颗功耗只有 2 瓦的处理器做出来的相机与 TX1 所支撑的智能抓拍相机,在抓拍率上完全是同一水平。当然,除了安防,地平线也在积极布局智能商业等领域。
以下是地平线副总裁张永谦演讲实录,雷锋网做了不改变原意的编辑:
大家下午好!很高兴今天能和很多业界知名公司在一起来讨论学习。地平线是一个成立两年半的创业公司,今天我听了一早晨到下午的会议,我感觉安防和泛安防领域很多公司做了非常深的探索,特别是上层的这些百花齐放的业务逻辑,真的是让我们的生活可以更加的安全、便捷和精彩。
地平线可能是今天里的为数不多的关注智能底层,做赋能的这么一家公司。所以我想今天想讲的核心的点,是希望更多的客户、各个行业的厂家还有合作伙伴,能够通过地平线提供的底层的 AI 能力,能够让 AI 这个东西变得非常便宜,非常的快捷,非常的好用,让真正行业里的能够为客户放开手,把你们的行业应用给做起来,让 AI 变得平民化。
怎么做到这一点?我们的路也比较明确,就是要做 AI 芯片,但是我们这个芯片不是一个传统的半导体公司的芯片。
人工智能这次革命跟以前最大的不同就是让机器能够自主决策和行为,三大要素让 AI 这几年这么火大家也都很清楚,数据算法和计算,地平线主要关注在算法和计算两部分,就是如何把算法与芯片相结合。
有几个观点,第一是中国需要自主 AI 芯片。大家看英伟达,市值上升非常厉害,整个市值已经 1400 亿美金,就是趁着 AI 的这一波浪潮。地平线成立于 2015 年 7 月,也是中国最早投身于 AI 芯片的公司,当时英伟达市值要比现在低得多。中国每年要进口 2000 亿美金的芯片,中国最关键的数据都跑在了国外的芯片上,这在国家层面也是不可以接受的,因为这涉及到国家安全。所以我们还是需要一个本土的公司来做人工智能的芯片。
第二,计算是从中央慢慢向边缘进化的。从 PC 时代到移动互联网时代再到人工智能时代,智能一定是越来越碎片化。为什么?智能一定是个性化的,只有个性化才能叫做智能,如果是工业时代的话,大家做的东西都一样,大规模,也不叫智能时代。个性化一定是碎片化的,所以今天前面很多的公司也提到在云端要做非常多的事情,这个我们都非常认同,包括刚才也在说阿里的云端大脑。最关键的是我们需要一个均匀的系统,也就是端+云。
传统的智能城市的解决方案,所有视频往回传的话占了云端的存储技能,但是如果采用云端的智能芯片,成本可以下降到原来的十分之一,这是我们想要维持努力的目标,就是让最终的系统变成一个端+云的非常融洽的、非常平衡的系统。
做 AI 芯片的时候,地平线要做的事情并不仅仅只做一颗硬的芯片,我们是软件定义硬件这么一个概念。Alan Kay 讲过一句话,如果你认真对待你的软件,一定要把硬件做好。这也是为什么苹果手机里面的处理器和主屏,包括它的运算力等等,是低于高通等等这些公司的处理器的,但是大家用苹果手机会觉得比其他的手机速度要快很多,也流畅很多,就是因为它从最底层的芯片,都是由他自己来打造的。
传统的半导体公司已经感受到了非常大的危机感,也要去主动变革,所以英特尔在去年收购了 Mobileye,不是看重它的芯片设计能力,他们最厉害的地方是有积累了十几年的数据,有一套基于数据的完整算法模型,最后在这个基础上再去定制芯片。所以它可以获得一个超额的利润,也可以以 150 亿美金的价钱被收购。像英伟达主要是软件上层架构和工具,而且最近英伟达所发布的芯片,已经比特斯拉那些小很多,已经开始采取深度学习优化的专业处理器。所以英伟达不能说是原来显卡时代的 GPU 的公司,他也是朝着软件定义硬件,朝着 AI 公司走。
所以整个 AI 芯片计算是有一个泛式转移的,从最成功的英特尔,就是用 CPU 串型计算,随着 AI,随着碎片化时代的到来,随着要对图象做更多的处理,而且图象天然的是定性处理,所以 GPU、FPGA 都登场了,而且都很火,但是这些都是传统的硬件和芯片,并不是根植于 AI 和深度学习,所以这些芯片的计算力和效率仍然不是最佳。
所以从 2015 年开始,真正把 AI 芯片做出来的公司反而是软件公司,有一家是 Google,他们做了 TPU,还有就是我们地平线,我们本质上是先有软件的公司,再去把软件和硬件做到一起。这样带来的好处就是,现在在市场上看到的所谓 AI 芯片的公司,他们提供的其实是一个“裸片”,底层提供一些加速,但是地平线所提供的是一个应用场景的平台,不是计算场景的平台,这样根植于地平线的芯片和算法,用户可以通过 AI 所得出的结果做行业,真正把行业做起来。
所以我们希望让 AI 变得平民化,不需要有一个很大的算法和团队,也不需要有多么多的数据,当然如果你有更好,我们会帮你把底层做好。对于没有算法的团队和有数据的合作伙伴,那也更好,你把你的数据交给我们,我们可以针对你的数据训练出来只有你有的解决方案。同时对于更往下走的做行业应用的合作伙伴,因为给你一个芯片本身你可能也用不起来,我们也会提供我们的智能相机的平台,不管是智能相机平台还是智能解决方案,最终做的是希望在我们之上能够构建一个共赢的事情,让各行各业的客户合作伙伴都能非常快捷、便宜的用到 AI。
AI 芯片本身一定是牺牲了通用性,换来了专用性,正如人的大脑也是专用性的,我们做几何数的乘法肯定是做不好的,但是可以在零点几秒的时间内快速识别出一个非常复杂的物体,比如说一只狮子,虽然原来只见过一次,所以人的大脑是一个专用处理器。我们也一样,我们牺牲了通用性,换来的是我们聚焦的场景里强大的处理能力。
简单介绍一下我们公司,成立于两年半之前,去年的 12 月份刚完成了 A+ 轮的融资,是英特尔领投,我们也是发布了中国首款全球领先的人工智能处理器和解决方案,有参加我们发布会的朋友会看到,我们的发布会不是靠 PPT,是在现场用我们的 AI 芯片做出来的智能摄相机以及已经搭建起来的整个应用场景。我们在北京、南京、上海、深圳四个研发中心,员工大概有五百多人。
下面介绍我们的 AI 芯片以及上面构筑的解决方案。我们的 AI 芯片有三个架构,目前发布的叫第一代,是用高斯架构,处理能力达到了 1080p @30fps 的处理能力。旭日的功耗目前是 2 瓦左右,第一代的芯片做的是目标级别的检测、识别以及跟踪,这里是对街景做的结构化处理。下面是我们真正研发的,也就是第二代,伯努利架构芯片,可以同时接入和处理 6-8 路 1080p 的处理能力。这个芯片我们会在 2018 年底发布,我们会每年发布一代新的处理器架构 AI 芯片,伯努利架构跟第一代最大的区别就是可以在智能上做到像素级别,而不是第一代的物理级别。
谈到 AI 一定要说场景,所以场景主要有三个,因为今天是安防论坛,关于驾驶部分就不多说了,重点说智能城市和智能商业。这是基于旭日处理器打造出来的智能摄像头,这是北京西单的地铁站,用芯片支撑的智能摄像头做到的实时大规模的人脸抓拍。我们最近也在做采用 TX1GPU 为核心的智能相机,也在做对比测试,可以很自豪地告诉大家,采用我们一颗功耗只有不到 2 瓦的处理器,做出来的相机在复杂程度抓拍的性能和 TX1 所支撑的智能抓拍相机,在抓拍率上完全是同一水平。这个是在故宫的前面,我们所做的人脸抓取和人脸属性和识别。这是利用我们芯片架构做的结构化处理,大家都很清楚这个结构化,只不过之前是在 GPU 上做,在 FPGA 上做,如果采用地平线的解决方案的话,你就在一颗不到两瓦功耗的芯片上就可以做。
后面是我们在智能商业上所做的一些事情,总之智能商业一定要用摄像头把线下场景做到数字化,让大家能够去做运营。所以这个场景就比较多样了,首先是做人员客流分析,包括人的属性分析,以及右边是人的移动,可以做轨迹、热力图以及人的动作检测和分析,进行所有的实现都是在前端智能相机实现,如果有做智能商业应用平台的合作伙伴,就可以跟我们联系。你可以没有后顾之忧的开发你智能商业应用的系统。
所以大家可以看到,在智能时代到来的时候,场景和应用一定会高度分散化,这也给地平线这样的创业公司,也给原来很多行业里的公司,我们的合作伙伴也带来了非常多的机会。因为它在这个时代对视频的处理不再是标准化的,只是把前端的视频怎么样变得更清楚,怎么样变得更小,更有效率的传递,而是说智能这个能力可以为各行各业所用,这时候我们相信一定是一个百花齐放的,我们也认为传统的一些巨无霸公司在智能这个时代,想再采用规模性和他强大背后的实力,在智能时代把整个市场吃下来,我们觉得这应该是非常困难的,这个时代就应该是百花齐放的时代。
所以我想地平线定位就是智能的平台公司,我们针对不同行业,不同时间段以及不同能力的客户,也可以提供不同的交付层次,从芯片的解决方案到智能摄相机的平台,最终我们希望和大家在智能时代形成共赢局面,互利共赢,百花齐放!谢谢大家!