人工智能的出现,让所有的厂商都站在了同一起跑线,对于传统芯片企业来说是一个重新起跑的机会。
10月31日,杭州国芯(下简称「国芯」)携手合作伙伴Rokid、思必驰、Cadence在深圳华侨城洲际大酒店举办了一场发布会,发布了一款人工智能芯片「GX8010」,发布会现场,国芯总经理兼CEO黄智杰博士在台上讲出了开篇的那句话。
人工智能大热是近两年才开始的事,而国芯在2001年就成立了,在没有进入人工智能领域之前,该公司主要专注于数字电视芯片和机顶盒芯片。
从传统的数字电视芯片、机顶盒芯片到AI芯片,看似跨度奇大,实际上其中还是有些关联的,比如电视机顶盒芯片处理图像和声音的能力,正是当下人工智能领域极力想要攻克的。
2016年,国芯成立了AI事业部,想要做一款面向物联网市场的专用AI芯片,能够在本地离线、低功耗、可移动的工作,由此才诞生了「GX8010」。
「边缘计算」是国芯发布会上重点提及的一个词,按照当前AI行业的说法:
边缘计算指在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。
这看似生僻的「边缘计算」,其实并不「边缘」,且意义重大,边缘计算和云计算有些类似,都是处理大数据的计算运行方式。但不同的是,这一次,数据不用再传到遥远的云端,在边缘侧就能解决,更适合实时的数据分析和智能化处理,也更加高效而且安全。
那么为什么要重点提「边缘计算」,更简洁的来说,边缘在一定程度上代表了「终端」,这其中有个AI发展的逻辑,就是终端和云端的需求不尽相同。
目前深度学习对于计算力有着很高的要求,目前业界更多的是将多数计算力放在云端处理,云端设备不会考虑服务器大小、功耗大小这些问题,成本也不是首要的,但是,世界不只是云端组成,还有很多很多的终端,比如手机、智能音箱、智能设备等等,当把AI技术应受到这些售价亲民的大众性设备终端时,云端没有考虑在内的细节就都成了问题,物联网终端要考虑带宽、功耗、延时等多个方面,这些就要靠终端芯片来解决。
AI芯片里到底有什么,它和传统芯片有何差别,以及各种在物联网上部署人工智能的难点和痛点到底是什么?
黄智杰在发布会上讲到了这些问题,在其中提出了三个痛点并给出了解决方案。
本地神经络计算问题
目前来说,物联网设备中内存带宽普遍小,因此国芯专门设计了神经网络压缩引擎 NCompressor,能利用神经网络中的数据稀疏特性,压缩计算权重,可实现6~10倍的压缩效果,神经网络经过压缩后,需要的内存容量和带宽大幅减少,同时运算的速度也得到了提高。
此外,针对压缩,国芯还提供了编译工具,可以一键实现模型的量化压缩,然后通过芯片中的硬件引擎解压,无需重训练和额外处理,在芯片架构、编译工具、和编译压缩工具一起,国芯还发布了全套神经网络开发SDK,只需要简单三步,就能完成模型从服务器到芯片的部署。
考虑到物联网应用中的成本和功耗因素,这一代的gxNPU中并没有堆砌非常多的MAC阵列,而是选择了64x64的配置。国芯方面表示,在典型应用的性能评测中,gxNPU@200MHz仍然比树莓派中的多核CPU@1GHz,快了近30倍,能效提升100倍以上。
AI交互系统复杂,成本高
人工智能芯片如果想要真正的落地,光有NPU还是远远不够的,因为整个AI交互是一个非常复杂的过程,除了神经网络计算还包括传感器接入,信号处理,检测识别,以及软件层面的决策和反馈等。环节众多,每一处需要的算法和计算特性还不一样。
以智能语音交互为例,当前语音识别的巨大挑战仍在前端的语音降噪,为了解决噪声和有效语音分离问题,业内引入了麦克风阵列,利用空间信息进行降噪滤波。多个麦克风的引入首先对硬件上的接口就提出了要求,一些传统芯片没有这么多接口只能通过其它器件来扩展。同时多路信号的接入,也使得前端语音处理计算量大增,传统芯片中大家用CPU软解已是十分吃力。
为了解决这些问题,国芯在芯片中集成了Cadence Tensilica最高阶的语音DSP Hifi-4,据雷锋网了解,Cadence Tensilica HiFi DSP系列是全球使用最广泛的音频、声音、语音处理器,DSP Hifi-4专门为智能语音而设计,可以高效地进行各种语音信号处理计算。同时GX8010芯片中支持8通道麦克风接口,不仅支持PDM和I2S数字接口,还内置了8路ADC直接支持模拟麦克风。
在语音算法方面,国芯也选择了国内知名语音AI公司Rokid和思必驰作为合作伙伴,将他们的算法移植进来,合作推出低成本、低功耗的整体语音解决方案。
除了语音系统外,GX8010还构建了视觉系统,支持1080P摄像头输入,图像预处理,MJPEG编码等模块。语音和图像的信号处理完后,都送到中央的决策和应用系统进行业务和应用处理。
功耗大
物联网产品的一大应用难点在于体积较小、场景多样,很多时候需要电池供电,这便对产品的功耗提出了较高的要求。
针对这一难题,国芯也给出了他们的解决方案。
在动态功耗上,芯片充分利用多核异构的优势,合理安排每个模块的工作频率和启停时机,可以做到按需使用、用完即停的效果。
据国芯方面介绍:
在典型的语音交互中,GX8010只需要100-200MHz即可完成离线语音识别,DSP工作在300-400MHz即可实现多麦克风阵列处理,CPU更是可以根据系统负荷进行动态调整。这种方案让芯片在高效运转的同时,又能保持非常低的功耗。据测试,在离线语音交互的场景下全速运行,GX8010的功耗可以做到0.7W以内(包括DRAM)。
而关于待机欢迎问题,国芯做出了「多级唤醒机制」的方案,可以根据是否有声音、是否有人声,是否是关键词这多个等级来做硬件划分,逐级唤醒系统。这种逐级唤醒的机制,既保证了语音助手能实时响应指令,又能大幅延长设备的续航时间。据测试,GX8010可以在0.05W的待机功耗下实现语音唤醒。
AI 终端芯片满足了终端设备的需求,但是仅仅是芯片亦或技术并不是大众的最终需求,AI技术只有落地才能惠及用户。在这点上,国芯选择了Rokid和思必驰两家合作,借力智能音箱、消费机器人等物联网产品进行AI 落地。
在讲述为何选择合作伙伴时,黄智杰也谈到,此举是希望能够满足不同设备的需求,让需求商能够找到更合适的方案,一个成熟的芯片就应该是多方共同努力的结果。
Rokid 创始人Misa在群访时也表示:就像我们也不会自己做芯片一样,国芯不需要把所有的技术都包揽。
在现场,思必驰VP赵恒艺也讲到:
如果要完成一个很好的语音交互,就需要把整个端到端的闭环打通。但是,端到端的闭环是不是完全由一个公司来做成的?我不认为是这样的,任何一个行业成熟的标志,一定是非常多的玩家一起参与进来,然后去推动这个行业向前发展。
目前市面上已经有很多包括巨头在内的厂商都推出了自己的AI芯片,算是在短时间内掀起了一股AI芯片的小热潮,从现在的发展趋势来看,智能设备对AI芯片的需求也在不断扩大,未来还会出现更多的AI芯片厂商和研发团队。而相对于目前市场上从「单一功能芯片」入手的团队,国芯直接选择了语音和视觉的全能芯片,这也得益于此前他们在传统行业的积累。
未来AI芯片要进入更多的终端设备、应用场景,在这个过程中,也需要更多像国芯这样从「传统芯片」加入的AI玩家一起努力,从底层推动整个人工智能行业的发展,反而言之,就如黄智杰所说,人工智能带来了新的起跑线,给了传统芯片厂商重新起航的机会。
关注雷锋网旗下公众号「新智造」,跟雷锋网一起读懂智能&未来