资讯 芯片
此为临时链接,仅用于文章预览,将在时失效

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

作者:包永刚
2020/04/22 10:36

上月,全志科技发布了新款智能语音专用处理器,这是Arm中国耗时两年研发的周易AIPU的落地首秀。近日,雷锋网与Arm中国产品研发副总裁刘澍和全志科技副总裁陈风进行了深度交流,了解到了Arm中国的产品进展以及Arm中国与全志科技定制周易AIPU的更多细节。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

Arm和Arm中国的AI产品冲突了吗?

Arm中国在2018年注册成立,中方投资团队占股51%,Arm公司占股49%,接管Arm在国内的所有业务。同时,Arm中国也会研发更符合中国市场需求的产品。据悉,Arm中国从2018年开始就在推进3个产品线,分别是:周易AIPU、山海平台安全解决方案、星辰处理器。

刘澍透露:“这三个产品线从团队建立、到产品开发到发布客户、到客户芯片流片回来测试的工作,目前一切进展顺利。今年第一季度恰好都有客户的芯片返回而且工作正常。”

周易AIPU属于当下最受关注的AI产品品类,也是Arm中国最先看到落地应用的产品。“与Arm不久前推出的配合Arm Cortex-M处理Ethos-U55和配合Cortex-A处理器的Ethos N系列NPU相比,Arm中国周易AIPU更加通用,既可以跟Cortex-M或Cortex-A一起工作,也可以作为处理器进行独立工作。”刘澍对雷锋网表示。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

也就是说,周易AIPU既不是CPU处理器,也不是神经网络加速器。这是因为,周易AIPU定义了一套新的适用于AI算法的指令集,通过指令来驱动里面的向量处理单元和固定的AI算法处理单元,从而完成各种复杂网络的组合的操作。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

但作为一款AI处理器,周易AIPU也必须寻找通用性和效率的平衡点,以提升产品的竞争力。周易AIPU的做法是,用向量处理单元Vector/Tensor Process的并行的8-bit向量阵列进行向量计算,Arm中国为Vector/Tensor Process定义了一整套向量处理指令集,有点类似于Arm此前的NEON指令集。

另外,周易AIPU中的AI Fix Function把常见的AI网络里所通用的部件和单元固化为硬件,通过指令就可以驱动硬件工作,提升效率。

标量部分,周易AIPU也有标量单元,这个单元并非完成的CPU,但有类似标量处理器的功能。

因此,周易AIPU用标量处理单元Scalar Unit、向量处理单元TensoCre Ellxe.Cell,还有能提升AI效率的AI Fix Function,最终实现通用性和效率的兼顾。

除此之外,周易AIPU的架构中还有可扩展的安全架构和可扩展的用户定义架构。“可扩展的用户定义架构其实就是给像全志科技这样的战略合作伙伴准备的,因为有的客户可能很简单地把AIPU集成下来就可以了,但也有一些比较有深入研究的芯片公司,会对里面的算子有自己定制的理解和需要。”刘澍进一步指出,

“我们开放了这样的接口,可以用特殊的指令来驱动用户定义的算子。因此,不同周易AIPU平台的产品最终的效能可能不同。”

当然,周易AIPU也是一些列高度可配置的处理单元,开发者既可以配置通用的Tensor算力,也也已配置AI Fix Function专用算力。周易AIPU单核性能为0.2TOPS-4TOPS,用多核配置组成系统最高可实现64TOPS的算力。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

全志科技最新发布的R329语音专用SoC中集成的正是定制的周易AIPU。

定制化是AI处理器提升竞争力的关键

全志科技R329中集成了定制的周易Z1-0701,1代表的是Arm中国第一代周易AIPU架构,07指它有2的7次方个硬件MAC,01表示还有一个通用的Tensor处理单元。刘澍说:“0701是专门针对智能家居、智能楼宇、智能机器人这样的场景深度定制的,它可以非常高效地运行在本地的ASR的各种语音算法。同时,它也有相对比较简单的视觉的分析能力,比如说图像和人脸识别以及感知。”

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

刘澍也表示,Arm中国是根据全志科技给出的市场定位,在周易AIPU 的处理器上又花了数月的时间进行定制,最终做出全志科技所需要、在市场上具备竞争力的产品。这样,通过全志科技这个战略合作伙伴,不仅带来了准确的市场需求信息,更用顶实话的方式开发IP保证Arm中国的产品最切合客户需求。

全志科技副总裁陈风也说:“当下仅仅把芯片做好还不够,在过去几年里,我们花了非常多时间进行市场信息搜集,涉及市场需求,实现方式、手段、技术细节等。所以,在我们双方探讨合作的时候,Arm中国也发现全志科技拥有非常多有价值的市场需求信息和思考,这也促成了双方的迅速合作。”

“通过跟非常多的友商和算法公司进行了大量的交流,发现大家对专用算力是有明确需求的,所以我们就推出了全志科技R329这样的芯片,经过了10个月左右的研发,这款新品已经有样片和样机。”陈风也透露。

“各家知名的算法厂商,包括讯飞、思必驰还有其他的合作伙伴都已经开始做了算法的工作,他们的反馈现在都是非常好的。”

对于算法公司而言,算法移植的难度以及与硬件匹配的软件的易用程度成为关键。据悉,通过Arm中国和全志科技的合作,可以实现TensorFlow模型的24小时移植。未来,周易AIPU还会支持更多的业界主流的AI框架。

不过,在AI框架之下,还需要Arm的Compute Library或者是Open AI Lab的异构计算库,进一步去支持像Arm NN、安卓NN比较流行的接口。像全志这样有实力的公司,则会有自研的Tina OS和Runtime的框架,只要把周易AIPU的驱动层接进去都可以正常工作。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

陈风介绍,Tina OS在全志科技内部使用已经有5、6年的历史,它是一个轻量级的Linux OS,使用Tina OS的名称后已经迭代了三个大的版本,整个OS完全开源,并且启动速度非常快,现在全球已经有累计超过5千万台的设备使用了Tina OS,包括音箱、扫地机、冰箱和微波炉等。

品质和靠谱是AI芯片落地的关键

成立于2007年的全志科技,早在2011年就开始进入智能音箱产品,但那时的智能音箱是能连上Wi-Fi就叫智能,和2013年之后我们所说的智能音箱的概念还是有所不同。全志科技新发布的AI芯片会以智能音箱为切入点,然后渗入到智慧城市,包括智能楼宇、智慧工业以及智慧生活当中。

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

陈风预计,家电产品应该在2020年和2021年左右开始迎来第一波的智能化的普及浪潮。

他指出,语音面板看起来不起眼,实际上量非常大的市场。因为工业控制器、电梯、汽车的驾驶平台以及一些专业的电子设备都会有控制面板,这个面板的语音化现在也已经开始全面启动了。

谈及全志科技AI产品的核心竞争力,陈风说:“我们现在是有非常明确的答案和信心的,任何一个产品或者是技术的落地,需要的是非常可靠的一种实现方式。我所说的可靠,不仅来源于全志科技有实力,过去的经历也证明我们公司能够向客户提供极其持久的技术支持和产品支持。”

另外就是品质,“电子产品是否可靠,在消费电子领域、工业电子领域,以及在智慧家庭领域有截然不同的等级要求。在家电领域,品质也是客户重点考量的对象,要求的级别可能是99.9%,也可能是99.99%,最高达到了99.9999%,这么高的可靠性要求,背后也是客户精细化经营的要求。”陈风指出,“通过类似的场景大家可以感受到,语音技术在商品化的过程中,靠谱这两个字是有多么重要,它摆在了先进性之前。”

雷锋网小结

Arm的AI产品的发布和落地进展在业界都并非最快,这其中很重要的原因就是Arm在权衡NPU的效率和灵活性花了更多时间。在Arm中国的产品中,周易AIPU作为Arm中国的首款AI产品,通过一套新的AI算法指令集适应AI处理器的需求,兼顾通用性和效率。并且,周易AIPU的指令集设计和架构设计都由Arm中国完成,因此这也是一个Arm中国自主可控的产品。

Arm中国与全志科技的合作,是周易AIPU的首秀,最终的竞争力到底如何,我们将保持关注。另外,Arm中国除了将周易AIPU授权给智能家居领域的公司,还授权给了汽车应用领域、手机领域和安防监控等领域的芯片合作伙伴,周易AIPU的表现值得期待。

还有一个值得关注的问题,周易AIPU和Ethos NPU在中国市场会如何协同发展?

相关文章:

独家深度 | 为何手机AI处理器都快普及了,Arm才推出全新NPU系列?

最新产品AI性能最高提升480倍!是Arm着急了?

长按图片保存图片,分享给好友或朋友圈

历经两年研发,Arm中国首款AI产品周易AIPU迎落地首秀

扫码查看文章

正在生成分享图...

取消
相关文章