“希望到2030年,我们能够实现支持中国自动驾驶成熟量产方案的落地。”安谋科技执行副总裁、产品研发负责人刘澍在周易X2发布会上如是说。
其实,安谋科技早已开始布局汽车市场。
去年发布了“星辰”STAR MC2 CPU车规级处理器,加上正在开发的车规安全类IP,以及Arm已有的车规ISP。本周最新发布的面相智能驾驶、手机影像AI等市场的周易X2,为安谋科技押注汽车市场又增加了新的砝码。
当然,为了繁荣AI市场,安谋科技还推出了“周易”NPU软件开源计划,安谋科技团推测算这可以节省50%的软件工作量。
押注汽车市场
“为什么我们这么关心中国的汽车市场?”刘澍解释,“这和我们过去所看到的产业升级和新老格局的交替有重大的联系。手机行业在2000年前后基本上是国外品牌主宰,从功能机到智能机升级的过程中,市场上涌现了一大批新的品牌、新的势力。我们认为,智能汽车行业可能也会重现这样的格局,过去我们被欧美、日本品牌所垄断,未来中国市场和中国品牌势必在产业占有一席之地。”
相比手机芯片的市场规模,汽车芯片目前看起来还比较小,但具有市场潜力。
刘澍表示,汽车自动驾驶应用对人工智能的需求越来越多,不光是ADAS有更多的摄像头、更多的雷达,会产生更多需要处理的数据,同时,车内车外的各种监视、辅助的决策系统,需要更高的帧率、更大的算力、更多人机交互、更多安全性需求等,这些都给对IP产品提出了更高的要求。
随着智能驾驶从L2到L3、L4的演进,汽车对芯片和IP的要求会越来越高。而最新推出的周易X2瞄准的正是中国新势力汽车品牌。
当然,周易X2不仅可以用于汽车领域,也可以应用于更大算力的边缘侧服务器类型,例如手机、PC、平板电脑等应用场景。
专为汽车市场需求优化的特性
与前代产品周易X1基于V1、V2架构不同,周易X2基于V3架构,也是首款基于V3架构的产品,带来了八大特性升级,包含:
第一,通过支持多核Cluster实现更大的算力,可以支持10T-320T子系统的算力。
第二,支持更好的i-Tiling的技术方案,大幅减少带宽需求,进一步提升计算效率,降低系统的成本。
第三,通过专门的硬件加速调度器实现实时的任务调度和管理。
第四,支持int4/int8/int12/int16/int32,fp16/bf16/fp32多精度融合计算,计算效率与计算密度得到显著提升。
第五,优化的Transformer性能。
第六,增加了无损的权重压缩的技术,
第七,在低功耗领域进行技术升级,7nm工艺节点可以实现10TOP/W的能效。
第八,面向手持设备也做了专门的优化,比如拍照的AI去噪声,视频的超分辨率、插帧等。
安谋科技产品总监杨磊指出,面向车载领域,周易X2 NPU主要做的优化包括三个方面:
首先,基础的架构层面专门针对汽车的场景做了优化,通过多Cluster支持大算力的需求,既可以满足智能座舱几十T的算力需求,也能满足ADAS或智能驾驶几十到上百T的AI算力需求。
其次,为了满足汽车需要很高的计算精度的需求,周易X2通过混合精度既兼顾了功耗、面积也兼顾了计算的准确度来满足汽车场景的需要。
最后,周易X2 NPU也针对车载专用的算法进行定向的优化,典型的代表是Transformer模型结构,专门做优化。
“Transformer结构优化完的结果和我们自己相比,假设在算力相等的情况下,可以比上一代的周易 Z2 Transformer的性能提升10倍,是一个指数级的性能提升。”杨磊强调,
“通过面向汽车场景的这些优化,我们希望通过成熟的软件和硬件的IP产品,加快合作伙伴芯片的上市周期,以及最终的产品落地。我们可以看到国内很多汽车窗口的时间预测是在2025年,我们这样成熟的NPU的软件和硬件可以加快合作伙伴芯片开发和设计的速度,并缩短最终汽车落地的周期。”
据悉,周易X2 NPU现在已经到成熟阶段,可以正式交付客户,今年会有多款搭载周易X2 NPU的芯片产品面世。
开源NPU软件
想要加速芯片的落地,软件生态非常重要。
安谋科技科技做过一个有意思的统计,过去一年国内60个用到NPU的芯片项目,其中大概55%的项目都用自研NPU,并且这些自研NPU都不相同。
杨磊说:“每换一个硬件平台,不单换硬件,可能整个软件的工具链都变了,这对应用开发来讲是极其复杂或者是痛苦的,因为要不停地换软件平台或者是硬件平台,这样极大地增大了应用开发或者说创新的代价和周期。”
“我们发现在软件部署的过程中存在很强烈的白盒开发的需求,希望工具链是以源代码的形式提供的,而不是一个黑盒,越是这种以算法和数据为核心的合作伙伴,越有强烈的软件工具链白盒的诉求。”杨磊同时表示。
据雷峰网(公众号:雷峰网)了解,AI软件是影响AI落地的关键因素,想要把AI硬件用起来难度很高,学习成本和周期很高。
于是,基于上述的考虑,安谋科技推出了周易NPU软件开源计划。这个计划首先对外开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,并向相关合作伙伴提供“周易” Compass软件平台,包括软件模拟器、调试器、C编译器等在内的多种软件工具。
后续,安谋科技还将逐步开放更多资源,如模型量化、算子实现等源代码。
“开源的好处是能拥有一个统一的方案,即使是用别人的硬件,这个项目提供的也是同样的软件方案。”杨磊说,“我们最新的一代V3架构是免费授权,特别欢迎有自研NPU想法的合作伙伴也来兼容周易NPU的架构。我们的NPU团队大概有130个人,初步测算基本上可以节省65人/年以上的工作,我们也希望通过这样的手段,首先可以繁荣生态,另外也希望能借此加强合作伙伴的AI创新。”
目前,周易NPU软件开源计划已经有第一批合作伙伴率先加入,其中不乏来自AIoT、智能汽车、智能操作系统等领域的明星企业。