雷峰网按:2021年12月9日-2021年12月11日,2021第六届全球人工智能大会(GAIR 2021)于深圳正式召开。历经五年,见证数次潮水的转向,成为目前为止粤港澳大湾区人工智能领域规模最大、规格最高的学术、工业和投资领域跨界盛会。
GAIR 2021“集成电路高峰论坛:国产高端芯片之路”,集聚来自学术界、产业界和投资界的15位大咖,探讨了国产高端芯片的实力以及RISC-V带给中国芯片的机会。
RIOS 实验室执行主任谭章熹将 RISC-V与元宇宙结合,带来《RISC-V专属架构芯片赋能元宇宙》主题分享。
RIOS 实验室执行主任谭章熹
谭章熹首先介绍,元宇宙可以追溯到早些年火热的VR/AR,在这一领域,微软Hololens在技术上最为突出且已经经历了两代的发展,为应对AR/VR的结合场景,微软为Hololens专门开发了一颗HPU,第二代HPU以处理器配合固定加速器的组合架构,26个处理器组成13个核心,算力达到彼时顶配。
但值得注意的是,这颗HPU Tensilica功耗高达2.4w,难以被集成到手机或头盔中,导致装备过大,严重影响外观设计,成本昂贵,无法满足真正的VR/AR需求。
谭章熹指出,结合现在的计算机技术,基于RISC-V,业界有能力设计出比HPU更好的芯片,睿思芯科已经做出了一些验证。
RISC-V 具体如何在元宇宙的世界中发挥作用?谭章熹的演讲中有更多信息。
以下是谭章熹在GAIR 2021 上的演讲内容,雷峰网(公众号:雷峰网)对其进行了不改变原意的编辑整理:
历史上的技术代表微软Hololens
最近,TSMC董事长刘德音表示,未来的元宇宙将对半导体产生重大影响。AR将替代现在的移动手机,VR替代PC,元宇宙是半导体领域未来半年最大的生意。
最新的一些报道称,苹果明年可能会推出眼镜,从虚拟世界的交互带来新的用户体验,这也有可能会是苹果继iPhone之后又一次革新。
事实上,并不是2021年才有元宇宙,回顾世界上的元宇宙玩家,2015年甚至更早之前,Google就推出了Cardboard,当时下载量超过160 百万级,玩家体量大。
另外,Valve S,Magic Leap,Facebook收购了 Qculus QUest 2。2020年,Facebook VR全球市占率达到38%,非常高。
技术上做的最好的公司是微软Hololens,目前已经发布了两代产品。第一代于2016年发布,第二代于2019年发布,产品较为完备且用户体验不错,是AR和VR领域较为典型的代表作品。
Holoens也是技术上最为开放的设备,大家可以看到典型应用场景中,包括虚拟和现实的交互式教育、3D建模。
如果将Hololens拆开看,是非常神奇的应用,有非常多新技术的探索,包括传感器和手机APP。
先后两代Hololens所使用的处理器区别较大,第一代使用Intel的处理器,第二代使用了高通的处理器。最为重要的是,微软还为Hololens专门开发了一颗芯片,这颗芯片做了很多既不是GPU也不是摄像头做的事情,例如能获取视觉提示,始终跟踪手的位置,这需要对各个方位都非常敏锐,且能实时响应,类似AR和VR的结合,运行大量算法,因此区别于传统的CPU和GPU,微软将其称之为HPU(Holographic Processor Unit)。
与Hololens产品迭代一致,HPU也迭代两次,第一代使用台积电28nm工艺,650万电路,主要用到24个可编程的Tensilica核心,相当于计算核心,里面有大量的存储,64Mb的Cache和1GB的DDR3;第二代 HPC采用台积电16nm工艺,芯片面积扩大到将近80平方毫米,约为第一代的两倍,另外增加两个核心,与上一代相比算力提升至1.7倍,存储带宽提升至2倍。
值得注意的是,在推出第二代HPU时,额外增添四项工作负载:手势、眼睛、理解场景语义和空间音频,现在的苹果耳机已经开始实现空间音频。
第二代Hololens,核心处理器使用了Tensilica Processors,该处理器由2000年初MIT团队创立的公司设计,通过增加扩展指令和可编程性提高计算能力,该公司于2012年被EDA巨头们收购,后来的Tensilica处理器围绕音频、视频展开,被认为是并行处理器。
HPU中的Tensilica处理器核心分为两种,一种是用来做浮点运算的向量处理器,一种是定点处理器,整体上是高度异构的可编程架构。从数据位宽来看,未来的HPU位宽会越来越宽。
Tensilica的核心是什么?通过异构包括指令化定制完成,微软在第一代HPU中增加了超过300条的定制化指令来做数学运算,提高计算目的。此外,微软还增添一些硬件单元,类似于如今GPU中做的3D,是非常有意思的设计。
不过HPU也有一些不足之处,例如功耗达到2.4瓦,这意味着HPU运行35分钟,温度将达到85摄氏度,如此高的温度决定了HPU最终无法被放置于手机中,这也正是Hololens设备体积大,售价高的原因。
基于RISC-V,与HPU相媲美
如今的工艺制程已经更加先进,结合现在的计算机技术,我们能否做出比HPU更好的处理器?答案是肯定的,我觉得RISC-V开源架构是非常重要的技术。
RISC-V是加州伯克利2010年开发出来的精简指令集架构,非常精简且免费,相当于处理器中的Linux,同时也是模块化的,任何人、任何组织都可以根据自己的应用需求增加模块,甚至定制自己的指令集。通常,我们在设计芯片时会想要覆盖云端和终端,RISC-V同样也有云端和终端产品。
十年以来,RISC-V已经形成非常好的开源社区生态,大家对软件知识、硬件支持已经形成了一定的合理,重要的是,我们发现在很多安全问题上,开源的RISC-V有着天然的优势。
2010年,我在加州伯克利读博,RISC-V发展的前五年,只是做一些标准化顶定义,后面我们做了大量的测试芯片,同时成立了RISC-V国际基金会,现在基金会已经迁移至瑞士。知道2105年,才慢慢有大企业真正将RISC-V引入到产品中,包括MCU以及后来推出的高性能RISC-V处理器,将SSD全部放入RISC-V处理器中。
去年Intel宣布收购SiFive,就是为了与Arm竞争,今年苹果也对RISC-V的开发指令、扩展指令方面有一些研发布局。回顾过去十年的发展,RISC-V从简单走向高端,甚至定制化场景。
基于RISC-V的处理器,能够与HPU处理器相媲美吗?答案是肯定的,我们孵化的睿思芯科就是一家主要做高性能RISC-V的公司,我们比较了目前最好的处理器与算法,结果显示,我们产品的算力最多能跑出Tensilica的 4.7倍,且发热不到Tensilica的60%。在电池寿命方面,我们的产品是Tensilica的211%。
RISC-V加上扩展指令可以与传统的DSP相媲美,而且可以获得成倍的性能和功耗提升。
此外,Tensilica基本与ARM处理器一起使用,不过ARM需要通过保护ISA固定授权,而RISC-V是开源的,场景定义更灵活,迭代速度也会远远超过ARM。为什么苹果选择自己做处理器?这正是因为它没法接受Arm公司推出的处理器每18个月更新一代。
站在全球角度,目前所有的公司,中国、美国,甚至欧洲的公司,都在找除了ARM之外的指令集架构,RISC-V提供了非常好的选择。
综上所述,结合元宇宙,我觉得元宇宙在基于RISC-V定制化指令的架构会带来革命性的影响,会服务真正的元宇宙硬件,谢谢大家!
相关文章:
紫为云顾友良:元宇宙怎一个“互”字了得? | GAIR 2021