自动驾驶汽车的发展需要AI已人尽皆知,但你应该没有想到自行车也可以实现自动驾驶。
其实,这是清华大学施路平教授团队为验证全球首款异构融合AI芯片设计的系统。该研究登上了顶级学术期刊《自然》(Nature)8月刊的封面,封面标题为《双重控制》(Dual control)。
这篇名为《面向人工通用智能的异构天机芯片架构》(Towards artificial general intelligence with hybrid Tianjic chip architecture)的论文介绍了一款新型人工智能芯片,它结合了类脑计算和基于计算机科学的人工智能。
天机芯片是多学科融合的结晶,团队成员来自清华大学、北京灵汐科技、北京师范大学、新加坡理工大学和加州大学圣塔芭芭拉分校,论文的第一作者有7位,清华大学的成员是核心。清华大学精密仪器系教授、类脑计算中心主任施路平为论文通讯作者。
自行车也能自动驾驶
为了验证这款全球首款异构融合的AI芯片,研究团队设计了无人智能自行车系统。论文的第一作者,加州大学圣塔芭芭拉分校博士后邓磊认为,比起自动驾驶飞机,智能自行车看起来很小,但实际上是一个五脏俱全的小型类脑技术平台,“这实际上是对我们的考量”。
据悉,施路平团队设计的无人智能自行车系统包括了激光测速、陀螺仪、摄像头等传感器,刹车电机、转向电机、驱动电机等致动器,以及控制平台、计算平台、天机板级系统等处理平台等。
来源:nature
根据公布的视频,这一无人智能自行车系统可以实时感知周围环境,跟随前方的试验人员并自动进行避障的操作,并根据语音指令、视觉感知的反馈产生实时信号对电机进行控制,以达到保持平衡,改变行进状态(包括横向和纵向)。
邓磊介绍,无人自行车系统的语音识别、自主决策、视觉追踪功能运用了模拟大脑的模型,而目标探测、运动控制和躲避障碍功能运用了机器学习算法模型。
研究团队还指出:“通过随机将新变量实时引入环境中可以产生高时空复杂性,例如不同的道路条件、噪声、天气因素、多种语言、更多人等等。通过探索允许适应这些环境变化的解决方案,可以检查对AGI至关重要的问题,比如概括、稳健性和自主学习。”
什么是AGI?
这款芯片可以同时融合两种方案正是其受到关注的关键所在。通用人工智能(Artificial General Intelligence,AGI),是一个尚未实现的研究课题,有时也被称作强人工智能,它所描述的机器智能可以理解或学习人类所能完成的任何智力任务。
对于AGI,部分人工智能学者认为,AGI的概念并不严肃,在实践中基本不可能实现。另一些人则十分看好人工通用智能的发展,认为它有可能塑造人类的发展轨迹。在Nature论文的新闻发布会中,施路平表示,“AGI是一个非常难的研究课题,但我们相信它是一定会实现的”。
施路平认为,发展通用人工智能的最佳方案之一是把人脑和电脑的优势结合起来。
这种研究思路也就意味着要将计算机科学导向和神经科学导向这两种发展AGI的方法结合在一起。但是这两种方式在公式和编码方案上存在根本差异,想要结合困难重重。
也就是说,这种结合的核心挑战在于脉冲神经网络(SNN)和人工神经网络(ANN)的融合。
在生物大脑中,每个神经元都与各种输入相连。一些输入在神经元中产生激发,而另一些输入则抑制它,对于SNN(脉冲神经网络),在达到由变量(或者可能具有函数)描述的特定阈值状态时,神经元发出脉冲信号。
ANN则是是从信息处理角度对人脑神经元网络进行抽象,目前热门的AI神经网络CNN、RNN都属于ANN。
就可以理解SNN和ANN最大的差异,ANN以精确的多位值处理信息,而SNN以脉冲处理信息。为了在一个平台上实现两种模型,脉冲需要表示为数字序列(1或0),以便与数字编码格式的ANN兼容。
当然,两者之间还存在其它差异,比如SNN在时空域中运行,而ANN依靠时钟在每个周期刷新信息。另外,SNN的计算包括膜电位积分,阈值交叉和电位复位,ANN主要与乘法累加(MAC)操作和激活变换相关。还有,SNN的处理需要比特可编程存储器和额外的高精度存储器来存储膜电位,发射阈值和不应期,ANN仅需要用字节存储器来进行激活存储和变换。
全球首款异构融合AI芯片
邓磊表示,两类模型所使用的语言、计算原理、编码方式和应用场景都不相同,实现这两种模型深度高效的融合,是天机芯片设计中最大的挑战。
天机芯片异构融合计算架构
清华研究团队的解决方案是,建了一个跨范式的神经元方案,又设计了一个统一的功能核(FCore),这也是一项重要的创新,FCore的每个功能核包括轴突、突触、树突、胞体和神经路由器构建单元。通过可重构功能核灵活的建模配置和拓扑连接,编码方式可以在ANN和SNN模式之间转换,从而实现异构神经网络。
当然,为了实现深度融合,几乎整个FCore都可以重新配置,以便在不同模式下实现高利用率。FCore能够涵盖大多数ANN和SNN使用的线性积分和非线性变换操作。该芯片上的FCores以二维2D网格方式排列。
天机芯片设计图示,来源:Nature
最终看到,天机(Tianjic)芯片由156个FCore组成,包含大约40000个神经元和1000万个突触,采用28纳米半导体工艺制造,面积为3.8×3.8平方毫米。可以同时支持机器学习算法和类脑电路。
性能方面,天机芯片提供超过每秒610千兆字节(GB)的内部存储器带宽,以及运行人工神经网络的1.28 TOPS的峰值性能。
在生物启发的尖峰神经网络模式中,天机芯片实现了每瓦约650千兆每秒突触操作(GSOPS)的峰值性能。该研究团队还展示了与GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,电源效率提高了12-10000倍。
论文作者、清华大学精密仪器系副研究员裴京透露,团队的下一步计划是面向问题商业化,把现有的、已经成熟的成果商业化推广。另据施路平透露,目前,天机芯已经在北京灵汐科技有限公司开始进行下一步开发。雷锋网雷锋网
相关文章: