11月底,阿里云的一项变动备受瞩目。阿里云事业群升级为阿里云智能事业群,这代表着云计算与AI等技术将更密切融合。实际上,阿里云在架构升级之前已经在内部孵化了强大的AI平台能力——ET大脑,ET大脑于2017年12月由阿里云机器智能首席科学家闵万里正式公布。
雷锋网分别采访到了闵万里、以及阿里云ET城市大脑算法专家余亮,阿里云ET工业大脑算法专家杨斌,由近及远,从内而外,探讨阿里云如何贯彻着云上的AI战略。
有人认为数据是数字时代的石油,闵万里却有另外一番理解,他表示,数据不像原油奇货可居,数据是不断大量产生的,数据的价值如果得不到快速释放,价值密度就会不断降低,数据密集的地方才有AI。
闵万里加入阿里,同时带来的还有两篇含金量不低的论文,这两篇文章解决了复杂网络下随机过程的大样本理论,认知反演则解决了在一个具体拓扑网络上寻优的问题。
在闵万里看来,交通、工业等产业领域的问题,归根结底都是一个拓扑网络问题:城市交通是车流的网络,工业是流程的网络(流程型制造是一条流水线、离散型制造则是一个更复杂的网络),航空是人流、飞机的网络……要解决这些产业的问题,其实解决的都是拓扑网络问题。
2005年时,闵万里曾与合作者发表了两篇理论文章,目的就是要解决这一问题。
“On linear processes with dependent innovations”, Stochastic Processes and their Applications, Volume 115, Issue 6, June 2005, Pages 939–958;
“On Canonical Correlation Analysis of multivariate time series”, Statistica Sinica 15 (2005), 303-323
雷锋网观察了不同类型厂商在不同领域的所谓“大脑”,是否有厂商“旧瓶装新酒”营造概念行旧事?答案是肯定的,有一定比例的厂商并无新意的拼凑起一个“大脑”,与这类厂商截然相反的是——阿里云的ET大脑的人工智能回归到本质,建立在数学理论基础之上。
“一张网”是阿里云完全自研的核心技术,也是ET大脑解决产业问题的关键所在。实际应用中的拓扑网络类似于互联网式的分布式结构,在网中不断流动的是数据,数据来源多种多样,不同时空、不同结构,甚至不知真假,ET大脑纳入多种融合数据,形成可复用的场景输出能力,而此前大多平台数据孤立不流动,且需要苛刻的数据“饲喂”才能输出相对精准的判断。
ET大脑的四个关键词——认知、判断、决策、学习。多维感知数据,分析并实时决策,形成全局性可执行洞察(actionable insight),兼具持续进化的学习能力,ET大脑的核心也在此。
“我们有了网络,有了动态的物流、业务流的时候,就有了动态的数据流,如果把数据流抽象出来,我们可以发现最终回归到人工智能原点——人脑”,或许这也是各式各样的AI平台统称为大脑的缘由。
2007年闵万里就曾应用该理论研究新加坡的智慧城市交通管理,开发的预测算法对新加坡CBD区域不同等级的地面道路进行预测,准确率超过85%,其也是业界第一个能准确预测未来路况的实战系统。通过表象数据的信号、关键统计量及一系列算法找到数据特征,寻找到拓扑网络上的量化关系,进而找到控制窍门,闵万里的理论研究是基础,但阿里云在其上做了更多的研究。
算法、算力和数据是人工智能的三要素,同时也是ET大脑的三要素,不得不说云计算的大规模发展解决了ET大脑需要的算力资源,才有了ET大脑在各行各业开花结果,ET大脑与各个领域行业大脑是总分关系,根本性区别就在于加入行业知识,专攻行业场景。
ET大脑的发展有不少值得铭记的瞬间,闵万里提到了两个案例,其一是阿里云顺利将浙江高速历史数据、实时数据与路网状况结合,基于阿里云大数据平台,预测未来一小时内的路况,其二则是阿里云在工业领域不断重复尝试,终于觅得一缕成功曙光,雷锋网本次也采访到了两位专家。
雷锋网获悉,杭州主城限行区域已经全部接入杭州城市大脑,此外还有余杭区临平、未来科技城两个试点区域及萧山城区,总计420平方公里,相当于65个西湖。优化信号灯路口1300个,覆盖杭州四分之一路口,同时还接入了视频4500路,可以实时指挥200名交警。
ET城市大脑是阿里云ET大脑最先落地的场景,这其中既需要解决模式的问题,又需要解决技术的问题。
阿里云ET城市大脑算法专家余亮介绍,阿里云在ET城市大脑中主要解决两个问题:
• 数据问题:城市交通有不同的数据特点,需要一整套大数据的处理平台。阿里云从硬件、软件到设计服务拥有深厚积累。
• 弹性计算问题:支撑起一个城市计算平台必然需要消耗相当大的资源,尤其是视频计算,云服务从根本上解决了规划、采购和管理问题。
但实际上,阿里云是互联网公司,相对于传统交通行业是“门外汉”。余亮表示,交通工程有自身的一套数据模型和理论,但交通领域的数据模型可能聚焦于局部,在一定区域内流量如何建模,参数如何调优。而阿里云是以网络的视角看数据科学,包括时空特性、网络节点数量和关系等等。
基于闵万里最初提出的运用互联网数据做单点信号的优化,团队在后期加入了更多的数据科学知识,各种预测、优化。阿里云目的不是解决一个点或者是一片主干道的交通问题,而是把几百个信号灯当做一个整体来进行优化,在世界范围内都是第一个。
目前阿里云ET城市大脑横向复制和纵向深化并重而行,第一要务仍然是在国内已有的项目中向各个行业提供基础服务设施,纵向深挖提供端到端能力。在全球领域的横向复制中,阿里云已经将ET城市大脑复制到马来西亚等地区,交通问题是普遍性难题,阿里云有很大的潜在市场。
余亮也坦言,在技术领域ET城市大脑仍在不断进化,技术和应用结合发展,比如大规模信号灯调控方案的进一步优化,认知反演如何寻找关键节点、网络分隔,包括流程、算法的协调上有一些创新。
“我们对于工业一直心存敬畏之情,工业是国之重器,影响国计民生,工业细分行业又是如此繁杂,行业know-how深不可测”,阿里云ET工业大脑算法专家杨斌如是表示,笔者很难想象阿里云ET工业大脑开拓的艰难程度,不过据闵万里回忆,ET工业大脑甚至一度要放弃。
杨斌表示,ET工业大脑第一个项目始于2016年,标志着ET工业大脑开始进入探索行业性大数据解决方案和价值输出的开始。针对工业企业客户的要求,产品和解决方案输出必须要能够提供给行业客户应用场景的指导,而不是像常规的互联网干预,或者有所谓的工业互联网数据连接和平台连接。
“对于阿里云来说,我们自身数据智能的技术,云计算、大数据、AI算法等等这方面是我们的信心所在。但是,深入到工业行业里面,对工业数据的分析、探索,以及对这个工业细分行业它的每一块细分行业的特殊性,然后业务的理解性,这都是很大的挑战”,杨斌提到。实际上这也是当下所有工业互联网领域厂商所面临的共性难题。
杨斌补充道,“甚至在这个过程中,并没有一个系统说明让我们知道在工业的工研产销的各个工作流里面是有哪些数据的。我们的工程师面临着从0到1的难题,阿里云的工程师直接深入工厂场景,通过和具体生产部门、工艺部门、信息部门做交流,在对数据的理解达到一定程度之后,再结合阿里云自身云计算、大数据、人工智能算法找到突破口”,
ET工业大脑本身属于平台级产品,包含数据工厂、算法工厂、AI创造间,支撑行业客户去完成工业企业的数据算法以及开发治理,最终生产出给企业量身定做的数据智能服务。ET工业大脑沉淀很长一段时间才推出,但在推出之前已经有过若干年的实践,基于项目的交付、实施和业务价值提升,最终成型数据工厂、算法工厂、AI创造间的架构体系。
数据工厂主要解决客户数据安全、有效、稳定上云的过程,同时在数据平台进行质量管控和治理;算法工厂基于阿里云过去历史项目的积累、实践,沉淀了工业大脑的算法引擎,算法引擎可以根据用户需求再开发,基于该平台,工业客户不需要自己重新再经历算法工程化过程;在AI创造间里,客户通过拖拉拽的方式,把数据模块、算法模块,变成工作流业务的编排,形成一个工作流的业务输出,对外发布服务,可以调试出量身作定做的数据智能应用服务。
“我们希望通过ET工业大脑降低行业AI使用门槛,通过可配置的方式做业务的编排。但这个平台本身也是一个开发型的平台,合作伙伴或者工业终端客户自身信息部门的开发人员可以进行行业模板构结、定制,在平台之上沉淀自身的行业数据模型,架构自己的算法模型,进而形成一个生态”
工业领域的自动化程度不一而足,如何兼容并包是一个现实问题。杨斌表示,阿里云ET工业大脑和工业企业原有系统、平台、软件根本不存在相互竞争关系,很大程度上阿里云更多的是通过自身能力普惠工业行业,为企业降本增效、数字化转型提供全链路、全数据、全流程的数据智能输出。
在雷锋网看来,ET大脑是阿里云多技术、多模态融合的典型输出产品,而阿里云仍在强化ET大脑的极限。
对内,在日前的架构调整中,阿里巴巴集团首席技术官(CTO)张建锋(行癫)将兼任阿里云智能事业群总裁,特别需要注意的是,阿里巴巴集团过去几年在实施中台战略过程中构建的智能化能力,包括机器智能的计算平台、算法能力、数据库、基础技术架构平台、调度平台等核心能力,将全面和阿里云相结合,向全社会开放,为全社会服务。
对外,阿里云很早就喊出了产业AI的口号“过去每一次产业革命,都是技术与产业的深度融合,从而引发经济和社会变革,AI也不例外。未来AI要深入各行各业,去解决生活、生产和社会环境中遇到的棘手问题,这样才能引领真正的产业革命”。阿里云智能事业群几乎聚齐了阿里集团面向2B市场的大部分要素,时任阿里云总裁胡晓明谈及阿里云对产业的思考 。阿里云的AI侧立于行业旁,融入于行业中。
阿里云提前鸣响了下一场比赛的发令枪,下一场,关乎人工智能与未来。
相关文章: