浪潮云是国内第一家把“数据云”作为战略发布的企业。
“数据云”到底是一个什么新物种?浪潮云又为何选择数据云作为公司战略方向?
其实浪潮云并不是第一家提“数据云”这一新概念的,去年10月份谷歌就已经推出过“数据云”相关的产品。业界对于数据云这一概念还没有形成深刻的认知。
浪潮集团执行总裁、总工程师,浪潮云董事长肖雪指出,在数字时代,数据要素变得越发重要。然而面对汹涌而来的数据,仅仅依靠传统的基础设施,无法满足以数据为要素的驱动模型,如何让数据动起来、算力动起来、算法动起来?基于此,浪潮云希望通过打造分布式数据云,来帮助数字经济提升效率并使其成本最优化。这是把“数据云”作为战略发布的重要原因。
3月29日,浪潮数据云业务战略发布会在北京召开。雷峰网(公众号:雷峰网)与部分媒体就“数据云”战略的相关问题与浪潮云总经理颜亮 、浪潮云首席技术官孙思清进行了深入的交流。
一、为什么要“解放”数据价值
近年来,随着5G、IoT、大数据、AI等系列技术的发展,数据量迎来了爆发式增长。IDC预测:未来的五年,全球的数据量将会增长一倍以上,其中中国本土的数据量将会仅次于北美地区,达到大概56.16ZB规模,年复合增长率接近25%。
但其实真正使用数据,让数据产生价值只是总数据量很小的一部分。
“一千多年前,北宋就打出了石油,但是我们并没有把石油的能力解放出来,直到工业革命后,才把石油的价值解放出来。”颜亮表示,数据从我们的认知角度讲,已经成为了新一代能源,但是如何解放这一新能源的价值,一直以来是很模糊的。在中国,我们最大的优势就是拥有海量的数据,但是我们要想让释放数据的价值,提升生产效率,就需要用新的技术和工具解放海量的数据。
但是现在,数据在封闭体系内发挥了应该有的作用,但是面向产业来看却遇到了困境,目前全国建了很多数据交易所,但是数据的交易量有限,说明数据交易的商业模式已经遇到瓶颈了。
颜亮指出,一个新的商业模式成功不成功,往底下需要钻两层,一个是支撑商业模式的运营体系,在企业里面是企业的运行体系,在产业里面是产业的运行环境,在社会上社会的支撑体系;再往下一层是基础设施。
我们过去总以为云计算就是数据的基础设施,现在来看,应该有新的层次,面向数据的直接服务于数据的基础设施,才能叫做基础设施。因为以前数据不需要基础设施,是长在应用里面,直接用就可以;但是当数据单独存在的时候,数据怎么跟上应用走,就需要新一代的基础设施。
欧盟提出“数据空间”才有可能是数据的基础设施。颜亮认为“数据云”的提出,就是弥补和提升面向数据的基础设施,数据云是它的组成一部分。
“数据云不是突然冒出来的,数据云是衍生来的,它是基于原有的云计算体系,结合着数据供给体、线上的数据创新应用衍生出来的一个新的具象的基础设施服务。”
在问及“数据云”和传统的云有什么区别时?颜亮告诉记者:首先,过去的云计算核心对象叫算力,实际围绕的是应用,而数据云是围绕新的优先的对象是“数据”;其次,过去的云开放程度不够,数据云衍生升级,它是基于算力,脱胎于算力,是独立存在的,可以跨算力;最后是服务方式的不同,过去的云服务商分为两个阵营:服务态的云服务和项目态或者产品态私有云服务,“数据云”的核心是服务态的云服务。
浪潮云的思路就是通过打造“数据云”来支撑数据空间建设。
二、浪潮数据云的定位是什么?
“浪潮云自成立到现在整整十年,期间只做了三次战略发布会。第一次是2016年,浪潮云在成立三年后,发布了政务云战略;第二次是2021年,发布了分布式云战略。而这一次,浪潮云发布的是数据云战略,”肖雪如是说。
肖雪称,通过前两次发布的业务战略,浪潮云现已形成七大核心中心,113个区域中心,493个分布式云节点,实现了覆盖全国的分布式算力网络。基于此,浪潮云才能够支撑起政府及各个行业不同的计算需求。
不仅是云厂商还有大数据软件类厂商和数据库厂商都在说“数据云”这一概念,那么浪潮云又是怎么给自己定位的呢?
“我们现在看到的是数据的衍生品,这是决定数据发挥价值的主通路,数据的衍生能力决定将来在生态和领域中的贡献能力。”颜亮回复说,专业的数据库厂商是技术贡献者,会在里面占一席之地,在技术上会起到促进和支撑作用;大数据厂商更多地聚焦在应用,对数据的创新应用、模型建立、场景落地上都具有很大的优势;云服务商有云服务商的优势,云服务商最大的优势是服务化和综合体,它是奔着基础设施服务去的,云厂商会发挥底层基础整合、服务化输出、衔接作用,这本身就是云厂商整个产业的定位决定的。
据介绍,新要素、新模式、新产品,构成了浪潮数据云。
新要素:Data First——以数据为核心,围绕“数采-数算-数用”价值链与数据可信自由流通,打造新产品,应用新模式,释放数据价值。
新产品:围绕数据价值链与流通,打造数据云新产品。
新模式:面向数据、建管运融合的DOS模式。
三、数据云化是未来
前面十年,数据上云,实际上数据跟着业务上云,数据跟着应用上云,解放的还是算力。如何解放数据才是新课题,未来的5—10年数据云化才是未来。
据了解,浪潮云的计划是“百城千业”,也就是投入100亿,在100个城市和各行各业的落地覆盖,,建设1个数据云联盟,目前已经有493家企业加入这个联盟,共同推动Data在整个新阶段的发展。
颜亮在媒体采访中表示:“未来会利用18个月的时间,在全国100个城市部署数据云,一方面可以更好地汇集本地数据,另一方面能够形成数字政府城市治理、产业智慧化赋能、产业数字化转型的支撑,这是我们的初衷。”
浪潮云为什么能有实力放话18个月就部署完成呢?
颜亮说,这不是一个突发的新事,浪潮云在前期已经有不少的铺垫和基础,过去在各地政府的数据治理业务、数据服务业务、数据共享交换业务、新兴的数据创新业务,浪潮云已经跟进了七年左右的时间,“数据云”是一个新的阶段新的业务战略升级。从目前看,18个月内能够完成百个城市的部署。
据了解,在构建数据云的过程中,浪潮云积累了6个方面的能力,涵盖了从数据的采集,数据的计算,数据使用,以及数据安全流通全栈能力。
从数采层面来看,首先是全域全量的数据采集,原来解决数据场景问题是单点解决的,大模型的出现对数据提出更高的要求,各个行业数据既然是战略资产,全域全量拥有这些数据是未来发展核心竞争力。还有采集完后如何对不同类型不同来源的数据进行治理的问题,这都是要解决的问题。
在数据计算层面,如何能够调度闲散的算力,提供数据高效的计算,这里面最关键的是所有这些数据从数采到数算,到数据的使用,如何去通过数据驱动来进行业务的创新,也是整个构建数据云的关键点,包括数据的安全流通。
孙思清举例说,在全域全量数据的采集方面,浪潮推动物联感知平台的汇聚;在各种各样的数据汇集进来以后,浪潮云提供了分布式数据库,从而实现多模数据存储,无论是什么形态的数据,都可以统一数据访问,统一数据存储,整个存储空间比传统数据存储节省90%以上,在整个响应上比传统模式快了接近30%。
在数据的使用上,浪潮云打造了线上数据治理的智能化工厂,积累了治理规则有5000多项,包括数据质量检测等,所有的数据多元异构的数据进来之后,能够快速的把它变成标准化的数据,提高工作效率。
另外随着数据的增长,算力的不足的问题被摆在了前面。浪潮云提供了一个云原生算力平台,帮助客户更好的提供算力资源进行算力计算。目前浪潮云在全国布局了整个算力中心,总共有7个核心云中心,113个区域云中心,493个分布式云节点,来提供算力服务。
浪潮云还在可信的数据交易和数据隐私安全相关的技术和研究有了一些突破,例如推出了数据沙箱,实现数据动、模型动,数据可用不可见,还有数据可信可追溯的数据流通体系。
孙思清表示,浪潮数据云希望基于整个算力生态赋能,通过浪潮云的算力基础设施,和我们的合作伙伴包括数据的提供商和模型应用开发、安全,以及高校和科研院所一块来共同努力,为整个社会,整个国家的数字经济发展共同赋能,为数字中国建设尽一份力。
浪潮云的数据云化战略这台发动机已经正式发动了,但是摆脱数据的困境还需要整个社会共同努力。
(雷峰网)(雷峰网)