“2010年起,随着云计算技术的快速兴起,云数据库技术开始崛起,这给了国产数据库厂商弯道超车的机会。”
阿里云智能数据库事业部总负责人李飞飞如是说到。
数据库技术的起源,可以追溯至上世纪五十年代,伴随整个信息技术行业的迅猛发展,数据库也已发展成为一个年市场规模达到数百亿美元的大产业。
上世纪80年代,Oracle、DB2等作为当时领先的数据库技术,被引入我国通信、金融、航空等行业,并很快形成行业垄断。
为打破国外厂商的垄断,国内诞生了以高校为背景的数据库厂商,诸如人大金仓、武汉达梦、南大通用等厂商,争抢这个重要基础软件领域的话语权。
如今,随着云计算技术以及数字经济的高度发展,我国数据库产业也得到了长足的发展,对于数据库行业的发展也仁者见仁智者见智,对此雷锋网与阿里云智能数据库事业部总负责人李飞飞进行了一次对话,探寻数据未来的发展趋势。
就在今年,国产数据库迎来了开源热。
6月1日,蚂蚁集团自主研发的分布式数据库OceanBase宣布正式开源,并成立OceanBase开源社区,社区官网同步上线,300万行核心代码向社区开放。就在几天前,阿里云也对外宣布开源了PolarDB for PostgreSQL。
加上作为先行者的TiDB,中国数据库第一集团的TOP ( TiDB,Oceanbase, PolarDB) 都将开源作为战略选择,在业内引发了巨大的讨论。“开源的拐点到了”、“开源成为新一代数据库的主流选择”。
随着而来的也不乏有泼冷水的言论,如抨击阿里为KPI式开源……
“全球顶尖的云厂商是很少将开源作为核心战略的,但我们也可以负责任的说,我们也并非是KPI式开源,之所以会选择开源我们有着两方面的考虑。”李飞飞对雷锋网坦言到。
李飞飞表示,将数据库产品开源一方面可以通过开源社区来吸引更多的开发者来使用阿里云的数据库产品,从而降低阿里云产品的准入门槛;而另一方面,由于有更多的开发者参与,则能够让阿里云的数据库产品的迭代速度可以加快。
但李飞飞也说到,目前开源软件最大的挑战还是商业化问题,“数据库开源成功并不代表着商业化就能够成功,作为云厂商的核心产品,阿里云数据库最先考虑的还是商业化的问题。”
由此,李飞飞也坦言道,并不会将阿里云所有的数据库技术都进行开源,将会保持一个水位差。
那究竟如何才能让商业化和开源社区宛如两条腿可以正常地向前行走?对此,李飞飞提出了两点建议:
企业做开源首先要想清楚开源目的。如果开源目的不纯粹,只是为了商业化或打压竞争对手,这种开源是不会成功的。对于阿里云而言,开源目的是要把开发者生态做起来。建立一个全新的生态需要大量的时间成本,助力和引领现有生态是更加高效的一条道路,目前开源的PolarDB PG版本就是这样的一个选择。
明确好开源路线。开源真正的关键就是要让社区真正活跃、运营起来,要有清晰的开源规划路线,建立对开发者和用户有核心差异化能力和价值的技术组件。
而据李飞飞透露,在今年阿里云云栖大会期间,也将会宣布将阿里云PolarDB X版本进行开源。
如今,云数据库已是大势所趋。美国知名科技领域的分析公司Gartner预测,2023年全球3/4的数据库都会跑在云上。
这种趋势,也意味着大量政企客户也会加速采用云数据库。市场研究机构IDC的研究报告指出,中国传统线下部署的数据库市场上,金融、政务、电信、制造等行业占据超过70%的份额。
“政企客户是影响整个数据库市场格局的重要变量。”李飞飞表示,一方面政企客户正加速数字化转型,推动基础设施云化,对云数据库有着巨大需求;另外一方面,政策层面也在积极鼓励政企客户替换存量传统商业数据库。
潜在市场虽大,但是门槛也高。金融、政务等领域的客户对数据库的安全、稳定和高性能,有着极为苛刻的要求,要满足它们的需求,需要深厚的技术积累和实践经验。
“可以说,政企市场已经成为检验云数据库竞争力的黄金标准。”李飞飞坦言,阿里云也是在“双11”等极端场景淬炼之后,才逐渐赢得客户认可,支撑铁路12306、健康码等国民级应用场景,同时也正是这些独特的应用场景推动中国数据库发展出独特技术,在部分应用场景下开始引领技术发展路径。
李飞飞表示,阿里云将会保持耐心,继续在数据库技术上强化研发并大胆创新,联动整个数据库生态中的企业,一起抓住云数据库市场的发展机遇,用硬核产品技术和服务赢得更多客户认可。
据了解,阿里云作为最早为政企服务的中国云厂商,服务十年以上的企业就接近有一万家。截至目前,阿里云数据库产品和技术服务已经服务国税总局、中国邮政、中国人寿、中国太保、中国南方航空、友邦保险等客户,全面应用在核心系统之中。
“我们的数据库在有些场景下的性能表现比传统老牌厂商还要好。”李飞飞表示,阿里云数据库如今已经做好了全面服务政企市场的准备,将通过打通云上与云下数据库技术栈,进一步提升核心技术优势,满足更多应用场景需求。
用友旗下财务软件公司畅捷通服务数百万中小企业,通过引入阿里云PolarDB云原生数据库,实现业务系统并发能力提升了4倍以上,大幅提升了业务系统的稳定性和健壮性。该公司助理总裁熊昌伟表示,云数据库充分释放了研发团队的能力,帮助公司更好专注于产品开发与服务,仅仅只靠少数几位数据库管理工程师就能管理数百个核心数据库。
事实上,随着企业对于数据处理的需求日益增长,数据库架构也呈现出:大数据和数据库一体化、云原生和分布式技术结合、智能化等趋势。
为此,各家数据库产品也都在进行相应的布局,以阿里云PolarDB为例,其通过将每个数据块分成三个物理节点,不用关心分布式带来的挑战,比如分库分表、分布式的查询,对应用完全透明,读写一份数据,做到了分布式技术透明化、集中式部署。
在实际的客户案例中,利用PolarDB Oracle兼容版替换现有的Oracle,在性能一样的前提下,整体成本不到原来的三分之一。
除了云原生的架构,也有分布式架构版的PolarDB-X。在每个分区里面做这种三节点的架构,同时三节点利用协议做数据的一致性保障,而且三节点可以做到同城跨AZ部署。
在数据管控上,阿里云则通过K8S这套编排技术,把多源异构的资源管理起来,打造智能化的运维管控平台。
在安全方面,阿里云还打造了全加密的数据库,数据进入内核后不需要解密。利用安全硬件技术做了全加密的流程和保护,实现了不解密也能进行数据加工和处理。
而在生态工具上,阿里云传输采用DTS,做端到端数据的同步,用DBS数据备份做多云多端的逻辑备份、物理备份,DMS做企业级的开发建模流程, ADAM做针对基于传统数据库和数据仓库开发的应用评估和迁移。(雷锋网)