“快抢,快抢。”零点刚过,阿里西溪园区报告厅瞬间成了大型抢购现场,媒体中心大屏幕上不断攀升的是实时销售额数字,1分36秒飚至破100 亿,12分49秒突破500亿,1小时3分59秒就超过了1000亿。
数字追赶着数字,陡峭的上升曲线牵动着心跳,主持人说话仿佛被加了倍速效果,在这样一个环境里,你很难不被周围情绪感染。
阿里西溪园区工作人员合影打卡
五年之后,阿里双十一重新回到杭州西溪园区主场,灯火通明,照耀整个园区宛如白昼,到处都是红色元素,来来往往的阿里小二们身着红色T恤,印着“Make 11 Happen”,今年恰巧是双十一的第十一年,全球最大的流量洪峰发生在零时,每秒订单峰值54.4万笔,是2009年的1360倍。
不过我想象中的阿里程序员焦躁忙碌的场景并没有出现,目力所及之处,阿里人或漫步园区,或合影打卡,倒颇有些悠然自得的情调,于是我深入到阿里园区,看看阿里技术人到底在干些什么。
核心系统首次上云
“我在阿里巴巴这么多年,第一次在媒体现场跟大家介绍阿里巴巴的技术,过去的一天,20个小时是阿里技术上最经受考验的一次。”阿里CTO、阿里云智能总裁张建锋首次以阿里云发言人身份出现在双十一现场。
今年双十一,阿里巴巴核心系统100%上云,承载着阿里业务的核心命脉,并且成功抗住了洪峰。能抗住阿里双十一这样的业务规模,也就意味着几乎所有的业务阿里云都能Hold住。
张建锋说,用公共云来承载这样一个万亿规模的核心系统,阿里云是第一个做到的,“很多云厂商自己的业务系统,不在自己的云上,今后阿里全部系统都在阿里云上。”话语间丝毫不掩饰自信与豪气。
回想2009年的双十一,根本就没有阿里云什么事,但今年不一样,阿里云变成了“大娃”,一力撑起阿里生态内的多个应用。张建锋上任后更新了阿里云的定位——阿里云是阿里巴巴经济体的技术底座,阿里巴巴所有技术和产品的输出平台。今年也是首个核心系统跑在云上的双十一,阿里云的新定位全盘体现。
据了解,双十一开启的几个月前,阿里巴巴就已着手将数十万物理服务器从线下数据中心迁移上云,并且在这个过程中对业务丝毫不产生影响,也难怪现场阿里小二们都不怎么着急,功夫用在平时。
阿里CTO、阿里云智能总裁张建锋
张建锋表示,我们从去年开始,决定把整个阿里巴巴经济体核心系统全部上云,其实上云还要加一个定语,是上“阿里云”,并不是上任何一朵云都能撑得住这个流量。在中国,我们经常说中国有两朵云,一朵叫做“阿里云”,还有一朵叫做“其它云”。
为什么讲阿里云跟其它云不一样,因为在中国只有阿里云是完全从头研发的一朵云,我们的云完全是中国国产的一朵云,其它中国的很多云从开源软件改造过来的,这是非常大的不一样。
从技术维度,阿里云的硬件、数据库、云计算操作系统,到云操作系统上的核心应用,五位一体,都和往年不同。
自研神龙架构服务器:一般服务器随着压力增长,最终负载能力会慢慢下降,神龙服务器能够做到高并发压力下,维持线性输出。
飞天操作系统:能够在10万台级别以上的服务器做调度,具体来看,今天双11有非常多的应用,但并不是每一个时间点,所有应用负载分配都是一样的。
飞天操作系统在零点把大部分计算资源分配给交易等应用,过了一点之后,把数据分配给数据处理系统,今年双十一当天数据处理量也创下新高,处理970P左右数据,相较之下,2017年当天处理了300PB的数据,2018年处理了600PB的数据。
自研数据库:日前获得TPC-C测试榜首的OceanBase以及PolarDB,广泛应用在本次双11,每秒峰值远超Oracle传统的数据库。
计算与存储分离:现在阿里巴巴划出一个地方专门存数据,数据都从远端存取,方便扩容,阿里解决了网络访问速度的难题。据介绍,阿里能做到在远端存储比本地读写磁盘更快。
淘宝总裁蒋凡形容,双十一是商业世界的奥林匹克,那么阿里云肯定是拿到了技术挑战赛的冠军。
走出阿里云,我就来到了达摩院,未成想,达摩院资深算法专家,达摩院自然语言理解团队成员骆卫华直白地告诉我,这个双十一晚上他只干了两件事,第一是清空购物车,第二是准备这次讲演的PPT,此时我不禁有些羡慕起来,阿里小二果然“上班划水”。
达摩院资深算法专家,达摩院自然语言理解团队成员骆卫华
阿里全球化的愿景是希望到2036年,能够服务全球20亿消费者,一千万商家,这意味着未来阿里大约有一半的消费者都来自于国外,阿里需要有更强的翻译能力支持境外用户的需求。
“我们希望我们的语言能够扩展至100种以上,支持其中任何两种语言的翻译,实现真正的全球买和全球买,实现语言无障碍。同时图像、语音、视频翻译在阿里经济体全面落地。让大家无论是看文字还是干图片,都能够没有任何语言障碍的去理解和阅读。”骆卫华表示。
为了达到这个目标,阿里机器智能实验室的重点研究方向之一就是自然语言理解,并且不仅服务了阿里巴巴内部基本上所有的国际化场景,同时将能力沉淀之后对外输出,也能为生态伙伴所用,比如直接放到阿里云上对外输出。
阿里开始做翻译是从2013、2014年起步,经过5年多的努力,目前形成了平台级能力以及一些重要的单点技术能力。平台简单来说分为三个部分,机器翻译、人工或者众包翻译、以及数据或者语料平台。
“每天都会有大量的商家在平台上铺货,更新商品信息,一个商品要翻译成几十种语言。每天要处理的商品量都是数千万级别,双11之前商家铺货,这时候就是阿里要处理的峰值,以我们现在的处理能力能够上亿级别的商品的翻译,是没有什么问题的”,骆卫华自信的表示。
阿里巴巴的智能客服机器人阿里小蜜承接了淘宝天猫平台97%的在线服务需求;“基于图片的智能问答”后机器人,能理解图片内容,并自动截取可以回答用户问题的图片作为答案;天猫精灵在今年的双11推出了“语音购物”功能,只要对天猫精灵说出你要购买的商品,就能直接下单;阿里翻译机器人能熟练使用超过20余种语言,60余种语言方向,服务全球100多个国家和地区的用户。在双11当天,翻译调用量突破16.6亿次,全天翻译超过2000亿个单词。
雷锋网了解到,现在,阿里巴巴的人工智能调用规模每天超过1万亿次,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句。目前,阿里在人工智能已经形成完整布局,覆盖AI芯片、AI云服务、AI算法、AI平台、产业AI。
双十一前夕,阿里自研的分布式数据库OceanBase在TPC-C基准测试结果中,双倍反超Oracle成功登顶,而雷锋网在现场了解到,OceanBase在今年双11再次刷新了数据库处理峰值,达到了6100万次每秒。
传统的企业级数据库是一个面向单机设计的数据库,没有解决可扩展性的问题,扩容采用垂直扩展方式虽然简单稳定,但是成本非常高,后来不管是国外的AWS,还是国内的阿里等厂商,纷纷开始了自研数据库的历程。
OceanBase起步非常早,从2010年立项,由阿里巴巴和蚂蚁金服100%自主研发,也是具备完全自主知识产权的企业级分布式数据库。
11月11日下午2点21分27秒,天猫双11销售额突破2000亿大关时,这个千亿大项目背后的支付宝三代技术核心倪行军、程立、胡喜首次合体现身媒体间,这个行为本身就已经体现了技术在进化,据他们说,往年在这么关键的时刻,他们全都坐在作战室严正以待。
在支付宝内部,这三位被戏称为“老中青三代程序员”。作为师徒弟,他们一起亲历了11年的双11,如今“师爷”倪行军是支付宝事业群总裁,“师傅”程立是蚂蚁金服CTO,国际事业群COO,“徒弟”胡喜是蚂蚁金服副CTO,80后的他同时是阿里最年轻合伙人之一。
十年前,爆发性增长的成交量让一屋子程序员措手不及,手忙脚乱人肉腾挪资源,以保住服务器不宕机。
十年后,被视作双11“宇宙中心”的技术作战室,“光明顶”会议室内,所有程序员除了盯着大屏上快速飞升的数据,没别的可干,“因为没有出现问题”。阿里从人肉调配计算资源进化到用机器智能调优的阶段。
经此一役,我掌握了数位阿里小二“带薪划水”的证据,恰恰是技术的进步让阿里把双十一大考过成了春节,以往提心吊胆的场景不见,飞天云操作系统、人工智能、机器人等取而代之,阿里巴巴是自带技术属性的阿里巴巴经济体。
在西溪园区熬了一天两夜,双十一的造访者们深切感受到的是阿里巴巴CEO张勇此前的话,“相比销售数字,我更关心技术的峰值。”雷锋网