详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

作者：张驰

2017/04/24 20:23

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

Serverless无服务器架构是一个新的事物，从出现到现在也不过两年，目前也没有一个公认的权威定义。从2014年亚马逊正式发布Serverless服务Lambda，经过近两年的发酵，Google、微软与阿里也在2016年相继推出了自己的相关服务。

业界认为，Serverless代表了新的软件设计范式，可能也颠覆了我们一般对云的理解。本次硬创公开课，雷锋网就邀请到了Strikingly创始团队成员及首席架构师龚凌晖，来讲讲Serverless服务到底是什么，它的发展状况又是怎么样的。

Strikingly是自助式建站平台，提供模版、设计资源、编辑器等，可以在短时间内容搭建自己的网站，提供托管服务。它是第一家从YC孵化的国内初创公司，主要帮助不懂技术但又有建站需求的用户服务。

龚凌晖，Strikingly 创始团队成员，第一个工程师。毕业于复旦大学计算机学院，在加入 Strikingly 之前，曾在 Morgan Stanley 的 Enterprise Infrastructure 部门任职。2013年加入 Strikingly 之后，做过产品，搞过运维自动化，研究过 Web Analytics 和 SEO，玩过数据分析，目前在团队中负责后端开发，系统运维以及数据分析等部门的项目研发和团队管理。

以下是雷锋网整理的公开课主要内容，更完整内容可观看上面雷锋网公开课的视频：

我们从2014年开始使用AWS。2014年，亚马逊发布了Serverless服务，当时它还是一个颠覆性的想法，少有人使用。我们也是在去年初才把Serverless引入到系统中。

那么什么是Serverless服务呢？

早期的互联网应用依赖传统IDC做系统架构，要有专业的运维人员管理计算资源，还要对系统负载做严格的评估和预测，这样才有时间购买新服务器。后来虚拟化技术提高了灵活性，计算资源拥有者可以把资源打包，按使用时间计费，这也就诞生了IaaS服务。

IaaS对系统的可拓展性和成本控制都有很大作用，但对刚起步的公司来讲，虚拟化仍不够，所以云平台在虚拟化的基础上作了进一步抽象，让开发者只关注应用逻辑，而不用管服务器配置和应用部署，这也就是PaaS。

不过虽然简化了系统的复杂性和开发应用的迭代速度，PaaS依然要调整计算资源的数量来适应系统变化，那如果计算资源可随系统的变化自动伸缩呢？这也就是Serverless诞生的原因。

Serverless不是没有服务器，它与传统去计算服务形态的区别主要包括：

更细粒度的计算资源分配；
基本无需预先计划计算资源；
高度弹性可扩展；
按需使用，按使用量付费。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

不过这些可能也是云计算的特别，而真正的区别就像上图中的比喻，从自行打井水到筒装水再到按需随时使用的自来水，Serverless就像是水龙头，它把服务的灵活性做到了极致，本质是最细粒度的云平台服务形态。

在业界的现状

最前沿的Serverless厂商无疑是亚马逊AWS，它从2006年开始提供云计算服务，这种领先也一直延续。微软Azure与阿里云也相继推出Serverless服务。

为什么AWS要开发Serverless？其实用户对云的方便与灵活有越来越高的要求，所以Serverless是一个必定出现的趋势，即使不是AWS，其它厂商也会提出来。下图是AWS Serverless服务发布的时间表。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

可能其中最出名的是Lambda，但Serverless包括了方方面面，比如S3就是一个很典型的Serverless服务，按照存储的数据量和访问量收费。

有一个值得关注的点是，2014年AWS发布了Lambda，但Serverless是在近两年后才逐渐引起关注。这是因为2014年容器技术才刚成为关注点，而Serverless太过于前卫，所有的云厂商都没想明白怎么样去发展它，而且生态也不成熟，在落实到工程中仍有很多问题。

AWS用了一年多时间推动Serverless，同时相关的工具也得到了发展，让部分用户尝到了甜头，这也引起了其它厂商的跟进，纷纷在2016年推出服务。其它厂商追赶的时候，AWS也把Lambda拓展到了其它服务，比如物联网和海量数据运输。

Google云平台在2008年发布App Engine就进入云服务，目前它的Serverless服务Cloud Functions还处于试用阶段。微软Azure云与阿里云也在2016年发布了Azure Functions和Function Compute，都是试用。

Serverless长什么样？

接下来介绍几个典型的Serverless服务，以及如何构建实用的解决方案。

下图把AWS的服务分成三类。一是基于EC2直接构建服务。第二类是托管服务，不需要对底层的虚拟机进行管理，只需配置资源大小，它会自动分配资源。托管服务在各云厂商之间的差异较大，也是竞争所在。第三类是Serverless服务，完全由AWS托管，甚至不用预先分配计算资源，也不用考虑实现弹性伸缩，只需要用就可以了。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

有代表性的Serverless服务有下列一些。

一是Lambda

这是基于事件驱动的Serverless服务。它一不需要管理服务器和抽象的计算资源；二由事件驱动，可自动扩展计算能力；三是实现成本控制，按使用量收，计时可精确到4秒。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

如何用Lambda呢？一是把现有的代码包装成Lambda函数；二是选择计算单元的大小，AWS提供了单一唯独的指标，只需要选择运行时所需要的内存大小，就可自动适配GPU，I/O等；三是代码打包上传到AWS；四是指定事件触发方式，如来自API的请求和SNS的消息，它有与其它服务交互的能力。

Lambda使用中要注意的是：

它是一个无状态的计算模型，因此要避免运行过程中安装代码依赖；

二是它的实现机制有一个流量预测算法，但它无法在没有流量的情况下进行预测，因此在一段时间没有执行后，再启动时会有延时，因此要视情况避免冷启动；

三是内置了版本和别名机制，需要合理利用；

四是正确编译平台相关代码。

DynamoDB

它是AWS内部分布式NoSQL数据库服务。它的主要特性如下：由AWS完全托管，不需要任何设置就可以获得快速稳定的读写性，存储空间也会随着数据量增长而增长。它也支持Lambda，这样同时支持精细到每一项数据的访问控制。

Aurora

它是AWS兼容第三方接口的关系型数据库服务，目前还在预览阶段。它的出现是因为，传统数据库解决方案不是为云平台设计的，需要用云的思维重新定义。

AWS引入了SOA理念，重新打造数据库引擎，把传统数据组件分解成一个个的独立模块，再通过自己云平台中已经有的服务来实现这些服务模块。这使得用户不用担心数据库升级，容量扩展这些令人头疼的问题。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

如上图，整个数据库服务被分成数据层和控制层，控制层由DynamoDB来存储元数据，Route 53提供服务发现，SWF负责SOA中的工作协调。数据层则使用了可靠性强的S3来实现数据的高可用存储。

AWS通过共享存储也实现了读写分离和高可用性，可以满足大部分用户对数据库的要求。Aurora的价格几乎接近开源数据库的价格，只是约高端商业数据库价格的十分之一。

下图是Aurora（蓝色）与MySQL（绿与红）数据库在读写上的性能对比。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

总体来说，从经济成本，管理成本和实际效用上，都超越了传统数据库。

Serverless设计模式

经典3层web应用

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

典型的web应用通常分为动态与静态资源。在设计中，可以用S3作为静态资源的存储，同时用CloudFront的CDN加速服务。动态这一块DynamoDB作为网站数据存储，通过API Gateway和Lambda实现前端的静态页面调度。整个架构中都用的是Serverless服务。

还可以设计更复杂的架构，如下图：

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

静态部分还是S3与CloudFront，但加入了高级功能。动态部分加入IAM支持，同时在API Gateway这一层加入流量控制，认证等。还可以加入防火墙服务WAF。

不过Serverless架构中的组件过多，如果API有数十甚至上百个节点，Lambda函数也会这么多，手动管理会十分不方便。因此亚马逊也推出了相应的方案SAM。如下图：

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

AWS CloudFormation是亚马逊专门用来配置和管理计算资源的服务，SAM是它的一个子集，可以用它打包整个架构设计，自动把所有东西同时打包配置好，做到自动化。

数据批处理

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

很多数据批处理的逻辑都可以分解成Map-Reduce的合理操作。但亚马逊Lambda提供的思路是，把原始数据存在云端，然后定义filter（把输入的数据分配到多个maper上），maper（执行映射逻辑，并把映射结果存在DynamoDB），reducer（处理映射逻辑，把最终结果存在S3上）三个lambda函数。由于S3和DynamoDB的事件都能触发Lambda函数执行，整个过程可以完全自动完成并自动伸缩。另由于起点和终点都是S3，所以可以把多个Map-Reduce逻辑串联，构成更复杂的处理模型。

数据流式处理

Kinesis是亚马逊处理流数据的品牌。下图是简化版且S3和Lambda数据流两步归集的处理系统。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

第一步要用Lambda实现初步处理器Stream Processor，它处理流数据后会把结果保存在S3上。第二是用CloudWatch定时器功能周期性触发Lambda函数，把中间结果进一步处理，把最终结果存在S3上。为了提高效率，第二步中的Lambda是一个任务分配器，可以同时触发多个具体处理数据的Lambda函数，同时对多个S3中的中间结果对象做处理。

这里有一个隐患，它来自Lambda和Kinesis集成方案的技术性区别。两者对接时，前者的并行能力会受到后者并行能力的限制。同时运行的Stream Processor的数量不能超过Kinesis的数据流分配的数据，这会导致数据流的推积。

详解Serverless服务，它会颠覆你对云的理解 | 雷锋网公开课

解决方法是，如果瓶颈在于对接Kinesis的Lambda函数，那可以缩短函数的执行时间。具体而言，Lambda函数不负责具体的数据处理，而是应该把它给更多Lambda并行处理。由于从Lambda函数触发其它Lambda函数没有并行限制，那可以做到即时处理Kinesis过来的数据。

Serverless的优势与劣势

前文已经提及它的优势，现在再来谈谈它的问题与挑战。总的来说，一些传统开发的技术和经验不适用。

首先是服务细粒度增加了开发大型应用的难度。传统web应用可以管理成百上千的API，但在Serverless中需要开发者有足够的管理能力进来应对。

其次是Serverless只能选用云厂商支持的特定的技术栈，对代码的行为有一定限制。

建立本地开发环境较为困难，调试不便。现在有人在本地用Docker模拟运行环境，这值得一试，但无法完全接近生产环境。

应用安全模型不够成熟，如何实现加密、认证、权限管理都需要时间来检验。

Serverless的意义

对开发工程师来说，Serverless是一个新的职业发展机遇。它不会完全替代现有的传统开发与部署模式，但一定会在某些领域大放异彩。它也降低了开发高并发应用的门槛，能为应用实现高可扩展与高可用性。

对运维工程师来说，可以更清楚认识到在云计算时代系统运维这个职业的危机。云计算的一个发展趋势是，云厂商把自己在架构和运维实践上的经验产品化，提供给用户，而它们的共有特征是对运维的依赖越来越小，开发工程师可以独立完成系统部署。

不过这个职业的发展方向是兼顾开发，做运维自动化。Serverless也给希望向自动化运维方向转型的工程师提供了职业发展机遇，可以利用Serverless新的运维逻辑，完成运维自动化。

对CTO和架构师来说，Serverless可以帮助理解全新的架构设计思路，把系统架构中一部分用Serverless实现，提供开发和运维效率，用低成本实现可扩展性和可用性。

对CEO与产品经理来说，理解Serverless有助于判断某个产品特性是否适合这一服务进行快速实现。

对于学生来说，学习更新的知识总没错，学习Serverless可以帮助理解新的软件设计范式，为自己的职业发展做准备

可以说，Serverless代表了全新的软件设计范式，需要用新的思路来看待云计算，它已经颠覆了对云的理解。

专题

雷峰网公开课查看更多文章