近日,来也科技联合创始人兼高级副总裁褚瑞在雷锋网公开课上,以「RPA:数字化转型的连接器」为题,讲述了他眼中RPA的“昨天、今天和明天”。
在褚瑞看来,无论是当年在他手中诞生的按键精灵,还是现在的来也UiBot,「连接」这一RPA的价值所在一直没有变过。
关注公众号「AI金融评论」后台回复关键词“听课”,收看本节课程视频回放。
以下为褚瑞的分享内容节选,雷锋网做了不改变原意的删减:
各位观众大家晚上好,我是来也科技的褚瑞,我今天的主题是RPA——数字化转型的连接器。
“连接器”的概念,怎么理解?打个比方,从2000年以后,私家车开始逐渐走入我们的生活,私家车不仅仅是一个交通工具,它就像一个连接器,把活动圈连接在一起,大大拓展人类活动范围,改变人类的生活方式。
汽车作为连接器,一般有硬连接和软连接两种连接方式。两个地点之间有路,汽车可以开过去,这是“硬连接”;两个地点之间没有路,性能好的越野车也可以开过去,这是“软连接”。
汽车作为连接器,还让驾驶变得越来越简单。以前的驾驶员都是一种职业,现在普通人也可以当驾驶员。我们称之为“平民驾驶员”。
这是汽车作为连接器的两个特点:支持软硬连接、支持平民驾驶员。这背后是汽车厂商多年来不断的努力。
2001年火起来的网络游戏,需要玩家通过繁琐的操作,完成NPC指定的任务才能升级。
当时,我在大学毕业前夕,用C语言写一段无限循环的代码,每过一秒钟,就在横坐标100,纵坐标100给按一下鼠标。这个程序很简单,但它可以代替繁琐的人力操作。然而,它有一个非常致命的问题——不能应对业务变化,坐标变了,程序就要修改。
我们发现,这里面的主要问题在于:它的平台和业务逻辑是绑在一起的,灵活性不够——这时,按键精灵应运而生。
按键精灵的初衷是将平台和业务逻辑进行分离,让大众在平台上定制自己的业务逻辑。用户无需懂得编程知识,撰写一个脚本,在平台的作用下,代替用户的双手去执行一系列的鼠标及键盘动作。
按键精灵1.0版本解决的是打固定靶的程序,连变量的概念都没有,很快也不能满足需求了,所以升级了按键精灵2.0。
2005年,我们给按键精灵增加了插件功能,提供很多预置插件,还可以通过编程添加其他的功能。这样一来,插件可以给按键精灵带来更多神奇的功能。
这就是按键精灵做得很成功的一点,它把用户自行开发的功能连接在一起了。按键精灵本身提供的功能非常有限,但在此之后,它就可以做到更多有意思的事情。知乎上也有讨论过按键精灵能做哪些有趣的操作——这正是“连接器”的意义所在,价值也通过这样的连接操作而体现。
通过这么多年的发展,按键精灵给我们很多启示:
第一,业务逻辑是会变化的。就像游戏,任务会变,所以要把平台和业务逻辑分离开,各自负责专门的事务。
第二,有些对业务可能不太熟悉、但对IT特别熟悉的IT专家,他们可以借助连接器,运用自己擅长的技术,可以做出厉害的脚本。也有些平民开发者,不懂IT技术,懂业务,连接器把他们连接,大家能做更多很有意思的事情。
2015年发生了一件非常重要的事情。美国的一家公司,前身是罗马尼亚公司DeskOver,之后改名为UiPath并拿到天使轮融资,迅速扩大业务规模,就此引领了一个行业的爆发。
当时他们和一些业务合作伙伴,包括会计师事务所、咨询公司,一起推出了很多财务、人力资源等方面的解决方案,大家才发现,这些领域其实可以靠自动化实现降本增效。
2017-2019年,UiPath迅速发展,成为一家高速成长的全球领先企业,RPA时代也就此到来。
RPA的全称是机器人流程自动化。现在的办公领域,有很多这种日常重复性工作,规则和逻辑非常明确。这种情况下,用自动化的机器人软件代替人工的手动完成。这跟当年游戏里不停点鼠标一样,本质上没有不同。
一个常见的问题是,很多系统之间数据没有打通,此时用机器人能非常容易地做到这种非侵入的跨系统数据集成,不需要改程序,只需要模拟人操作。这是RPA非常重要的应用之一。
2015年,RPA行业被引爆;2019年以后,随着微软宣布正式入局,这个行业被推到了一个新的高点。微软在2019年的时候宣布它要推出Microsoft platform,这个平台包含4个主要的功能组件,其中Power Automate就是微软用来实现机器人流程自动化的重要工具。
很多人现在都想不清楚,为什么RPA热度这么高?
咨询机构预测,到2023年,RPA的服务和软件的收入规模大概是120亿美金。
我们可以发现RPA很多有趣的特性:
1、大客户小订单。使用RPA的厂商,很多是世界五百强这种大客户,但它们的RPA订单往往很小,可能只订购几十万的合同。但这些大公司普遍对RPA表现出了他们的关注,因为它们内部有很多复杂的流程,更需要用自动化连接。
2、RPA从2015年爆发起来,到今天,一直采用订阅的方式,客户需要每年支付一定的金额,软件厂商提供相应的、到位的服务,才能促成买卖双方达成合作。RPA的订阅续费率很高,因为大多数公司对RPA都有一定的需求。
可以说RPA是具有普适性的,很多行业、领域、部门都会有这样的需求,这也是大众看好RPA这个方向的原因之一。
此外,同一行业内不同部门会有不同的需求,好的效果可以加速它的传播效力。
从买方市场来看,为什么RPA这么热?
这两张图表现了我国出生人口和高考录取率的变化。图一显示,1990-1999年,我国每年出生人口从90年的2600万降低到了99年的1100万,意味着人口老龄化成为了一个严重的问题,并且会越来越严重,人力成本也随之增加。
除了年轻人口的减少,图二还可以看到高考录取率也在增加。98年的时候高考录取率只有6%,到了2017年变成65%,增长了10倍,意味着很多蓝领工作很难找到人去做。大多数人不太愿意做这种机械重复劳动,这种情况下用机器人代替人做简单重复劳动,就成为了重要的趋势。
还有一个原因,RPA适合数字化转型的需要。以前银行存款用钢笔填写信息,跨行兑付,但这种方式被淘汰了;信息化以后业务无纸化,通过支付宝随时付款。
信息化带来很多好处,但也有一定问题。信息化带来一波业务增长,但当增长到一定程度后又显乏力。这时有人提出来,要把已有的数据整合,实现数字化转型,产生新的价值。
目前信息化壁垒过于严重,系统与系统之间的数据没有打通,很难将数据进行整合。所以RPA这种非侵入式,在不更改系统的前提下,能够模拟人的操作,将不同系统的数据进行提取及整合。
所以RPA是数字化转型的一个连接器,把很多系统连接起来,这种连接本身就是它的价值所在。这个概念是微软提出来的,微软Platform的四个组成部分之一就是Data Connectors,意思是数据的连接器。
就像开头举例的汽车,RPA也具有连接器的一些特点,它也支持硬连接和软链接,也支持这种专业开发者和平民开发者。
评价一个RPA产品的好坏,一定程度要看它是否支持多种硬连接,同时支持多种常见的软连接。
在RPA里,硬连接是指业务系统有提供接口,可以去做连接,类似Excel,有COM的接口。邮箱也可以通过业务接口去操作。
软连接是指在没有业务端口的情况下,系统间的数据无法互联,这时候RPA的“非侵入”特性就展现出来了,它能够通过界面元素的抓取和自动化操作,实现无接口的数据获取和写入。硬连接和软连接各有优势,双剑合璧就更加强大了。
其次,也要看RPA是否支持低代码。通过基本的变量、表达式等很简单的代码,就能够实现一个自动化的逻辑。这样,一些平民开发者也能很容易学会它。
虽然还需要学习,但是门槛已经降低了很多,大家可以通过一种简单的方式,就能够实现自己的业务流程自动化。
Q:很多人听完RPA之后会问,RPA好像没有什么技术门槛?
RPA的技术门槛不在于让鼠标自动跑起来(这个技术我在大学毕业之前就能做,一个应届生就能做的事情,当然没门槛),而在于如何把低代码做好,让平民开发者也会使用。
Q:某某开放源代码,RPA市场也会像以前一样变成红海?
其实不是这么回事,因为这些源代码,比我在2001年做的工作也就稍微先进一点点,仍然不是一套成熟的产品。
Q:为什么我们不去做一套数据总线,然后把业务系统都连接到数据主线上来?
这个想法非常好。在汽车时代,这种数据总线我们把它称为高铁,所以说数据总线跟RPA的区别,就好比是高铁和汽车。
数据总线有很多的优势,传输速度快、传输量大,安全性更好,但RPA有它独特之处,就像高铁无法完全取代汽车,只能在各自领域发挥作用。
Q:Python语言这么流行,用Python直接加一个开发包不能实现自动化吗?
Python语言不够低代码,经常有人开玩笑说Python语言是要拿着游标卡尺去写的,用它去实现自动化的话,不能做到我们前面所说的平民开发者的目标。
RPA作为连接器,也遇到了一些挑战。不同业务系统之间的数据,只有20%是可以直接利用的结构化数据,比如表格数据库,剩下80%都是非结构化数据。现在还是没有办法联系到一起。
通过AI,把非结构化数据转化为结构化数据,连接器就能处理剩下80%的数据——所以,RPA+AI才是连接器的未来阶段。
因为AI做了大脑的工作,可以把非结构化的数据,比如图片、声音、文字,转换成结构化数据,然后去做手的工作。
很多人问,既然RPA+AI能起到简单作用,比如像阿里云、百度云这样的云平台都有这种标准的接口提供了,那把这些做得比较好的AI能力直接引到RPA里可以吗?
可以,比如扫描一张发票,其实不用云平台,有专门的发票扫描仪就可以,将仪器跟计算机连接起来,就一张张自动扫描发票了,自动把发票信息从图片、纸质形式变成结构化数据的形式,这种效果已经很好了。
扫描仪和RPA连接这种还属于初级阶段,我们称之为连接AI能力的连接器。
什么叫高级连接器?就是把一些智能化的功能,把AI所能做的一些事情给分装到连接器里。这种智能化的研究系统,能解决很多初级阶段不能解决的问题。
有时RPA本身能力有限,需要用AI增强。有的是标准AI场景,比如扫描发票、身份证,这都是非常标准的文档,已经有很多插件做得很好,直接调用就好。
RPA和AI的界限非常分明,AI负责把非结构化数据转成结构化数据,而RPA拿复杂结构化数据来做处理,这是交互非常简单的情况。
首先需要识别出软件里有多少界面元素,一般的RPA软件都能做到,但有些软件不是在本地操作系统里运行,而是运行在远程计算机,我们通过远程连接上去。
这种情况下,就可以运用AI识别界面。我们用了大概几十万张的软件界面图片进行标记,拿深度学习模型去训练。在这个模型里,你只要按下一个键,它就能自动帮你识别,把虚拟机里的基本元素,比如输入框、按钮、标签等都用绿色识别框标记。
注意它不仅是识别有文字的元素,一些输入框是空白的,里面还没有填内容,它也能准确的识别出来。
财务领域经常要识别和处理合同,首先OCR合同一下,把里面的图片扫描件编成文字。
从合同正文里提取关键信息,比较麻烦,因为合同没有标准格式,比如甲乙方的位置、合同金额、到期时间等。
只能用RPA产生的AI能力进行训练,才能在合同扫描件里提取出所需要的总金额、账期、供应商等关键信息,然后用RPA把这些信息送到财务,给财务提供一个成本的管理依据。
在一家地产公司,它的物业就是一个集中的呼叫中心。为了提高用户的服务质量,当业主拨打物业电话时,接入的是呼叫中心。
呼叫中心有200多个人工客服可以直接回答简单问题,对于一些类似维修等问题就需要先做下记录再修理。AI可以理解人说话的意思,以及做一些简单回复。
公司邮箱每天能收到一些邮件,需要每天有人收邮件并归类为客户或潜在客户。
这些客户也需要进行初筛,判断公司规模及相关信息。我们就做了商机邮件处理机器人,能自动收邮件、查询客户和分类。
如果是归为潜在客户,还能自动查该公司大概情况,自动回复邮件,把处理的信息存到Excel表格里。
从按键精灵到来也UiBot,它们有共同点,都做连接器,也都具有一个连接器所应有的低代码特点。
不同之处在于:游戏速度变化较快,所以按键精灵要体积小、速度快;来也UiBot对速度的要求没那么快,一般办公界面切换不会太快,所以更强调稳定性、安全性、容错性等。
其次,来也UiBot的安全性要好得多,在很多方面都比按键精灵大幅增强,包括在硬连接和软件能力上,AI的能力集成上,跨平台的能力,分布式控制中心等。
我们也是坚持做好连接器去服务平台开发者,我们的开发者社区用户数今天已经超过30万人。我们的UB Store,是提供给付费能力不太强的小型客户。
Q1:RPA就是机器加上智能,可以这么理解吗?
褚瑞:昨天的RPA应该说只是代替了手的工作,只能做一些机械性劳动。今天或者未来的RPA会加上更多的智能,可以做很多比双手能做的、更复杂的事情。机器加上智能,可以认为是未来RPA的一种形态。
Q2:怎么应对客户流程的不同,不断更新?
褚瑞:这就是我们要强调平民开发者的原因之一。RPA应该是每个人都能掌握的。上线以后,后期的修改虽然不可避免,但只要足够简单、好用,每个人经过简单的学习,就可以调整这个参数,应对流程的更新。除非更新复杂到一定程度的时,才需要更高水平的人介入。
RPA不是作为一个项目交付完就结束了,而是一定要做更新的。让原厂继续服务的话不太现实,一定要通过这种低代码的形式让更多人轻松掌握。
Q3:RPA在实际应用中会因为网页页面的改变而修改流程,这会导致后期的运维成本很高吗?
褚瑞:RPA流程是可能会需要修改的,因为你用它连接了多个不同业务系统。这些业务系统的改变,就导致RPA流程也要发生改变。但当业务系统在一个成熟的大型企业中使用,它的变化不会太频繁,即使发生了改变,这个体系里只要有少量的人学会使用它,那就没有问题,都能自行应付。
Q4:学了一个月的来也UiBot基础命令判断都可以理解,但一些场景觉得挺难的,不知道应该怎么继续学习。
褚瑞:实际上可以拿一些现实生活中常见的场景做练习。我有时候需要把知乎上的文章批量导到Kindle里,这样可以在离线的情况下阅读(比如飞机上),但知乎和Kindle之间是没有接口的,我就用来也UiBot社区版,自己写了一个流程,自动把文章导到Kindle里,这就是我生活中常见的一个用例。我们也会把使用门槛进一步降低,让更多平民开发者能够掌握它。
CCF-GAIR 全球人工智能与机器人峰会———AI金融专场
历届 CCF-GAIR 已汇聚多位诺奖、图灵奖得主,28位海内外院士,21位世界A类顶会主席,103位Fellow,400多位知名企业家以及100余位VC创始人出席。
8月7日-9日,《AI金融评论》将在第五届CCF-GAIR中举办「AI金融专场」,目前统计学“诺贝尔”— COPSS总统奖得主,摩根大通执行董事,世界顶级学会主席,金融巨头首席科学家、首席风控官,已确认出席。
会议详情与合作,可联系专场负责人周蕾,微信:LorraineSummer
更多会议安排点击https://gair.leiphone.com/gair/gair2020查看。
雷锋网雷锋网雷锋网