雷锋网按:8 月 5 日,在 Rebuild 2017 大会上,智融集团 CEO 焦可发表了题为《智能如何重新定义金融的边界》,分享了传统金融机构业务与智能金融的差异,并讲述了智能是如何解决传统金融不平等的问题。雷锋网根据现场速记进行了整理。
以下是智融集团创始人焦可的演讲实录,雷锋网在不改变原意的基础上做了精编:
《智能如何重新定义金融的边界》,看到这个标题的时候,我想最抓眼球的,一定是“智能”这两个字。人工智能在最近的这段时间已经成为大家不可忽视的一个话题,从餐馆的服务员、到出租车司机,每个人都能聊两句人工智能相关的东西。借用李开复老师的一句话来讲,他觉得人工智能已经从一个科学、科技变成一种科幻,我们希望它不要变成魔幻。
所以,真正吸引我们的是什么呢?首先,只有智能我觉得是不够的。智能就像一把锤子,我们不能举着一个锤子满世界去找钉子。那么钉子是什么?钉子就是金融的边界。
我先介绍一下,在我们眼里传统金融的边界在哪里?
我们真正找到金融的边界花了很多成本,这张图,其实就是一个实际的现状。在中国,只有15%左右的人,能够被传统金融机构所服务。但是在欧美,实际上有70%的人可以被传统金融机构所服务。
这也回答了刚才金证济苍(Video++创始人&CEO)提到的问题,为什么在以色列 IMVC 机器视觉大会上,如果有1000万美元会投哪个AI应用领域,1600位 AI 的科学家没有把票投给金融和安防,因为对于欧美这些发达的国家来讲,这可能已经不是一个太大的问题。
所以,我们跟很多美国的信贷公司交流的时候,他们其实非常羡慕我们,因为觉得中国有一个巨大的市场机会。中国的传统供给是不够的,所以这才给新技术有了发挥的空间。
就像在过去几年看到的手机支付,在中国其实远远超过了美国。就是因为在美国,卡支付已经是一个非常普遍的手段,留给这些新技术的空间非常小。但是在中国,我们看到的是一个巨大的没有被满足需求的市场。
我们刚刚看到了金融的边界,接着深入想一个问题——金融的边界为什么在这里,为什么传统金融没有为剩下的巨大市场服务?
这在我们看来其实是一个传统金融机构的审美问题。我不知道大家有没有去银行办过信用卡,或者办过贷款,银行基本上都会要求大家提供一些材料,比如说提供你的征信报告、社保、工资证明、工作证明,提供各种各样的抵押品、资产证明等。但是,当你不符合它的审美的时候,往往你就会被拒掉。
我们知道,中国是一个数据建设并没有那么完善的国家,我们看到有很多年轻人实际上是没有征信记录的,有很多私人企业里,发工资的方式是用现金,很多人是没有社保的,很多人也没有车、房这样的资产。这些人,就不符合传统金融机构的审美。
在我们看来,传统金融机构就像是数据冰山水面上的部分,好处是看得很清楚。但是,坏处是它只能代表个人数据非常小的一部分。
我们的一个观点是,如果能利用好水面之下的数据,能够去看到这个人更多的信息,那么我们就能发明一种新的审美,而这种审美是不同于传统金融机构审美的。
传统金融机构,我们经常做一个比喻,像什么呢?像是一个筛子,它用了几条规则,去把这一堆苹果里面的大苹果筛出来。而漏掉的苹果里,一定有一些好的苹果,但是他们是没有办法判断这个苹果是好是坏,我们在做的事情,是发明一杆秤,去真正的测量这个苹果是好是坏。
所以,我们现在可以做到,单月信贷业务量已经突破150万笔。这个数字其实对于传统金融机构来讲是个天文数字,因为一个银行网点一般一个月的信贷业务量可能也只有几百笔、几千笔,150万笔对传统金融机构来讲是一个不可能的数据。
但是,这150万笔背后还有一些更神奇的数字,我们现在做一笔信贷业务只需要通过8秒的时间。全程是没有任何人工介入的,每天7×24小时的工作。
我们公司里没有传统金融机构的人,没有一些“老司机”告诉我们什么是好用户、什么是坏用户。
先举一个很好理解的例子。这是 Google 在做的一个项目,如何在一堆动物图片里面找到猫和非猫,如果我们按照传统的方法,可以写一个规则引擎,可以写几条规则。
比如说,如果这张图片的物体里面有毛的纹理,如果这个轮廓上面有尖的耳朵,如果有尾巴,如果这个东西有胡子,你可以判断这是一只猫。但是实际上你会发现,这样首先会引入很多错误,有时候你会把狐狸找出来了,如果这只猫是只折耳猫或者是无毛猫,或者是它在图片里面把猫的尾巴隐藏起来了,这只猫你就会错过。
但是 Google 是怎么做的?Google 实际上并没有找动物专家去判断、定规则什么是猫,Google 的做法是把一大堆图片里哪些是猫、哪些不是猫标注出来,扔给模型,让模型自己去找到它的特征,让模型自己去发现规律,这个时候你发现它的准确度和召回率都要远远高于人的能力。
我们在做的事情跟这个有很类似之处,我们在做的事情也是在一堆这样的用户里面去找到哪些是猫,哪些是非猫,哪些人是我们传统意义上会还钱的用户,哪些人诚信是有问题的。
而这些事情不是像传统金融机构一样写一个规则引擎,我们不是这么做的。规则引擎是什么?就像我们谈到的,传统的金融是怎么判断你的风险的呢?是做一堆规则,如果你的工资大于多少,并且你有社保,以及你的征信报告是怎么样的,然后你是可以通过的,或者你就被拒掉了。这是传统金融的规则引擎。
但是在我们看来,这种规则引擎跟刚才那个猫的例子是一样的,总是受到人的局限。特别是在人无法进行判断的业务领域里面,局限就越发明显。
而我们在做的事情就是我们把一大堆人的特征扔到模型里边,让模型告诉我们什么是好的用户,什么是坏的用户。
我们最核心的一个技术就是 I.C.E.
I.C.E. 实际上是三个英文单词首字母的缩写,就是 Identification、Calculation、Evaluation,这三个环节其实也是很多人工智能领域里,都会碰到的。
第一,辨识,找到这个事件、业务里的特征。比如对于智能驾驶,就要找到识别路上的物体都是什么东西;第二,计算要处理大量的人工无法处理的特征,这个时候要有充分的计算能力;第三,决策、评估,究竟该左转、右转、踩刹车还是油门。
这是人工智能的三个环节,在金融领域里面,同样有这样的三个环节:
第一,柯南特征工程
从大量的数据里面找到那些真正跟客户逾期率相关的特征。
对于传统金融来讲,他们看到的特征可能是那几项、十几项特征,但是对于我们来讲,我们看到的是一个用户1200个以上特征,而这个特征是跟逾期率相关的,我们看过的特征也远比这个数据要多很多,我们看过各种各样奇奇怪怪的特征。比如说我们之前也试过说星座会不会跟逾期相关,处女座会不会爱还钱?其实没有。
但是你发现有很多更奇怪的特征是跟客户相关的。比如说我们会看到用户在使用的时候,输入身份证号的节奏会不一样,而这种节奏跟客户的逾期率相关。我举的这个例子相对大家不太好理解,但是你发现有更多的特征,实际上是非结构的数据,是一种人类无法解释的数据。就像 AlphaGo 一样,如果用规则引擎来写这样的规则,你知道他为什么会下这步棋,但是 AlphaGo 为什么会下这步棋,你实际上是不知道的。
我们在特征领域可以发觉到远远比人的经验更深入的一些特征,而且绝大多数的特征都是人的计算力无法去计算的。有了这些特征之后,为什么我们能够知道这些特征是跟逾期率相关的?是有赖于我们接下来的模块。
第二,D-AI机器学习模型
我刚才谈到不依赖传统的金融专家告诉我们什么是好的、什么是坏的,为什么?
回到我们最开始的数字,我们单月的业务量已经突破了150万笔,而这150万笔意味着什么?意味着每天就有5-6万的用户在使用我们的信贷服务。这5-6万个用户下个月实际的表现就会告诉我们,他是一个好用户还是坏用户,相对而言,跟人的经验比起来,我们更相信的是实际的数据。
这个很类似于刚才那个猫,甚至比那个猫的意思更好一点,根本就不需要雇人标什么是猫、什么不是猫,用户实际上会用行为告诉我们。
当这5-6万用户每天回来的时候,大概计算一下,5-6万的用户加上每个用户有1200个特征点,所以你每天处理的特征点数是几千万的数量,而这个时候可以充分地告诉我们什么是好用户,什么是坏用户。
就像一个传统的风控人员,他的风控也是来自于对一些案例的学习,可能今年放了几百笔,明年看看这几百笔的效果。但是他的量级和速度是远远跟不上机器。
所以,我们现在每个月机器学习的次数其实是上百次,这个跟传统金融是不一样的,传统金融可能半年、一年会迭代一次模型,但是我们每个月、每天模型都在发生大量的变化。
而我们线上在跑的模型也不是一个,实际上每天线上放出几万笔贷款的时候,背后的模型是有几百个模型。这是跟传统金融很不一样的地方。
第三,Anubis 大数据计算架构
为了支撑这么大的计算量,我们搭了一个大数据计算的架构,每天处理的数据量已经超过了5T。特征进行全量样本的迭代速度,其实只需要15分钟,真正进行线上的审核是8秒钟。所以这一切对传统金融来讲都是新的变革。
从实际的案例里面看到,用人工智能技术去解决金融的需求,确实是一个很有意思的话题,我们发现金融天然就是跟数字打交道的,所以在这里会有很多数据产生,而金融天然又是正负样本非常清楚的业务,还或者是不还,股票的涨跌,保险赔还是不能赔,这都是被实际迭代出来的样本、学习的对象。
我们发现机器会比人更加擅长处理大量数据的定量计算,人比较适合做的是定性的,可以就可以,不行就拒掉,机器比人的学习速度要快很多,而且机器没有偏见,机器不会疲劳,机器没有道德风险,我们不用担心说像传统金融领域一样有很多从业者去做欺诈,我们机器是没有可欺诈的部分。
当你使用大量的特征点的时候,也会发现欺诈的用户根本就无从下手,他不知道你是怎么建立这个模型的,如果你是一个规则引擎的话,就容易被人攻破。
但我们发现传统金融产生资产的方式,传统金融进行风控方式还是停留在原来的规则引擎,还是在用传统的专家经验去找到什么是猫,什么不是猫。
我们认为互联网金融正在进入下半场的革命,下半场真正最核心的就是内在技术(引擎革命)。
传统金融实际上是一种燃烧不充分的金融,传统的金融引擎烧的是什么呢?烧的是专家的经验、人力。我们认为新的金融模式应该不是这样的,新能源下的金融模式引擎烧的是数据、算法、工程师,这是新的引擎,真正的价值来自于新的引擎。
传统金融之所以使用这样的引擎,受到了传统的局限,你发现传统金融在开展业务的时候,它往往是基于一个产品为中心的模式,它是先定义一些产品。比如说白领贷、工薪贷、车抵贷、企业贷,往往先定义一个产品,然后定义规则,然后根据规则找到人。这就很像我们先生产出一批35号和40号的鞋,去找到适合这个鞋的脚,这个模式其实是有问题的,因为有时候你的脚比较小的时候,穿这个鞋很不舒服,如果你的脚比较大的时候,就要削足适履,这是传统的金融。
那么我们期望在新金融模式下,能够做到先找到人,通过技术评估一个人,通过 I.C.E 判断一个人的风险,然后为他提供适合他的金融产品以及金融能力。
传统的金融是一个少数人的金融,如果想改变这样的问题,改变这样的不平等,需要的是一个更加有智慧的金融。