撼山易，撼「AI金融」难

金融科技

作者：周舟

2020/07/27 19:01

撼山易，撼「AI金融」难在现代金融史上，没有一项技术比人工智能这颗核弹辐射的范围更广，更能决定命运了。

它看准了金融行业数字化程度高、历史数据准确等特点，像熔浆一样无孔不入的流进金融的各个业务中，并给它们烫上了自己的烙印：智能投顾、智能风控、智能营销、智能客服......

但同时，很多人也在质问它是否名副其实。国内好的智能投顾产品几乎为0，智能风控的效果太过依赖样本，智能营销推荐的商品让人“摸不着头脑”，智能客服遇到不会的问题秒变“复读机”。

人工智能到底给金融带来了哪些改变？它是否真正产生了实实在在的经济价值？是雷声大、雨点小，还是真正解决了金融业务中的诸多痛点？每个人选择不同，答案不同。

AI金融“四处碰壁”

｜1000亿美元投入“大海”，愣是没砸出一个花来。

AI这条路，真的不好走。

即使是曾经一度成为世界首富的孙正义，最近也在人工智能的投资上栽了跟头。

作为人工智能的头号粉丝，为了投资人工智能，过去的几年中，他筹集了1000亿美元的基金，其中大部分资金投资了以人工智能为中心的70多家公司，但战绩潦倒，仅2019年，软银便亏损了880亿元，相当于一年损失了两艘“伊丽莎白女王”级航母。

撼山易，撼「AI金融」难

其实，在现阶段的大部分行业中，AI能颠覆的场景并不多。即使在数字化程度颇高的金融行业，AI也并非一帆风顺。

比如「AI风控」，因为事关财产安全，一直是银行等金融机构关注和投入的重点。

一直以来，银行对「信用卡套现」等产业诈骗团伙十分头疼。一些不法分子利用漏洞，通过有组织的活动，将信用卡的资金提现，用于投资、赌博。而「AI风控」可以通过对个体骗贷行为的分析，找到某种联系，识别出诈骗团伙，进而做出相应的封卡措施，减少损失。

但是，AI风控的效果的好坏十分依赖样本，如果样本的数量或者质量不达标，会严重影响风控的效果。

在欺诈等场景中，样本天然比较充足，效果也相对较好。

但是在信用卡盗刷、账户盗用等场景下，因为银行的防控力度比较强，发生的案件数量较少（能积累到的样本较少），使得AI风控的效果也是参差不齐。

邦盛科技副总裁王雷认为：“样本的质量高低，很大程度上依赖于专家的经验。”而目前，AI专家人才紧缺，有经验的科学家更是凤毛麟角，这也使得AI风控在行业整体效率上难以提升。

然而，相比智能投顾、智能营销、智能客服等AI在其他场景下的应用，「AI风控」取得的成果已殊为不易。

在“AI+投顾”的场景中，智能投顾企业迟迟未能解决获客成本高、大多数投资人未能实现盈利的问题。

虞爱是一家金融科技公司——悦保科技的CEO，他平时常常会接触到做智能机器人的客户，也喜欢体验新的产品和技术，在被问及AI在哪些场景中落地并不理想时，他首先就提到了智能投顾。

他认为NLP需要对语义有更精准的理解，现阶段NLP只能实现部分流程的替代，若不能实现进一步突破，智能投顾公司与客户之间始终会存在一条看不见的“天堑”，很难进行有效且顺畅的交流。

“此外，实现AI能力的基本要素在于数据的积累，而目前的情况是智能投顾公司积累的数据量普遍较少，这也阻碍了行业的进一步发展。”虞爱说道。

在非常火热的“AI+营销”的场景中，消费者多元化的需求和市场上产品的稀缺，形成了鲜明的对比，商品的推荐效果并不理想。

智能营销通过优化AI算法，根据购买商品的网络痕迹等非常有限的信息，为每一个客户构建用户画像。构建好画像后，把用户分层，然后和相应的标签进行匹配。

“然而，智能营销的模型做的效果再好，也很难通过少量的产品满足消费者的全部需要。”专注于智能金融赛道的慧安金科CEO黄铃说。

撬起AI金融的“支点”

AI金融不是一条坦途，人工智能在金融领域每一个业务的落地过程都充斥了“分歧”与“争端”，想要更好地落地金融，需要共同的衡量标准和相对通用的技术指标。

而这些标准，不仅能为技术提供方和使用方达成共识“牵桥搭线”，也撕开了一道AI金融难以大规模落地的口子。

随着与科技公司的合作愈发紧密，金融机构逐渐摸索出一套比较通用的技术指标，比如KS值、AUC、F-score，来鉴别哪家金融科技公司的AI实力更强。

KS值越大，表明正负样本区分的程度越好，AI模型越好；「AUC」（Area Under Curve）可以分析在一条曲线下的面积到底有多大，如果曲线下的面积越大，这个模型效果越好，反之模型效果越差；「F-score」，用来判断准确率。

此外，模型覆盖率也是考验AI产品是否有很好效果的指标之一。

假设模型可以覆盖1000万人，目标是需要触及客户900万人。如果在测试时，模型覆盖了1000人，触及到的目标客户达到901人，达到了模型的测试标准，但是，因为测试的样本量太少、测试的次数太少，不代表AI产品就达到了标准。

AI模型也是有时效性的，随着时间的变化，它的性能是否会大幅下降？AI模型在更新的过程中，是否需要大量时间和金钱？AI模型和银行的核心系统在对接的过程当中是否简易？AI模型本身是否做的很标准化？

这些都是在技术指标之外，银行使用AI产品时，必须要考量的标准。

冰鉴科技CEO顾凌云说到：“部分金融机构，会执行一套客观的指标来考察AI企业的产品质量。以24小时、7天或者30天为一个期限，他们会时时刻刻监控模型的效果，一旦模型的效果超出规定范围，马上就会根据期限调整产品。即使你本身的模型效果很稳定，他也会每3个月做一次测评，每6个月做一次测评，每一年对供应商进行一次重新的测评和调换。”

通过这种方法，金融机构可以保证他们使用的产品，一直由最佳技术实力的公司提供，而反过来，也不断磨砺和推动科技公司在技术上的不断创新与发展。

｜给我一个支点，我能撬起整个地球。

作为第一个掌握杠杆原理的科学家，阿基米德认为只要找到事物的内在规律，即使撬动地球也是一件自然而然的事情。

但是，想要撬起「AI金融」这座大山却殊为不易，需要找到许多支点，除了推进金融科技公司和金融机构“达成共识”外，怎样驱动人工智能更加“智能化”和怎样促进监管与科技之间的“协同发展”，也是我们需要思考的问题。

人工在前，智能在后

｜人工与智能，孰好？

这是一个自AI创立以来，人们就津津乐道的话题，也是每一个AI企业家都需要思考和抉择的问题。

慧安金科CEO黄铃认为，人工和智能是互为补充的，具有完全不一样的属性。

人工，可以在自己已有经验基础上做非常复杂的推理，能够根据一些蛛丝马迹做复杂的关联和分析，挖掘出潜伏非常深、伪装特别像的风险。

但是，人工也有几方面的问题。

第一，要成为一个非常有经验的专家，需要长时间的积累和沉淀。

第二，「人工」处理数据的“带宽”非常有限，一天只能处理几十个案件，发现很少的问题。

而对于机器智能来说，「人工」的劣势，恰恰是它的优势。它有足够的带宽处理海量的数据，还可以按照一些推理规则或者机器学习模型，帮助人们减少工作。

黄铃说：“我们可以通过准确率、覆盖率这两个量化指标，对人工智能产出的效果进行全面评估。通过ROI来判断这个人工智能项目是否取得了良好的效果。”

按照目前的发展来看，AI在人脸识别、文本识别以及风控、合规和监管等场景，效果都非常好。有些领域，AI的水平和能力甚至超过人类，比如风控合规监管，机器可以达到人类97%或者98%的水平。

但是相比人类，特别是非常资深的专家，AI的推理能力还是远远不够。

“AI其实像一个被高考机器惯出来的孩子。”蚂蚁集团首席AI科学家漆远这样形容AI目前发展“偏科”的情况，好比一位有着特别强大记忆体的学生，能通过题海战术学习了大量知识点之后，做题效率极高，却不懂怎么推理。

比如在智能风控领域，存在大量的欺诈分子，他们隐蔽身份的手法千变万化，机器也难以察觉。如何使用数据、对数据特征分析以及如何把特征组合起来，产生一个准确高效的信贷风控模型，十分具有挑战性，需要有经验的AI人才。

监管与科技

｜科技可向善，也可为恶。

避恶扬善，是一个永恒的话题。

邦盛科技的王雷认为：“机器学习等技术，最大的一个问题是不透明、不可解释。”而这一特征给监管带来了许多困扰。

人工智能应用往往通过采用神经网络，使用算法产生结果，其复杂程度只有计算机可以理解，有时候连金融科技公司也不清楚人工智能是如何决策的。这种情形下，相关部门是否监管、如何监管科技公司成了一大难题。

随着技术与产业的进一步融合，人工智能的决策可能涉及数百万美元——甚至是关系到人类的健康和安全，在金融等受到高度监管的行业中，不能解释人工智能的决策，对于企业和个体而言，都面临着极大的风险，这也给监管部门提出了更高的要求。

人们往往认为监管与科技的关系是，先有人工智能等科技，后有监管，监管部门的技术与理念永远落后于科技公司，实则不是。

品钛副总裁李惠科说到：“政府监管部门跟业界之间的讨论是非常频繁的，一些高级别的监管官员会直接在群里，提各种各样的问题和业内的公司管理者们一起进行思考。”科技企业在迅猛发展的时候，监管也在与时俱进，并参与和推动整个生态的发展。

如果非要形容科技公司与监管之间的关系，科技公司就是非常前沿、时尚的法拉利跑车，而「监管」是在整个道路上面设计红绿灯、限速、停车等各种标志的交通规则。

跑得再快的法拉利，受到交通规则的管制，到了路口，也要停下来；而红绿灯的设置，保证了科技公司这辆飞车不至于“超速行驶”或者“跑得太慢”。雷锋网雷锋网雷锋网