7 月 7 日,由中国计算机协会(CCF)主办,雷锋网、香港中文大学(深圳)承办的第二届 CCF-GAIR 全球人工智能与机器人峰会在深圳如期开幕。大会第二日,作为金融科技专场上午的最后一场报告,百度金融高级科学家吴健民带来了主题为《智慧金融:助力金融机构迎接 AI 新时代》的演讲。
吴健民老师先后就职于雅虎北京研发中心、腾讯,从事分布式机器学习算法与搜索相关的工作。在2014年加入百度,当前负责百度金融在智能获客、大数据风控、金融画像方面的工作,以及 AI 技术在百度金融的落地。
AI 技术服务于金融机构的业务与创新
银行业
金融科技的诉求包括用户画像、精准营销、风险管理和智能客服四方面
保险业
风险评估与定价、交叉销售、客户流失管理和理赔欺诈检测。同时有基于场景的保险产品设计及基于使用的风险定价。
证券业
AI技术主要应用于股价预测、客户关系管理、投资景气指数预测等。
资本市场对金融科技投资增幅明显
埃森哲的报告显示,2015 年全球对金融科技的投资有比较大的增幅,呈现地区结构化的差异。各地区的投资额增长率为:
北美 44%,欧洲 120%,亚太 300%,中国超过400%。
百度金融的7大技术方向及三步走战略:
下面逐次有侧重的介绍5大技术应用方向:
智能获客的核心是降低获客成本,通过三个步骤来实现用户需求的精准的定向及满足:
刻画用户的金融画像及需求,需要做到全面、准确且能够及时触达。
生成与场景自然切合的动态创意
通过响应模型准确匹配金融产品与用户的需求
首先用户画像是一个标签体系,根据业务需求进行扩展。百度数据对对用户金融属性有比较准确的刻画,举个例子,如果一个用户经常出现在加油站或者高速路收费口,他很可能有车,可以为他贴上“有车”的标签。这是对用户资产是一个很重要的衡量。
其次是根据需求场景,人生阶段,生活品质,消费水平等确定智能创意的构成,实现响应率的优化。
最后是根据用户的基础信息、信贷需求、网络行为、风险偏好因素及产品的额度、利率及收益率等通过响应模型进行客群匹配。
老客激活也是一个很重要的方向,一个原因是现在获取新客户的获客成本越来越高,大概在3000-4000元左右。老客户的重复用信,就具备了相当高的价值,一般一个信贷用户有3-5次的重复用信,业务才能实现盈利,如何高效的激活老客户的重复使用是很重要的问题。这需要对优质存量客户进行用信激励、实现客群优化。以百度钱包的个性化补贴为例,该业务通过在支付环节为用户提供补贴,激励用户使用钱包支付。策略的核心是计算补贴额度,我们通过模型估算用户的支付响应率,依据支付响应率计算最优的补贴额度。最优补贴额度同时优化两个目标:1. 支付率尽可能的高,2. 补贴成本尽可能低;通过数学规划的方法求解,进而得到最优的补贴成本。
关于大数据风控,百度在内部经常说风险管理,而不是风险控制。金融做的是风险业务,相对于控制风险,我们更需要准确计量风险并进行风险定价。
大数据征信模型面临来自两个方面的挑战:
大数据的特征本身高维稀疏、异构、弱相关。高维稀疏是由于用户本身的行为多样、差异大。异构主要是由于用户行为大数据在电商、搜索、社交等不同的产品线上积累,呈现不同的分布与结构。弱相关是指相对于人行征信数据,大数据变量与金融场景是弱相关的。但大数据的好处是用户互联网行为产生的非常多可以利用的弱信号。如何利用大量弱信号来构建具有强风险区分的模型,是我们要解决的问题。
另一方面是信贷样本,首要挑战是样本缺少,小贷公司和金融机构的坏账是核心数据,大家希望可以用所有坏账数据做区分能力很好的模型,但当前缺少坏账数据共享的机制,因此带来的问题是样本缺少。样本波动性大也是另外一个挑战。
主要解决方案包括三个方面:
通过集成学习及boosting方法,融合弱特征生成具有强区分度的模型;
利用深度学习,通过降维的方法,解决高维稀疏的问题;
利用半监督学习来解决样本过少的问题,通过少量有标注样本及大量无标注样本生产推广性和稳定性好的模型。
完成申请的用户,需要通过活体识别、声纹识别及手写签名等方案来准确鉴定用户身份,这些能力的基础是百度的paddlepaddle深度学习平台。
关于量化投资,百度利用 AI 技术实现以大数据驱动的量化投资策略。包括四个步骤:投资标的调研、标的筛选、投资组合设定、组合的动态调整。
以搜索数据为例,搜索和股票的市场关注度高度相关,一个股票的搜索量和上证指数的趋势有很强的相关性,加上舆情因子,我们通过搜索量,可以判断买家和卖家的能量积蓄。基于地图的时空数据可以帮助我们判断资产质量,如通过对一个商业地产周边人群的流量、画像分析,可以有效评估该商业地产的价值。
客服是金融业务的最后一步。百度金融通过AI技术,提升金融业务客服的效率,一年内单次服务成本降低了 80%。这80%来自于三方面工作:
智能客服机器人构建,通过问题预测、检索及多轮会话来实现问题的自动服务。最终金融问题解决率接近90%,解决率是通过客户的实际反馈给出的。
对于智能客服机器人未解决的问题,通过人工客服来支持,AI帮助我们通过语音输入、客户意图预测提升客服人效;
智能语音质检,这本身也是一个客服成本,假设有 5% 的客服效果质量抽查率,对应客服的成本就增加5%。通过用 AI 提升质检的效率,做到智能自动检测客服沟通是否满意,对关键业务覆盖达到100%。
这些能力的基础是百度自然语言处理和语音技术。雷锋网雷锋网