雷锋网按:11 月 6 日,京东举行 JDD 京东金融全球数据探索者大会,在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践 。其中,国际人工智能联合会理事会主席、香港科技大学计算机科学及工程学系主任杨强作了演讲,从学界角度探讨了人工智能技术的商业化,以及人工智能在金融领域的应用场景。
杨强认为,算法应用到实际场景中需要满足三个方面的要求。第一,算法的闭环路径要短。第二,反馈一定要是足够高频、高通量的反馈。第三,反馈效果一定要起到一个复合作用。
其次,他表示,技术风口主要有基于图像的学习和理解、自然语言理解、智能推荐、迁移学习四个方面。
而在技术革新和商业应用的结合点,他特别指出金融行业是拥抱智能时代的领跑者。在金融里面有各种各样的应用场景,比如和用户沟通的场景、金融安全、活体识别、人脸识别、声音识别、行为识别等等。另外运营、投顾方面都可以借助于人工智能大量加强提高效益。
今年的 JDD 赛事中也紧贴金融行业的应用场景,主要包括登陆的行为识别,信贷需求预测以及店铺销量预测,猪脸识别。
以下为杨强演讲内容实录,雷锋网在不改变原意的基础上进行了编辑。
刚才我们听到了几位从不同方面给我们解读了人工智能、金融、大数据方面的前景,我要讲的是从另一个方面来看这个问题。
我是一个做学术的,同时我对商业也有着浓厚的兴趣,所以我想从从学术的角度来探讨一下商业的问题,我们会得到哪些新的发现?
人工智能成功的商业模式
首先来看一下 AlphaGo 的成功能够引起了很大振动,我们从中能学到什么,对商业方向有哪些指导。
AlphaGo 本身是几种算法的结合,包括深度学习、强化学习,算法和环境有一个有机连接,那么环境不断给算法提供反馈。深度学习既能告诉你当前状态,又能为未来行为提供一个指导。
这样一个算法是不是可以应用到实际当中去呢?
第一,闭环路径要短。商业路径也好、算法路径也好,它的中间最好不要有过多环节,比方说从用户到得到反馈,到反馈到AI的算法得到补充,最后再返回到应用,这个闭环要足够短。
第二,反馈一定要是足够高频、高通量的反馈,不断得到反馈,系统得到刺激,这样智能才能够成长。
第三,也是大家过去比较忽略的,反馈效果一定要起到一个复合作用。我们在经济上经常讲复合收益,在人工智能上这一点也是非常重要的。也就是说,这一轮的反馈对系统增益要持续进行,就会有一个指数型收益上升。
我们再看看周边实际遇到的问题,是不是有很多类似场景满足这样的需求呢?
我们回顾一下人工智能的里程碑。1997 年,我们有深蓝,然后 2011 年的时候我们有 IBM Watson,最近我们又有了 AlphaGo,无人车,包括最近有了德州扑克,这些都是我们引以为豪的人工智能。
在这些里程碑的成功背后是不是路径闭环足够短,反馈足够频繁?另外,复合作用是非常明显的,系统在不断改进自己,智能在提升。
再看一下周边工作,我就有一个想法:人工智能在现阶段的应用并不是在所有领域都会取得成功,我们一定要非常仔细挑选在哪些领域人工智能比较容易得到成功,在哪些领域还要等一等。
所以,下面就来看一下技术和商业这两方面到底哪些是我们现在可以得到效益的风口。
首先是技术风口。人类的知识获得 70% 以上都是通过视觉的,深度学习的发展肯定对人工智能应用、对人工智能技术而言一定是持续发展的。比如,用更好的深度学习、可解释的深度学习,包括理解物体之间的关系,以及通过一个视频可以理解里面的一些人类能理解的摘要,把它给取出来,为人类和计算机的模型进行沟通。
自然语言紧随其后。包括文本阅读、理解、产生、问答、分析等等,现在深度学习都带来了非常大的提高。但是,这个提高还是要随着算法的提升有待进一步提高,从而在在使用当中能够产生更大的效益。
另一个是智能推荐。在电商的网上购物等等都有,但推荐的一个重大问题是我们很容易陷入一个所谓的深坑,也就是在机器学习技术上所说的过拟合:当我们点击了一个在手机上的新闻,我们会得到好多类似的新闻,而不会顾及我们对其他(新闻)的兴趣。
怎么样解决这些问题呢?这就是技术革新所期待的,我们也在不断做新的研究。
还有一个就是我个人研究的迁移学习。人类很自然就会使用迁移学习,比方说我们在一个领域很专业,怎么把这个知识迁移到另一个领域,能不能让计算机也有这个能力?有很多专家认为这就是人工智能机器学习的下一个热点。
迁移学习也会带来很多技术革新。比如我们可以在一些小数据上面应用大数据得到的结果,在一个领域得到一个非常好的模型,可以把它迁移到周边一些小数据模型,这个也是人类学习的一个有效模式。
迁移学习也可以使得模型的可靠性得到加强。一个模型产生了,我们可以让它在不同场合都适用,这个模型就更加可靠。
再有越来越多的个性化需求,在场景当中经常听到这样的名词,千人千面,这样一个场景可以用迁移学习实现。比如如果在云端得到一个通用的模型,可以把它适配到各个终端,使它在不同的终端就有不同模型体现,这样就实现一个个性化。
它带来的另外一个好处就是迁移学习可以解决隐私问题,每一个终端用户都不必把他的个性化数据上传到云端就可以得到它的结果。
迁移学习不一定是一步到位,从一个模型迁移到一个场景,我们可以通过一系列场景把一个模型迁移到不同的更广泛范围,比方说一个手段就是用深度学习来做迁移学习,这也是我最近一个研究方向。
一个实际应用是最近斯坦福大学和联合国共同做了一个应用,利用卫星图片分析非洲大陆不同地区的贫困程度。利用这种所谓传递式迁移学习,就大量节省了人力。过去是要派一些观察员到本地去做各种积累、各种调查,现在就用卫星图片把白天和晚上的地球图象加以比对,最后训练出一个模型,大大节省了人力。
这里我们看到这些技术可能的革新,这些技术革新和商业应用方向有哪些是最契合的?这里我要特别提金融方向。我们之前提过,一个是闭环的路径要短,一个是沟通要高频,最后要有复合效应产生,很快让模型能够变得壮大。
人工智能在金融中的应用
金融就是这样一个领域。我不用多说大家也明白,在金融里面有各种各样的场景,和用户沟通的场景、金融安全、活体识别、人脸识别、声音识别、行为识别等等。在后端,可以对用户整个风险进行分析,是不是应该借贷。做一笔投资,在这笔投资之前要进行风险分析,现在基于大数据和人工智能可以自动产生这样的分析,像个人和企业征信。
另外运营、投顾方面都可以借助于人工智能大量加强提高效益。经济本身就是一个不断提高效益的过程。现在人工智能又为经济效益的提升提供了一个强大动力。刚刚讲的风险管理这里面又分监控、识别、评估和干预,每一个方面都可以有大量的人工智能参与。
一个很有趣的例子是从京东金融本身实践得来的,就是人工智能可以帮助养鸡,是一个非常有趣的应用。
过去一个养殖户用 12 块钱养一只鸡,需要提前贷款,贷一笔很大的款放在那儿,这个时候就产生了很大利息支出,这对养鸡户是一笔很大的费用。但是在鸡成长过程中,小鸡不需要吃那么多饲料,只有长大的时候才吃。不同的鸡对不同饲料需求也不一样。
当我们能够掌握这个过程的时候,我们就可以把放贷变得因地制宜,在一开始养鸡户不需要借这么多钱,过去逐次增加。所以如果我们能够做到按日计息就可以做到这一点,就能够大大提升效率。现在京东金融可以做到 6 分钱就养一只鸡,用人工智能算法来做分析。
同时,我刚刚提到推荐系统,大规模机器学习系统当前共有的一个问题是过拟合,这是为什么呢?这是因为在技术上,它没有照顾到两个需求,一个是准确性需求,一个是多样性需求。
现在我们在研一个强化学习模型,能够把两个需求全部照顾到,这个名词叫迁移的匪徒模型。用这个模型既照顾到准确率,又照顾到多样性,就把过拟合的问题彻底解决。
最后,我要说一下 JDD 背后是一个大赛,同时在中美两边进行。在学术界大家都听说过KDD即数据挖掘和知识发现,这样的大会已经有 20 多年的历史,而且每一年都有一个大赛,就是由工业界出题,也变成了我们发现一些优秀团队的一个方式。
今年的 JDD 也采用了这样一个在金融方面的机会。今年的机会来自三个方面,都是紧贴着金融应用。
一是登陆的行为识别。要发现有没有可能是欺诈行为,这里面需要深度学习,需要了解一些金融知识,所以需要两方面知识。这也是 JDD 大赛的一个特点,我们不仅要技术上的革新,同时也需要这些参赛队伍能写出一个商业计划,能把商业场景想清楚。
二是金融界非常关键的一个需求,就是信贷需求预测,还有店铺销量预测。
还有一个非常有趣的识别——猪脸识别,不是人脸识别。
猪脸识别是需要做什么呢?首先我们可以获取到大量数据,而不用担心隐私问题,我们想猪可能不太关心隐私,同时又是一个活体识别问题。
这确确实实背后有一个商业场景问题,可以设想一下,假如有学生参加这个比赛,一个场景就是它可以帮助养猪户鉴别不同的猪在养殖过程中的各种活动,这个猪是不是活跃,它是不是散养的或者它还是一只非常不爱动的猪,由此对健康就可以作决策,对保险就可以作预测。
另外消费者可能也会有挑选,有人可能喜欢不同的猪肉,可能对猪的鉴别就有个性化需求。所以这既有深度学习应用,又有商业应用,是非常有趣的一个题目。
我们很期待这样一个学术界和金融界的结合。
*雷锋网整理