在大数据、人工智能、区块链等技术奔涌薄发的时代,金融成为最佳首选落地场景。不论是理财投资、保险、信贷、房地产等传统金融业务领域,还是市场分析、征信、风控等技术环节,金融科技的介入让这个古老的行业再一次迎来翻天覆地的变化。那么,在技术带来业务革新的过程中,业界都遇到了什么问题,有什么最新的实践经验可以参考?面对威胁,传统金融业的出路在哪里?
为了解答这些疑问和探讨行业的未来发展,在由中国计算机协会CCF主办、雷锋网和香港中文大学(深圳)联合承办的「CCF - GAIR」全球人工智能与机器人峰会中设置了金融科技专场。雷锋网邀请了产学研各界十数位大咖为我们奉上了精神饕餮盛宴,涉及人工智能、大数据、区块链与智能合约、智能投资、智能投顾、智能营销等金融科技领域最热的话题。由于各位大咖们的研究领域、研究角度都不同,接下来的内容将会划分为“学术前沿”、“产业前沿”两部分。
如果将科技研究比作在广阔的森林里有目的的寻找,学术研究就是在千万次试错中发现新风景。
雷锋网邀请到了数位桃李满园的学术泰斗,包括英国皇家工程院院士、原牛津大学计算机系主任Bill Roscoe教授,香港科技大学张晓泉教授,北航区块链实验室主任蔡维德教授,中科院计算所副研究员罗平。
作为金融科技专场的开场嘉宾,Bill Roscoe教授分享了凝结着他三十年研究经验的技术专利,包括信息安全、计算机验证、智能合约等方面。
两级密码系统
该系统是对密码学老问题的创新解决方案,密码学老问题是:如何分辨错误和恶意攻击?而密码越复杂安全,用户出错的几率越高。
这就涉及 PAKEs,一个密码验证、密匙交换的协议。当双方需要在不同的系统上搭建一系列的交换或者建立安全通道,需借助它建立密码安全加密链接。这时就要针对每组密码需要满足的目的,基于签名建立一套标准,利用该标准选择密码。该标准看起来会像 hash(ps)<C。C 控制能通过系统验证的随机字符串比率。
加密签名
数字签名现有的方案仅仅使用 hashing,比如 Lamport。它的方案对于每一个数字、每一个字位、每一个比特都有公匙和密匙,提供单独签名。
但有一种全新的解决方案: temporal signiture (临时签名)。它完全抛弃了公钥和私钥之间的差别,假设一个各方同意的、可靠的时间标准,比如区块链。对于每个密钥要经过的三个阶段:未确认、保密、公有。该方案中,初始有效密钥只需经过后两个阶段。
此外,他表示,目前所有的密码学签名都假定某数学问题难以破解以此来保障安全。而在未来,业界能够借助量子计算来对重要信息进行加密,保证信息数据。
张晓泉是香港科技大学商业统计及运营学系教授,擅长领域是信息产品的定价策略、大数据营销、商业人工智能以及互联网金融等。作为本场唯一一位经济学家,他认为,经济学也可以助力 AI。经济学家和计算机专家研究人工智能的最大不同在于,机器学习在做的事情更多是预测和分类,而经济学家的研究目标是解释清楚事情的底层机制,发现因果关系。
张晓泉教授还提出,决策场景中存在五个级别的不确定。
第一个是 Certainty,也就是 100% 会实现的。
第二个是 Risk 风险,有概率出现。
第三个是 Black Swan,也就是小概率事件,虽然概率小,但会发生。
第四个是 Ambiguity 模糊性,“比如即便我有世界上过去所有股市的数据,我仍然不知道明天会涨还是会跌,因为有很多影响的因素”,这就是模糊性。
最后一个是 Radical Uncertainty,“当你有这种 Radica Uncertainty 的时候,你是没法描述这件事的,无法写一个模型来预测恐怖袭击会在什么时候、哪里、怎么发生”。
在这五个级别中,第二级别囊括了世界上的绝大多数问题,第四和第五级别是人类目前无法解决的,而他正在研究第四级问题。
蔡维德教授是北航区块链实验室主任和天德科技首席科学家。研究领域是高并发的大数据版区块链,而他领导研发的北航链去年宣布交易速度已超过4万笔/秒。蔡教授认为区块链将成为新计算基础设施。值得强调的一点是,他表示区块链与去中心化没有关系,只是一种分布式技术。
同时,他还提到两个研究进展。
一,由于美国交易后金融服务公司 DTCC的‘净额结算’流程处理方式有问题导致区块链无法完成结算,蔡教授团队的解决方案是:存储所有交易主体全部历史交易信息和余额信息,从净额结算到大数据版区块链,并提供监管节点。
二,区块链互联网将成为行业新趋势。区块链互联网分为异构网络和同质网络两个类别。如同互联网也有着各种局域网、广域网,未来也会有很多区块链,因此需要组织一个区块链互联网,来做好链之间的交互。
“ 其中涉及的层面很广,包括技术(例如新的 TCP/IP 协议 和 能被区块链支持的新版 ISO 20022)、商业、联盟、国家,甚至是草根力量,但是目前区块链互联网的规则是空白。多链架构会是未来主流,区块链的互通和网络设计会推动行业的大洗牌。”
最后一位学术型嘉宾是中科院的罗平博士,他的研究领域主要是机器学习以及大数据。罗平告诉雷锋网,他的研究逻辑是,扎根金融领域探索实际问题,再进行抽象研究。不同于前三位嘉宾关于底层技术、研究思想方面的演讲,他分享了一个将AI应用于投行领域的具体项目。传统投行人员工作中需要接触大量的金融文档工作,而撰写操作风险高,有可能造成很高的声誉和经济损失。
为了解决困境,罗平团队正在研究一种智能化处理金融文档的技术。其中的核心技术称为 Text2Tuple & Text2Equ,即自动提取元组和公式,生成明晰的数学表达,将非结构化、半结构化的金融文档(公开或非公开),分解重组成可供计算机搜索、比对、分析的结构化数据。并将这一结构化数据应用于金融文档的智能撰写、智能合规、智能风控、智能审批、智能审计等。
目前已经研发上线了一款名为 AutoDoc 的金融文档处理工具,以及一个名为 NeuSALG 的智能化金融通路平台。
近几年由于大数据的发展,业界和学术界的研究水平差距已经变得很小,两方互通有无,合作变得愈加频繁,形成了良性循环。张晓泉教授在接受雷锋网专访时表示。
学术研究是找寻新风景的过程,接下来的产业应用则会开始实地探测、挖掘金矿。了解业界金矿的挖掘现状也非常重要。因此雷锋网也邀请了几家在各自领域影响力巨大的企业分享他们的Fintech发展之路。
其中,有两位来自传统金融机构的嘉宾,分别是平安科技首席科学家肖京、中国银联区块链负责人周钰。
肖京博士毕业于美国卡内基梅隆大学计算机系,是国家引进专家之一,擅长于人工智能与大数据分析挖掘。作为Fintech的先锋者,肖京总结了平安的三个IT化建设阶段:
信息化阶段,平安集团在四年前打通了各业务数据体系,实现信息化,让公司的业务人员和决策者能够快速获得信息,做出决策;
数据化阶段,公司把信息存储下来做分析统计;
智能化阶段,公司不仅可以把数据存储下来做分析,还可以做深度挖掘,帮助我们更好的做决策甚至自动做决策。
他还表示,人工智能目前存在一些不足,即机器只能告诉人们会赢,但没法说明为什么会赢。而在金融决策时,必须要使用量化的数据和信息。此外,金融以及医疗行业很多情况下获得的数据量很小。基于此,平安科技提出了三大改进方向,一是可解释性,二是小数据学习,三是记忆增强神经网络。
周钰是专场的压轴演讲嘉宾,他带来了题为《金融机构的区块链技术研究与实践》的分享。他谈到,作为一个时常要“被颠覆”的机构,银联从2015年就成立了团队开始研究区块链,主要从三个方面开展:技术评测、技术应用、数字货币。
银联总结了几大实践规律。
第一从简单场景入手,区块链的“去中心化”在理论上适用于复杂场景。但这会面临工程可行性上的困难——比如,参与方越多,协调观念和理念的沟通成本越高。
第二从核心业务到非核心业务,不会从核心业务领域开始应用,会从外围业务探索区块链。例如电子票据、跨境对账业务、POS电子签购等。
他还表示,银联很适合牵头应用区块链,因为天生是一个传统的被信任的中心,银行之间的合作通常又需要一个可信任的第三方。
传统金融机构在努力求变,Fintech公司也坚持着不断探索。作为金融行业的新玩家,他们也不少实践心得。出席的嘉宾分别是通联数据CEO王政、百度金融高级科学家吴健民。
在加入通联数据之前,王政曾任巴克莱全球投资公司基金经理、博时基金股票投资部总经理、ETF及量化投资总监等职,拥有近20年资产管理、金融信息平台研发和大数据研究经验。
王政指出,与用AI下围棋不同,在投资博弈过程中,只有部分的规则是明确的,边界也不够明确。但无可辩驳的是,金融科技正驱动着投资行业的变革,我们开始迈入智能投资时代。
具体来说,智能投资包括四方面,投资研究、组合管理、风险管理和财富管理。其中,王政又着重分析了智能投资和智能投顾。他表示,知识图谱技术能在智能投资中发挥巨大的作用。至于智能投顾,简单来说就是让系统来帮助用户做资产配置。
最后,王政总结了人工智能对投资者的三点帮助,第一可以提升投资研究的效率;第二在数据驱动下,能随着不断变化的市场调整投资研究体系;第三打造机器人基金经理,完成投资管理全流程。
在加入2014年加入百度前,吴健民先后就职于雅虎北京研发中心、腾讯,从事分布式机器学习算法与搜索相关的工作。在演讲中,他介绍道百度金融已经确定7大技术方向,分别为智能获客、身份识别、大数据风控、智能投顾、智能客服、金融云、区块链。并重点介绍了智能获客和大数据风控。
智能获客的核心是降低获客成本,通过三个步骤来实现用户需求的精准的定向及满足:
刻画用户的金融画像及需求,需要做到全面、准确且能够及时触达;
生成与场景自然切合的动态创意;
通过响应模型准确匹配金融产品与用户的需求。
大数据风控主要有两方面挑战,本身特征是高维稀疏、异构、弱相关;信贷样本少且无共享机制。针对此,解决方案有三点:
通过集成学习及boosting方法,融合弱特征生成具有强区分度的模型;
利用深度学习,通过降维的方法,解决高维稀疏的问题;
利用半监督学习来解决样本过少的问题,通过少量有标注样本及大量无标注样本生产推广性和稳定性好的模型。
第二届CCF-GAIR在今日落下帷幕。三天十一专场,除了金融科技专场,还包括计算机视觉与NLP、自动驾驶、医疗机器人、机器人与自动化、CV+、AI+创投等多个火热议题。
其他场次受邀嘉宾还有中国工程院院士、原常务副院长潘云鹤教授, 中国科学院院士、英国皇家工程院外籍院士谭铁牛,美国人工智能学会主席、亚利桑那州立大学教授Subbarao Kambhampati,美国工程院院士、卡内基·梅隆大学教授金出武雄教授,伦敦大学学院教授汪军,IEEE Fellow美国工程院院士Vijay Kumar等,不胜枚举。此外,会场还设置了几十个企业展区。
一位与会嘉宾多次向笔者表示“人山人海,规模盛大”。今年没来的朋友们,明年约吗?