1月14日,中国金融四十人论坛(CF40)联合金融科技公司资配易召开的2017 “智能投顾”国际论坛在京举行。智能投顾已经流行了很久,但仍然有很多问题不明朗:人工智能用于投资的技术到了什么水平?人工智能用于投资的真实原理是怎样的?它有着怎样的研究方向和制约?论坛上,人工智能加州大学伯克利分校人工智能系统中心创始人兼计算机科学专业教授Stuart Russell(斯图尔特·罗素)在主题演讲中对这些问题进行了阐述。
以下是Stuart Russell教授的演讲实录,雷锋网做了不改变原意的编辑:
我们知道人工智能就是赋予机器智能,让机器能够做正确的事情。对于投资而言,人工智能也就意味着在一段时间之内可以帮助客户去实现最优化的投资。我们看到,人工智能的用途在不断崛起,像无人驾驶汽车在世界上正在发挥越来越大的影响力。通过人工智能也能够得到更加准确的医疗诊断,而更好的搜索引擎交通运输和物流行业也在发生巨大变化。我们也在让机器能够理解文本为人类提供各种问答服务。同时我们也会看到人工智能在投资以及在长期交易、短期承销、承贷、授信方面发挥越来越重要的作用。
我们也看到这个领域的进步正在大幅度加速,AlphaGo在围棋比赛中击败了李世石,不到一年的时间他们就得到这个结果。另外就是计算机视觉,就是人工智能系统可以对于照片、对图象进行识别,这里给大家举了一些计算机智能的例子。最近有一次大规模视觉识别挑战赛,有一千个类别,人类认识视觉认识准确度达到95%,但是在过去五年当中机器的准确度达到了原来的六倍,已经比一个视觉识别的人类专家都要厉害了,这是一个非常重要的进展。因为物体识别能力,目标识别能力是在现实世界采取操作的能力的一个关键的基础,例如机器人的运动。
当然,在这我也想给大家提个醒,人工智能并不像电影和媒体当中有些说法那样,就是机器是具有感知能力或者是有意识的,会统治整个世界,接管整个世界,不是这样的。而且人工智能也不仅仅是深度学习的一个分支或者是大数据的分支。虽然这里面有深度学习和大数据内容,但是还有很多其他的组成部分。而且有一些公司,他们会说我们有人工智能技术,如果你有数据拿过来,我们就能解决你的问题。很多情况下并不可能达到这样的效果,在很多情况下深度学习并不是能够轻而易举地投入使用的。
我想,投资现在是仍然有局限的领域之一。
接下来,我们看一看如何把投资决策看作一个人工智能的问题。
这个问题的输入要素包括每一种金融工具在所有市场、所有时刻的价格信息。现在机器就能访问到这些信息,很简单。还有很多的词语性的、语言性的信息,就是人类产生的各种各样的基于语言文本的信息,像彭勃社、路透社的新闻、上市公司报告、财务报告、政府报告、分析师报告,以及社交媒体上发表的,比如推文,所有这些人类产生的信息都是这种信息的组成部分。
然后就是知识。大数据必须有知识,现在在这个领域当中我们已经有了很多的知识,关于经济、政治、系统的运行,以及行业和地理划分,所有这些都可以帮助我们深度理解其他数据。
最后就是心理,因为我们所做的一切都是和市场有关的,市场上的价格并不仅仅基于现实,而是基于人们对于现实的感觉、感知,所以感觉、了解市场参与方,比如说消费者、买家和企业买家的心里、心态是负责重要的,有这样的信息才能做出预测。
这些是输入要素,输出要素就是买卖这样的投资决策。
这个问题和投资顾问并不完全一样,我讲的是投资决策,投资决策就是如何决定投资买卖,投资顾问是代表了另外一个问题,比如说你可以决定在每个微秒都决定买或者卖,但是不可能以微秒为单位提出顾问的意见。所以什么时候能给顾问意见?每次给多少顾问意见?这是非常重要的决定。人工智能能够帮助系统做出这样的决定。
而在做出了这种顾问的建议之后,你还要向你的机构客户或者其他客户来解释为什么做这样的建议。比如,说你建议买400亿美元阿根廷比索,为什么提这样的建议?你要把你的建议解释好,这样你的客户机构才能接受这个建议,解释是非常重要的。深度学习现在很难做到这一点,深度学习系统可以做建议,但是很难解释这样的建议。另外,你还要判断是否在告知真相,在提供投资顾问服务的时候,有的时候你表述的并不是整个真相,因为有的时候顾问仅仅是想说服客户采取一定的行动,有可能向他们隐藏一部分真相,想他们的决定对自己有利。
这样我们看看决策的问题。
因为我们刚才讲到了顾问的问题是非常有意思的,但是更加有意义的问题是买多少、卖多少。我们可以将之视为一个数学问题,首先我们有非常大的动作操作空间,在每一个微秒当中你都可以在任何一个市场买卖任何数量、在任何价位上的金融工具。如果你有能力做一些衍生品合约的话,在每一个微秒当中,你能够自动构建衍生品合约的数量也是无限的,复杂性也是无限的。所以,可以做什么选择是无可限量的。
另外,市场上有很多代理人、中间人。在下围棋的时候只有两方,但是在投资市场当中有数以百万计的组成部分。而且投资时间尺度非常之长,无论是个人投资者还是机构投资者,我们可能是希望实现十年的投资回报的最优化。而我们又是可以在开展微秒级的交易。所以我们可以做10的14次方次数的决定,而在下围棋的时候只要做100-200次决定,这样时间尺度就比下围棋和其他决策时间要长。
另外,对于这种动力机制,我们仅仅知道其中一部分,像围棋的机制我们知道的很清楚了,但是像市场和经济运行我们只知道其中一部分机制。
而且,数据有很多的噪音和杂质,围棋比赛是一目了然的,但是在投资过程中有很多噪声要过滤掉,我们拿到的很多数据是虚假的,可能是人们在推特当中发表的信息,恰恰是为了操纵信息的,假新闻、假数据,都是我们要对整个环境进行理解的一部分。
最重要的是,在投资决策当中,我们无法直接观察到很多的部分,虽然我们看到各种各样的价格,各种各样的新闻,但是我们不能够直接的看到实体经济、政治领导人的心态,所以大部分影响价格的因素是我们看不到的,我们必须要理解,从整个输入要素历史当中加以理解,并且理解整个市场和经济体背后运行的机制。
我们现在看看时间尺度。
市场中有长期、中期、短期投资顾问,有一些人通过机器人顾问按年度来做决策。而在另外一个公司,在另外一栋楼里面,另外一个人是按一周或者是一天的投资尺度进行投资,比如说日间交易。此外,在另一个公司另一栋楼里面,会有人按分钟级作出预测,为今后预测接下来几分钟的价格的走势。还有一些高频交易公司,他们的投资决策或者预测的时间的尺度放到了秒级以及微秒级,所以有很多情况。
在绝大部分情况下,我们都是对于中长期回报感兴趣,但是我们希望以不同方式达到这个目标,我们真正希望的是把很多时间尺度决策集成在一起。比如,对于高频交易系统来说,高频交易系统指导的原则是近期的迫在眉睫的时间尺度,就是在他们时间尺度当中情况变化、环境变化,对他们的系统在设计上和用一个月、一年理解情况的系统是不一样的。也就是说,这样一个高频交易的系统,他们是只能判断他们被训练认识的经济形势。
这种多种时间尺度的融合和在座各位的情况非常类似,因为我们在座每个人要做的恰恰是这样一个决策,比如说我们自己决定上大学,或者送孩子上大学,这是一个跨越多年的时间尺度的决策;当你打字的时候,可能你希望往这个方向打,往那个方向打,这是一个微秒级的决定;然后待会儿去哪吃午饭,是不是开这个会?可能是一周以后的事情,一周的时间尺度的决策。所有这些决策实际上是集成在一起的。手的运动的微秒级的决策是受到你的分钟级、小时级、周级、月级和年级的时间尺度决策的影响,人类决策就是这样。
但是这样一个决策机制现在并不存在于我们投资决策当中,这是我们必须要推动的一个最大的变化。
接下来,还有一些非常有意思的问题:如果系统是按照一年期作出决策的,这样一个系统对于决策,对于分钟级和小时级的决策能够做出什么建议呢?实际上对于这个疑问并没有什么研究结果,但是从更高的层级来说,主要是要理解微观经济方方面面的要素,通过微观经济这些要素来帮助我们解读高频交易当中秒级的情况的变化和解读。
接下来,我想谈一谈市场动力学当中的隐性状态。比如说,一家公司的品牌价值,你不可能让彭勃社来告诉你一家公司品牌价值是多少,有些公司品牌价值需要你自己计算。你要知道他在研发方面、广告方面、商誉方面做了多少投资;对于一家制药企业他有哪些药物在研发,对于一家石油公司你要知道哪些油层;对于物流公司来讲,你要知道他要吸引那些客户。所以我们要通过估计去了解,这是一些隐性状态,但是又影响了价格。
刚才我讲了市场心理非常重要。比如说大家可以想一想,你要去做一个决定,要不要买通用电器的股票,一旦有了这样的股票,买入这样的股票,不到万不得已,你不会以割肉的方式销售。所以当他面临一个卖出GE股票决策的时候,他是什么样的心理状态——我们必须要理解。另外,对于所有决策,包括微秒级的决策,不一定是基于最新的数据,他是根据历史数据,以及对于隐性状态、方方面面的理解结合在一起做的决定。
我们来看一下典型的机器学习的决策模式。
从60年代以来已经出现了这样的思路:对于短线的决策很简单,收集大量数据,再看一下历史上发生过的情况;上一次危机是什么,然后我们通过统计学的正相关性来做出决策。也就是说,我们把数据拿过来,用各种各样的预测技术,无论是深度学习还是什么样的预测技术。以前这种叫做合适机器,还有决策树,还有回归法,不管用哪种最流行的方法,你可以用这样的机器学习方法做预测,用到你下面做的新案例进行决策。但是,当你的预测基于并不容易获得隐性信息的时候,这个方法就不适用了。
小数据会带来一些问题。
比如,最终达成了巴黎协议,是关于气侯变化的,而且这个协议非常强有力,大家都感到很惊喜,很多国家已经签约了。但是在数据当中,会有多少个“黎气侯协议”呢?在机器学习当中,这对于价格变化的意义为零,比如说它对价格发生什么影响?或者有多少类似于英国脱欧和特朗普当选的事件对经济的影响,这个也不容易用到。有多少次巴拿马运河因为恐怖行动而关闭?因为之前没有。你要了解地理、供需、石油等等通过运河的供需,否则你很难做出判断,不是说用深度学习的逻辑在瞬间可以判断的,必须对全世界有透彻的了解,而且市场的情况在不断发生变化。比如说很长一段时间美国的利率基本上是接近零,欧洲也是这个情况。一旦利率发生变化怎么办?过去五年当中我们训练机器的时候,利率都是接近零,一旦加息他就适应不了了。实际上人类在确保高频系统的设定假设没有发生变化,但是一旦关系发生变化,他们就会产生灾难性的失败的决策。
给大家举一个例子,这是买书和卖书,这是生物的一个纸质书,可能合理的价格是20美元一本,现在有两个机器人卖这本书,一个卖1800万,一个卖2300万,这就说明的机器人系统,我们对他进行的培训的机器学习系统,他很多东西不理解。另外还有2010年的时候,一个事件,机器人的失控造成了一万亿美元亏损,这就是市场上的条件发生了变化,这个变化发生在0.1秒,这是一只个股交易当中出现的问题。经常我们看到有一些个股会出现股价瞬间的崩盘,甚至去年10月份英镑在几秒钟之内突然兑美元贬值10%,没有任何人类介入。所以这些自动化算法,不了解一些基本面,一旦出错会带来非常大的问题。
同时我们看到机器学习当中会有一些缺失信息,或者假的数据,假的信息。这样的话就会使一些算法本身有一些混淆,导致了决策的不正确。你在做决策的时候,机器的语言处理 如何使用之前不存在的数据呢?这些都是需要解决这些问题。
最后我们要看一下一些基本面。有关于全球基础的知识,也许此前我们并没有知道跟机器语言有什么关系,但我们发现基于模型的方法,包括宏观层面和宏观层面都有这样的优势,它们可以做很多的预测,而且是基于零数据或者是很少的数据就可以作出预测。但是他们非常昂贵,不会找一些刚毕业的学生,因为他们都不了解这种机器,必须要雇佣那些了解市场、了解很多历史知识,而且了解怎么样使用数据的学生,或者是毕业生。另外,要看一下你如何控制这种变化,而且对于任何一个投资公司来说,只有有这样的人,你才能用它管理巨额的资产。
另外还有一种趋势,在个人理财当中经常会发生的一些事情,很多个人也需要理财建议,不光是大公司,不光是买卖股票。另外,就是如何去买一个咖啡或者是付我孩子的学费,如何找一个更好的房子来投资,这些都是个人需要的建议,现在银行无法提供这些信息。因为如果要把所有建议提供给普通大众,成本太高了。但是现在人工智能就可以填补这个空白,不光是可以分析一些重要的股票,而且最基本的一些个人的财务状况也可以进行分析,从而给他们进行一些个人化的理财建议。
另外,从技术角度来说,这种深度学习与模型式的算法,都在相互不断地结合来使用人工智能,以让我们建立越来越多的复杂的模型,而能够基于真正的环境和真正的知识帮助人们做出更好的投资决策。对于未来投资的人工智能的应用,就可以产生更高质量的决策,而且是惠及所有人,降低成本,提高质量。
人工智能将在投资中的决策日益重要,我认为重要的是这个决策不光是在不同的时间序列,而是在整个不同的时间空间当中都能进行决策。不只是市场的趋势,隐性状态和动态都是非常重要的,而且在这样的情况下将更加准确。比如,沃伦巴非特进行决策的时候,他要了解一个公司的基本面,以及经济的基本面,包括政治因素。沃伦巴非特在投资方面是非常成功,我们是不是可以建立一个基于沃伦巴非特这样方法投资的机器呢?
最后,在投资顾问方面,我们人类将在很长时间内仍然发挥重要角色,不可能在短期被人工智能取代,但是人工智能可能提供一个非常好的工具,只是还是需要人类提供指导,包括了解我们的基础,经济的基本面结构,以及对于模型进行一些升级。所以在不同的时间序列方面都是需要人的干预。
后记:人工智能的本质并非类脑计算,这在雷锋网此前的报道中也有详细讲述。只是,如今大部分人对人工智能本身以及应用的认识都存在一定偏差,据雷锋网现场了解,包括智能投顾的最大需求方——券商的领导们。因此,对于人工智能,我们还需以理性的态度来做更加全面的了解。
搜索ID:aijinrongpinglun,或者扫以下二维码快速关注【AI金融评论】,回复“罗素”可获取Stuart Russell教授演讲中文版PPT。