在刚刚结束的中国人工智能大会CCAI上,今日头条科学家李磊同我们分享了一些他对机器学习未来发展方向的一些思考,以及在此基础上讨论了一下我们还要做些什么才能向通用型AI再靠近一点的问题。今日头条最初是一家新闻聚合平台,但素有应用AI来解决问题的传统。最近今日头条也做出了自己的新闻机器人,在里约奥运期间自动完成了大量的报道。而李磊作为有着多年机器学习、人工智能和深度学习领域研究经验的科学家。在这个问题上也有着自己的看法。
李磊在演讲中说,要弄清楚我们离通用机器人还有多远,首先要弄明白三个方面:一是人工智能是什么?二是现在我们能做到什么程度?在搞清楚这两个问题后我们才能去研究第三个方面:我们的局限在哪里?我们的挑战在哪里?我们怎样走到明天?
实际上不仅是李磊,有许多嘉宾在大会的演讲和讨论中都提到:我们需要管理好自己和消费者对人工智能的认知。目前大众对人工智能的期待普遍偏高,如果我们没有办法在短时间内将人工智能的实际水平提升到这种期望值的高度(实际上我们目前基本上不可能做到),那说不定过高期望的幻灭会导致新一轮的低谷。所以,我们需要时时刻刻提醒自己目前的人工智能处于一种什么状态。
什么是人工智能呢?李磊说,人工智能其实有两种定义。一种叫类人工智能,就是让机器像人那样去思考,去决策、去解决问题,具备学习能力,同时还能有行动能力。总之,就是一切方面都以人为参考。
还有一种定义叫理性智能。理性智能的目标并不是把机器去跟人比,而是把计算看成是一个自然现象,研究这个自然现象在智能这个领域到底能够做到什么样的合理的水平,以及能够怎么样来做工作。
人工智能的研究内容很广,机器学习只是其中的一块。在具体的一些问题上,人工智能已经达到,甚至超越了人类的水平。李磊在这方面举了很多例子,包括大家都熟知的AlphaGo,机器人看图说话、以及今日头条最近开发的奥运新闻机器人。越来越多以前由人来完成的工作已经可以用机器人来做了。在这些具体的领域内,机器人的能力已经达到甚至超越了人类。
不过李磊表示,我们离通用型人工智能其实还很遥远。他说,在研究中他们发现,深度学习目前最擅长的问题,是那些“有监督学习”的问题。他之前举的很多例子,依赖的都是有监督学习。
不过李磊说,我们要知道,人工智能,或者说机器学习,不仅仅是有监督学习,也不仅仅是深度学习,人工智能需要解决的问题其实比这要多得多。而且目前的深度学习尽管表现的很好,但其实它也有很多局限性。比如它依赖于大量有标注的数据。而过去获得这么多有标注的数据,其实要付出的代价是非常高的,即使是今天,也有很多人没有条件去获取如此多的数据。
深度学习的另外一点局限性是它的通用性还不够强,下棋的程序只会下棋,识别猫狗的程序只会识别猫狗。你让他们去做别的事情,几乎不可能做到。
李磊表示,我们可以尝试去解决,以推动机器学习发展的问题有三个:
一是,我们需要发展它的可解释性,(也可以说是理论基础),当机器学习表现得好或者不好,成功或失败的时候,我们需要从原理上明白它为什么会有这样的表现,这样我们才能从根本上对其进行提高。
第二是:希望机器学习能够做更多的推理,而不是简单的判断。
第三是过去的研究中,发现机器学习需要非常多的计算资源来训练,要使用非常多的GPU和计算机来训练,在这同时也消耗了非常多的能量,李磊表示,他希望能找到一种方法把能耗降下来,在不需要这么夸张的计算能力和能耗的同时,也能达到不错的效果。如果能做到这三点,相信我们在机器学习的研究上能够更进一步。