由中国计算机学会(CCF)主办、雷锋网与香港中文大学(深圳)全程承办的 AI 盛会 --「全球人工智能与机器人峰会」(CCF-GAIR),将于 7.7-7.9 日在深圳召开。
CCF-GAIR 为国内外学术、业界专家提供一个广阔交流的平台,既在宏观上把握全球人工智能趋势脉搏,也深入探讨人工智能在每一个垂直领域的应用实践细节。
在去年的 CCF-GAIR 上,香港科技大学计算机系主任杨强教授亲临大会现场,并做了题为《人工智能成功的几个必要条件》的主题演讲。而 CCF-GAIR 2017 再次荣幸地邀请到了杨强教授担任本届大会的程序委员会主席,并将在 7 月 7 日「人工智能前沿专场」的「AI 学术前沿」Session 担任主持人。
时隔一年,杨强教授在人工智能领域又有了哪些全新的思考?为此,杨强教授近期与雷锋网 AI 科技评论进行了交流。
回忆起去年的 CCF-GAIR 大会,杨强教授表示印象最深的一点在于与会者人数很多,且交流的热情非常高涨。据组委会统计,CCF-GAIR 2016 共邀请了 8 位顶尖学术院士、25 家前沿创新企业、100 位技术创新领袖参与,并吸引超过 1200 位行业精英到现场交流,是一场融合了产业界与学术界的盛会。「工业界可能更加关心落地的需求,而学术界会更关注展望与前景方面的内容。」杨强教授认为,工业界与学术界能拥有这样一个平台进行观点的碰撞,实际上是挺有意义的一件事情。
作为 IEEE、AAAI Fellow、人工智能和数据挖掘专家,杨强教授在去年大会的演讲令人印象深刻,他提及人工智能成功必要条件包括清晰的商业模式,高质量的大数据,清晰的问题定义和领域边界,擅长应用和算法、懂人工智能的跨界人才,以及计算能力等五个条件。
此外,他也强调了迁移学习在未来的重要性。迁移学习,顾名思义是将深度学习与强化学习叠加的一个结果,算法模型能够将已有的一个模型迁移到一个新的领域。
值得玩味的一点在于,目前学界的一大研究趋势是「小数据」,即通过更少的数据训练模型,这也与杨强教授所提倡的「迁移学习」特性相符。但杨强教授同样也强调了大数据在商业化的重要作用,那么二者是否代表着学界与产业界的两种研究路径?
杨强教授在去年 CCF-GAIR 上表示,「大数据设计出来的模型用于小数据上,它的副产品就是个性化。这就是迁移学习的目的。」而在与雷锋网 AI 科技评论交流时,杨强教授认为这二者并不相悖,而是一种研究的分工:「从学界落地到产业界需要经历一个时间差,当前凡是成功的案例都依赖大数据,如 AlphaGo、智能推荐系统、图像识别及无人车等;而目前小数据的应用场景尚不成熟,学术界现在也需要将重点放在小数据的探索上。」
而在迁移学习领域,杨强教授表示目前人在知识迁移领域可以做得比较自然,研究者也一直在模仿人做知识迁移的工作。但现在,机器在知识迁移的规律上可能有着截然不同的逻辑,因此研究者也开始尝试几种不同的做法。
第一种尝试是将结构与内容进行剥离,前者的迁移相比起后者要容易一些。
第二种则是通过深度学习来达到迁移的效果。以往深度学习在分层时,研究者可能只是笼统地觉得,不同的层可能具备不一样的迁移能力,但目前研究者们开始关注迁移能力的定量化。
第三种方法则是采用模拟的方法产生数据,这种方法以 GANs 为代表,通过设计一个模拟器产生数据,再用另一个判别器识别生成数据是否有效。「这样一来可以生成很多新的数据来解决小数据的问题。」
「机器学习一开始也有很多专家在背后进行算法的设计,但最后的理想状态,应该是系统自动进行学习。」杨强教授表示,目前也有一些实现的路径。一方面是做出一个易用的机器学习服务平台,在上面积累不同领域的经验与数据。杨强教授表示,团队此前尝试做过没有源领域的迁移,即在众多数据中找到一个最合适的大数据,并适配对应的迁移方法,为当前的小数据领域来服务。另一方面,研究者可以在统计学习的基础上,让统计知识向逻辑知识的路径上更进一步。
算法的设计与性能的提升只是一部分,更重要的问题是商业化落地的可能性。杨强教授在去年 CCF-GAIR 大会上提及,金融领域是他最看好的 AI 应用方向。
为什么是金融领域?杨强教授告诉雷锋网 AI 科技评论,主要有三个原因。首先是数据方面。因为金融因为有监管的要求,所有数据需要进行报备,反而使得经营的数据特别全。其次是金融领域的竞争比较直接,如果比竞争对手快一秒,或是正确率多 1%,可能市场份额就会发生根本性的改变。第三点在于金融领域的链条比较短,没有实体经济的「摩擦力」。「从得到反馈到系统更新的整个过程链条非常短,因此做端到端的机器学习相对容易些。」
而回顾过去一年的变化,杨强教授也惊喜地发现,场景式的人工智能已经找到了属于自己的位置,并且开始发挥它的作用。以亚马逊为代表,Echo 获得了巨大的成功,已经成为智能家居的重要入口,能让人在安静的家庭环境下表达自己的意愿。「去年大家可能还在宣扬通用型的人工智能,此外 AI 威胁论也比较盛行。但我觉得到了今年,大家在这一方面开始认识得比较清楚了。因为有很多公司的产品现在开始碰壁,有好些普遍认为人工智能积累比较深厚的公司,现在所拿出来的成果也比较有限。」
一个典型的例子便是医疗领域。在杨强教授看来,医学影像会成为人工智能在医疗领域的第一个落地点,但如果涉及到诊断或健康保障方面,囿于数据的质量及结构化问题,以 IBM Watson 为代表的公司所面临的困境也比想象的大。「相反,那些场景比较清晰的,像京东的物流与仓储,或是微众银行的客户需求,在人工智能的渗透上就做得比较扎实。」
在与雷锋网 AI 科技评论交流的时候,杨强教授表示,目前国内的 AI 创业公司主要分为两种,一种倾向于只关心技术,而另一种则有具体的场景和数据,这也是他个人更加看好的。「人工智能目前要完全颠覆一个领域的可能性还是比较渺茫,比较成功的案例还是集中于渐进的模式。也就是说,人工智能作为整个产业链条的一部分而存在,但并不会取代后者。因此,数据需要不断循环更新,而场景则提供了数据更新的环境。」
值得一提的是,与 CCF-GAIR 同期举行的「AI 最佳雇主」颁奖典礼,正是组委会针对人工智能与机器人前沿领域而评选的一份榜单,旨在探寻一批国内最具创新力量、最具价值的 AI 创业公司。相信这些入选榜单的企业都将会在具体应用场景中发挥它们最大的功用,助推人工智能的发展。
而作为今年 CCF-GAIR 2017 的程序委员会主席,杨强教授表示今年的人工智能专场覆盖得格外全面,包括医疗、金融、智能助手等多个领域都有涉及,且邀请了各领域产业界与学术界的领袖亲临现场,也让他感到非常期待。
如果您也对人工智能感兴趣,希望在短时间内了解各个领域最前沿的应用方向,欢迎和我们一同见证今年的 CCF-GAIR 大会!