雷锋网 AI 科技评论按:前不久,科大讯飞宣布曾任微软亚洲研究院副院长、硬蛋科技 CTO 的李世鹏博士正式加盟科大讯飞,担任科大讯飞副总裁、讯飞 AI 研究院联席院长,并称「李世鹏博士将领导科大讯飞研究团队在人工智能核心技术上的探索和创新,助力科大讯飞的 AI 技术应用落地,并主导科大讯飞的国际技术合作拓展。」(《前MSRA副院长李世鹏加入科大讯飞,任讯飞 AI 研究院联席院长》)
这不免让人感到些许诧异。科大讯飞作为一家在语音和自然语言研究具有雄厚科研实力的企业,为何要引入在计算机视觉领域享有盛誉的李世鹏博士呢?李世鹏博士又为何选择科大讯飞?他将在科大讯飞研究院发挥什么样的作用?
雷锋网就此来到讯飞北京总部拜访了科大讯飞副总裁、讯飞 AI 研究院联席院长李世鹏博士,并就相关问题,对李世鹏博士进行采访。以下为采访内容,做了不改变原意的调整和编辑。近期科大讯飞在 IDRiD 眼底图分析竞赛、SQuAD 挑战赛均取得优异成绩,加上引入李世鹏博士担任讯飞 AI 研究院联席院长,在雷锋网旗下学术频道 AI 科技评论的数据库项目「AI影响因子」中有突出表现。
李世鹏,IEEE Fellow,新一代人工智能产业技术创新战略联盟联合秘书长。在加盟科大讯飞之前,为硬蛋科技 CTO,创立了硬蛋实验室;在此之前,从 1999 年至 2015 年间任微软亚洲研究院首席研究员、副院长、微软公司合伙人,为微软亚洲研究院共同创始人之一。作为《IEEE 电路与系统会刊-视频技术专刊》现任总编辑 (2018-2019) 和 IEEE Fellow,李世鹏博士在多媒体、互联网、计算机视觉、云计算及人工智能领域极具国际影响力,拥有 195 项美国专利及 330 多篇国际论文。同时,李博士培养出四位 MIT TR35 创新奖的获得者(《麻省理工科技评论》「全球 35 位 35 岁以下科技创新青年」),目前担任微软亚洲研究院院友会秘书长。
李世鹏:我在硬蛋工作大概有两年半时间,主要负责人工智能使能平台——Kepler 系统(K-系统)的搭建,去年 5 月份这个平台已经发布,可以说基本的技术框架已经完成,研发方面的工作已经不是太多,剩下的主要就是一些技术落地方面的工作了。这个不是我所擅长的,所以现在硬蛋实验室由首席架构师苑贵强博士负责,我担任技术顾问。
李世鹏:总的来说,我在微软做研究,然后到硬蛋做产品,现在是回来继续做研究。
当时我从微软出来,是想给自己留一段时间对中国整个技术生态做一个完整的了解,硬蛋科技对我来说是一个很好的平台,给我一个机会了解中国产业的趋势、痛点以及他们亟待解决的问题;同时,我也帮助硬蛋将研发团队和能力给带动了起来。这两年多的时间里,我确实学了很多东西。现在我加入科大讯飞,再次回到研究领域,也是带着一些实际中需要解决的问题的。所以整个大方向就是回到自己比较擅长的研究领域。
李世鹏:国内研究机构很多,但是要看哪个平台更适合发挥自己的研究特长。我觉得有很多因素促成了这样一件事。首先,我本身是中科大毕业的,而科大讯飞也是出身于中科大,同根同源,彼此之间文化、交流、理念都特别相近。其次,科大讯飞是一家以技术为主导的公司,大部分人员属于技术人员,他们在技术研发方面投入了很多资源,这是我特别欣赏的。另外一个原因是,科大讯飞是做语音的公司,我本身是做图像和计算机视觉这块儿的,对语音不太熟悉,所以我加入讯飞正好是一个强强联合。我会把很多做视觉的资源带到公司,用我的经验和技术背景来增强公司在视觉方面的研发能力。
李世鹏:这个时间其实蛮长了。去年在苏州的一次创业会议上,讯飞研究院的胡国平院长和我都去做了演讲。在这个会上我们建立了联系,他问我:“有没有想过讯飞的机会?”不过我当时真没想过。
讯飞一直以来都是我心目中比较佩服的公司,我记得讯飞的董事长刘庆峰是历史上唯一一个拒掉微软奖学金的人。他说当时在创业,真的没有时间去拿微软奖学金。从那个时候起,我就对讯飞比较关注了。但是也只是远望,知道讯飞语音做的好,近几年在语义、机器翻译等方面做的也特别好,但是最近在做什么却并不是特别了解。
后来,胡国平院长深入地给我介绍了公司的方向;然后在今年年初,我和刘庆峰董事长也详细聊了聊。他讲,讯飞未来的产品其实定位很清晰,就是抓住人类社会的三个刚需:教育、医疗和司法;这三个刚需(雷锋网注:讯飞称为「赛道」)会把人工智能所有的技术都串起来。我觉得挺受启发,同时我也觉得这里面有很多需要深入研究的地方,我过来后会有很多空间施展自己的才华。
李世鹏:由于现在人工智能技术的普及,现在的人工智能公司,已经不可能靠一个技术打遍天下了,所以总的趋势都是往全栈方向发展。当技术不强的时候,你可以和其他公司在技术上进行合作,以弥补自己的技术短缺;但是当越做越好的时候,就需要建立自己的核心技术了,这样才能在做大项目时不求于人。讯飞目前走的是平台+赛道的路线,而赛道所需要的不是单一的技术,而是全栈的技术。讯飞在语音、NLP 等领域在业界做的非常顶尖;我希望加入讯飞之后能把视觉这一块也同样带起来。
李世鹏:其实讯飞在视觉方面的研究已经很强了,包括文字识别、医疗等方面,其实都有产品。如果你记得的话,讯飞去年在 LUNA 的比赛中获得了平均召回率 94.1% 的检测效果,刷新了世界纪录。
从某种意义上来讲,现在人工智能(包括视觉)能不能做好,关键取决于有没有足够的标注好的数据。很多公司只是在拿一些标准的训练集、测试集在做;但真正到实际应用时,还必须得采集足够多的真实数据集。讯飞在数据这一块花了很多资源,包括请一些专业的医生来标注医学影像等,这个力度是我在其他公司见得比较少的。这也是我加入讯飞的原因之一。
李世鹏:我说一下我个人的观点。完全靠大数据的方法有其局限性;但是在技术突破之前,大家拼的只能是数据,所以你必须在数据上下功夫。
我们意识到未来不会是完全依靠大数据驱动,所以我们不会完全停止在以大数据为基础的技术研究之上。这也是为什么我们会跟世界上最好的学校、研究所去合作,就是要去发现将来的人工智能是什么样的架构,什么样的新模式,是否可以从认知科学里面得到启发,是否可以靠知识或推理来补全等。这些也是我比较感兴趣的,即 what beyond 大数据+深度学习。把推理、知识的东西融入到人工智能当中,即使没有大数据也能把机器变得更智能。所以你这个问题问地特别好,我也正在看这方面的东西。但是现阶段要想往前走,还是得拼数据。
李世鹏:首先,讯飞现在有一个 60 多人的团队在做视觉,但视觉里面需要做的东西太多了,所以我们想随后将这个团队加强和扩大。另外,我们也有计划在北京跟一些研究所、高校进行深度合作,或者在北京建立一个计算机视觉的团队。
在研究方面,一方面我们仍然会和其他公司一样,继续用现在大数据的方式,解决现在的问题。另一方面,我们更多的还得看将来,例如 3 - 5 年,人工智能技术会发展到什么样的地步?我们从现在开始就做一些技术储备,等真正时机来临的时候,就游刃有余了。因此在研究方向上,我们从一开始就会做一些结合认知科学方法+大数据方法的研究。
李世鹏:不管是从市场还是技术合作商,今年都是讯飞真正正式进入国际的一年,我们追求的目标也更大更远。市场上,包括在今年 CES 大会上,我们也去展示了我们的产品;我们的翻译机在美国市场上已经开卖,目前很受欢迎。在合作上,我们的董事长刘庆峰今年亲自带队,下定决心跟美国很多高校展开正式合作,包括 MIT、斯坦福、伯克利等高校都在谈。
李世鹏:我本身曾是从跨国公司出来的,同时也在学术圈接触许多世界各地的教授。所以在讯飞这个平台上,我可以与他们建立一些新的联系和合作,这是一个很自然的工作。现在这项工作已经开展,而且还不错。
李世鹏:国际化是一个主要方向;但视觉只是很多技术的方向之一,准确来讲是向人工智能的全面化进军。不过我们没有想那么高调,想先踏踏实实做事,完了之后再说,这是讯飞的风格,也是我特别喜欢讯飞的地方。
相关文章: