雷锋网 AI 科技评论按:4 月份,在深圳举行的中国电子信息博览会「人工智能行业企业家峰会」上,国家 863 计划专家、科大讯飞执行总裁胡郁发表了「AI 赋能,智赢未来」的演讲。
本次演讲中,胡郁简要介绍了人工智能简史,并对人工智能与人类智能做了相关比较。期间,胡郁提及了实现人工智能的途径,重点讲解了语音如何承载人工智能产业、人工智能的未来发展。最后,他表达了看好中国在新一轮中美人工智能角逐中将最终胜出的坚定信心。
早在人工智能尚未大热的 2012、2013 年时,工信部杨学山副部长对科大讯飞所在的智能语音产业给予了高度关注,同时工信部和安徽省成立了专门项目组织,共同推进语音产业。当时科大讯飞在内的中国语音、人工智能的企业均因此得到了巨大关注,相关政府随之成立了包括语音产业联盟技术在内的专门产业扶持联盟,这对整个中国人工智能产业起到了举足轻重的支撑作用。
以下是雷锋网 AI 科技评论根据胡郁的演讲实录整理他的演讲要点:
类似 AlphaGo 和 AlphaGo Zero 的人工智能应用在个别领域战胜人类,并不能代表人类在智能上整体沦陷。因为计算机就是为了弥补人类在某些智能上的缺失而生的,这也就是运算智能。
机器智能与人类智能的最大区别在于,机器智能缺乏感知智能和运动智能,而人类能够掌握语言,发展知识,并进行逻辑推理和复杂的决策。人类智能的爆发(即认知革命),公认是发生在第三次技术革命之前,这也是人类之所以能够统治地球最重要的原因,而机器在人类智能所擅长的方面就弱得多了。
针对如何实现人工智能,胡郁在现场介绍了基于大数据法、智能动力学和为机器人建立逻辑推理能力三种方法。
工业领域大受欢迎的基于大数据法
人脑的学习方法并非基于大数据,而是基于超强逻辑对小样本数据进行推理分析。同时,随着云计算大数据和计算能力不断提升,计算机得以在其最擅长的大数据分析领域大展身手。从这方面来看,机器智能已经开始能够媲美人类大脑了。
大数据是促成人工智能第三次浪潮的一个关键要素,大数据的三点核心:深度神经网络算法,大数据和涟漪效应,都是指利用真实数据持续学习和进化的方法。
全脑模拟的人工智能:智能动力学
据雷锋网 AI 科技评论了解,胡郁是国家正在推进的脑科学与人工智能重大专项专家之一,在项目推进之时,他了解到一种全脑模拟的方法,即像模拟天气、模拟核爆炸一样将人脑 860 亿个神经元全部模拟出来,假如有一天我们能还原爱因斯坦的大脑,是不是就意味着我们能得到媲美爱因斯坦一样聪明的人,如果你做得足够精细,答案是肯定的,但这也存在局限。
类比人类学习飞行的过程,起初人类模拟鸟的飞行(认为对对鸟翅膀模拟的越像就越适合飞行),后来人类才意识到洞悉鸟类飞行原理才是关键,这也就是钱学森的老师冯•卡门于 20 世纪早期提出的空气动力学。
将人脑中的小样本学习、非监督学习破解再现到机器身上,这其中涉及到一系列生理生产,生殖方面的难题。但是,一旦将其实现,人类就能发明出能媲美甚至胜于人脑的人工智能:智能动力学。
感知智能结合认知智能,为机器人建立逻辑推理能力
胡郁介绍了科大讯飞在世界英文/中文/西班牙语的语音识别大赛和在肺结节检测 LUNA 数据库取得的成绩。期间,他列举了利用感知智能和认知智能结合的方法,帮助人类检测肺结节的例子。
逻辑推理建立能力对人来而言轻而易举,机器人却难如登天。当前人工智能领域面临的最大挑战,就是实现认知智能,即达到媲美人类的语言理解,知识表达。不同于留存下来的人类语音和图像的大样本数据,作为社会常识的人类语言知识和逻辑推理并没有被记录下来,大样本数据的缺失,导致了现在无法训练出认知智能。
但是胡郁认为,我们可以借鉴人类通过感知、认知运动,在实践过程中不断建立逻辑推理能力的过程来实现认知技能。他相信,一旦在此实现技术突破,机器人的认知智能将到达一个全新水平。胡郁还介绍了在高考记忆和逻辑性学科,医考机器人(参加医学资格考试的机器人)取得的成绩,以及已经能够利用机器人辅助人类进行分级诊疗辅助诊疗了。
人工智能即学习人的智能。一个社会人(哪怕文盲),在加入了人类社会后都必须具备「交互智能」,即交互技能,借助语言、图像、手势和姿态等融入进人类社会。上世纪 80 年代,日本曾提出利用第五代计算机解决机器和人类之间交互的问题,但最终失败收场。
具备媲美人类专家的专业知识智能。上世纪 70 年代,美国便进行了模仿人类律师,法官,教师医生来打造专家系统的尝试。如今,机器专业智能化借助全新人工智能卷土重来,而且已经打造出了找肺结节的这类专家系统。
胡郁从交互的角度得出新推论,认为语音交互将成为人机交互主要方式,并表示其在将来五年之内得到实现。
人类获取的信息,80% 来自于视觉,但输出信息的 90% 则是通过语音。对机器而言,输出信息最快方法是显示各种复杂(图形,文字)的显示屏。由于人类输出最快方式为语音,所以机器与人类交互最快的接受(输入)信息的方式也顺理成章为语音,这就形成闭环人机语音交互,基于视觉呈现的语音交互。
胡郁还介绍了该闭环人机语音交互基于的视觉呈现,可分为无视觉呈现和强视觉呈现两种。
无视觉呈现,即类似人类通过电话进行彼此交流的方式。
强视觉呈现,即设备上显示是否处于工作状态。强视觉呈现语音交互,例如人类观看手机屏幕并与它交互。在此基础之上,科大讯飞推出了 AIUI 2.0 平台。至今,讯飞语音云相关开放平台已实现超过 11 亿台设备,每天超 50 亿到 60 亿次的调用,覆盖了将近 60 万开发者,同时也提出了一系列如输入法、翻译、汽车、家庭等语音交互应用场景。
解决了生产力的问题的行业大数据、行业专家和人工智能算法,将彻底颠覆各行各业。即使专家系统只掌握人类专家 60% 功力,但它可以将这 60% 功力进行无穷尽复制使用。自动批改卷子应用(科大讯飞在合肥一中的人工智能教育应用试点),可根据学生知识弱点进行定制化作业布置,从而实现因材施教。中国在智能化教学方面已经远远领先日本,另外,在智慧城市,智慧医疗等很多人工智能应用领域也是如此。
雷锋网 AI 科技评论在演讲现场了解到,胡郁介绍了现阶段中国人工智能行业的两大类型公司:「冲浪型」公司和「登山型」技术创新公司。冲浪型公司在每当行业新浪潮来临,抓住浪潮劲头,与此同时,「冲浪型」公司如以「登山型」技术创新公司为实现目标,还需要一步一个脚印积累技术创新,中国恰恰兼具以上两种类型企业,因此中国才在当今人工智能大潮中立足并取得优势。
人工智能将像今天的云计算大数据一样无处不在,每家公司也都会拥有自己的人工智能。届时,公司之间业务彼此正交,知识经验数据和利益得到共享,从而实现合作共赢,胡郁称之为混合正交的商业生态。
在介绍完两大类型公司后,胡郁强调,人工智能时代的宠儿既不是互联网企业,也非移动互联网企业,唯有「登山型」技术创新公司才能在人工智能时代生存下来。
「登山型」技术创新公司,即如登山一般长年累月地进行技术创新技术积累。在「登山型」技术创新公司中,人工智能的核心技术系统创新、应用创新,微创新,以及产品创新都将结合为一个整体。
中美作为在人类的最新一轮的人工智能竞争中势均力敌的两个对手。日本、欧洲、中国、美国,甚至俄罗斯都具备技术专家和先进成果,但是除中美外的其他国家,均缺失人工智能时代必须的一条大腿:大数据。
大数据需要云计算基础设施、互联网移动、互联网、物联网等相关的商业模式和足够大的市场。经过以上筛选,只有中美获得了决赛圈资格。胡郁坚信,中国将在中美人工智能角逐中取得领先并最终胜出,其一因为深圳在人工智能应用落地方面远远领先美国。尽管美国在人工智能知识原创性上具备优势,但其整个工业落地方面是相对落后的,中美互有优缺点。胡郁还认为,中美这两个发动机定能推动整个世界人工智能产业蓬勃发展。最后,胡郁表达了未来与同行们共享政府支持、生态和渠道,在红利大潮中共同进步的希望。