11 月 8 日,在成都召开的腾讯全球合作伙伴上,腾讯首席运营官任宇昕提出了三个战略:连接智能化、内容生态化、技术云化。
在技术云化部分,他提出了 AI in all 战略,这与百度 All in AI 战略相比较,期间的差别或许是换汤不换药。他表示,AI 无处不在,腾讯会研发所有技术,但并不是服务自己的产品和业务,而是开放出来分享给全行业,与各行各业实体应用相结合,得到实际价值发挥。
腾讯 AI lab 实验室主任张潼则全面剖析了腾讯 AI 的整体战略,主要是与企业、社会、学界三个领域之间的关联。
张潼介绍说,腾讯 AI 要打造自己的世界级研究能力,要做科技创新,就需要特定研究能力。另外,腾讯希望能够将 AI 技术转化、应用到腾讯的各个业务场景中去,同时也能与外部共享研究应用成果,这是企业层面。
而在社会层面,他们希望行业共享大生态,将从场景、技术、人才、资本四个方面全面扶植AI创业者。同时,也要赋能中小从业者和传统产业,帮助行业做深度解决方案,推动 AI 在更多垂直领域台落地。
与学界之间的沟通也是不可或缺的,他们希望能培养产学研结合的人才,将工业界资源、经验反向输入到 AI 人才“造血库”,与学界联合培养AI领域的人才。
换句话说,就是对内、对外、产学相结合的“三位一体”方案,从这三方面出发,来实现腾讯 AI 的 Make AI everywhere 的目标。
而在应用层,腾讯 AI 主要围绕腾讯内部的三个应用场景,主要有以下三个方面:
一是游戏 AI,AI 在游戏的应用包括制造流程、玩家体验以及电竞等。就在今日上午,腾讯首席运营官任宇昕也提到 AI 在游戏领域的应用,他表示,AI 赋能游戏,能让游戏世界每个角色自己可以思考,能脱离人的情绪对游戏的干预,游戏角色可以自我发展。“未来的游戏不是设定好的,而是一个不断升级的角色。”
二是社交 AI,下一代社交是基于人机对话软硬件一体的,腾讯 AI 将会推出新产品,目前在系统层面也有不错的进展,并已经在落地当中,明年会将AI能力开放给开发者。
三是内容 AI,AI 可以用于分析内容、理解内容和做内容推荐,腾讯 AI Lab 和不同的业务部门有不同的合作模式,有些是做整体方案,有些是做技术点,然后提供给业务部门。
BAT 三大巨头里,腾讯的 AI 能力依然处于追赶者的角色,它先从内部应用场景做起,也是基于自身的战略布局考虑,但当 BT 都在瞄准外部更广阔的 AI 应用场景时,腾讯目前能拿出的好像也只有医疗领域的“腾讯觅影”了。
在张潼将整个腾讯 AI Lab 战略架构描述一遍之后,基于上述三个应用层方向,包括游戏 AI、多媒体 AI、机器翻译的负责人又将各自所属领域的应用场景和产品做了详尽介绍。
游戏 AI 是腾讯 AI 应用层的第一大板块,在人工智能分论坛上,腾讯 AI lab 机器学习中心负责人刘晗以“虚拟世界对物理世界的赋能”为主题,进行了详细讲解,主要分享了腾讯公司对游戏AI的理解与布局。刘晗表示,这也是腾讯第一次在公开场合,阐述腾讯公司对游戏AI的思考。
刘晗希望通过他的分享,对外传达三个要点:一,什么是游戏 AI;二,研究中游戏 AI 应具备哪些核心能力;三,为了得到核心能力,面临的挑战是什么,以及腾讯的解决方案是什么。
具体来看,针对第一个问题——什么是游戏 AI。刘晗认为,游戏 AI 是人工智能与博弈论形成的一个交叉领域,研究的是人、智能体、环境三者之间的复杂交互关系。对游戏 AI 的认识,是人类理解通用人工智能的一种渠道。从整体分类上而言,游戏可以分为两类:一类叫 PvP,即人类对人类的游戏;另一类叫 PvE,即玩家对环境的游戏。
针对第二个问题——游戏AI的核心能力有什么?从腾讯的角度而言,主要对游戏 AI 的三个核心能力感兴趣,分别是感知、决策、对话,这三种能力分别对应于人类大脑的三个组成部分(左脑、右脑、后脑)。
其中,感知能力指的是把外在环境转变为机器能够理解的内在状态;决策能力指的是把内在状态转变为下一步的动作和行为;对话的能力指的就是使用自然语言沟通的能力。
为了获得这三个核心能力,游戏 AI 的研究者需要面对三个核心挑战,分别是状态空间过大、多智能体协调、虚拟与现实的打通。面对三大挑战,腾讯 AI Lab 分别提供了对应的解决方案。
刘晗提到,游戏 AI 虽然是在虚拟世界里进行研究,有着识错成本低、迭代速度快的优势,但其实最终还是为了应用在现实物理世界。
多媒体 AI 的发展源自图像 AI,后者从特征提取与分类器训练的浅层学习模式,进化到了端到端训练的深度学习模式,它的发展对图像识别有革命性的意义,大大降低了 ImageNet 千类物体识别的错误率。
而随着深度学习的算法创新,多媒体 AI 也由此形成,它赋予了计算机处理、识别、理解多媒体内容的综合能力。
据刘威介绍,腾讯 AI 在多媒体 AI 的探索从图像的图像编辑,OCR/人脸识别,图像描述生成,到 AR和3D 视觉,视频缩略到有所涉及。目前推广中的应用场景主要包括影视特效、短视频拍摄、增强现实。
此外,腾讯 AI 还将在移动应用、场景重建、游戏娱乐、机器人视觉四个应用场景进行推广。多媒体 AI 技术,包括从视频制作的产生、处理、识别、理解、内容分发发力,从而覆盖完整视频产业链。
基于腾讯 AI 的语音识别、图像识别、人机交互的机器翻译技术,相应的机器翻译场景为同声传译、拍照翻译、辅助翻译。
据机器翻译平台负责人杨月奎介绍,同声传译中的机器翻译的难点在于译文忠实度问题、速度解码问题,以及口语化文本、文本标点、文本错别字等 Query 容错问题。
而他们的解决方案是强化注意力模型、重构网络覆盖度与长度惩罚;在 GPU 上解码、支持并行解码,局部词表、优先队列以及基于统计的 Query 改写,从而实现更快、更准、更通用的同声传译机器翻译。
在辅助翻译方面,据雷锋网了解,腾讯机器翻译平台的辅助翻译平台、嵌入式翻译系统、交互式翻译助手分别面向人工翻译团队、面向 B 端客户和 C 端客户。
杨月奎也对机器翻译的未来进行了展望,在他看来,机器翻译的思路可应用于所有序列到序列的问题,包括 Query 改写、摘要生成、问答系统、写诗等等。
腾讯智能平台部总经理陈谦以“智能时代的场景化机遇和挑战”为题作了演讲。
他认为,人工智能结合场景有两个特点。一是感官能力的多样化,体现在视觉与听觉信息的配合;二是计算设备的增强及小型化,比如智能电视这样单场景单设备的极致闭环。
而 AI 产品的场景化原则,他总结了四点:真正自然而优美的语音交互、视觉与听觉信息的高效配合,单场景单设备的极致闭环以及跨场景多设备的无缝衔接,并以腾讯叮当的技术为例进一步做了阐释。
论坛上,腾讯还发布了“AI 生态计划”,该计划将通过开放 100 项 AI 技术,孵化 100 个 AI 创业项目,推出 300个“云+创业百万扶持计划”,为 1000 个合作方赋能。
腾讯开放平台副总经理王兰表示,该计划的核心关键在于开放腾讯在场景、技术、人才和资本方面的资源及优势。“围绕场景、技术、人才、资本,腾讯开放平台会打造 AI 能力开放、孵化支持、产业落地和技术提升为核心的生态链条,与 AI 技术公司、产业合作方联合打造行业解决方案。”她说。
据雷锋网了解,在腾讯 AI 能力对外开放上,腾讯开放平台已先行推出了人工智能站点 AI.QQ.COM 和腾讯 AI 加速器。其中,AI.QQ.COM 开放了数十项 AI 技术能力;腾讯 AI 加速器今年从上千个项目中精选出 25 个 AI 创业项目,此外,还有4个海外AI大赛的优胜者入选。这些项目覆盖零售、医疗、翻译和机器人等 15 个垂直领域的 AI 应用探索。
由此看来,腾讯 AI 的战略意图非常明显 ,围绕企业、行业到学界的 AI 共享共连,然后在腾讯开放战略之下,腾讯开放平台也将作为腾讯和产业应用的连接器,通过汇聚、开放腾讯核心 AI 能力然后和资源,最终实现 AI 技术规模化、产业化应用和场景落地。
*来自雷锋网报道