资讯 业界
此为临时链接,仅用于文章预览,将在时失效

49.9元升级天猫精灵智能音箱 视觉交互了解一下?

作者:吕倩
2018/03/23 00:24

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

3月22日之前,智能音箱厂商焦虑于天猫精灵到底会发布一款什么价位的带屏智能音箱;3月22日,后者出乎意料地展示了一款旧版音箱+支架+带屏智能设备的智能产品,并非带屏一体机。

当然,这个支架并非传统意义上的“支撑物”,虽然天猫精灵产品总监释空“坦诚到夸张”得直接将其称为“一块塑料板”,但这块名为XHolder 、售价49.9元的支架,其所携带的二维码,可以让用户将原版天猫精灵APP升级为带有视觉交互的新系统。

发布会伊始,阿里巴巴人工智能实验室总经理浅雪先交上一份成绩单——天猫精灵X1上市半年多时间,销量突破200万台。相比较,Amazon Echo 达到这一数字用了一年多时间。

至于本次发布重点,浅雪表示,此次天猫精灵重点发布新版交互引擎AliGenie 2.0——增加视觉、触觉等多模态交互功能,发布搭载AliGenie 2.0的天猫精灵火眼系统。以及天猫精灵火眼重要配件 XHolder、天猫路由、天猫魔屏S1激光投影电视、天猫精灵曲奇版等多款硬件新品,但尚未公布具体发售时间和价格。

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

音箱+支架+智能手机≈无屏新智能音箱?

本质上来讲,该款天猫精灵升级版,即在天猫精灵X1基础上,搭上XHolder支架,再搭建上一个带有天猫精灵APP的带屏设备,即完成天猫精灵升级版的改造。

操作上,XHolder 上有二维码,系一种激活方式,天猫精灵产品总监释空对雷锋网表示,天猫精灵希望通过这种方式,建立XHolder 与天猫精灵之间的第一次连接,也算一种仪式感。经此激活,手机或其他智能设备上的原版天猫精灵APP,即自动升级为带有视觉功能的APP,再之后,激活方式可以选择语音输入、手动打开XHolder、再次扫二维码等多种方式皆可。

谈到为什么采用这种组合方式时,释空表示,实际上团队内部也产生过争议与分歧——智能音箱新品到底要不要带屏幕?最终团队选择了天猫火眼系统+XHolder的形式。释空解释称,这种组合看似简单,实际上“最难的方式”—— 要兼容现有产品,再根据一个现有产品进行适配修改,比完全从零开始开模具难度更大。

实际上,释空例举了一个小细节——当初这个智能音箱新品组合是按有另一款配件转折镜的,但是由于开模多次都失败,最终还是觉得将转折镜拿掉,这给技术人员造成很大难度压力,但也确实倒逼技术团队打磨多次推出现有系统。

到底为什么要选择这样一个“组合”的方式,浅雪对雷锋网表示,团队从不认为在硬件上简单加上一个东西就变成下一代了,“并不是新加一个屏幕,它就叫人工智能,更重要的是算法与理解。”浅雪强调,“今天我们做的,不是图像识别、不是图片搜索引擎,而是在真实3D世界里让机器理解世界。”

至于天猫精灵之后到底会不会推出带屏智能音箱,释空答道——“当带屏产品尚无法探索出足够大的议价空间与应用场景时,我们先憋着。”

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

天猫精灵火眼系统

虽说发布会出乎意料得没有发布带屏音箱,但确实另有惊喜——在已有“听”“说”功能之外,新加“视”——视觉交互。

浅雪将AliGenie 系统称为天猫精灵里的灵魂,她直言,AliGenie 是一套可以不断进化的人机交互系统,这套人机交互系统里包含语音唤醒、语意理解、声纹识别等前沿人工智能技术。目前,AliGenie已建立超强知识体系,拥有1个亿的实体理解能力,构建了近10亿的关系,并覆盖了生活当中行行业业的品类——简单来说,就是天猫精灵团队在过去半年多时间里面,至少构建了五个垂直搜索引擎。

同时,浅雪透露,系统算法也进行了升级,发布全新序列标注模型,增加自动纠错能力,帮助语音理解增强容错性。此外,AliGenie还具备主动学习能力,每一次跟用户的交互过程当中,它都会自动完善。

至于本次发布的AliGenie2.0,是一个具备视觉、语音等多模态交互能力的新一代人机交流系统。它不仅具备听觉能力、视觉能力,还有情感感知能力,例如可基于你所在的上下文、对话场景自主学习,深刻理解情景需求。本次重点推出的视觉能力,包括图像识别、人脸识别、物体检测,并将语音能力与视觉能力进行融合,实现多模态交互。

以上铺垫,皆是为天猫精灵另一新系统做铺垫——搭载AliGenie2.0的系统——天猫精灵火眼。释空表示,目前火眼系统仅仅是视觉交互的起始,暂可进行三类演示:

“我们希望通过精灵火眼,以普惠的方式让大家在不增加硬件成本的前提下,体验到视觉的魅力。”浅雪称。

但需要特别注意的是,此处所谓万物交互,是未来的理想状态。目前主要支持117套图书与4万个药盒的准确识别(具体数字仍在增加),“人脸识别”与“万物识别”还准备当中。释空也对雷锋网坦陈,图像识别是分为2D识别与3D识别的,其中图书与医药包装识别属于2D识别,而具体商品识别属于3D识别,后者有些具体问题还没解决,还在努力中。

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

Three More Things

现场,浅雪发布了另外三款新品——天猫路由、天猫魔屏S1、天猫精灵曲奇版。

浅雪称,整个智联网环境中,网络是最大的问题,对于人工智能来说,网络也是一个巨大的挑战。而天猫路由正是为智联网而生,可以同时支持256款设备同时联网与在线,意味着智能家居里所有设备都可以通过天猫路由网络小能手连接到云上;同时,天猫路由“自主网络能力”可保证家里无论两台还是三台路由器都不会掉网。

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

第二款新品是天猫魔屏S1,具备三种特点:“更大”——最大投射屏幕有300寸;“更短”——只需1.8米距离就可以投射出100米的影院效果;“更亮”——达到3000流明。

49.9元升级天猫精灵智能音箱  视觉交互了解一下?

第三款产品是天猫精灵曲奇版。浅雪表示,阿里人工智能实验室一直认为未来的个人智能助手,应该是越来越小、甚至是无处不在的,新品天猫精灵S1 仅仅比可乐罐稍微大一些。要做到这个程度,需要平衡音箱内喇叭与收音器之间的关系。

总之,经历2017年双十一补贴销售、以及目前200万销售战绩,2018年伊始,天猫精灵将整体步伐调整到匀速慢进,速度减缓、范围扩大,对智能家居布局毫不松懈,如今就等阿里人工智能实验室到底选择通过什么方式、探索出带屏音箱最大议价空间了。

长按图片保存图片,分享给好友或朋友圈

49.9元升级天猫精灵智能音箱 视觉交互了解一下?

扫码查看文章

正在生成分享图...

取消
相关文章