如今,人们对智能语音交互驱动的产品已不再陌生,「语音」也正在由一种前沿科技逐渐成为具有普适性的「基石技术」,开始到更广泛的应用场景中,发挥作用。在实现了消费级领域的经验积累之后,出门问问正在探索,如何从为产品赋能,到为产业赋能,进而驱动更大价值的创造。
在极客公园Rebuild科技商业峰会上,出门问问 CEO 李志飞分享了出门问问在语音方面的技术以及产品落地的趋势。
据李志飞介绍,出门问问在语音交互行业做了很久,早在2012年,大家对人工智能还不是很了解的时候,出门问问就做了很多这方面的前沿技术探索。包括语音识别技术本身的研发,把声音转成文字,到怎么理解文字,再到后面怎么跟服务对接。
早期,出门问问在语音交互的落地场景方面,做了很多探索。主要是把语音交互放到消费电子场景下面,过去几年基本每年出一个新的品类:智能手表、智能车载设备、音箱、耳机,每一个设备都在站在消费者的角度做决策。目前由于很多技术的限制,体验还做不到最优,但李志飞相信,在未来的消费场景里面,可穿戴、车载、家居、还有路面场景基本上会覆盖语音交互。
雷锋网注:出门问问发布的4条产品线
经过前期的一些探索,更多是需求更加清晰了,技术也越来越成熟,当语音交互变成基石技术,整个市场又会有什么样的变化?
雷锋网注:语音交互市场规模增长趋势
首先,在数据增长方面,无论是用户的使用规模,比如语音搜索量,可能从现在的20%,未来变成50%。也就是说,未来每搜十次搜索引擎的时候,有5次是语音的交互方式。不一定是在手机上,可能是在音箱上,也可能在车里,都是用语音交互做。但是主要是为了搜索内容。包括智能音箱市场从无到有,现在全球市场规模达到了几千万。
其次,从设备场景的角度去看,语音交互可能有几大类,一个是2C,一个是2B,另外还有一个2G。2C前即面对消费者,各种各样的交互设备变更人与机器的交互方式。比如车里面,家里面,在路上的时候,现在可能更多是键盘和触摸屏,但是未来语音交互也会成为非常重要的交互方式。
2B更多是帮助企业去提供更好的工具,提高他们的效率。同时因为你工具更加个性化人性化,也可以帮他们的用户提供更好的用户体验。
2G跟2B比较类似,只是行业不太一样,比如政法、公安、教育可以有很多应用,比如高考教育的打分,英语的打分,还有医疗,都是偏政府的行业,通过语音提供更有效率、更好的用户交互方式。
接着,李志飞介绍了出门问问在过去一年,把语音交互落地到各种场景方面的探索。主要有两个方向,一是上游跟芯片深度的集成,二是和下游垂直行业的深度绑定。
上游侧,发布问芯,是AI语音的芯片模组。解决了现在的智能电视不能远场唤醒的问题。芯片跟杭州国芯一起合作,但是把麦克风技术、信号处理技术,包括低功耗的唤醒技术都做到了芯片模组里面。用一个usb线跟芯片模组连接,电视即成为一个可以远程语音交互的智能电视。
另外,未来还会发布一个专门面对IoT设备控制的AI语音芯片模组。现在控制空调也有,但都是通过智能音箱作为控制台,后台控制设备。不好的一点就是每次都要把音箱唤醒,然后把后面的设备唤醒。李志飞表示,希望未来芯片模组可以直接放在灯泡里面,回家直接说开灯关灯就可以打开,而不是现在先要把音箱唤醒才能交互。此外,在回声消除方面,出门问问也做了一些改进,已经在跟合作伙伴洽谈,准备落地到一些智能电视或者机顶盒场景下面的应用。
在下游测的应用场景方面,主要做了四大场景的探索,包括:消费电子、金融、保险、地产。
金融方面,做了名为“问真”的AI金融反欺诈系统。当顾客找金融机构贷款的时候,可以进行身份验证和真话鉴别。系统会自动问客户一些问题,根据回答的答案和系统答案是不是一致,就可以判断是不是真话。此外,还会用到人脸识别技术,识别是不是本人,是真实的才会进行贷款操作。
在保险行业,利用2C的经验,跟保险后台数据系统结合起来,提供更好的用户体验,使他们的用户服务更加满意。在智能家居或者房地产行业跟合作伙伴做了一整套解决方案,提供样板间。
总的来说,当语音交互变成基石技术以后如何进一步落地,出门问问的答案是往上游跟芯片深度集成,下游跟场景深度绑定。
近年来,语音芯片领域玩家众多,作为推动AI发展的三大关键因素之一,巨头和初创公司都争先自主研发AI芯片,布局语音和视觉芯片。仅国内,Rokid、云之声、出门问问、思必驰等都已经或者即将推出AI语音芯片,不仅说明了AI的火热,更体现了自主研发芯片对于语音产品的重要性。
当雷锋网问到出门问问打造的语音芯片优势体现在哪里,与其他厂商的语音芯片有何不同时,李志飞掏出随身携带的硬币大小的芯片,解释道:“我们做了两件事情。芯片是其中这一块,我们是第一个做了模组的公司,芯片以外,还有连接器。第二件事情,我们把最核心的算法整合到了芯片里面,把它整合成DSP的代码,还有神经网络单元计算的NPU,我们做了整个的电路板整合,做了整个软件算法的集成,因为我们有一整套的语音交互,所以我们在电视上有还有软件SDK可以连到云端。”
“你说跟市场有什么不一样的话,坦白讲,我们的芯片模组早已量产,这段时间已经有电视厂商在应用我们的芯片模组在做产品了,你刚才说的这些公司应该还没有我们这么快,这个是我们比较确定的。当然讯飞也有模组,但是他们不是基于这种AI芯片做的,他们的特别大,而且价格很贵。”
此外,跟其他AI语音交互公司的区别,李志飞说道:“首先我们有时间差,而且我们有软硬结合的能力。这个对我们来说是最简单的事情,对他们来说,可能就不行。他们很大的问题就是磨合需要很长的时间,我们是外接的模组,所以没有需要磨合的过程,智能电视厂商花三个星期就可以完成。”
作为一家探索智能语音交互应用的创业公司,出门问问却面临着被巨头夹击的“高级”待遇——北美市场,面对Amazon与Google发起的价格战;国内市场,面对阿里天猫精灵99元、京东49元的超低价格打击。
面临这样“尴尬”的境地,为什么出门问问还要坚持做音箱,李志飞说:“因为我们有这种使命感,下一代的人机交互重要的场景之一就是家里面。家庭在我看来是一个不可以缺失的场景,它要打磨的技术跟车内场景不一样,家庭场景需要远场交互,比如3米5米,车内是0.5米。家里有小孩、老人,所以对于一个语音交互的东西来说,怎么把家内的语音交互去打造好,在我看来是必须要做的一件事情。”
“商业上的话,确实智能音箱会受到一些挑战,但是就是因为我们做了智能音箱的算法、降噪,才有后来的把这个算法整合到AI语音芯片模组里用于智能电视。做智能音箱虽然短期的收入没有那么明显,但是对公司技术的打磨,对产品的开拓等等,都是很有意义的。”
目前市场上智能音箱产品众多,谈到智能音箱最主要的核心竞争力是什么,李志飞无奈地说到,“现在最核心的就是谁有钱谁就有核心竞争力,这是很可悲的一个现状,尤其是大公司。这个在美国,比如说Google、亚马逊他们还是比较有节操的,还是希望自己来打磨技术;中国市场主要的玩家,都是用其他公司的技术集成。”
最后,李志飞透露,出门问问正在计划新一轮融资,至于上市计划,今年应该不会有。
相关文章: