雷锋网按:本文作者李智勇,十年栈道程序员,有一个好玩的公号:zuomoshi(琢磨事)。
回退到五年前,可能并不会有人想到给Google造成最大麻烦的会是亚马逊,Alexa的成功事实上正在对Google造成根本性威胁。现在再回头看亚马逊一路采取的行动,你会发现它几乎每步都做对了:
从收购三家语音公司打造Echo;
再到花4~5年打造一款产品的体验而不是草草拼凑一款好像能用的产品;
然后确定一个柱状的ID而不是拟人态的机器人来降低用户预期;
销量一旦站到百万以上则开放后端Alexa Skills Kit以及Amazon Voice Service;
再到最近的开放七麦克风阵列。几乎每一步都高度务实和正确,与之相比有些国内公司就显的太想抄近路了。
麦克风阵列是把多个麦克风组合在一起来对声场的空间特性进行采样并处理的系统,形状不局限于环形,而可以有线性、十字等。(更详细的介绍,请参见声智科技的陈孝良博士的文章,如:聊一聊麦克风阵列技术:语音交互应该选用怎样的方案?|深度)。
亚马逊Echo这产品虽然用到了很多技术,也连接了很多内容,但最为核心的部分正是麦克风阵列。因为在柱型ID下面,人们的预期已经被大幅收窄,这样内容外的核心的体验点就只有速度和精度。而在远场语音交互中由于真实场景中各种干扰声源的存在,精度的瓶颈就变成了声学,而不是已经相对成熟的深度学习等。声学技术中对最终体验比较关键的正是这次亚马逊授权给第三方的:麦克风阵列,唤醒、回声抵消、降噪、去混响等算法,当然还有一部分是融合到AVS中的已经开放出来的远场语音识别。
亚马逊开放自己的 7-Mic 阵列的本质含义在于亚马逊正式把Alexa的优先级放在 Echo 这个产品之上。基于亚马逊的 7-Mic 阵列以及配套技术,理论上讲少数其它公司是可以打造出交互体验与 Echo 一样的产品的,而显然的用亚马逊阵列其背后必须集成的是亚马逊的 Alexa。
这很符合一个互联网公司的本质定位,Echo 再怎么卖下去也很难让亚马逊变成苹果,但 Alexa 如果成功则可以大幅侵蚀Google的市场份额。简单来讲是这样:Alexa 占据搜索多少份额,Google 就失去多少。这点上正好可以突出一个产品公司和互联网公司的差别,苹果尝试过授权自己的操作系统,但很快放弃了,这在产品公司的商业逻辑上是合理的;亚马逊开放自己的核心技术,并授权给第三方,这在互联网公司的商业逻辑下也是合理的。
亚马逊的这次行动可以平息掉行业里面一些很莫名其妙的争论,比如两个麦克风就够了等等。既然亚马逊认识到了对多麦克风阵列的需求,并且NXP等也愿意跟进,那无疑的可以说明多麦克风阵列是市场必须的环节。这反过来可以衬托Google Home上的决策失误,Google拿什么来覆盖多麦克风阵列的市场?
显然的大家也会比较关注亚马逊这样的行动会对国内市场以及创业公司有什么样的影响?
直接的影响其实不大,因为国内语音交互的启动速度眼下看比国外要慢个2~3年。但间接的影响其实并不小,因为亚马逊的一系列行为本质上是在开启一个新的分工链条,这个分工链条里很可能出现很多个百亿市值的公司(想象下iPhone的产业链拉动了多少百亿市值的公司)。
很多人可能以为亚马逊自己的授权行为会导致第三方技术提供商生存空间被压缩,但其实正相反,在这个新开启的行业中会涌现出新的有实力的技术提供商。
因为亚马逊的这种行动本质含义在于加速激活语音交互这个市场。假设我们前面的判断正确,亚马逊确实认为Alexa远比Echo重要,那无疑的亚马逊的核心使命是尽快为Alexa获取客户,这样一来只用自己的麦克风阵列(以及背后一系列技术)来为Alexa获取用户显然是极不明智的。那样的话,Alexa用户的增长速度会与自己麦克风阵列技术的销售速度等同。
同时做过声学前端的人会知道,声学前端事实上是一种只能适度标准化的技术,也就是说即使有80%的工作在一个产品上重用,但一旦迁移到第二个产品上还有至少20%的工作要调整,这和芯片有本质差异。所以如果不能拉动整个链条,只依赖于自己一个公司,那语音交互推开的速度会极慢。所以如果亚马逊足够名字那一定会积极寻找第三方技术提供商,培育生态,只有前端的生态链条足够成熟并且有足够的动力支持亚马逊,那么Alexa才可能真的加速普及。
国内有的很多人被互联网模式荼毒过深,会想当然的觉得一切会免费,但可能并没有意识到NXP这类大公司如果没有合适的边际利润,那就根本没和亚马逊做下去的动力。我们假设说亚马逊做成了Alexa,那亚马逊可以得到Alexa整个生态,那这时候NXP可以得到什么?也就是说除非亚马逊只是自己玩这游戏,否则如果想创建生态链条,那就需要为生态链条上的各个玩家留下利润空间。
这件事情上一个典型的反例是Google的Chrome Book,Chrome Book从体验上其实已经基本满足了用户对笔记本的各种需求,甚至可能更加方便。但展开上核心的一个问题是Google并没为第三方厂商留下足够的利润空间,比如联想使劲推这产品,但最终发现自己无法从中盈利,这时候即使有销量,联想这类公司显然也动力也不足。从过往战略的明智程度上来看,亚马逊不是Google,所以估计不会犯Google的错误。
在这样的大背景下,远场语音交互的新链条上,最有机会的反倒正是对前端有深刻理解的公司,这些公司几乎每个都不可能通吃整个市场,但考虑市场规模,只要占据20%的市场份额已经足够支撑起10亿美元上估值的公司。在PC、手机上国内公司参与这个分工链条比较晚,所以这个部分几乎全是海外公司,但眼下声智科技这样的创业公司正在尝试在其中抢占合适的位置。
亚马逊开放7-Mic阵列授权后,Google、微软等预计会采取相应行动,因为亚马逊的授权显然不会允许支持Google Assistant与Cortana。
国内其实是缺一款能和Echo媲美的标杆性产品,没有这样一款产品,大家就没法相信语音交互是普遍可用的。声智科技等公司可以提供与亚马逊水平相当的远场语音交互技术,但显然的把这种技术转化为产品体验仍然需要合适的人与足够的投入进行打磨。
没有这样一种标杆性产品,那就只会有各种简单尝试,但这种简单尝试基本上都只会得到体验较差的产品,无法担负起激活市场的重任(想想iPhone和Echo)。这很像用火柴烧水的那个比喻:只要还是单根火柴,那不管你用多少根事实上都无法烧开一壶水,只有把足够多的火柴放在一起,一起点燃,那才能最终把水烧开。
显然的突破语音交互只有两个瓶颈:
一个是技术上的这就包括了交互的速度和精度,这只能依赖技术提供商来突破;
一个是用户习惯上的,这需要硬指标与内容同步突破。
这两者的突破都需要沉淀和打磨。而国内的很多尝试更像是重复:迅速点燃火柴,尝试迅速的烧开水,然后发现水没开这样一个过程。
这点上其实需要大公司扮演更多的角色,因为其投入和产出都会比较大。打造一个平庸的产品可能只需要100万,但打造一个足够有说服力的产品可能需要5000万以上,这对创业公司挑战确实会比较大。但收益显然也是巨大的,假设说腾讯花了1亿RMB打造了一款像Echo一样的产品,那其它人即使打造了完全一样的产品,很多人也会更倾向于活在腾讯的生态下(这正是Google尴尬的地方)。反过来讲,这意味着谁第一个在国内打造出了一个成功的产品,谁更有可能扮演亚马逊的角色,去挑战既有搜索市场的格局。
亚马逊发功越来越有稳准狠的势头,但不管怎样,我估计它那产品进不来中国。