资讯 业界
此为临时链接,仅用于文章预览,将在时失效

专访科胜讯总裁 Saleel Awsare:智能语音交互为我们带来的新机会

作者:叨叨
2017/07/13 18:56

2017 年 6 月,雷锋网曾报道了新思科技(Synaptics)收购科胜讯(Conexant)的消息,新思作为老牌的触控引擎提供商,自1995年推出触控板接口后,几乎接管了整个 PC 时代,而当 PC 进入衰落期,新思又抓住了手机,推出了触控交互技术,这两项业务目前组成了新思最主要的收入来源。

擅长把握人机交互的“关口”,似乎是新思一贯的思考逻辑,从这个角度来看,3.5亿美金收购科胜讯的交易,就非常容易理解。面对全球 PC 出货量连年下降,手机市场增长放缓,不仅是新思,任何一家想要在未来有立足之地的企业,都在思考下一个人机交互的关口在哪。而 Echo 的成功,无疑是一个答案。

至少是一个成功概率偏大的答案。

进入2016年后,语音交互市场硝烟滚滚,国外亚马逊一马当先,Google、Facebook、苹果、微软紧随其后,国内百度、腾讯、阿里先后加入战场,搜狗、科大讯飞、小 i 机器人、云知声、出门问问、三角兽等也都虎视眈眈。从“战况”来看,语音作为下一代人机交互的关键似乎是铁板钉钉的事。

而科胜讯之于新思,或许就是这枚钉子。

科胜讯其实早在 1999 年就已经成立,前身是罗克韦尔国际公司的半导体事业部,1999 年从罗克韦尔剥离并在纳斯达克上市。另据 EE Times 报道,此后科胜讯陷入了一种并购狂热,在短短十一个月中,收购了7家公司,疯狂的收购带来的确实债务,科胜讯进入了“以债养债”的死循环中。2012年,作为柯达打印机唯一供应商,前者的破产,加剧了科胜讯的危机,很快便申请了重组。

当时的科胜讯 CEO Sailesh Chittipeddi 认为,这次重组,对于科胜讯或许是幸运的。单一贷款方 QP SFM Capital Holding 接受了科胜讯重组的协商,并提供了1500万美元的 DIP (debtor-in-possession)融资。此外 QP SFM Capital Holdings 将以1.95亿美元的可担保债(secured debt)交换重组中的科胜讯股权,这意味着,科胜讯将摆脱深陷多年的债务危机。

重组之后的科胜讯,盯紧了三项业务,分别是:

2016年,科胜讯被亚马逊选中,并于当年12月发布了为  Alexa Voice Service (AVS)  量身定做的 AudioSmart 语音处理开发套件。科胜讯开始了新的征途,除亚马逊等国际巨头合作外,在过去两年还“收割”了几乎韩国所有的运营商,在中国市场上则与百度、腾讯、阿里、科大讯飞、云知声等厂商进行接洽。

科胜讯总裁 Saleel Awsare 向雷锋网介绍,其语音处理方案,从一开始就是为了远场拾音而设计的,这样才能保证在未来物联网的环境下,有很好的体验。通过这项技术,能够在只搭配2-4个麦克风基础上,经过降噪、降混响等处理,达到6个甚至更多麦克风的拾音效果。

此外,应用于4个麦克风上的 AudioSmart 解决方案,还拥有通过声音定位的技术, Saleel Awsare 认为,这项技术在未来也会得到很广泛的应用。

在7月5日举行的百度 AI 开发者大会上,百度公布了为第三方设备制造商推出基于语音应用的开发套件和参考设计,其中采用了科胜讯的 CX20924 四麦克风和 CX20921 双麦克风语音输入处理解决方案,以供第三方厂商在百度 DuerOS 平台上,开发远场对话式设备。

专访科胜讯总裁 Saleel Awsare:智能语音交互为我们带来的新机会

*右一,科胜讯总裁 Saleel Awsare

以下为雷锋网专访科胜讯总裁 Saleel Awsare Q&A 实录,并在不改变原意的基础上做了精编:

雷锋网:2013年,科胜讯经历了一次破产,当时申请破产的原因是?

Saleel Awsare:2013年的时候,我们宣布重组,因为科胜讯在语音交互方面有一个非常特别的技术,能够继续吸引和招徕语音交互方面的技术人才,重新建立团队,重组这块生意。目前来看,重组之后的科胜讯,每年都能达到 60%-70% 的成长。几个星期前,我们以 3.5 亿美金卖给了全球领先的触控引擎的厂商—— Synaptics。

科胜讯在语音方面的业务,基本上都是在最近的3、4年里重组起来的,当然这个组合里,包含业界最专业的人才。我们明天(雷锋网注:7月5日,百度AI开发者大会)会跟百度发布一个合作,上周腾讯云大会也提到了我们公司。此外,在国际上我们去年已经跟亚马逊合作过,并有微软、哈曼,韩国所有的制造商、运营商基本上全部都是科胜讯的客户。

在语音市场上,我们已经做了蛮久的,以前都是和别的语音提供厂商做合作,而没有来宣传我们自己的产品跟品牌。

雷锋网:当时是预见到了语音交互会火吗?还是只是出于对这个技术的相信?

Saleel Awsare:从2012年左右开始,我们已经看到语音交互领域,有很大的市场前景,那时候我们聚焦在 Audio、Voice 上,基本就是这个原因,看到了这个市场正要兴起。

因为我们是芯片、半导体厂商,我们要做的东西,必须比市场快,甚至要快很多年,这样在这个市场正在成长的时候,厂商们可以选用我们的方案。我们的业务分两块,第一块是语音交互,另外一块是 USB-C,前一个是人工智能相关的语音交互,后一个应该说是在两年半之前,我们已经看到这个先机,苹果准备把耳机的3.5毫米孔拿掉,所以我们在 USB-C 上面就花了很多能力,就是等苹果、华为、Google这些公司有动作的时候,我们的方案就已经成熟了。

雷锋网:科胜讯的语音交互产品叫 AudioSmart 解决方案,它是包括软件和硬件两个部分?

Saleel Awsare: AudioSmart 里面是有硬件的,基本硬件就是一个DSP(数字信号处理),这个 DSP 里面运作一些软件,用来降噪、降回声、降混响等,但是我们有一个很特别的地方,我们在当初设计的时候,已经是为了远场收音来做设计,所以它跟市面上流行的麦克风是可以做搭配的。

另外一边,最机密的地方是在我们的软件,通过这个软件,我们可以做到用两个麦克风或者四个麦克风,效果跟市面上六七个麦克风一样,当然这个是非常难做的技术。为此我们研究了大概五年以上了。

因为有这个特殊的软件技术,我们可以在远场的拾音上面做的特别好。

另外,我们有一个技术,是通过声音进行定位,这个东西在未来的 IoT也是另外一门重要的技术,上述这些我们都是有专利的。

雷锋网:声音定位的技术有应用吗?

Saleel Awsare:当然有,在我们的四个麦克风产品上都有用,目前两个麦克风的没有。

雷锋网:亚马逊、Google 、苹果等公司都出了智能音箱产品,他们在麦克风上花了很大的力气,所以,是不是对于智能音箱来说,麦克风的技术更核心、更关键一些?还是你们的产品更重要一些?

Saleel Awsare:市面上有很多不同的麦克风,但麦克风的好坏不会决定某个音箱产品——拾音或者辨识能力的好坏,重点依然是我们做的这块,我们必须把降噪、降回声、降混响等等做好,另外还要处理好跟这些不同引擎的搭配。

大部分人不了解,亚马逊、百度、Google 都有各自的引擎,每一个引擎的习性都是不一样的,你必须要在做降噪、降回声或其他处理的时候做相应的优化,你必须要了解这些引擎,才能优化到最佳状态。

麦克风怎么拾音,拾音后要做多少降噪,如何处理回音,这这里面实际上有很多调整的功夫要的,并不是说你拿了麦克风,加在到这上面就可以用。

实际上,中国厂商在这方面应该有很多经验,但很多人觉得一个音箱加两个麦克风就能变成智能音箱,但是后来发现产品非常糟,因为他们从来都没有想过,这后面还有引擎如何搭配,产品声学怎么去设计等问题,在这些方面,科胜讯有很多年的经验,我们目前在指导市面上一些厂商,因为这些才是最重要的。

雷锋网:我看到官网主页上说,目前这个性能非常好,甚至是最好的,有没有一些量化的数据可以佐证?

Saleel Awsare:提供这些资料当然是没有问题,我们本身也做过很多测试报告,但是以我们自己来提供测试报告给你们的话,我相信也不止我们,你去问任何的一个厂商,它的报告都认为自己的产品是最好的,我们有另外一个想法,如果我们技术不好,哪为什么亚马逊、百度、腾讯、哈曼和这么多的韩国厂商要选我们。

所以,本质上其实也不是我们说了算,而是由客户们自己去做过这些测试,他们来证明科胜讯在这方面是世界上最好的语音交互方案公司。

雷锋网:就中国市场来说,科胜讯大概有多少客户?未来在中国市场的营收方面,有一个什么样的预期?

Saleel Awsare:其实,我们比较早就投入到这个市场了,很早就跟科大、云知声这些厂商有合作,只是有一些原因,导致我们没有公布跟他们合作的消息,但我们在中国市场上已经做了很久了,现在跟 BAT 做的合作,目标就是希望在未来的几年,把这个市场打开,中国的人是全世界最多的嘛。

我们在国外已经有很好的成功案例,中国市场上有 BAT 的加持,基本上我们可以做一个预期,这个市场的大小,在未来2-4年,可能会跟手机的市场一样大。因为语音实际上不止在音箱上用,你在家里任何一个地方都可以有的。

雷锋网:但现在有一个现状,在国外 Echo 卖得非常火,但国内的智能音箱厂商,包括以语音交互为主的智能电视,卖的都不是很好,所以,中外市场会不会有一些差别,比如在用户习惯上,可能国外的用户更习惯于使用音箱,但国内用户没有这种使用习惯,这会不会对你们的预期造成影响?

Saleel Awsare:亚马逊花了两年的时间,打开了市场,让大家真正开始去使用它的产品,除了音箱本身,很重要一点就是 Skills,Skills 就相当于手机上的 App,你有很多的App,就会很多人去使用这个产品,它会让你的生活更方便。

所以,基本上打开市场需要做的就是两件事,第一缩短生产产品的时间,第二让开发者更快的开发应用。

以我们的看法,国内 BAT 在领导这个市场,现在我们有安卓、苹果 iOS,但未来的话,语音 AI 就变成一个 OS,那可能就有为不同系统设计的新应用,亚马逊叫 Skills,中国我不知道百度叫什么,但是会有这些应用,让你叫它帮你叫车、叫食物、问时间。

通过语音,生活上面所要做的东西,以后就不用带电话了。你可以随时携带,也可以放在家里,但是你直接跟它讲话,它就可以帮你实现,会回答你,帮助你,做语音助理等等。未来来讲,现在开始是非常早的阶段了,但是我们会往这个方向去行进。

雷锋网:除了在智能音箱上的应用之外,有应外在其它的场景吗?比如汽车、电视、其它的可穿戴的设备上面?

Saleel Awsare:基本上现在大家看到的,就只有音箱和电视机,但实际上我们接触的产品已经包含耳机、智慧控温器、机顶盒、路由器、冰箱、冷气机,应该说现在都已经有科胜讯的产品,几个月之内就要上市的。

所以,所谓的 IOT 市场,换个讲法,我们在一个人在家里面,只要有插电的东西,都可以加上语音,这个是我们看到已经在发生的趋势了,并不是预言而已,我们已经有产品在制造了。

雷锋网:对于语音识别来说,因为中文和英语差别比较大,为了开拓中国市场,会不会在中国单独设立一个研发部门来研究语音识别等技术?

Saleel Awsare:其实我们在成都和上海已经分别有很大的研发团队了,这个也是很多人可能不知道的,这跟科胜讯以前的背景有关。另一方面,语音识别这块不是我们负责,我们是做语音处理,语音识别可能由其它的厂商来做,BAT、科大讯飞等这些厂商,我们的角色是这个声音进来,确定它要接的这个识别引擎,可以做到最好的配合。

雷锋网:在图像处理这个方面,目前有什么样的进展吗?

Saleel Awsare:现在说这个业务还太早,暂时不能对外透露。

雷锋网:无论是语音还是图像,用这样的安排是因为在人工智能领域,这两个方面,它实现商业化的前景最明朗,是因为这样的原因吗?

Saleel Awsare:绝对是的。在 PC 和手机市场之后,实际上它们已经没有再继续成长了,接下来成长很快的市场就是 IoT,语音交互、视觉等是它未来成长最主要的因素。

雷锋网:目前在研发投入上,中国市场占全球市场的比重是?

Saleel Awsare:我们制造研发团队已经有 60% 以上的人,是在中国上海、成都这样一些(城市),资金投入也至少达到 50% 在中国,因为我们相信中国市场是很大的,即便现在还没有比美国大,但是未来它的潜力应该是比美国大的,中国在未来几年一定是一个潜力最大的市场。

雷锋网:现在看到你们的合作策略是大公司也有,初创公司也会合作,是来者不拒的还是也会有选择去甄别一些有实力的公司来合作?

Saleel Awsare:我们的做法就是把这个开发工具做好,做的让大家都能够很容易去接到不同的 AI 云,接到不同云交互的引擎上,因为我们知道,这是打开这个市场最快的方法,我们也不知道有什么新的公司会进来,尤其在中国,这种新的公司真的非常的多。

所以,我们能做的就是把我们自己做的部分做到最好,然后让开发者更快更容易去使用它,基本上硬件跟云端的结合,我们都已经做好了,剩下的部分就是让这些软件公司还有软件开发者,他们去做研发,他们知道去那里找到我们这个平台,这个在国外已经被证明,是非常成功的案例。

在亚马逊,我们已经卖了超过 600 个这样的开发工具,当然不是完全 600 个机会,但是全世界也至少有400-500个,这种机会已经存在了,这些不止是开发者,也有制造商,中国市场上,可以把百度做为同样的模式,把这个工具散出去。

雷锋网:明天(7月5日)是百度的开发者大会,可以提前透露一些你们跟百度的合作消息吗?或者是合作了什么?

Saleel Awsare:最主要明天公布开发工具,跟一个参考设计。

雷锋网:这是为了让更多厂商来用它的语音平台是吗?

Saleel Awsare:对。

长按图片保存图片,分享给好友或朋友圈

专访科胜讯总裁 Saleel Awsare:智能语音交互为我们带来的新机会

扫码查看文章

正在生成分享图...

取消
相关文章