昨天云知声在京举行了年度品牌发布会,除了宣布与华为进行合作这个仪式,大屏幕一直在播放其互联网客户这一年对云之声的反馈,唱吧陈华、Ucloud季昕华、酷我音乐雷鸣、亮风台廖春元、小优刘雪楠、有巢智能皮振兴、学多多符悦、爽哥英语Jason等我们熟悉的30多个创业者面孔,让坐在下面的媒体朋友们以为来了个互联网新锐CEO的一个大集结。
而云知声CEO黄伟则重点回顾了自家在这一年取得了什么进展:
• 升级LSTM深度学习技术
• 语音方面,在IOT方面延生了 远讲识别和降噪技术、低功耗唤醒和识别技术、车载噪声和回声消除技术
• 语义方面,将解析领域扩充至60+
• 发布面向家居的完整解决方案
• 在车载终端后市场份额做到第一
• 在口语评测方向成立子公司
• 开始和华为、高通、海尔这些大公司取得合作。
会上,我们看到年初以开放、亲近互联网自居的云知声开始更多地和大厂商合作,以及在智能硬件遭遇寒冬的情况下,依然逆势推出面向IOT领域的完整解决方案,会后雷锋网采访了CEO黄伟,问他如此布局的原因。
黄伟:目前智能家居和车载,跟手机比的话,存量确实不大,但这是一个新兴的市场,它未来的容量会超越互联网,最近国内有很多芯片收购的案子其实都跟硬件联网息息相关。
从行业布局的角度看,今天的量小,并不代表未来的量小,而且跟硬件相关的,越是看着很艰苦的工作,越是要提前做,就像今年的O2O,除了一线的BAT,有价值的恰恰是那些干过苦活脏活累活的58同城美团等,这也是在硬件还没起来的时候,我们要去做IOT布局的考虑和原因。
另外,我想说的是,跟硬件相关的语音识别第一个考虑的是成本,之前亚马逊icon音响有个9个麦克风,就像9个信息源一样,可能要一个非常powerful的CPU放上算法把声学噪音消除掉,但是光处理所有跟声学相关的部件就要100美金以上,但厂商最多能承受10多美金的水准,所以要等以后做到3-4美金的成本,智能硬件才会更好地普及。
黄伟:其实是因为技术获得认可后,我们被对方选择的,和华为高通全志的合作,他们的行业标准制定者是有利于提升我们的技术水平的,他们的量非常大。
来的人我们既需要高通华为这样的大客户,也需要创新性的小客户。
因为大客户往往是稳健保守的,创新性产品往往是创业公司来承担,小的公司没钱的时候,不会硬性说你先给我钱,对于一些好的团队和好产品方向也会给与一些支持。
黄伟:每个公司有自己的基因和主业,百度在08年之前就开始跟中科学合作,08年后就组建了自己的团队,还请来了吴恩达博士;微信下面有自己专门的语音识别团队;讯飞可能更多地关注政府、金融或者运营商。
作为一家创业公司,我们自己的定位是一家技术驱动的互联网公司,我记得二零零几年初的时候,这个领域的博士毕业生工作是不太好找的,甚至是要转行的,但最近人工智能整个领域都在蠢蠢欲动:
这个领域技术积累很重要,但我们更相信技术到方案的快速落地比较重要,在提供的技术性能不变的情况下,保持高效率,低成本这可以说是我们作为一个创业公司近两年快速突围一直在努力的东西。
另外虽说竞争对手都很强大,但是公司再大,每个Team获取的资源是相对有限的,随着时间的推移,大家都各自会奔向各自要深耕的垂直领域。
除了云知声,BAT、科大讯飞等厂家都普遍使用了DNN算法,对于云之声升级的LSTM算法,
黄伟表示:
DNN是一个前向操作,对时间轴是没有记忆的,但LSTM具有记忆能力,对时间轴可以进行建模,对大数据的描述和解析能力会更强。
(对此,记者问了思必驰CEO高始兴对LSTM算法的看法—— “相对于DNN,可以学习长时和短时两种上下文信息,本质是一种递归网络,用的好的话,声学可以提升相对15%(不是绝对提升),相应地计算量也会更大”,高始兴如是说。)
相对于科大讯飞的十多年布局,云知声成立之初一直以互联网公司自居,借着亲民形象俘获了不少硬创公司的支持,在新兴垂直领域,比如家居、车载取得了一定的成果,甚至在科大讯飞布局的在线教育也抢得了一杯羹,而从会上发布的合作商名单来看,其在大公司领域也开始穷追猛赶,但是目前语音识别公司间的竞争并不像外部想的那样你死我活。
语音识别作为一项应用技术,而不是产品,在生活中的应用领域非常之多、非常之细,如果要问两者间的区别
“科大更封闭一些,云之声更开放”
科大讯飞的人士如此回应说。