资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

着重发力智能家居,思必驰从“成长榜”到“最佳雇主”的进击

作者:赵青晖
2017/05/06 12:43

雷锋网「新智造」正在启动“新智造成长榜2017”评选活动,我们将对人工智能与机器人行业进行大规模报道、梳理和调研,并联合数十家著名投资机构根据这些创新公司的技术实力、商业能力和成长性进行深度评选,最终从多个领域分别选出一些极具潜力成长性的创新公司。如果你想参与我们的评选,可点击「报名」链接,或通过邮箱xinzhizao@leiphone.com联系我们!

着重发力智能家居,思必驰从“成长榜”到“最佳雇主”的进击

去年8月12日,在第一届CCF-GAIR 全球人工智能与机器人峰会举办的当晚,CCF-GAIR的承办方雷锋网联合近30家创投与资本机构、资深学者与产业界代表一起,共同为25家创业公司颁出AIR Top 25成长榜(今年正式更名为「新智造成长榜」)榜单。

此次AIR Top 25成长榜旨在发现在未来3年内在人工智能和机器人领域最具成长性的行业创新群体。雷锋网与上述近30名来自资本、学界、业界的代表一起,从130余家人工智能、机器人、智能驾驶等领域的创业公司中筛选,并最终形成了AIR Top 25成长榜单,智能语音技术开放平台思必驰也成为了上榜企业的其中之一。

而今据第一届CCF-GAIR峰会已经有很长一段时间了,第二届的CCF-GAIR峰会即将在今年7月7日召开,在开始之前,雷锋网「新智造」对去年上榜的企业做了一次回访,聊一下他们近一年来的发展状况,本篇就是雷锋网「新智造」对思必驰的回访内容。

着重发力智能家居,思必驰从“成长榜”到“最佳雇主”的进击

业务偏重变化

思必驰的CMO龙梦竹告诉雷锋网「新智造」,过去这一年对思必驰来说,最大的变化之一,就是智能家居领域在总体业务的重点程度提升了很多,这其中有三个业务领域的产品发展得最快:分别是音箱、白电和故事机。

从解决方案来说,音箱和故事机的解决方案这两个是重点。

而机器人市场方面,较去年来讲,消费机器人在今年也稍微降温了一些,让思必驰在这方面也有所调整。

智能玩具市场的升温,让智能机器人整体的市场有些下降,所以我们在消费机器人领域的业务重点程度也降了些。但是关于故事机我们最近也在争论,是应该把故事机看做一个智能家居的产品还是看成一个微型的机器人,这个还没有个准确的说法。

在此前,思必驰在车载方面发力很猛,市场能能够见到诸多后视镜都在使用思必驰的方案,今年以来,随着车机4G功能的提升,智能车机的整体市场发展明显迅速升温,思必驰也加重了对智能车机的发力程度。

另外,近一年,思必驰的合作客户按照数量来算,大概增长了30%左右。其中一些标志性的客户和产品都是大家耳熟能详的,比如小米互联网音箱、联想的电视、音箱以及海尔的馨厨冰箱等等。

技术迭代和突破

系统迭代

对于思必驰的对话操作系统AIOS来说,在去年CCF-GAIR峰会至今,期间最重大的变革就是完成了3.0版本的升级。

据介绍,AIOS15年10月推出,在去年CCF-GAIR峰会的时候是2.0版本,而现在最新的版本是已经是AIOS 3.3了,也就是说,从去年大会到现在,AIOS已经升级版本大概四五次了。

技术突破

龙梦竹告诉雷锋网「新智造」,近一年,思必驰在技术上有了两个重大的突破。

抗噪语音识别

去年下半年,思必驰在抗噪语音识别方面推出了一个新的算法模型——VDCNN。

一直以来,噪声环境下的语音识别都是一个难题。

目前基于深度学习的主流语音识别技术及引擎,已经可以在很多信噪比相对比较好的环境下取得良好的准确率,但是在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),性能变会急剧下降,远远不能满足实际应用的需求。

为此,思必驰上海交大联合实验室对此问题进行了研究,历时一年多推出了VDCNN算法模型。

根据思必驰官方技术介绍中的描述:

相比于传统语音模型仅使用1至2层卷积层,思必驰通过堆叠较小的卷积层和池化层,将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述,能够更好地在语音模型的内部实现了声学自动降噪的能力。

龙梦竹告诉雷锋网「新智造」,该算法在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率,而国际的平均水平是10%左右。

着重发力智能家居,思必驰从“成长榜”到“最佳雇主”的进击

解码框架

在通常语境下,大词汇连续语音识别由于词汇量庞大且没有固定语法,会造成搜索空间非常庞大,导致识别速度缓慢等问题。

目前,通过离线基于WFST的搜索空间预优化、在线逐帧同步维特比解码、结合可变帧率分析等传统做法都可以加快语音识别速度,但是,离线优化效果有限,逐帧搜索计算量大,而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

近来,连接时序模型(CTC)取代传统隐马尔科夫模型(HMM),被应用到语音识别中,其特点显著,能够针对识别序列进行整体建模,带来更好的前后文建模能力,使语音识别的建模单元显著减少,并使庞大搜索空间相应减小。

另一方面,模型本身建模了多帧对一个音素的映射关系,使得模型输出的声学信息集中。根据模型输出特点,适宜采用更长的搜索步长,由逐帧同步解码,转变为音素同步解码,从而减少了搜索计算量。

思必驰结合以上两点改进,研发了新型解码框架Phone Synchronous Decoding,使语音识别系统的速度累积提高20-30倍,内存下降50%以上,从而使得大词汇连续语音识别可以应用于离线手持设备;而基于该系统提出的置信度算法,得益于集中的声学信息和相应设计的优化算法,取得近一倍的提升。显著改善了语音识别系统的用户体验。

以上就是思必驰在去年CCF-GAIR至今在产品和技术上的成长,此外,龙梦竹还告诉雷锋网「新智造」,思必驰今年还会继续参加第二届CCF-GAIR峰会,并且他们最近还在准备另外的一些技术,不过还在保密阶段,届时会在大会上一举公布。

人员变动和融资

自去年CCF-GAIR至今,思必驰已经完成了一轮融资,即去年9月份的C轮融资,具体的金额和资方都没有公布。

龙梦竹告诉雷锋网「新智造」,在去年10月,思必驰已经从这笔融资中拿出几千万来做员工的福利政策,比如员工可以享受30万的购房免息款。

在员工方面,思必驰目前员工将近300人,而去年CCF-GAIR期间只有200左右,较去年增加了近百人,据悉,在新招员工中,技术研发和项目产品占大部分,因为拓展了一些新项目,在项目开发和商务产品团队建设方面都需要投入。

从“成长榜”到“最佳雇主”

去年的成长榜TOP 25,和今年即将推出的「新智造成长榜」一样,旨在未来3年内在人工智能和机器人领域最具成长性的行业创新群体,其中评选上榜的标准其中一条是具有「三年十倍增量的潜质」。

去年思必驰估值10亿,今年年初已经达到了20亿。

 三年十倍,也是我们的目标,目前看应该是靠谱的。

经过一年的成长,今年思必驰仍会参加今年7月7日的CCF-GAIR峰会,据悉,今年峰会上,思必驰方面还会有更多更大的料要爆。此外,思必驰除了报名了新的「新智造成长榜」的评选,还参加了雷锋网联合旗下人工智能频道AI科技评论、环球科学以及BOSS直聘共同重磅推出的AI领域雇主评选榜——「2017 AI 最佳雇主」的评选活动,从“成长榜”到“最佳雇主”,见证了思必驰的成长,也证明了我们榜单对未来的预见力。

长按图片保存图片,分享给好友或朋友圈

着重发力智能家居,思必驰从“成长榜”到“最佳雇主”的进击

扫码查看文章

正在生成分享图...

取消
相关文章