2016年8月12-13日,全球人工智能与机器人峰会CCF-GAIR在深圳香格里拉酒店如期举行。在会场外的展区内,雷锋网看到了语音技术公司思必驰,他们正在用一款车载HUD产品展示车载语音交互的技术。本次搭载思必驰语音系统的设备是车萝卜(点击查看详情)。最终是实现将语音交互的内容显示在前挡风玻璃上(14寸),驾驶员就可以在不用低头看手机看车机、不用抬头看后视镜看遮阳板的情况下看到导航、微信、来电信息。
思必驰市场部经理赵燕燕告诉雷锋网,语音交互是符合人生活习惯最天然的入口,所以语音的识别、合成、理解、交互、集成,这一整套内容都为更智能的驾驶做辅助。
在语音交互这一块,要做的就是如何保证快捷交互的同时不给驾驶带来安全隐患。测试以记者说出的一句“萝卜”开始,设备识别到语音之后便会回应“来了来了!”接下来HUD投影的界面便迅速跳转,驾驶员可以在导航、微信、电话等诸多选项中选择需要的项目,比如导航。然后说出目的地名称,就投影显示屏会开启导航工作。
目前车载语音的难点在于快速唤醒功能,很多普通交流的内容很容易触及唤醒词,如两个人在聊天时聊到了下雨,那么车载设备识别了“雨”可能就会开启天气预报模式,这个时候可能就会影响驾驶。目前在车载领域,智能语音应用十分广泛,快捷操作成为了行业追逐的趋势。但是却往往会忽略一个最重要的问题,就是安全驾驶。思必驰表示,任何的快捷操作都是安全驾驶的辅助手段,抛开这一原则的任何产品设计都是不合理的。例如现在市面上很多的快捷唤醒,试用起来很方便,但是长期使用,会发现误唤醒率很高,给安全驾驶带来隐患。因此,车载语音的应用方式无论如何变化,都要以用户的安全驾驶为根本原则。
另一个就是他们所一直培养的认知智能,比感知智能更近一步,基于场景化的语音理解,进行追踪,进行决策的判断,最后是语音的反馈,更加侧重于人工智能。基于语音识别等底层技术的基础上,集成丰富的后端资源,这也是构成竞争力的重要因素。比如思必驰的车载音乐部分集成了酷我、虾米、天天动听以及电台类如喜马拉雅、考拉、多听等,保证用户在选择音乐时不被版权和平台限制。
其实国内的车企也可自主研发有自己版权的,开源的资源其实并不能完全满足用户定制化的需求,自主研发便可以满足硬件的垂直化、专注化、专业化。这样才能将人工智能的落地做的更加扎实。但在一刻千金的汽车互联网时代,更多的国内企业选择了与对应系统做的比较成熟的厂商直接合作。
赵燕燕对此表示,他们选择了智能硬件语音交互这一个方向,也是本着专注性决定专业性的原则。在车载后装市场包括智能后视镜、智能车机、便携式导航仪、HUD、车载音箱占到近半的份额。前装主要和互联网汽车合作,比如小鹏汽车、奇点汽车。
在6月份硬创公开课上思必驰还进行过裸技术分享(点击查看详情)。未来他们将把车载语音系统做的更加专注。2015年他们推出了车载AIOS,今年6月做了系统更新。语音可以及时打断和纠错,接受口语化的意图。最让中国人觉得人性化的莫过于方言的识别,目前东北、河北、山东、河南等大部分方言均可识别,四川话、粤语的版本也即将上线。