雷锋网按:本文作者陈孝良,博士,声智科技创始人,曾任中科院声学所副研究员和信息化办公室主任,北京市公安局首届网络应急专家,主要从事声学信号处理和 GPU 深度学习算法研究工作。
两年前,还没有声智科技这个名字,那个时候就连人工智能都是不清晰的,远场语音交互的概念更是无人问津,对于我们来说,唯一能让投资人有点兴趣的就是亚马逊的Echo,但是一个当时还没任何影响力的智能音箱未来又能有多大的市场?所以,我一直在思考和试图回答一个问题:语音这个赛道到底有多大的市场容量?
遗憾的是,我也一直没找到让资本市场更为信服的答案,即便科大讯飞的市值超过了千亿人民币,资本市场对于语音赛道的质疑也最为明显,因为语音赛道确实不如视频和自动驾驶的商业模式清晰,语言本身就是一个看似简单却又极其复杂的问题,也成为了困扰国内语音赛道最为严重的问题。除了科大讯飞,似乎没有一家语音赛道的公司估值能和视频或者自动驾驶的公司相提并论,即便语音赛道很多公司的年龄都远大于AI其他赛道的公司。
那么国外又是一种什么情况呢?我们现在知道,国外的互联网巨头无一例外的都投入了重金并且战略性发展语音业务,包括了目前市值排在全球前三的苹果、亚马逊和谷歌,当然也包括微软、三星和脸书,有意思的是,虽然这两天的中美贸易战影响了股市,但是亚马逊的市值还是超过了谷歌成为老二。而且,人工智能全球实际领跑的企业,不是一直投入重金研发的谷歌,反而是一家出身于电商的亚马逊,电商的基因就是善于打仗,亚马逊现在偶尔就闹点摩擦来围堵谷歌的核心业务。
虽然国内还是慢了一些,直到今年的春天,语音才真正在国内开始爆发,这其中贡献最大的就是小米和阿里的智能音箱,但是这两款产品相继突破百万的销量也给苦苦寻找出路的消费电子市场带来了新的方向。从AWE到CCBN两个展会,智能语音都成为了最受关注的方向,不管是互联网巨头,还是传统的电子厂商,大家都把精力聚焦到智能语音产品。这蛮有意思,2018年资本界的风口是区块链,而产业界最为热闹的却是智能语音。
很自然地,大家开始意识到智能语音的市场容量是巨大的,因为从智能音箱、智能盒子、智能电视到智能汽车,似乎智能的前提都是必须先具备智能语音的功能。刚刚开年,猎豹、阿里的发布会就相继发布了多款智能语音产品,相信今年的消费电子发布会都会以智能语音作为噱头。但是这又产生了一个新的疑问,提供智能语音的技术公司到底赚钱吗?或者说,语音这个赛道确实热了,但是智能语音公司的商业模式清晰了没有?显然,在这个早期的阶段,应该不会太清晰,任何一个行业兴起的早期阶段,未来都是不清晰的,即便我们一直再说要站在未来看现在,但事实上,我们还是会被周边圈子的意见严重束缚着,很多时候我们对未来都是恐惧或者焦虑的,或者逃避了我们对于未来的判断。所以很多时候,我们才会非常崇拜乔布斯、霍金或者杰克逊,至少他们代表了我们作为人类的想象力和创造力。
语言,从我们人类的经历来看,确实会非常影响我们的决策和判断,人是从属于社会的,我们无法跳出周边环境的影响。那么假若机器都具备了语言交互的能力,再假设这些机器足够多,将会给我们带来一个什么样的未来呢?我想,机器很可能会影响甚至左右我们的很多决策,或许就这一点就足够了,因为这将会给未来的商业模式带来颠覆性的变化。我们回顾历史再来看当前的互联网巨头,20年前互联网也是刚刚兴起,那个时候的互联网也就是做个网站而已,但20年后我们才发现,真正改变我们生活的,不是这些网站,而是谷歌、亚马逊、脸书、百度、阿里和腾讯,当然还有苹果、小米、Uber、滴滴、美团、今日头条等等,事实上,我们的传统经济模式已经被颠覆了许多。
于是,20年前的巨头很自然就被20年后的巨头所取代,最难以接受的是曾经很多辉煌的巨头早就倒下了。那么再过20年,这个世界又该如何变化呢?未来总是不确定的,但是有点是可以明确的,也就是说,我们身边的机器必然会越来越多,因为人类已经无法再离开这些更为高效特别是更加懂你的工具。那么,当你身边的音箱、电视、冰箱、洗衣机、微波炉、空调和汽车,甚至咖啡壶都给试图给你建议的时候,我们还能保持人类的独立判断吗?至少现在,我们人类独立的判断力已经被媒体和互联网严重侵蚀了,我们需要广告和用户点评才有信心吃顿饭或者买双袜子。所以,我们是应该更加信任机器呢,还是应该更加恐惧机器呢?当然,这会让很多企业看到大把的商机,而且绝对是极其诱人的,但是怎么实现呢?至少,从现在的格局来看,每个巨头的优缺点也都是非常明显的,有缺流量的,有缺支付的,有缺产品的,有缺渠道的,等等吧。那么,谁又能把搜索、社交和电商串联起来?或者说颠覆了呢?
只有新兴的时代才能改变现在的格局,假若未来人、宠物和机器构成了我们主题生活,而我们宁愿更加信任宠物和机器而不是人类的时候,或许就是新的时代来临了。语言就是其中最为重要的工具,我们无法预测机器学会人类语言后所带来的影响,因为人类的决策可能瞬间就被机器改变了,我相信人类很难会拒绝机器的甜言蜜语或者恰当好处的恭维。这就是未来,语言最大的魅力就在这里,这和人脸识别或者自动驾驶这类非常确定的生意不同,语音是一个可以引起更多商业模式创新的技术,只要你够有想象力和创造力,可能你引领的就是未来20年后的生活模式。
所以,暂时还是无法清晰看到语音赛道到底有多大市场容量,到底能颠覆什么,这是未来都需要思考的问题,或许我们都有一个答案,需要5年或者10年才能验证。但是,就因为看不懂,所以我们才好奇,因为好奇,我们才会热爱,因为热爱,我们才会奋不顾身!只有能拿来赌的,才是未来!
雷锋网雷锋网