上上周雷锋网写了个《儿童机器人怎么还没火起来?》的文,一位做而儿童类语音识别芯片的人士(深圳天博智科技)找到记者,表示对文中儿童机器人创业的现状分析非常有同感,同时他也表示自己也有一些话要分享给正在做儿童机器人的朋友,希望自己多年的积累能对正在做儿童机器人的朋友有所启发。
对于这样一位之前做嵌入式语音芯片,现在开拓云端语音芯片,拥有10多年儿童类语音芯片研发经验、和世界多个玩具品牌合作的传统芯片厂家人士,记者觉得这是一面常规互联网之外的镜子,可以照出一些之前我们看不到的东西。
果不其然,这位人士分享的观点跟我们平时看到的很不一样。
从我们的芯片输出来看,小孩类的机器人不论是3岁-6岁还是6岁-12岁的主要的功能还是玩。奥飞的溜溜球和陀螺,一年卖20亿元,卖了那么多年还是卖地那么好。本质上因为满足了孩子的社交需求。
另外,这个溜溜球会随着孩子一起“成长”,小孩子大了会接着买更大的溜溜球。
现在互联网的创业者做儿童机器人,如果做出来的用户体验好不好,不了解父母的需求的话,是行不通的。从我们上游产业链的角度来看,玩具是用来玩的,但是做玩具不是闹着玩的,它要基于市场的需求来做,市场的数据。
譬如,现在一些机器人里面掺杂了一些娱乐和学习的功能,但已经上学的小孩子是非常排斥你要他学习的,高素质教育的家长也希望孩子玩的时候好好玩,学的时候好好学,玩的时候还强加很多东西去学,这是不行的,包括乐高都是纯粹让孩子玩的,不会加上儿歌、算数、英语让孩子去学,从我们的经验看,这是不对的。
(为什么点读机类的东西有大量家长买单?)
步步高点读机,这个东西不算玩具类的,这个产品又不一样,它不属于幼教类的产品,它属于电教类的产品,它是教材相配的辅助工具,一半是三年级以上用的比较多,它这个是有一定市场的,回来温习功课的用得着,就像大学生上课还要买个英语电子词典学英语。
如果早教机里面非要加什么东西把它当做娱乐功能加进去比较好。比如优彼熊、果果兔以及其它一些玩具外表的娃娃,能唱歌能背诗,能讲故事,其中优比熊就做的很好,卖200-600块钱的市场也很火爆。但你若光放点唐诗就没这么好卖了。
我们这行基于云端的语音芯片出来之前,嵌入式语音识别芯片是主流,包括科大讯飞都有嵌入式语音识别和云端语音识别两种业务。嵌入式语音识别之前主要用于故事机、几百块的儿童机器人。
通俗地讲,嵌入式语音芯片是一个本地计算实时处理的芯片,不受网络负载的影响,可以实时的看到结果,比如你一说“你好”,就会马上得到答复反馈,会比通过WiFi网络来做云端的识别要快一些,之前它们90%应用在智能玩具上。
不过,其缺点是语义识别这方面做地比较弱,它的对话模式比较固定,可以反馈得语句也比较固定,语法不够流畅,没法即兴发挥。
但瘦死的骆驼比马大,单说儿童机器人,这块技术积累了很多年,以我们自己的芯片为例,从支持5句话的到5万句的芯片都有,造价从1块钱到几十块都有。
如果是对这个行业有长期积累的语音芯片公司,使用稍贵的嵌入式语音芯片并不比初生牛犊的云端芯片体验差很多,所以云端语音技术做得不是特别好的情况下,不建议卖几千块,这在消费者体验的时候差距不是很大。
之前业内的芭比娃娃玩偶公司用了硅谷Nuance的云端语音识别技术,导致了很多家长的投诉,因为那些玩具回答出一些有暴力倾向和性暗示的词,最后沃尔玛和亚马逊都下架了,综合来看,使用基于云端的语音技术也需要一个长时间的积累和纠错的过程。
所以最好是了解儿童语音习惯,又懂云端芯片开发的公司做这个最好。
虽然包括我们自己都在研发基于云端的语义识别,但嵌入式语音识别这波不会过去那么快。等到什么东西都用WiFi时肯定是过时的,可是因为它的成本很低很低,在儿童领域的数据库因为多年的积累,交互还是非常好的。所以,在云计算识别的大趋势下,它还是会有很久的生命力。
在嵌入式识别这块,之前印象比较深刻的是,奥菲、骅威、火火兔、优彼熊在用我们的芯片的时候,每天会给与很多反馈,包括性能、抗造、内容、功耗、性价比上的,孩子家长那边会长年累月的积累出来许多数据。所以市面上新推的小优机器人,虽然用的全志的嵌入式语音芯片,但依然是一款高端产品,以3000多块的价格在卖,这个展示给我们的另一面,是嵌入式语音技术并不一味地意味着低端,它也有高端的产品。
从客观的市场现状来看,儿童行业是一个比较传统的行业,是一个充分竞争的行业,它算一个红海行业,通常的娃娃、故事机都在几百块钱的样子,甚至在几十块钱,市场里的一部分人会承受不了突然给它加个几十块钱的冲击,这是一个不现实的事情,卖100、200块这个市场是一个刚需。
现在我们这个行业,支持本地也支持云端语音识别的公司就那么几家,但云端这个趋势在玩具里面,可能需要5年,估计三年都够呛。
据记者所知,机器人这波的创业潮,有人把它称为继“PC、智能手机之后下一波智能主机的种子选手”, 但当中的儿童机器人扮演的角色,偏偏不是老手皆宜,人手一台的消费级机器人角色,它是有其轨道的特定属性的。
它的技术门槛不算高,但它的行业积累不能少,即使一些基于云端的语音识别公司想通过自己的产品打造一个全新的语音数据库,但有一部分的数据积累是之前嵌入式语音识别公司做过的,他们不一定完全相同,但是有一部分东西是共通的,这一部分就是我们要借鉴的地方。
之前我们做“智能硬件”,有一些创业公司因为找不到合格的代工厂,甚至想过要自建一个全新的代工厂,新开一条全新的生产线,但是很多势单力薄的创业公司,碍于囊中羞涩,最后不得不向传统行业“妥协”, 甚至最后衍生出“智能硬件原来是个传统行业”的超级论调。
风口变换,创业不息,我们不支持一开始创业的开始就带着传统行业的脚链跳舞,但我们可以用辩证的思维,看看什么是可以借鉴的,什么是因为成本控制有可能要做出妥协的,什么是这个行业发展到时没法跟上的,保持热血的同时多一点思考,只为把成功的概率提高一点点。