雷锋网消息,2月21日下午,还未上市的搜狗在北京举办了一场财报媒体沟通会。在会上,这位CEO保持了他一贯敢讲敢说的风格,除了介绍公司过去所做的事,以及对人工智能和业务方向的理解,还对其他公司作了近乎不留情面的点评。
雷锋网了解到,在王小川看来,以搜索起家的搜狗本身就是一家AI公司,不存在转型的说法。“中国现在有两家是在AI上最努力做报道的自媒体,其中一家问,搜狗要转型做AI了,我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,搜索引擎变得很聪明,能够帮我们选择出更好的页面来。”
他认为,AI里面最难的地方是人的思想和知识的学习,不仅是图像的识别,语音的识别,因为人的难点也在于知识的理解和推理能力。而搜狗在AI场景里细的分类,是在自然语言里,这是人工智能最难的一块。公司将通过语言将搜索升级到对话系统、问答系统以及翻译系统,这是他们核心能力的三部分。
那在AI领域,搜狗做得怎么样了呢?王小川认为,如果论排名的话,搜狗搜索在国内排名第二,AI方面应该在前三的位置。
不过面对一些世界级公司,他还是比较谨慎,称“我们没有Google或者DeepMind那种能力里面,属于开创出新的算法出来,但基于上面的算法去改良的能力是足够的。”
百度同样是一家搜索公司,也同样将AI放到了核心地点,所以两家公司的对比也是王小川绕不开的话题。谈到百度,他表示,“2015年,我们发布了微信搜索和知乎搜索;2016年,我们发布了明医搜索和英文搜索,慢慢开始和百度走向不同的道路。”
他说到,“我认为百度是没战略的公司。”在医疗上,他则说到,“ 我会认为百度会变得更难,因为百度现在毕竟市场份额大,他会把广告模式转成免费为用户提供多种咨询的模式,收入会下滑”。
不过王小川对百度新上任的COO陆奇十分尊重,称陆奇有两个很大的优点,“一是技术理想主义,和他聊天能看到他一谈到新的算法就两眼放光,半夜两三点去读论文,是个很好的技术人。二是也不官僚,跟他谈东西,也不会摆在全球华人最高职位上,而是非常平易和我们去谈的。”
对于无人驾驶,王小川认为有两个事,一个是无人驾驶里的辅助系统、导航系统;但开车目前还无法完全实现。他表示,在车载这块,搜狗会在里面做一些东西,但不是无人驾驶这个事情,“开车这事儿不是搜索公司该干的”,公司会聚焦在“自然交互和实时计算,导航在这个范围里”。
或许上面就是他认为百度没有战略的原因。
对另一家AI公司科大讯飞,王小川显得“仁慈”得多。
他认为,科大讯飞是to B的公司,基因是做企业的事情;搜狗是做toC的公司,是和消费者、网民能产生一种连接,基础的技术竞争力方向是不一样的。
不过在竞争性的产品上,“贬”一下也是不可避免的。
“目前语音识别里,用户使用量最大的是搜狗,远远大于科大讯飞,在输入法里已经用到了。做技术现在需要两件事儿,一是有数据,二是有研发AI的能力。数据能力上,我们是有优势的,研发能力我觉得搜狗也没有弱的地方。从应用场景到数据积累、技术能力,我自己评估一下我们都占优势的位置。”
在语音加翻译上,他表示“和讯飞的比较里已经不是关键问题,我们现在明确和两家公司作对比,一家百度,一家Google,我们有信心比他们要好,直接线上能看的。无论是语音识别还是在线的翻译,我们都比他们好。”
以下是雷锋网得到的沟通会王小川自述部分,全文请看这里。
挺高兴有机会和大家面对面谈,有段时间我们和媒体没有亲密的接受任何一个这样的访问。回顾从2013年到2016年,13年搜狗与搜搜合并,到现在已经三年的时间。
我第一个感慨是,搜狗搜索活下来了,2013年合并时,360的一些言论,说中国搜索市场只能容纳两家,没有第三家的事情,表达第二家是他,现在看起来,在中国百度依然还是很大,此外搜狗是唯一一家既有PC搜索也有无线搜索,市场份额、收入利润在上升的公司。这也是我们活下来,而且不断地有更多竞争力的原因。2016年利润是6.4亿人民币,其中投入到很多领域去,在搜索行业算是活下来的。
具体看量,我们可以号称叫全球第三大搜索引擎,虽然只做中国市场,因为Google最大,百度第二,我们第三,从搜索量排是在第四,后面才是其他家引擎,想说量上中国市场是最大的,在国内第二,在全球排第三的位置。2015年,我们发布了微信搜索和知乎搜索,2016年,我们发布了明医搜索和英文搜索,慢慢开始和百度走向不同的道路。大家用微信会用一些。我认为,医疗搜索和英文搜索是通向未来两个很重要,可以展开无限想象力的事情,通过微信搜索和知乎搜索基本固定了形态,在医疗往下出现自助诊断甚至分诊,能够让用户真正明明白白看医生。现在大家拿着化验单可能不知道什么意思,给你个诊断方向你不知道怎么办,或者发生头痛感冒不知道怎么办。这是借助大数据下,在AI分析里逐步走向辅助医生或者让用户和医生之间建立更多信任的工具。我们知道,国内之前有很多做医疗的创业公司,基本觉得把这个市场做坏了,把医院医生搞得很疲惫,因为大多数逻辑,是希望医生脱离医院出来在线做诊断,他要形成对用户的吸引力,也要建立后面的商业模式,这是原来的一点。
但是我们没有这个需求,因为我们本身有用户,用户需要解决诊断的问题。我看到一些医疗机构,大部分来讲,上不接用户,下不接医院,就是医院不是他的,用户也不是他的,在中间是没有竞争力,他想把医院拉到自己这边,吸引用户,医生是没有办法独立于医院的,这是之前创业者出现的问题。但是我们有用户,我们代表用户找到医院,找到医生,这样的模式能够真正有机会成立。而且我们在医疗上也没有创业公司赚钱的压力,因为对我们而言,只要用户认可搜狗搜索,有足够大的搜索量,搜狗搜索有良好的商业模式,只要量大,给用户搜索产品就行了,而其他创业公司会面临压力,第一是没用户,第二是基于资本压力创造赚钱的模式,这也使得搜索引擎公司在医疗服务里能找到自己更好的位置。
我会认为百度会变得更难,因为百度现在毕竟市场份额大,他会把广告模式转成免费为用户提供多种咨询的模式,收入会下滑,我们没有这方面的压力,这是关于医疗上的思考。
另外,我们从英文搜索走向海外搜索,这周内我们会有两个升级,一是英文搜索升级成海外搜索,最后搜索的结果也是用中文呈现,以前我们大家谈到的事情是,去年有几十个院士跑去给习近平写联名信,希望能对谷歌网开一面,如果科技工作人员不能用谷歌搜索海外科技信息,中国和世界是脱节的,国内的科技发展就会受制约,我们可以不看国外的美剧、韩剧,但在国外科技、信息层面不能落后。但我认为不够,即便开放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括医疗信息、科技信息,甚至大家言论上的讨论都发生在英语世界里。
在这种情况下,把英文变成中文以后,我相信,98%的中国人才能更好享受全球的内容,因为我们最强的是语言部分。正好这个时代到了,去年在AI爆发一年到年底时,翻译技术是突飞猛进的,比原来的翻译有快速的发展,就像语音和图像突破,翻译技术突破了。因此,我们有机会把翻译和搜索做一个联动,因此我们说搜索全世界。一个中文输进去我们现在开始搜索的是全球的英文,然后我们未来考虑把全球的日文或其他文字的信息都搜索到,这样会构成一个独有的竞争力,这是Google并不care的东西,因为英文是他们的母语。这种情况下,在翻译上更多是秀研究的肌肉,Google秀8国语言的互译,秀的是如果没有语料,没有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻译,他们是在做这样的事情,和我们的目标不一样。我们是实实在在希望通过翻译技术把搜索做得更好,海外搜索也会成为搜索竞争中的差异化。
第一次从微信内容开始,我们开始和百度不一样,开始有了知乎、明医和海外,这周升级完之后就可以完全用中文完全浏览世界的网页,不仅是搜索的词用中文搜索,结果也用中文呈现,点出去的链接也全用中文来看,在一些场景里应用也更加方便。我们内心对这个事情有蛮高的理想,先不说赚钱的问题,因为地球上中国人是最多的,但是我们很不幸,在200年来发生的变化,英语成为世界主要沟通的语言。这么大的人群和世界主要语言有隔阂,使得用中文搜索世界,我认为,对中国整个大的复兴、成为世界主旋律的一部分是有历史意义的,我们内部叫重写《通天塔》的故事。《通天塔》就是讲语言不通,使得各个国家的人没法联合起来做事情,语言通畅了之后会带来一个新文明,就像发明火、发明电一样,所以我们2016年在搜索做了很多的工作,从AI也是武装到牙齿。
去年有个很著名的AI媒体负责人跟我聊,中国现在有两家是在AI上最努力做报道的自媒体,其中一家问,搜狗要转型做AI了,我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,搜索引擎变得很聪明,能够帮我们选择出更好的页面来。陆奇刚刚去百度,放出一句话,说搜索是AI最好的场景,搜索和AI是天生在一块儿的。今天在做AI的很多公司,大规模做机器学习、深度学习方面,人才方面也都是找搜索公司去要人。因为有了深度学习之后,会使得搜索场景有更好的武器来满足,甚至升级这样的能力,而我们内部的员工大部分受过正统的训练,怎么用这种数据和方法,大家都知道怎么读论文去提升,我们没有Google或者DeepMind那种能力里面,属于开创出新的算法出来,但基于上面的算法去改良的能力是足够的。
AI里,我们在翻译里面是往前在走,输入法之前也是很容易地开始做语音输入、图像输入,我们现在语音输入量是全中国最大的,而且比其他家加起来还要多的份额,1天2亿多次语音识别请求。在AI时代里,大家的理解不只是语音和图像,AI里面最难的地方是人的思想和知识的学习,不仅是图像的识别,语音的识别,人最宝贵的不是图像和声音,人的难点在于知识的理解和推理能力,而这种能力是靠语言体系来支撑的,靠语言来支撑对知识和思考的表达。搜狗在这里面天生是两个场景,一是输入场景,让大家用语言表达,二是用语言获取信息。因此,我们在AI场景里细的分类是分在自然语言里,自然语言代表了对知识和思想在这里面的人工智能,这里面是人工智能最难的一块。
往下的思考是几个事儿,通过语言将搜索升级到对话系统、问答系统以及翻译系统,这是我们核心能力的三部分。包括《一站到底》,可以认为是搜索对未来的模式,就是提问题,不是给你10条链接,而是给你1个答案,实际上《一站到底》的场景相对比较窄,我们在问答处理能力上是比较宽泛的,不仅能找到实体,能在里面做更多的运算,《一站到底》是演示下一代技术中间的场景。对话系统也是今年的一个重心,翻译系统,我们会把这种能力不仅用到移动互联网,未来在智能硬件里也会大量地使用我们的一些能力。以自然语言为核心,我们做语音也是把它翻译成语言,语音识别是从语音到语言,合成是从语言回到语音,但处理的核心是语言,我们要把语言的能力,结合语音、图像和其他方式放到手机之外的硬件里。所以,我们AI的逻辑不仅是放在输入法和搜索里,产品形态里有几个关键词:输入法,搜索,自然语言的计算,自然的交互。他们支撑的地方是对话的问题,问答的问题以及翻译的问题。我们希望在这几个场景里,大家都能看到搜狗的声音,尤其硬件、IoT到来的时代,无处不在会有交互和机器智能,这是对未来的判断。
以上是搜狗过去所做的事情,以及往下对人工智能和业务发展方向的理解。