不妨在Google搜索中尝试这样的操作:在搜索框中输入“how long does a goat live”(山羊能活多少年),接下来你就会看到如彩蛋般的特殊卡片显示在搜索结果最前面——15-18年!接着继续试着输入“a goat's mass and height”(山羊的体重和身高),就像是搜索引擎能够自动生成用户问题答案那样,45-300kg和40-58cm的答案又跃然出现在屏幕上了!
这套功能的官方名称叫做Google Knowledge Graph(知识图谱)。Knowledge Graph自动筛选出正确的搜索结果,做出全面的总结,将与关键词相关的知识全部的系统化地呈现在你面前。简而言之就是搜索智能化,根据用户的需求意图,提供用户真正想要的搜索结果。
Knowledge Graph诞生于两年半前,并且随着用户搜索次数的增多,其知识储备容量也是呈现指数次幂的增长状态。Knowledge Graph在Android操作系统中得到了应用,随后逐渐融合进Voice Search的功能。这意味着,你可以向Android手机说出需要搜索的内容,声音处理器通过处理语音信息,将结果传送给Knowledge Graph,然后给用户反馈答案。
Knowledge Graph通过以下三个方面的优化,给用户带来了更加人性化的搜索体验,
语言可能是模棱两可的 —— 一个搜索请求可能代表多重含义,Knowledge Graph会将信息全面展现出来,让用户找到自己最想要的那种含义。Google证逐渐学习理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。
有了Knowledge Graph,Google可以更好的理解用户搜索的信息,并总结出与搜索话题相关的内容。例如,当用户搜索“玛丽·居里”时,不仅可看到居里夫人的生平信 息,还能获得关于其教育背景和科学发现方面的详细介绍。此外,Knowledge Graph也会帮助用户了解事物之间的关系。
由于Knowledge Graph构建了一个与搜索结果相关的完整的知识体系,所以用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。
强大的功能和海量的数据库,意味着Knowledge Graph的运营成本是巨大的。另外各个巨头公司也开始开始参与进智能搜索市场的竞争中,例如Apple Siri和Microsoft Cortana,但是Google仍然被大多数人认为是行业领先者。最新的数据调查表明,Knowledge Graph能够智能回答用户提出的88%的问题,而Siri和Cortana分别只能做到53%和40%。但是这项测试是基于大量问题的调查下,当你向手机或电脑询问某个特定的问题时,你如何能确信自己得到的就是正确答案呢?
Siri功能的拓展是伴随着iOS系统的每一次的更新实现的,就像是今年夏天新加的“音乐识别”功能,现在的Siri朝着越来越臃肿的方向发展。这的确给苹果公司的工程师们造成了很大的压力,他们不得不绞尽脑汁在每一次的更新中,试图去添加最有价值、适用性最广的功能——而不是回答一个用户“山羊能活多少年”这种偏门的问题。Cortana的数据则来源于Google搜索,同时每两周定时更新添加新的功能模块。但是对比与已经成功运行两年多时间的Knowledge Graph,微软想在一时半会赶上Google的脚步绝非易事。
但是对Knowledge Graph来说,目前最棘手的问题莫过于,如何全面保证知识的正确性。本月初,美国电视节目主持人Stephen Colbert向公众声明自己的身高是5英尺11英寸,并不是Google给出的5英尺10英寸的数据。虽然事件的最后处理结果是,Google将数据修改为5英尺10.5英寸,但是这件事却揭露出Knowledge Graph面临的重大挑战。如果当用户在搜索时,采纳了Google给出的错误答案,这将会产生怎样的后果?再回到了最初的“山羊寿命”问题上来,从某些角度上说,15-18年或许并不是一些用户需要的最完美的答案。美国乳制品山羊协会给出的权威资料显示,乳用山羊的寿命一般为8-12年的水平,而小山羊的平均寿命则会更短。就像人类一样,山羊也是有复杂的物种区别的,所以在现阶段Google Knowledge Graph难以给用户一个全面完整的答案。
当用户向Siri提问,“how far away the moon is”(月球距离地球有多远),Siri将会向Wolfram Alpha请求数据。Wolfram Alpha是一款计算知识引擎,在数学问题领域拥有更强的权威性。Stephen Colbert事件的确让Google吸取了教训,现在当Google遇见了不能回答的问题时,便选择只呈现搜索内容,并不给出自己的答案。就如同“三人成虎”的现象一样,如果每个网民都认为山羊能活200年,Google也将在无数次的搜索学习中,将答案设定为200年。
Google公司将自己的Knowledge Graph产品称为星际迷航型号超级计算机(Star Trek computer)——能够给即刻反馈用户提出的任何问题的最正确真实的答案。科学家们耗费数十年的时间,来研究如何在计算机中更好的呈现知识,但是目前仍然做不到像人类的真实思想过程那样,让计算机拥有拟人化的思考方式。相比于特定事实,我们的大脑更加喜欢用固有的印象来描绘事物本身。例如当在谈到天空的颜色时,大多数人都会浮现蓝色的概念,即便有些时候天空的确是灰色的。Google想办法绕开了这一问题,将一些外围知识加入到答案之中。这虽然不像Wolfram alpha引擎那样完美,但答案足够接近,有一定可信度。可能,这就是我们现在能得到的最正确的答案。