AI 搜索向左，搜索 OG 向右

AI AI搜索大模型

作者：晓楠

2024/08/08 18:56

作为 AI 世界的领头羊，OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。

这把火原本由 Perplexity 引燃，在美国烧及 Google 和微软，在中国引发了百度、360 的追随，又带动一批创业者跟上，已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话，那么 AI 搜索之争，就可以步其后尘，称之为“百搜大战”了。

在这场竞赛中，AI 搜索和搜索引擎的区别泾渭分明：

Perplexity 类产品的横空出世，对于搜索引擎似乎已经形成了莫大的威胁。对于大厂派而言，内部的组织惯性、竞价排名商业模式带来的变革阻力，以及用户流失到新的 AI 搜索产品上，成为了他们不被看好的几个话题点。

但在与多家公司交流后，雷峰网(公众号：雷峰网)认为，AI 搜索是产品驱动的先锋，但搜索引擎也决不是被动挨打的对象。

胜也推理，败也推理

提及 AI 搜索，第一印象，当然是 Perplexity 所自称的“我们不是AI搜索，我们是答案引擎”的自信。用户提出问题，对话框下面直接给出答案，而且还提供了引用来源，给出联想问题，与用户形成进一步的延伸互动。

许多人都对这一问题百思不得其解：AI 搜索有何特殊之处？为什么不管是像 Perplexity 这样的创业公司，还是夸克这种原本做传统搜索引擎的公司，都将 AI 搜索视作新目标？

首先，AI 搜索引擎做到了传统搜索引擎所不能做到的事情——更加智能。

用户使用搜索引擎是为了满足自己的求知需求，每问出一个问题，都希望得到一个明确而具体的答案，而不是传统搜索引擎所给出的相关文档、网页链接等。只是在技术条件达不到的时代，退而求其次，接受搜索引擎将大量网页送到面前，供我们挑选最满意的结果。

但挑选毕竟效率低下。而且用户的需求，不一定恰好有网页可以满足。大模型的出现改变了这一切。

相较于搜索引擎，Perplexity 创始人 Aravind Srinivas更愿意将其描述为一个“答案引擎”——当用户提出问题，它会给出一个简洁、明确的答案，且所有的答案都标明了来源。

之所以做出这样的产品，是因为Aravind Srinivas认为，当前世界中存在海量信息，在信息过载的噪音中，需要有一个平台来为用户提供精准答案。他信奉Google创始人拉里佩奇的一句产品哲学——在人机交互的过程中，用户永远不会犯错。

在我们的调研中，不少业界人士都向雷峰网表示，目前 Perplexity 被认为是美国大模型 ToC 产品中最好用的两款产品之一，另一个是 Character.AI。

国内的 AI 搜索类产品，比如秘塔科技、Kimi 等，本质上也是直接通过对话形式给出答案，填补的是传统搜索引擎搜索结果相关度不高、专业知识难以寻找、无法围绕一个问题进行探讨的缺陷。

搜索引擎的 AI 化，则是在原有搜索结果的基础上，增加了一部分通过模型能力生成的答案。百度、夸克都是这种做法，在某些搜索场景中，将生成式答案置顶，后面接续原有的搜索结果。

这两者的区别是，无论是秘塔还是Kimi，所有的答案都是完全基于大模型技术原生出来的内容。而加入大模型技术的搜索引擎，将搜索词（query）分为两类，一类是可以从网上得到标准答案和足够内容的搜索词，一类是可能包含有进一步需求、无法被网上现有内容满足的搜索词。

比如用 Kimi 和夸克同时输入“地球直径”这个搜索词，得到的结果是这样的：

AI 搜索向左，搜索 OG 向右

Kimi 是完全通过推理生成得到的答案，夸克则直接引用了百科的答案。

如果输入变为“地球直径是多少”，得到的结果也发生了变化：

AI 搜索向左，搜索 OG 向右

夸克通过对搜索词分析，判断这两次搜索时的实际需求是不一样的，前者可能只是想了解一个数值，后者可能是想要更多的详细知识。

推理计算是有成本的，尤其是面临着 C 端用户不可计数的需求时，这个成本就很可观了。假设推理成本降低到百分之一，搜索需求增长到一千倍，那这个成本还是要增加为原来的十倍。

搜索引擎的优势就是，他们已经积攒了大量的搜索数据，对用户的需求有了分析和分类，所以他们能够降低这个成本。这是传统搜索引擎多年的布局，新入局的AI搜索工具目前还无法跨越。

AI 搜索是“0”，搜索引擎是“1”

AI 搜索没有门槛。Perplexity 被称为“套壳产品”，因为它的推理能力来自于 ChatGPT，搜索能力则是靠接入 Google 和 Bing 的 API 来实现的。

蜂拥而至的同类产品在证明，这里确实谁都能来掺合一把。大模型时代的这些新公司，要走的是一条从零到一的道路。他们没有用户，没有数据，既没有搜索历史的负担，也没有搜索历史的积累优势，想要突出重围，只能另寻办法。

既然技术上找不到差异，那么那些在产品上有独到思维和差异化能力的，如 Perplexity 的一句话搜索、Kimi 的长文本总结能力等，才能跟其他产品产生用户心智上的差异，让用户记住，争取到一定的生存空间。其他的产品，如果产品的特征仍然是聚焦在类 GPT-4 的对话答案生成中，是没有竞争力的。

与初创企业或是传统搜索厂商不同的是，秘塔科技主要是靠做法律起家。

一位接触秘塔科技的投资人形容秘塔AI搜索是“一个神奇的项目”，原本秘塔所在的法律赛道就算做透了也就只有一两个亿的收入，并不被看好。融资过程中碰壁的秘塔认清这一点后，开始寻找新出路，由于秘塔的能力在于知识整理与搜索，这其实与AI搜索一脉相承，于是团队转向搜索，推出秘塔AI搜索，没想到踩中了风口，一炮而红。

传统的搜索公司，产品形态早已经稳定下来，这阻碍了他们的产品进化和创新。

但是从另一面来说，这些历史包袱带来的也不仅仅是阻碍，还有一些宝贵的财富。传统搜索公司的长处不在于产品，而在于他们的历史数据。比如从前文所述的搜索案例中，他们可以通过不同的关键词来预测用户真实的需求；或者通过一个用户的搜索数据和使用历史，去建立用户的个性化标签，了解用户想要什么。

此外，大模型的技术特点是“预训练”，即擅长记忆与背诵。AI搜索产品如 Perplexity、Kimi 都会遇到 1 个问题，就是 Perplexity 的一句话搜索会吸引的用户也是习惯用一句话搜索的用户，而无法吸引长文本分析搜索的专业用户，Kimi 也会更吸引长文本用户，但对有更多搜索需求的用户吸引力可能不大，造成用户茧房的现象。

了解用户、提升结果的精准度，搜索引擎在 AI 时代是跑在前头的。Perplexity 或者是 Kimi，这些新玩家暂时还没有这样的能力。

StatCounter 数据显示，2024 年 1 月，微软搜索市场份额为 3.43%，Google 搜索为 91.46%，而去年同期，两者分别占 3.03%、92.9%，微弱的增长并没有达到微软预期，Google 霸主地位依然稳固。

谷歌也在伺机反击。

去年 5 月，谷歌内测开放生成式搜索平台 SGE，今年 5 月，又添加可生成摘要呈现在搜索结果顶部的新功能——AI Overviews。对此，谷歌搜索副总裁 Liz Reid 的解释是，“有时你想要一个快速的答案，但并没有时间去拼凑出所需要的所有信息，那么通过 AI Overviews 就可以帮你完成任务。”

但一位投资人告诉雷峰网，他认为谷歌对 Perplexity 的反击似乎有些“敷衍”，只是将 Gemini 集成到搜索引擎中，添加些许 AI 功能，但使用时和传统谷歌搜索并没太大区别。

Perplexity 的一顿拳打脚踢也引起了非搜索领域厂商的兴趣。今年 4 月，有报道称苹果想要将 Perplexity 收入麾下，为下一代苹果旗舰手机做准备，不过也有业内人士分析称，Perplexity 现在更可能的买家是 Meta 和 Amazon。

技术驱动与用户驱动

虽然初创企业、传统搜索厂商纷纷争相入局做AI搜索，但在整体的探索路径上，大致可以概括为两种流派，一种是聊天机器人式AI问答搜索引擎，另一种是基于传统搜索引擎的对话框升级。

AI 搜索新生代中，又分为两类，一类是如 kimi 般“先技术后产品”，一类是如 Perplexity 般“先产品后技术”。

在技术上，Perplexity走的是典型的“先做产品再做技术”路线，Aravind Srinivas曾豪言“拥有十万用户的套壳产品，比拥有自有模型却没有用户更有意义。”，所以Perplexity的“套壳”之说甚嚣尘上，引发业界臧否。其实Perplexity确实使用的是第三方模型，但团队也在调用大模型时基于产品需求做微调，并打造出更适合需求的模型。

据了解，Perplexity模型用到的大模型有 Mistral AI 的 mistral 系列，以及 Meta 的 llama 系列等，并基于 mistral-7b、llama2-70b进行微调，打造出两款自己的大模型：pplx-7b-online 和 pplx-70b-online。

而除了大模型，Perplexity 的核心技术还包括传统的 RAG（检索增强生成技术），通过增强现有生成模型，使其能够访问外部信息源，提高答案的准确性和可靠性。这项技术的使用，确保了 Perplexity 在处理用户问题时，能够实时搜索互联网并提供准确的最新信息，同时附加可靠来源引用。

而传统搜索引擎代表往往具有强烈的用户驱动意识，如夸克搜索。

传统的搜索引擎，更像是在用户的需求中不断“缝缝补补”。推荐引擎时代来了，要加上推荐引擎，所以手机百度的首页上，要出现文章feed流。大模型时代来了，要加上 AI 能力，所以就要在搜索结果上面加上生成式的内容。

新的技术变革再出现后，搜索引擎还会有新的变化，至于这些变化能不能跟之前的功能相结合，会不会消弭掉产品的特色，可能他们自身也没有想清楚。

AI 搜索是技术驱动的产品，意味着更大的想象空间，有望催生更多更有趣的 AI native 应用。而用户驱动的产品或许有着更大的确定性，但是想象空间呢？没人知道。

另一个更关键的问题是，在用户认知与市场圈地下，AI 搜索的商业化前景如何？

多位穿越互联网周期的业内人士告诉雷峰网，他们认为：互联网时代，由谷歌开启、字节抖音达到巅峰的依靠流量卖广告的商业模式已经成为历史，AI 时代的蛋糕要有新的模式诞生。而 AI 搜索如未能摆脱过去的产品认知，也无法成为新时代最大的商业飞地。

所以，技术驱动诞生的 AI 搜索，在产品形态创新与用户开拓的双重挤压下，仍面临较大的不确定性。

结语

AI 搜索公司缺乏经验和数据积累，但他们有更大的想象空间，能够源源不断带来创新的功能和应用。

传统搜索公司在产品创新与技术实力上略有逊色，但他们有丰富的搜索数据与用户习惯认知，了解用户想要什么。

但是在短时间内，我们认为，Perplexity 是很难替代谷歌的，Kimi 和秘塔也是很难取代百度和夸克的。夸克这样的搜索引擎可以重新训练了一个全栈自研、千亿参数的夸克大模型，建立底层的分布式架构，专门为搜索产品服务。他们瞄准的用户是传统的、仍然有 80% 的需求是确定性答案的搜索用户。而 Perplexity、Kimi 等公司现在要做的，是从传统搜索引擎所无法覆盖的 20% 的市场份额中抢蛋糕。而这个蛋糕，Google 他们也在抢。

鹿死谁手，尚未可知。