【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。
张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化,他感慨:“大模型不仅把知识给压缩了,还把时间给压缩了。”最直接的体现是,在过去的 9 个月,张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化,2023 年结束时,张帆团队已拜访了上千家客户。
最大的褒奖来自竞争对手的敬畏。去年下半年,一位前大厂 VP 就曾对 AI 科技评论表示,当他准备入局大模型创业时,了解完智谱的市场步骤后,他的“创业信心打了 9 折”,原因是他们“才刚起步创业做技术,人家(智谱)就已经是一个商业化公司。”
商业化作为一道分水岭,将智谱与中国大多数的大模型公司区分了开来。2023 年 4 月份,AI 科技评论在北京见到张帆时,张帆就告诉 AI 科技评论,他预测中国的大模型发展“上半年是融资战,下半年是价格战”,但直到下半年,大模型 To B 与 To G 的赛场上,依然只有寥寥身影,智谱便是其中之一。
关于智谱商业化的“激进”,业界的一个解读是上一代 AI 公司的教训让科技投资者普遍耐心不足,因此他们给这一代大模型公司的盈收时间长度缩短了一半。但从 2023 年大模型的整体落地来看,这一解读并非事情全貌,部分明星公司也仍对外称“将重点放在技术打磨上”。
在 AI 科技评论看来,智谱商业化更快的原因主要有二,一是实力,二是洞识。
模型上,据 AI 科技评论观察,目前除了智谱,国内还没有出现第二家大模型公司能以平均每 3 个月迭代一次的速度来更新模型能力。2023 年,智谱分别在 3 月、6 月、10 月推出 ChatGLM、ChatGLM2 与 ChatGLM3。2024 年 1月又迭代了新一代基座大模型 GLM-4。
节奏上,也鲜少有人关注到,智谱从 2023 年 3 月就开始组建商业团队。
尽管过去一年智谱因为走To B、To G 的商业模式而被外界误解为“上一代视觉 AI 公司的翻版”,但经过一年的实践,故事开始出现新的走向:由于大模型技术的 AGI 特性,即使是聚焦在大客户服务,智谱的商业模式也有所不同。一位早期投资智谱 AI 的投资人更是告诉 AI 科技评论:
“过去的科技浪潮启示,在未来的五到十年,大模型的机会首先还是在基座。”
2023 年 10 月,在与 AI 科技评论探讨大模型开源与商业化时,智谱AI CEO 张鹏脱口而出:“谁说创业公司不能赚钱?”
作为中国最早的大模型开源团队之一,智谱曾被问及“非盈利”技术开源与“商业化”模型销售之间的平衡关系,张鹏认为人们对于学者创业的看法过于保守。而实际上,不仅是非盈利性质的技术开源符合智谱学者创业的基因,商业化思考也是智谱发展的持续动力。
1996 年,清华大学计算机系知识工程实验室(“KEG”实验室)成立,以机器学习、数据挖掘为主要研究方向。从2006 年起,团队开始研究大数据挖掘与知识图谱,并孵化了科技情报大数据挖掘与服务系统平台 AMiner 系统。随着 AMiner 的不断成熟,张鹏等人开始思考商业化,于是在 2019 年 6 月将 AMiner 单独拆分出来、成立了一家公司,也就是如今的“智谱 AI”。
据透露,智谱从成立的第一天起就有收入,团队氛围一直是“一边研究技术、一边开拓市场”。在智谱的研究重心还在数据挖掘与科技情报分析时,智谱所服务的客户群体就已经覆盖了国内的科研机构、科技型企业、互联网企业乃至海外科技公司。换言之,“智谱从成立起就拥有 To B 基因。”智谱 AI 总裁王绍兰说。
2020 年 6 月 OpenAI 发布 GPT-3 是智谱的一次重大转折点。也是在 2020 年,智谱创始团队将研发重点从数据挖掘转向语言大模型。
2021 年年底至 2022 年是智谱创立以来商业化色彩最浅的一年,理由也是要研究千亿大模型。智谱认为中国已有的万亿多模态大模型底层能力仍然只相当于一个百亿大模型,于是 2021 年年底开始在智谱找钱、找卡开发千亿大模型。但当时国内市场并不关注大模型,直到启明创投、君联资本与高瓴资本“冒险”,智谱才成功拿到一笔融资,并率先在 2022 年 8 月研发出中国最早的千亿大模型之一。
换言之,智谱“创业”在找钱、做技术的历程上都要领先于大多数大模型公司约半年,商业化节奏更快自然也是情理之中。也是由于技术的先发优势,ChatGPT 出来后,智谱仅用两个月就开发了 ChatGLM。
据熟悉智谱节奏的投资人透露,从 2023 年 2 月开始,智谱创始团队如张鹏等人就表现出有别于多数创业学者的商业热情,“很早提出要做私有化部署与 API。”也是从 2 月开始,张鹏等人开始对外寻找商业化负责人,前大搜车 CTO、连续创业者张帆加入,开始组建智谱大模型的商业化团队。
据 AI 科技评论了解,截至 2023 年 11 月中旬,智谱 AI 的商业化团队从最初的十几人迅速发展到上百人,从售前到售后、包括解决方案均建立了完善的团队。指挥分配上,智谱的商业化也是“一把手工程”,尽可能覆盖更多行业,在 Q2 就完成了商业模式的探索。
私有化模型是智谱商业化的关键转折点。智谱推出私有化部署这一更具有中国特色的解决方案后,受到了行业客户的广泛欢迎。但也由于过去 AI 落地中,“私有化”与“定制化”的关联过于紧密,智谱商业化遭到了业界的讨论与关注,被质疑是否会成为“上一代 AI 公司的翻版”。
张帆告诉 AI 科技评论,过去一年的探索启示,大模型的商业化不会重复上一代 AI 公司的老路。由于智谱研究的是通用大模型,智谱向客户提供的是“标准化的技术产品与服务”(即 GLM 大模型),然后再让各行各业的客户在智谱的标准通用大模型上微调,开发出满足各自所需的终端产品与应用。
换言之,智谱通用大模型扮演的是数字化时代的“ AGI 中台”,是大模型时代的“基础模型商”。在智谱,SaaS 的行业鸿沟并不太深。
关于 AGI,张鹏赞同一种说法,即大模型存在三个模型层,分别是 L0(基础模型)、L1(行业模型)、L2(面向更加细分场景的推理模型),三者并不独立,行业模型(L1)和细分场景的推理模型(L2)理论上是基于通用模型(L0)增强出来的,智谱要做的就是尽全力做好 L0,赋能伙伴和客户做好 L1 和 L2。
针对不同的用户需求,智谱现在总结出四种主要的商业模式:API、云端私有化、本地私有化、。
智谱的商业体系是一个金字塔形状:最底层是开源层,ChatGLM 拥有上千万次下载量;往上第二层是 API 层;第三层是云端私有化,面向中型企业,中型企业不仅有使用模型的需求、还有将自身数据作为竞争壁垒的需求;第四层是本地私有化,面向对安全性要求极高的企业。据知情人士透露,比较小的单子、智谱只用一两周就能交付完。
同时,智谱不是一个模型打天下,而是拥有完备的大模型矩阵:语言模型、代码模型、多模态大模型,参数上涵盖开源的 6B 到商业化的 12B、32B、66B、130B,用于部署在手机与汽车等端侧的 1.5B、3B,对话产品 ChatGLM 与角色扮演的 CharacterGLM 等。
从 To B 的角度来看,与一家拥有完备模型矩阵的大模型独角兽合作,就意味着合作成本的降低。
此外,在大模型的商业浪潮中,智谱的定位实际也符合一个大的科技浪潮的发展规律。以互联网为例,互联网的起点是芯片的诞生,芯片成熟后跑终端(如小型机与 PC),终端成熟后跑软件(如甲骨文等公司纷纷在 80 年代成立),软件成熟后进入 PC 网络时代、后来是移动互联网时代……
科技浪潮从来是先基建、后应用。若 AGI 也是一个新的浪潮,在最开始的五到十年,基座大模型也将是最蓬勃的市场。
2024 年 3 月 14 日,距离智谱发布千亿对话基座模型 ChatGLM、并开源 ChatGLM-6B 已经过去一年时间。在 ChatGLM 的一周年期,智谱对外发布了一批商业化案例 ,给行业提交了一份商业化狂飙的成绩单,也验证了智谱在商业化上的前瞻性。
据智谱商业化负责人张帆透露,在过去的一年里,智谱的商业化取得了远超预期的成绩,包括圈定了超过 2000 家生态合作伙伴,与超过 200 家客户进行了深度共创。
过去一年里,智谱商业化团队完成了重点标杆客户的业务拓展,据智谱发布的这份商业化案例合集,包括了智能汽车、金融、咨询、数字营销等诸多领域的应用案例。
数字营销领域的巨头分众传媒,拥有中国最⼤的⼾外媒体⽹络,分众用户覆盖4亿中国城市主流消费人群,庞大的广告业务意味着所有广告编写都需要由专业广告编辑完成,人力成本高,效率低。同时,销售收集、整理⼴告主体的产品信息⼯作量⼤,信息不全⾯。
基于上述场景,分众传媒在智谱大模型基础上,微调开发了“众智AI”营销行业大模型,共使用了5000条微调数据,如:品牌、产品、⼴告⽂案。
如上图所示,分众公司通过输入客户产品相关的信息,模型就能输出符合分众⼴告⻛格的⼴告语。
⼴告⽂案对于基础模型的要求极⾼, 需要基础模型已经学习过⼴告相关的的内容, 并且⼴告⽂案本⾝对于语⾔的运⽤更加严谨、复杂,对于模型的基础能⼒有更⾼的要求。通过测试对比,微调后的GLM模型生成的广告,相比较于GPT-4,更加简练、准确,风格和语言运用更贴近分众的风格。
智能汽车是很多大模型落地时瞄准的一大领域,因为现在的车控场景追求越来越智能化,能精准地与用户完成交互、提升用户体验成为一大卖点,而大模型的能力刚好可以升级这块。
智己汽车是上汽集团旗舰品牌,是阿里巴巴智慧赋能,专注打造的高端纯电智能车,智己汽车聚焦「智能化」。基于智谱的GLM系列基座模型和智己提供的座舱内的预料数据,智己汽车微调得到“IM生成式大模型”,深入挖掘海量座舱交互体验数据并构建最新模型智能体能力框架进行整体升级换代,与端侧大模型协同配合,将综合复杂场景进行云上分流,实现更丰富的多模态AIGC智能化场景。
传统⻋机系统对于语⾳指令理解率受限,⽤⼾需要明确指令才能执⾏操作,当⽤⼾有更加自由的说法时,车机无法理解用户的真实意图,智谱GLM系列⼤模型通过AI技术使⽤更少的语料⽀持座舱更多的意图,赋予座舱更准确、更流畅的语⾳识别功能,以及更丰富的知识储备和语义理解能⼒。
金融领域也是AI 落地的必争之地。华泰证券基于智谱的GLM系列⼤模型,叠加了40-50G⾦融专业书籍、资讯、百科、法规、上市公司公告等⾦融专业数据进⾏增量训练,以及投研、客服场景上万条⾼质量指令集进⾏指令微调,形成华泰⾦融⼤模型1.0,落地到智能客服场景,相较于通⽤⼤模型效果提升10~20%。表现出明显的金融领域优势。
华泰证券之前传统的运营模式,是基于传统知识库机器⼈和模板引擎等能⼒,已经初步构建多场景的客服服务体系。但仍存在产品形态孤⽴、意图识别泛化性不⾜、缺乏多轮会话理解能⼒等问题,导致客⼾使⽤体验不佳,未充分形成⼀站式财富管理助⼿形式的服务能⼒。
添加了基于智谱GLM系列模型微调后的华泰⾦融⼤模型1.0能力后,华泰证券新一代的财富管理助手“涨乐财富通APP”终端⽤⼾的体验感变好,解决了传统技术无法对意图进行精准识别、无法与客户之间进行多轮交互的问题,拥有了加强和用户的交互体验和一站式服务的能力。
华泰证券测试对比发现,智谱的模型对于多轮多意图的语义理解能⼒,以及⽂档精准有效的总结,在国内外模型能⼒中领先。
除了数字营销、智能汽车、金融,智谱还在互联网、传统制造业等多个领域,跟金山办公、蒙牛等多家公司通过模型私有化、API调用完成GLM系列模型的商用落地。
根据客户的反馈,这些B端用户愿意选择智谱的模型主要是因为模型效果好,安全,GLM系列模型表现领先其他模型,导致生成结果效率高、准确率高,带来用户增长、效率提升。
有人曾告诉AI科技评论,智谱极大可能会成为中国大模型第一股,因为智谱在三方面领先其他公司:一是商业化快,二是算力多,三是生态在不断完善。
对于今天的成绩,CEO 张鹏认为,智谱最大的特色是从核心技术出发到整个商业化落地过程都有自己的想法,坚持自主可控的核心技术,以生态为主来做商业化落地。
但大模型赛道没人能够松懈,即便强如智谱,今天大模型技术进步的陡峭曲线还没有放缓的迹象——大模型与上一代的AI技术不一样,比如视觉 AI 在人脸识别上,识别准确率达到 90+%、超越人眼就已经是一项里程碑的技术,但大模型是活的,这项技术的能力还在不断扩张,如 2024 年刚开始,Sora 便惊艳四座,未来 OpenAI 还有多少“王炸”,大家都在等。最终大模型的能力能达到什么水平、谁都不知道。
在张鹏看来,智谱商业化最大的拦路虎还是在技术。如果智谱真已经做到了 GPT-4 或者 GPT-5 的水平,很多商业化上的问题,如效果不好、价格高昂,甚至连商业模型都不用再考虑,只提供 API 就行。
技术的突破意味着算力之争,粗暴点说,谁的卡多,谁能训练出“中国的GPT-4”“中国的Sora”的机会更大。
张鹏预测,2024 年智谱所面临的挑战是非常艰巨的。一方面,2024 年 OpenAI 在超级认知、超级对齐上的技术会实现新的突破,这要求智谱不断迭代技术,跟进世界领先脚步;另一方面,2024 年大模型会迎来商业化落地潮,智谱的商业化竞争压力也会加大。
大模型商业化之路方兴未艾。