【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!
上次零一万物(以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。
这一次,时隔半年,零一不仅将基座模型卷到千亿量级,甚至还直接拿出一款 C 端新品“万知”,零一万物创始人李开复称其为“AI-First 版 office”。
在模型层,零一发布了千亿参数的 Yi-Large 闭源模型,在第三方评测基准斯坦福大学的英语排行 AlpacaEval 2.0上,Yi-Large 可与 GPT-4 比肩(如下图所示);并全面升级了开源模型系列 Yi-1.5,分为 34B、9B、6B三个版本,且提供了 Yi-1.5-Chat 微调模型可供开发者选择。
斯坦福 AlpacaEval 2.0 Verified 认证模型类别,英语能力评测(2024年5月12日)
李开复预测 2024 年是 AI 大模型应用爆发年,零一率先推出 AI 生产力产品“万知”,同款产品去年 9 月就开始试水海外,上线 9 个月用户数便突破上千万,产品 ROI (投入产出比)接近 1,根据现有的增速,零一万物预计 2024 年海外市场营收达到 1 亿到 2 亿人民币。
经过海外市场的验证后,针对国内市场的“万知”顺势推出。
万知立足于生产力产品赛道,瞄准办公场景,开辟了三个核心高价值场景“找读写”,不仅能问答、还支持超长文档阅读,最吸引用户的是支持一句话生成PPT,要做大模型时代的“AI 办公助手”。
发布会当天,李开复不仅宣布了Yi-Large 千亿模型、万知等新品发布,还公布了零一万物的战略打法,而在发布会后场答媒体问时,金句频出:
“ofo 的烧钱逻辑不再适合 AI 2.0。”
“PMF(产品市场契合)已经过时了,大模型赛道从狂奔到长跑,取决于有效实现 TC-PMF(Technology-Cost Product-Market-Fit,技术成本 X 产品市场契合度)。”
“AGI 是我的超级梦想,我承诺过我的投资人,未来十年不套现。”
经历过 2023 年的融资恶战,加之近日 OpenAI 的 GPT-4o 发布后并未引起太大震撼,说明大模型技术增长曲线处于放缓的状态,大模型从卷基础模型能力已经进入应用落地、商业化阶段。
零一正是基于这一判断,早在今年 3 月初零一就推出了 Yi 大模型 API 开放平台,为开发者提供包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型 API 接口,初步试水商业化。
目前大模型商业化主要通过两种方式:API、私有化部署,其中私有化根据各行各业对数据安全的不同考量,分为云端私有化和本地私有化,API 的方式,简单点说,就是各家通过一个程序接口,将模型的能力封装起来,让用户可以随意调用。
在零一的“模应一体”战略中,万知跟 Yi 大模型 API 开放平台都是模型应用、商业化的探索,一个主攻 C 端用户,一个面向 B 端开发者用户。
近日,AI 科技评论对话零一万物生产力产品负责人曹大鹏、Yi 大模型 API 开放平台负责人蓝雨川,跟他们聊了聊万知的研发过程,C 端产品如何在海外做到 ROI 接近 1,更多探讨了他们对 AI 大模型时代的产品思考 ,以及 API 如何成为一门好的生意?
两人曾在飞书时便是产品与市场的搭档组合,是移动互联网辉煌时代的亲历者,在 ChatGPT 来临后看到未来一个大的技术浪潮,躬身入局,遂决定加入零一万物。
以下是跟两人的对话(经整理):
AI 科技评论:请两位分别讲讲自己的从业经历,对大模型时代的借鉴与帮助?
曹大鹏:我经历过 Web 互联网、移动互联网,也曾自己创业,在大厂做过 B 端的 SaaS。
上一份工作是在飞书做产品负责人,国内的生产力赛道主要是 tob 的 SaaS,很多软件不好用。但飞书在国内无论是面向 ToB 还是 ToC,用户体验都非常好。这段经历对我帮助很大,让我了解办公场景的用户需求。
在移动互联网创业时一年融了三轮,当时市场热钱很多,所有投资人或者市场大家更关注用户能不能增长更快,但是不是发展更健康关注较少,经过了四五年,从 2017 年开始,整个市场完全就变了,抖音或者更大的产品出来,以前高速增长的一些创业公司例如 ofo 打车这些很难持续下去。
后来一个新技术出来,都开始关注商业模式,这种认知延续到我加入零一,当时零一选择市场时,便选择了商业化比较成熟的海外市场,我们第一天就提供收费功能,一直以收入目标为核心去做增长产品。
零一的生产力产品主打 AI 工作平台,核心是找到“找读写”这三个痛点场景在一个产品里完成,而不是说只做一个 chatbot。
蓝雨川:我早期做战略咨询跟移动互联网时代的投资,后面出来创业,做中国财税的 SaaS,也用到了 AI + RPA 技术,到飞书后跟曹大鹏搭档,做一个新业务的探索,曹大鹏是产品负责人,我是GTM负责人。看到ChatGPT 出来后,判断这是未来明确的大趋势,又一起做了一段时间海外 AI-Native 应用的探索。后来发现模应一体是更大的机会,所以就加入到零一万物。
到零一万物后,一开始花了很多时间在做海外的生产力产品,去年 11月开源 Yi-34B 模型后,在海外影响力不错,那时起就筹备 Yi 模型 API Service。
AI 科技评论:为什么当时没有选择从 B 端开始切入?
曹大鹏:任何一个新技术浪潮来临的时候,最先增长起来的肯定是 C 端市场,因为 C 端决策非常简单。ToB,从客户认可产品价值,到跟决策层谈好合作,再完成产品部署,整个周期至少 3 个月到半年起。
AI 科技评论:面对国内 C 端付费意愿较低的环境,万知未来要如何商业化?
曹大鹏:国内跟海外发达国家相比,不光是AI C端应用,所有的工作软件,整个付费市场都差了不止一个量级。在国内,如果一开始就做一个付费产品,可能没办法获得用户,就没办法获得用户的反馈,很难真正迭代产品。所以万知早期还是免费策略,但也有一些高价值场景可能会收费,例如用户想要一个 PPT,原来需要 1 个小时,现在用万知创作修改只用 10 分钟,我们相信有大量用户愿意付钱,而且据了解国内 PPT 制作市场,一些初创公司一个月也能达到上百万的收入。
AI 科技评论:零一的 API 如何跟友商竞争,有什么优势?
曹大鹏:首先零一最新公布的千亿模型性能多项指标超过 GPT-4,这是性能上的优势,其次,零一的 API 定价远远低于 GPT-4。零一最强的 Yi-Large 模型定价是 人民币20 块 100 万 tokens ,OpenAI GPT-4-turbo 定价是 10 美金的input, 30 美金的output,GPT-4 定价是 30 美金的 input, 60 美金的 output。
AI 科技评论:如何找到技术的 TC-PMF?
曹大鹏:研发大模型产品,除了要深度了解大模型本身的能力,能干什么,不能干什么,哪方面做的好,基于它能找到合适的场景去匹配。如果找了一个大模型根本不擅长的场景,这个产品就不可能有PMF。
其次,关于 cost 成本这块,即每次模型的调用到底花多少钱,包括接下来三个月、六个月它会降到多少钱?要计算产品给用户的免费用量应该是多少,付费用量应该是多少,因为最终要算整体的 ROI。所以,如果说模型每次调用成本降低很多的话,我们就可以给用户更多的免费用量,或者给用户更多的权益。但是成本一直降不下来的话,用户也就不能低成本获取 API,使用模型的成本较高。
这就对 AI-First 产品时代的产品经理要求更高,要有定义产品 PMF(产品市场契合点)的能力,还要对技术、商业有更多的理解,才能把 technology 和 cost 这部分权衡好。不同于互联网时代成熟产品的产品经理,现在的 AI 产品经理基本都要从 0 到 1 定义场景,构建产品
AI 科技评论:为何最初选择在海外开疆拓土?
曹大鹏:零一选择在大模型发展领先国内一个身位的海外市场出发,在一个相对成熟的市场去找真正的刚需,这是零一的策略,所以去年 9 月率先在海外推出了一系列产品,包括 PPT 这个功能也是在产品迭代过程中,发现用户对这个需求特别强,也愿意付费,我们才选择迭代进去。C 端产品在海外已经发展了近几百万用户,已经有了验证后面才决定跟基础问答的功能放在一起,在国内推。
AI 科技评论:API 开放平台跟生产力产品两块分别在模应一体战略中扮演什么样的角色?
蓝雨川:ToC Apps 和 API 都算是模型的应用。
API 并没有想象中简单,除了标准模型的 API 之外,也提供了Yi-Large-RAG、Yi-Large-Turbo这样的 API,这些 API 背后不是对应完全不同的模型,而是各个模型的组合。
我们把 API 当做一个产品,去想企业真实去使用 API 的时候,会怎么用,例如他们在做知识检索类场景时,是不是希望有一个RAG API能够带来知识查询和联网搜索的能力?
我们认为是会的,万知以及其他少数几家竞对产品都包含了RAG能力,但真正给到企业开发者的国内首个 RAG API 是零一API平台推出的。例如 Turbo API,开发者不是永远都需要选择最好的那个模型,他们经常要在性能、成本和速度之间去做一个平衡,这个时候 turbo 可能更适合。
曹大鹏:在零一的模应一体战略中,应用不仅包含了零一自研的应用,例如万知,另一部分的应用更广泛来自整个零一的生态,例如通过 Yi API 开放平台,将零一的模型开放给外部开发者,驱动大量新的应用。
因为不是人人都能去部署、训练大模型,API 就像一个管道一样,让开发者调用,零一希望通过 API 将大模型能力赋能到千行百业。零一选择几个擅长、了解的场景去做ToC 应用,其他应用则通过 API 平台去孵化。
蓝雨川:产品对于 API 是有非常大的帮助的。比如最开始是通过万知发现用户问到一些复杂的问题时,他需要有一个 RAG 的能力去提升这个回答的质量,所以我们就在模型上做了相关的 RAG 能力,再定义了 RAG API 。
AI 科技评论:大模型幻觉还没有彻底解决,在将模型应用到具体生产力场景中,是否会产生不良影响?
曹大鹏:幻觉并不都是坏的部分,比如零一模型在开源阶段,就有开发者专门拿模型来做创作、创意文案,想象力特别丰富,这就是好事。现阶段我们用大模型做生产力的应用也好,商业的应用也好,主要还是希望帮人们节约百分之八九十的时间,最终还是要依赖人的把关、跟判断的能力,所以现阶段 AI 还做不到万能跟全自动。
AI 科技评论:零一的模型对内部开发跟外部开发者有什么样的共通性和区隔性?
曹大鹏:零一海外、国内的生产力产品以及未来正在探索的产品,都用了零一的 API,可以理解为零一自己也是一个开发者,跟外部的其他公司开发者一样,直接调用 API 来研发应用,底部都是零一的各个模型。
因此,万知是一个非常丰富的产品,里面不止一个模型,例如解读图表背后就叠加了零一的视觉语言模型。
AI 科技评论:万知的核心场景除了 PPT 制作还有哪些?
曹大鹏:核心场景主要是“找读写”,“找”对应的是通用问答,就 chatbot;“读”是 AI 文档阅读,万知最多支持 5000 页,500万字的PDF,这个能力在竞品里还没有几家能达到,这其实用到了 RAG 技术;“写”对应到 AI 创作 PPT。
AI 科技评论:PPT制作怎么算是高价值场景?
曹大鹏:举个简单例子,小红书、抖音上有大量靠卖 PPT模板 ,一年赚几百万的博主。所以这证明了 PPT其实有大量需求的,WPS 现在 C 端一年收入都有几十亿人民币,这其中透露的就是产品力和商业模式。
而且通用问答产品已经严重同质化了,如果大家都做免费的,真的挺难活下去的,创业公司烧钱能烧过字节吗?
AI 科技评论:零一是如何去找应用场景的?如何才能做到事半功倍?
曹大鹏:用 TC-PMF 方法论去定义场景,模型的能力是不是足够好,还要看成本是否能 cover 掉,不会盲目去找一些留存少的场景。
其次,从海外寻找经验。万知是海外先行的产物,海外比国内在应用落地上快一年到一年半,所以我们先孵化海外,再复制到国内,而不是仅仅在国内闭门造车。现在国内大模型大家普遍还处于寻找场景的阶段,证明其实还没找到合适的场景。
AI 科技评论:零一会做私有化部署吗?
蓝雨川:零一会很谨慎对待这一点,我们优先关注的是,客户是不是真正在自己的场景上把 API 的用量用起来,把自己的AI产品做起来,产品能PMF 能赚到钱,我们不会去盯着项目交付赚一次性的钱。
AI 科技评论:大模型公司做 C 端应用成本相比市面上其他初创应用公司成本高很多,零一如何看待这个问题?
曹大鹏:自研模型有机会作出SOTA模型,还可以针对产品场景微调强化。如果用开源模型,验证期可能可以,但做深做大就很难,一是缺乏技术壁垒,二是开源模型本身部署微调的成本和人才要求也很高。
AI 科技评论:零一做应用的优势在哪?
曹大鹏:首先零一自己有在国际标准上排名靠前的模型,而现在的 AI 应用能做起来至少 60% 是由模型能力决定的。
AI 科技评论:现在零一API平台的用户有多少?
蓝雨川:正式发布前已经试运行了一个多月,有不少种子用户,可以期待下今年的成绩。
AI 科技评论:零一未来会持续开源吗?
蓝雨川:会持续升级,开源重要的是开源出来的模型要真的有用。所以零一开源还是以实用性为主,未来开源还是会以轻盈的模型跟多模态为主。
AI 科技评论:对过去一年整体的感受与看法,未来有怎样的的趋势预测?
曹大鹏:过去国内基本都在拼模型能力,真正落地到应用的很少,今年 AI 应用会迎来爆发,因为模型能力可能达到了一个临界点。同时,商业化会成为非常重要的一个课题。而 API 是很好的一个商业模式。
蓝雨川:我们理解接下来一年会迎来 AI 应用爆发,因为国产大模型能力已经与GPT-4 不相上下,而美国 AI 应用全面爆发正是在 GTP-4 0314发布之后。
我们也希望 Yi-Large 能够带来国内AI应用生态繁荣,也通过 API 为零一创造一个比较好的商业模式。做大模型的投入非常大,需要融资、买卡、训模型,如果一个创业公司一年、两年看不到商业回报,不能建立商业闭环,继续做更大的模型就很难,所以我们很努力在通过 ToC 产品和 API 去增长、赚钱。