加入大模型赛道,魏伟说,他和不少人一样,是“跑步进场”。
在互联网领域,魏伟并非初来乍到——相反,魏伟是一名技术出身的“老兵”。
2006年在百度,魏伟就是百度在云领域尝试的第一批贡献者,和余凯、贾磊、徐伟等大牛同袍同泽。2011年,他也是最早一批开始使用 GPU 驱动深度学习的先锋,支持算力平台。从百度出来,魏伟在2016年加入了正在高速发展期的腾讯云任职副总裁,在技术和业务层面都有涉猎。
中间,魏伟又经历了一段创业,而也是在这时,ChatGPT横空出世,让 AGI——这个一度被视为“口号式”的人工智能愿景——展现出了新的可能性。
面对这个可能颠覆科技界的机会,魏伟怎能不心动?在介绍之下,魏伟遇到了 MiniMax。魏伟发现这个年轻的团队对人工智能未来发展趋势的理解十分深刻,并且也坚定地相信着AGI。
于是,“跑步进场”的魏伟加入了 MiniMax,担任副总裁和开放平台负责人,帮助 MiniMax 在 B 端发展开放平台,拓展业务。现在,MiniMax 已经成为大模型独角兽公司。
近日,雷峰网来到了 MiniMax 北京办公室,和魏伟进行了一次深谈。也是在这次谈话后,有关 MiniMax 的很多疑惑,也都在不同程度上获得了解答。
在外界,MiniMax这个名字并不“响亮”——甚至不少 AI 领域的从业者,都从来没听过这个名字。
如同“锦衣夜行”,MiniMax 鲜少对外发声,鲜少参与测评,也鲜少主动发布自己的产品。事实上,和雷峰网的对谈,是 MiniMax 的高管首次面对媒体,直抒胸臆。
既有头部资本的支持,又有米哈游、腾讯、小红书等大厂的青睐。单从这一点来看,虽然没有主动制造“神秘感”,MiniMax 正伫立在聚光灯下,作为中国 AI 的新生代力量被密切关注着。
MiniMax 是谁?在魏伟的描述中,雷峰网看到了很多个“面相”。
从几位早期成员,到今天 MiniMax 近200人的整体团队,平均年龄在95后左右,还有不少00后。
(在 AI 2.0 的“英雄时代”中,涌现了一大批年轻有为的85后、90后创业者,雷峰网后续将持续关注和报道他们的故事和成果,欢迎添加作者微信:william_dong,交流认知,互通有无。)
魏伟来到 MiniMax,主要工作之一就是组建开放平台团队。不少入职的员工,都经过魏伟的亲自面试。
单是招人这一关,MiniMax 的标准,就足以管中窥豹,看到他们企业文化的一个侧面——每个加入 MiniMax 的候选人,都需要对技术和产品有足够的信念感。
这种对于 AGI 的信仰,体现在很多方面。比如,MiniMax 并不特别青睐更了解传统 NLP 或CV技术的“老人”,也并不强求新人具有多厚重的经验和背景。
“其实在大模型上,我们讲泛化能力;我们用一样的方式看人——应用到人身上,我们招人更讲究‘通才性’。”魏伟说道,“(我们招人)已经不再局限于必须得是计算机出身。我们也发现,很多数学、物理,甚至文学、心理学出身的人,都会有实际输出。”
在过去,不少头部 AI 公司招人,很多的关注都被放在:拿过多少竞赛奖项、发过多少顶会的 Paper……而这些“名头”,MiniMax 却并不强求,反而对很多进取、活跃、没有包袱的年轻人广开大门。
“大模型赛道还存在着太多非共识,既然我们也没完全弄懂,干脆和新朋友一起学习和成长。”魏伟对雷峰网表示道。
MiniMax 的低调,已经几乎成了一种“习惯”。
而当问到为什么他们更享受这种“神秘”的感觉的时候,魏伟对雷峰网说,他们并非刻意在保持一种“神秘”,而是真的觉得,自己的技术还并没达到能够让内部觉得“拿得出手”的程度:
“我们的技术还没能让我们满意,所以就不会贸然公布什么——在我们还没能达到自己期待的时候,过多‘抛头露面’,反而消耗的是市场和社会,对大模型事业的期望值。”
有一个投资人对雷峰网说过:在赛道过热时,能体现出一家公司定力的,不是他们在这个时刻做了什么,反而是他们选择不做什么。
这种定力,反而是体现在公司对于 AGI 的“野心”。
“如果大家都在现阶段水平下“卷”,其实没有任何意义,目前距离实现真正的AGI仍然有很长的路要走。我们的目标是在算法上持续保持领先,在业务上始终为用户创造实际的价值。”
这种“野心”,在 MiniMax 的身上体现相当明显。但也正是这种“野心”,让 MiniMax 显得相当谦逊。
然而事实上,MiniMax 在技术上的实力从成立至今一直保持领先水平,也是目前国内少有的拥有文本、语音、视觉三模态融合的通用大模型引擎能力,并打通产品全链路的创业公司。
对于全链路自研,MiniMax 的目标相当执着,目前模型每周都会做迭代更新,这对整个系统有着非常高的算法要求和工程标准。
“不少人质疑我们的算法是不是‘套壳’——对于我们来说,这甚至称得上一种褒奖。”魏伟对雷峰网说道。
在算法能够初步达到面向市场的程度之后,MiniMax 一直致力于“User-in-the-Loop”的产品研发模式,并且还取得了不错的成绩,而由此取得的用户反馈数据,也为算法的进一步提升打下了坚实基础。
但 MiniMax 还不满足于此,在算法日渐成熟之后,他们把眼光转向了 B端市场。魏伟所负责的面向企业及用户的开放平台,就是 MiniMax 意在利用大模型改变市场的矛头先锋。
做 To B 和做 To C 的逻辑完全不同,大模型更是如此——To B的产品要能实打实地带来生产力和使用体验的提升。
魏伟表示:“一个 C 端用户通过低廉,或免费的方式,获取大模型对他们问题的解答,或许有不少人愿意买单。但 B 端用户是否愿意为大模型付费,支撑公司的营收,中间其实还有一道鸿沟——很多 B 端客户不会轻易掏这个钱。”
而跨越这道鸿沟,MiniMax 选择的方法无他,只有通过加深对场景的理解能力,来发展出更具优势的技术。MiniMax 开放平台目前已接入数百家企业客户,打通办公协作、智能硬件、教育、医疗、客服等十余个行业场景。
“首先还是基于我们过去一年的研发能力积累,整套研发链路跑通后,我们会基于我们的算法能力来帮助客户在实际场景中对齐输出效果。”
以办公场景为例,MiniMax 为金山办公旗下的智能办公助手WPS AI 提供多种大模型能力。
结合办公场景的业务需求,大模型可以帮助用户完成文本生成、要点总结、任务分发、表格和演示生成等任务,以让办公更流畅、高效、智能。
如果你参加今年的 WAIC,在 WPS AI 的展区,MiniMax 将联合金山办公,完成一场技术分享会,推介他们最新的技术研发成果。
为了能让算法对于文档场景的理解能更加深刻,做文章、故事的续写,乃至到代码的生成,MiniMax 不仅有团队全时派驻在客户的公司,来帮助厂商获得更好的“使用姿势”;同时还更是分出人力,一家家地跑了不少业务相关小公司,有不少甚至只是五六个人的工作室,Case by case 地收集案例和使用需求,以此来实现算法层面的更新。
在落地的过程中魏伟带领的开放平台团队就是如此,跨越了一个又一个挑战。今天在办公文档领域,MiniMax 的算法已经可以帮助客户处理超过16k的长文、支持和优化摘要和缩写格式的输出、更准确直接地理解用户的需求,甚至生成代码,让处理文档的算法,从一个“文科生”往“理科生”的方向上转变。
而当被问起时,对于过去经历的难题,魏伟似乎并不完全在意。
“都是已经被解决了的问题,”他说,“我们更关注的是下一个我们将要迈过的‘坎’。”
以技术突围,MiniMax 已经在多个领域有了不少落地的案例:
在企业服务场景中,MiniMax与腾讯轻联做了许多关于打造个人工作生活“小助手”尝试,在其已有工具上做模型转化后能力输出,拉通大模型和SaaS产品的融合使用。
与掌阅科技合作的对话式 AI 应用“阅爱聊”,能让文学作品中的角色来到现实,与用户展开一场“跨次元”对谈;
而与金山合作的 WPS AI,则已接入了 WPS 矩阵中文档、演示、表格中大量场景,在智能办公领域提供了不少新的可能,与上面提到的“阅爱聊”一同,入选了“北京市通用人工智能大模型行业应用典型场景案例”;
而与小米,MiniMax也展开了深入的合作——MiniMax开放平台为小爱同学(小米的智能语音助手)在智能硬件、商城助手等场景赋能,具体包括闲聊、角色扮演、知识问答、信息提取等相关能力。
MiniMax 最重要的企业文化是“不走捷径”。
在 To B 生意上已经生根发芽,但这对于一家有“野心”的大模型公司来说,要保持技术领先并持续打通产品和业务链路,走向通用人工智能的终极目标,这只能算是一个阶段性成果。
因为核心团队都亲历过 AI 1.0 时代,MiniMax决定不走捷径,把“与用户共建智能”(Intelligence with Everyone),作为公司立身发展的第一性。魏伟坚定表示,“始终基于用户需求,这样算法才能不断突破临界点,我们也才能为越来越多的客户带来实打实的价值。”
这势必是一场持久旅程。当下,大模型算法的天花板还没能看到,MiniMax 起步虽然不晚,但在数据和场景的积累上,还依然需要很多沉淀。
而 MiniMax 也绝不单纯只是“眼望星空”的空想家,在“脚踏实地”的层面,他们也勇敢地面对接踵而来的挑战。
一位圈内人士对雷峰网表示,大模型从一项“技术”变成能实际变成生产力的“产品”,中间有很多复杂的工程问题需要解决。而能否解决这些工程问题,则是众多 AI 公司能否“落到地面”的关键细节。
而大模型 To B 做 MaaS,也就是“模型即服务”,部署就是这样一个相当微妙的工程问题:
一方面,要做云端部署,不少客户,尤其是身处医疗、金融行业等对保密性、安全性要求更高的企业,对于云端部署的不确定性相当介意;
另一方面,企业承担私有化部署的成本非常高。而当下很多小模型由于算法能力不足,尽管企业针对私有数据进行fine-tune,仍然很难达到业务上线标准,反而会让企业花更多成本踩“坑”。
魏伟和团队认为,只有当模型能力足够通用之后,企业买私有化部署的模型才能产生足够大的价值,这样才能实打实的解决企业问题。
不少厂商给出的解决方案,是做一套更小的模型,降低私有化部署的压力,通过一定程度牺牲模型能力,来换取更加低成本的产品落地。但这里必须要解决更新速度的问题,不然会很难跟上技术发展。
魏伟认为,不管哪种解决方案,只有能真正让企业在业务上获得提升,才是真正有价值的。
MiniMax 在模型性能上不想妥协,那么部署问题就必须被解决。
而这个问题,难不倒云业务出身、SaaS经验丰富的魏伟和他带领的开放平台团队。MiniMax 给出的方案,是“云上专区”部署。
针对客户基于安全性的需求,MiniMax 和多家云厂商达成了合作,模型提供方把模型在云端放置在一个相对封闭的专区中,只具备日常更新和 Debug 的权限;云厂商只作为审计第三方,通过堡垒机和安全审计来防止非法的下载。
这种单向的链路,让无论模型提供方还是云厂商,都无法直接下载用户的数据,安全性就得到了很大程度上的保障。
同时在这个模式下,模型直给应用,用户通过 API,可以直接调用专属的集群,模型提供方实时的模型更新,用户也能第一时间接收到成果。
这种“云上专区”在美国有不少尝试者,而这种模式也正逐渐为 MiniMax 国内的各个大客户所接受。
不少了解 MiniMax 内情的人,会用“外佛内卷”来形容这家公司。
对外,MiniMax 足够“佛”。他们知道过多的关注会给团队的心态带来不确定的影响,于是“谨言慎行”,能够不受外界影响,专研开发的状态,严谨而“孤独”。
对内,MiniMax 却很“卷”。他们的更新迭代始终保持在一个很高的节奏上,因为距离真正实现AGI,对所有人来说都还很遥远,必须要保持足够快的进步速度。
因此,评价这家年轻的创业公司,尽管团队和公司的年龄都不大,却总能让人感受到一种不似新创公司的“老成”。团队有激情、有拼劲,公司文化也更直接,对事不对人。一位猎头向雷峰网(公众号:雷峰网)表示,现在上海能从字节逆向挖人的,除了刚在拼多多对面开办公室对着挖拼多多和字节增长岗的Shein,就是MiniMax了。
MiniMax 之所以“有所为,有所不为”,是因为他们把“与用户共建智能”,看得比什么都重。
在内部,MiniMax 常常用“造一艘火箭”来形容自己的状态——在火箭成功上天之前,一切都应该踏踏实实为技术发展服务。
有了解 MiniMax 的人分析,以MiniMax 的算法演进,目前在中文能力上在不少复杂场景已经可以平替GPT3.5,而 GPT-4 似乎也不再只是一个“可望不可及”的目标。(当前MiniMax开放平台已上线其最新版本的文本模型“MiniMax-ABAB 5.5”,欢迎申请体验:https://api.minimax.chat/)。
去往 AGI 的路途虽然仍然遥远,在今天可能只写完了一个“序言”。而明天,对于MiniMax来说,仍如同黑夜中的海洋,充满着未知的风浪。
好在,远处仍然有一座灯塔,还闪烁着依稀温暖的光芒——只要心中仍有对AGI的信仰,MiniMax 就不至于迷路。
(雷峰网后续将持续关注 MiniMax 以及其他优秀的大模型创业公司,欢迎添加作者微信:william_dong,一同见证这个足称“伟大”的 AI “英雄时代”。)