历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面下泛起涟漪,新玩家浮现……
其实,“新玩家”一词用来形容阶跃星辰并不恰当,去年年末,阶跃星辰以一家通用大模型初创公司的身份开始出现在公众视野,AI科技评论当时也就此做过报道。
但彼时网上关于这家公司的公开信息并不多,公司属于微软系创业,由前微软 NLP 大牛姜大昕创立,成立于2023年4月,发力自研大模型+AI原生应用,仅此而已,寥寥数笔就可以勾勒出大致轮廓。
神秘、低调,大概是阶跃星辰留给大家的第一印象。
而如今,在距离公司成立近一周年的时间点,阶跃星辰交出了第一份答卷。
坚持一条自研大模型+AI原生应用的路线
今年3月底,阶跃星辰正式对外发布自研大模型——Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型,以及 Step-2 万亿参数 MoE 语言大模型预览版。
同时,阶跃星辰还发布了两款 ToC 产品——跃问与冒泡鸭。
跃问是一款 AI 聊天类应用,定位个人效率助手;冒泡鸭则是一款由剧情和角色构成的 AI 开放世界,可以为用户提供娱乐和社交。
整体来看,跃问作为一款 AI 聊天类应用,定位是个人效率助手,页面简洁明了,目前可支持上传图片、文档和网址,以及具有联网搜索功能。据了解,当前跃问的知识库信息储备截止到2023年,后面的信息可基于联网搜索提供。
从很多用户的使用反馈来看,跃问的效果得到了一众好评,“对于上传的文档,跃问可以快速输出总结结果,而且总结的能力还不错。”“计算会调用Python,保证了数据的准确性。”“能够识别图片。”
而说到图像识别能力,这也是跃问的显著优势之一,基于背后的多模态内容理解能力,它能够帮助用户识别真实世界的万事万物,像是理解和分析复杂的金融领域的数据图表、理解解读热门图片中的深意等。
比如,在输入框输入一份某公司的营业数据,要求将其转换为表格形式,并计算出每年的净利润增长率。根据输出内容可以看出,跃问明确诉求后,快速对数据进行分析、处理,给出结果。
另外,针对当前的热门电影《你想活出怎样的人生》,雷峰网也输入了一张剧照,让跃问帮忙解读其中的意义,后者给出了以下的解读内容:
可以看出,对于图像中的内容,跃问可以给出具体的描述,而对于其中的内涵和情感,剖析得也不错。
效率工具跃问体验网址:https://stepchat.cn/chats/new
而另一款产品冒泡鸭则呈现了一个全新 AI 开放世界。
在这里,用户可以探索故事、创作角色,沉浸属于自己的开放世界。不仅如此,用户还可以选择自己上手去创造属于自身的独特角色。
据雷峰网(公众号:雷峰网)体验,目前冒泡鸭上面用户玩的比较多的故事剧情是《逃离精神病院》,在对话过程中,不仅可以自定义回复内容,上面还提供选项,从而让用户以一种更便捷、快速的方式进入沉浸式剧情体验。
AI开放世界平台冒泡鸭体验网址:https://maopaoya.com
不管是跃问还是冒泡鸭,一款好的、能够满足用户需求的产品背后都离不开大模型的支撑。
正如阶跃星辰创始人、CEO 姜大昕所坚信的,模型和产品的关系就像是灵魂与皮囊,灵魂更加有趣一点,才能显示出产品的不同。
而跃问和冒泡鸭产品的灵魂就是此次发布的两款自研千亿级参数大模型——Step-1 千亿参数语言大模型和Step-1V 千亿参数多模态大模型。
据了解, Step-1 千亿参数语言大模型在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5。
Step-1V 千亿参数多模态大模型拥有出色的图像理解、多轮指令跟随、数学、逻辑推理、文本创作等能力。
国内的大型模型评估平台“司南”(OpenCompass)多模态模型评测结果显示,Step-1V 位列第一,性能比肩 GPT-4V。同时,Step-1V 的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。
跃问和冒泡鸭可以对电影海报、网络热门表情包等图像进行多方位解读,依托的就是该能力。
即便阶跃星辰此次发布的两款千亿参数模型已经带给大家足够的惊喜,但这只是第一步,他们脚踏实地的同时还在仰望星空,向着通用人工智能(AGI)的方向奔去。比如,阶跃星辰这次还发布了 Step-2 万亿参数语言大模型预览版,直接将大模型的战场升级到“万亿参数时代”。
其实,阶跃星辰从成立起,设定的航向就是AGI,并基于此目标,总结出了一条独特的前进路线。
一方面坚信 Scaling Law 方向,模型参数量决定模型智能水平的上限,完成 Step-1 千亿参数语言大模型的训练后,马不停蹄地投入 Step-2 万亿参数大模型的训练工作。另一方面是认识到多模理解和生成的统一是通往AGI的必经之路。
这也是为什么在大模型战场“打得”如火如荼的时候,阶跃星辰还能耐得住寂寞,埋头磕技术难点,钻研打磨产品,直到现在才正式发布。
抵达AGI的决心与底气
尽管探路者曾经一次次想象、描摹抵达AGI后的景象会是如何,但不可否认,大模型是一门流动的、仍在成长的技术,OpenAI 也还只是路上走得比较快的探索者,每一个高举旗帜的探路者都有可能通往终点。
而那些在理念、技术、人才、资本的累积上更丰富的玩家,更有可能接近正确答案。
在理念与技术上,阶跃星辰交出的答卷已经言明了,而人才上,阶跃星辰拥有一支强大的队伍。
早在今年年初,一位接近阶跃星辰的投资者就告诉雷峰网,阶跃星辰在算法、数据、系统方面都有足够的人才。
只是那时出现在公众视野的只有微软出身的 CEO 姜大昕,大家对其他核心团队成员信息知之甚少,直到这次阶跃星辰正式对外公布。
据了解,目前阶跃星辰的团队规模在 150 人左右,核心创始团队成员包括创始人、CEO 姜大昕、系统负责人朱亦博、数据负责人焦斌星。
姜大昕大家都很熟悉,早年从纽约州立大学布法罗分校取得计算机科学博士学位后,赴新加坡南洋理工大学计算机科学与工程学院任助理教授,2007 年加入微软亚洲研究院任首席研究员。
在决定离职创业前,姜大昕任微软全球副总裁,负责的团队规模一度达到 400 多人,包括研究搜索和 AI 算法、应用程序和平台的应用科学家、工程师等。
而在微软长达16年的职业生涯,让姜大昕在机器学习、数据挖掘、自然语言处理和生物信息学等方面累积了丰富的研究和工程经验。
系统负责人朱亦博也是微软出身,曾在字节跳动、Google等公司任职,拥有多次单集群万卡以上的系统建设与管理实践经验。
数据负责人焦斌星曾担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。
而基于强大的人才储备,阶跃星辰自成立起,便以Scaling Law为准则,在算力、数据、算法和系统这四大要素上进行综合布局,铸就自身高高的护城墙。
算力上,阶跃星辰采取的是“自建机房+租用算力”的做法;系统方面,有经验丰富的朱亦博坐镇;数据方面,由焦斌星负责;而算法方面,由创始人姜大昕负责。
对于大模型的研发来说,参数量从千亿增长到万亿,是一个数量级的变化,对算力、系统、数据、算法都有着极高的要求,而目前阶跃星辰作为国内第一家迈入万亿参数阶段的初创公司,这方面的积累在业界来说也是极为罕见。
资本方面,目前阶跃星辰在融资方面并未有消息透露。但是,单凭他们在完成 Step-1 千亿参数语言大模型的训练后,又火速开启 Step-2 万亿参数大模型的训练,就可以看出来,阶跃星辰“不差钱儿”。
另外,一位投资人还向雷峰网表示,除了上述的诸多硬性优势外,阶跃星辰还有一个长板,那就是团队成员大多历经过上一代 AI 的浪潮,该踩的坑也踩了很多,试错经验更丰富,在这一波浪潮中会避免踩一些不必要的坑。
阶跃星辰会是最后一家通用大模型公司吗?
这是在此次阶跃星辰正式公开亮相时,大家的疑惑与好奇。
毕竟当大模型故事线延伸至今,落地、商业化已然成为主旋律,还会有谁会选择,甚至成功切进通用大模型赛道?似乎很难,看似刚刚入场的阶跃星辰,其实也是早早入局,潜心钻研,等待一个厚积薄发的时机。
不过,可以肯定的是,随着万亿参数大模型浮出水面,通往AGI的战场已经升级,进入新阶段。接下来,水面下是否还有像阶跃星辰这样的公司在暗地涌动、等待,都是一个未知数,唯一确定的是,在这场竞赛中,故事变得越来越精彩了。
本文作者(vx:youlinancy)长期关注月之暗面、阶跃星辰等 AI 初创公司的大模型叙事,不止于技术发展、人物故事、行业动态,欢迎交流!