阿里云 all in AI 的决心

AI 大模型阿里云

作者：晓楠

2024/05/30 17:32

如何抓住 AI 的机会？

这是进入大模型时代后，面对新的起点，各大云厂商在不断思考的问题。

毋庸置疑，AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑，而大模型的落地应用，给云计算勾勒了一个比移动互联网更具想象力的新世界。新一轮的云计算周期已然开始了。

在海外，老牌巨头微软凭借 AI 在一年多内摇身变成了最潮科技公司；在国内，阿里云走在最前列，是唯一兼具强大模型和完备云平台的大厂，而且还选择了开源。

事实上，阿里云早在 2019 年便投入大模型研发，2022 年喊出MaaS（模型即服务）第一声，此后又从底层算力（IaaS）到 AI 平台（PaaS）再到模型服务（MaaS）全栈重构，走出了一条云+ AI 的独特路径。从模型到平台到算力底座全方位投入，选择“既要、又要、还要”，阿里云几乎是唯一的样本。

那么，阿里云的“云+ AI ”启示录能成为 AI 时代云厂商变革的新范本吗？

5 月 9 日，阿里云在北京举办 AI 智领者峰会，此时距离通义大模型问世正好一周年。阿里云首席技术官周靖人作了全面总结，关于大模型能力，关于模型落地，关于开源与生态。

01从追赶到并行，技术永远是硬实力

距离ChatGPT 引爆新一轮 AI 浪潮已经一年多，在这段一路狂奔、野蛮生长的日子里，大模型军备竞赛的风从没停过，从架构到参数，从单一语言大模型到多模态大模型，从基础大模型到行业大模型……

“卷生卷死”的百模大战带来的启示是，夯实基础模型的能力，永远是发展的硬道理，技术就是硬实力。

凭借技术实力在云计算时代叱咤风云的阿里云，自然懂得大模型能力的重要性，这是它想要走好“云+AI”的技术路径的关键一步。

结合通义大模型的迭代升级速度来看，阿里云在推进模型能力上的步伐很是稳健。

去年 4 月，通义大模型问世，紧接着阿里云持续聚焦基础模型的技术研发，综合性能超越 GPT-3.5 的通义千问 2.0、通义千问 2.1 相继推出。

如今，在距离通义大模型问世一周年之际，阿里云又带来了最新升级的通义大模型。

5 月 9 日，阿里云首席技术官周靖人宣布通义千问 2.5 正式发布，模型能力再次迎来新突破。

阿里云 all in AI 的决心

据介绍，相较于通义千问 2.1 版本，通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。

此外，与 GPT-4 相比，中文语境下，通义千问 2.5 文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超 GPT-4！

而在权威基准 OpenCompass 上，通义千问 2.5 得分追平 GPT-4 Turbo——这也是国产大模型首次在该基准取得如此成绩，可谓是“地表最强中文大模型”。

同时，通义还发布了最新款的开源模型——1100 亿参数的 Qwen1.5-110B，超越 Meta 的 Llama-3-70B 模型，成为“开源领域最强大模型”。

不仅是语言大模型，在多模态大模型、行业大模型上，阿里云也在持续发力。通义千问视觉理解模型、通义千问代码大模型等分别在各大基准榜单上名列前茅。

但单一的榜单数据并不能说明一切，来自用户的使用感受似乎更能说明模型的真实水准。

据统计，如今通义大模型的日调用量早已过亿，通过阿里云服务的企业超 9 万、通过钉钉服务的企业则超过 220 万，通义开源模型累计下载量突破 700 万，成为中国企业最受欢迎的大模型。

虽然已经在模型能力上已经实现了从最初的追赶到并行，但对于阿里云来说，这还不够。

正如周靖人所言，当前大模型有那么多家，大家说的都是同样的故事，但最后比拼的其实是能力差异，以及接下来的如何融合生态（尤其是开发者的生态）、如何落地运用起来，这才是最大的差异。

基于阿里云在大模型能力上的积累，让企业和开发者将模型“玩转”起来，是阿里云要思考的第二个问题。

02全面升级百炼平台，加速大模型落地应用

从去年下半年开始，大模型的战事信号已经开始从“做大模型”向“用大模型”转变。2024 年，商业化、落地应用成为大模型公司的主旋律。

最新的《中国大模型中标项目监测报告》显示，今年 1-4 月，可统计到的大模型相关中标金额已达到 2023 年全年披露金额的 77% 左右，涉及政务、金融、运营商、能源、教科、交通等各行各业，表明企业对大模型的应用需求正快速增长。

但，大模型的落地，并不是通过卷算力、卷参数的“暴力革命”就能实现，中间需要一个漫长的过程。

因为对于基础大模型来说，它所具备的更多是通用知识，但在具体落地过程中，大模型面对的是各种各样的垂直业务场景，而千行百业中的每一个企业都有自己明确、特殊的需求。

如果无法解决这些问题，大模型的落地并非易事。周靖人告诉雷峰网，在与大部分企业接触过程中接收的需求反馈，让阿里云意识到，“如果不对基础模型进行修整，难以直接对接业务需求。”

基于此，阿里云给出的解法是为用户和开发者提供一个工具平台——一站式大模型和应用开发平台，简化用户在部署大模型时所需进行的底层算力部署、模型预训练、工具开发等复杂工作。

去年 10 月，百炼大模型平台正式推出，这意味着开发者仅通过“拖拉拽” ，5 分钟即可开发出一款大模型应用，几小时“炼”出一个专属模型，大大降低开发门槛。

如今半年多过去，此次 AI 峰会上，阿里云宣布对百炼平台进行全面升级，从模型开发、应用开发到算力底座，变得更加易用、开放。

另外，还引入了更多模型，同时率先兼容 LlamaIndex 等开源框架，企业可自由替换能力组件来适配自身系统。

阿里云 all in AI 的决心

针对当下企业最关注的 RAG 链路，百炼提供灵活开放的企业级检索增强服务，“5 到 10 行代码”即可搭建 RAG 应用，让大模型拥有“最强外挂”。

具体来看，针对企业应用大模型的三种范式，百炼提供了丰富的模型和易用的工具箱。

一是对于那些希望直接“开箱即用”的企业，百炼集成了上百款大模型 API，除了通义、Llama、ChatGLM 等系列，还首家托管百川等系列三方模型，覆盖国内外主流厂商，同时支持企业上架通用或行业模型，提供足够多的模型选择。

二是对于那些需要对大模型进一步微调的用户，百炼提供从数据管理、模型调优、评测到部署的全链路模型服务，用户可弹性按需调用算力，无需关心底层架构。训练过程可视化，还可自动评测模型质量，并与其他模型对比。

三是对于那些希望打造 RAG 等应用的企业，百炼支持 Assistant API 开发模式，可在百炼上轻松创建知识库，并一键开启知识检索增强（RAG）。

据悉，目前，一汽、微博、小米、完美世界、朗新集团、央视网等企业都已经应用上百炼平台。

03打造开源模型+开放的云生态

技术要有好的发展一定要有生态，而不是闭门造车。阿里云早就意识到了这一点——阿里云是全球唯一一家积极做最先进的 AI 模型同时，也敢于全方位开源的云计算厂商。

阿里云想要打造一朵AI时代最开放的云。

其实，开源VS闭源，一直是大模型厂商所面临的艰难抉择。

坚定闭源路线的企业认为，闭源能够维持技术上的护城河，是更符合实际的理想商业模式。而坚持开源路线的企业则认为，众人拾柴火焰高。

此前，IDC 的一项调研数据显示，在实际应用开发过程中，企业采用开源模型与商业化模型的比例为 51% 与 49%。

而周靖人认为，开源，对整个技术领域的贡献毋庸置疑。开源模型给了企业和开发者更多选择，大家不用担心被绑定在某一家的产品或技术线上，同时也可以最大程度地自由使用不同模型进行应用创新。

“无论是 PC 端还是手机端，要能够与各种各样的场景做适配，快速搭建起更加复杂的业务、AI 系统，其实这都需要一个开放开源的生态，这也是全球开发者和企业在毫无疑问地拥抱‘开源’体系的原因。”周靖人说道。

因此，去年 8 月通义宣布加入开源行列后，便一直坚定开源路线，沿着“全模态、全尺寸”开源路线陆续推出十多款模型。

据雷峰网了解，目前通义已经开源了 8 款参数规模从 5 亿到 1100 亿的大语言模型。阿里云 all in AI 的决心

开源的本质是交流，历史上多种技术的突破都证明了这一路径对更大图景的推动作用。打通接口、拉平认知，释放大模型能力，将对整个中国 AI 发展都起到积极作用。

正是早早意识到这一点，所以阿里云在 2022 年的云栖大会上宣布搭建魔搭（ModelScope）社区，这也是国内首个 AI 模型开源社区。

据雷峰网(公众号：雷峰网)了解，魔搭社区彼时一经推出，便将阿里近五年苦心研发的 300 多个优质模型全部开源，促进中国的 AI 基础研究。

而目前，据周靖人介绍，魔搭社区平台还在扩大建设，平台上的高质量开源模型总数已超过 4500 个，开发者数量超过 500 万，已成长为“中国最大的AI模型社区”。

周靖人坚信，大模型还有很大一部分潜力没有真正被挖掘出来，当有越来越多的开发者、企业能结合自己的需求，来促进大模型的发展和应用，将带来翻天覆地的变化。在当下这个时间点，阿里云希望以开放的心态把最先进的技术开源出来，大家做并行探索。

“这很重要，能对大到每个产业，小到每个企业的创新性开发起到促进作用。”

04写在最后

大会现场，当被问到，曾经在云计算时代拥有绝对领先地位的阿里云（中国第一、亚太第一），如何在 AI 时代继续保持领先时，周靖人沉思了一下，回答道，早在大模型浪潮到来之前，阿里云就已预判业界发展趋势，率先提出 MaaS 理念，布局未来。

2022 年 11 月初，ChatGPT还未问世，在云栖大会上，作为阿里云大模型研发负责人的周靖人即提出 MaaS （模型即服务）——把模型作为重要的生产元素，围绕模型的生命周期设计产品和技术，包括数据处理、特征工程、模型的训练和调优、模型的服务等。

这是一条从未被提及的新概念。

后来的事情大家都知道了，当 2023 年年初 ChatGPT 拉下 AI 新时代的序幕，大模型进入“百模大战”阶段，MaaS 这一理念被广泛提及、验证，并逐渐被亚马逊、微软以及腾讯、百度等国内外云厂商所沿用，将其作为自己在新时代 AI 技术变革中转型的新选择，MaaS 成为最有望改变云厂商商业模式的路径。

如今，距离阿里云提出 MaaS 已有一年多，根据所交出的答卷，可以拼出，在 AI 时代，阿里云基于 MaaS 做出的完整战略布局。

模型层面，聚焦通义大模型的技术研发，将最好的大模型提供给客户；模型服务层，以百炼大模型平台为主要界面，针对企业应用大模型时的需求，提供模型调用、微调、训练、开发专属大模型及应用的工具服务；AI 基础设施层，依靠云计算体系，为其他大模型公司提供算力平台；生态层，持续构建开源开放的开发者生态，推动整个行业的发展。

以模型为中心，全面重构自身技术架构；同时，作为平台，为中国企业、开发者以及大模型生态中的公司提供模型相关的各类服务，最终推动整个产业的共同发展。

这就是阿里云想要在 AI 时代讲述的MaaS新叙事。

“只有这样，在 AI 时代，阿里云才能仍然是 No.1，仍然能为各行各业提供最先进的技术、最广泛的产业应用。”

AI 时代，阿里云将如何保持行业的引领者定位，拭目以待。