“国产Sora”Vidu全球上线百度百舸提供视频大模型训练支持

2024/07/31 19:04

7月30日，作为Sora全球首个挑战者，且是国内首个纯自研的视频大模型Vidu（www.vidu.studio）正式上线。生数科技宣布，目前Vidu无需申请，用户直接用邮箱注册即可上手体验。

“国产Sora”Vidu全球上线百度百舸提供视频大模型训练支持

生数科技作为国内最早布局多模态通用大模型的团队之一，今年4月联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。自4月底首次亮相以来，Vidu凭借媲美Sora的文生长视频能力，迅速在国内外引起广泛关注。此次Vidu全面开放了文生视频、图生视频两大功能，提供4s和8s两种时长选择，分辨率最高达1080P。

在效果上，Vidu不仅延续了四月份展示的高动态性、高逼真度、高一致性等优势，还在上线版本中新增了角色一致性（Character To Video）、动漫风格、文字与特效画面生成等特色能力。同时，在影响用户体验的推理速度层面，Vidu实现了业界最快的实测推理速度，生成一段4秒片段只需30秒。而市面上的主流AI视频工具在生成4秒左右的视频片段时，用户通常需要等待1到5分钟，甚至更长。 Vidu的高效推理不仅为用户带来了接近于无缝的创作体验，更短的处理时间还意味着它能够轻松应对大量用户的需求，提供个性化的服务。

众所周知，视频生成产品的开发周期长且费用高昂。而从发布到上线仅仅三个月，生数科技就完成了对Vidu的快速迭代，实现了高质量的视频生成效果，这离不开Vidu研发团队在模型高效训练方面积累的工程化经验。密集而快节奏的模型训练任务，不仅需要大规模的算力，还需要从数据准备到模型训练、再到模型推理的全链路保障。

Vidu在模型训练层面采用了百度百舸·AI异构计算平台。百舸是百度智能云基于过去多年在 AI 方面的沉淀，以GPU为核心搭建的异构计算平台，更适合大模型训练，保障模型训练的稳定性和效率。

在提升模型训练效率方面，百舸可以把不同地点、不同规模、不同集群的算力统一管理起来，通过芯片性能优化、自动芯片选型、潮汐混部这些经验和技术，大幅提升智能算力效能，万卡集群上的模型有效训练时长占比超过98.8%，线性加速比和带宽有效性均超过了95%，是业界领先的算力效能。

在提升模型训练稳定性方面，百舸提供了丰富的运维和可观测工具以及容错保障能力，提升了大规模集群长期运行的稳定性，降低因为故障导致训推任务异常终止的概率，减少业务损失。

同时，百舸支持混合多芯，兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片，支持同一智算集群中混合使用不同厂商芯片，最大程度上屏蔽硬件之间差异，帮助企业摆脱单一芯片依赖，实现更优的成本，保证更有弹性的供应链。在多芯混合训练任务中，百舸能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致，百卡规模性能损失不超过3%，千卡规模性能损失不超过5%，均为国内领先水平。

百舸高效、稳定、混合多芯等特点能够帮助生数科技实现大模型开发的“快、稳、省”，助力生数科技短时间低成本完成大模型的业务上线。目前，百舸已经在互联网、教育、汽车、生命科学等行业有了广泛的落地实践，帮助行业客户实现大模型应用的快速落地。

未来，生数科技将不断基于百度百舸·AI异构算力计算平台持续训练、提升模型能力，并逐步通过百度智能云千帆平台开放模型服务。

雷峰网(公众号：雷峰网)

“国产Sora”Vidu全球上线 百度百舸提供视频大模型训练支持

“国产Sora”Vidu全球上线百度百舸提供视频大模型训练支持