对话｜应用来了，百度云的企业级大模型应用如何在产业落地？

2024/11/13 17:48

当AI赛道来到下半场，如何真正借助大模型引领各行各业发展创新，成为头部互联网企业的必争之地。（雷峰网雷峰网(公众号：雷峰网)雷峰网）

放眼全球，企业对大模型的需求日益增加，这不仅因为其强大的数据处理和分析能力，更因为其在实际应用中的出色表现。大模型通过预训练大量数据，提升了模型对内容的理解力和生成力，面向行业，无论是在市场营销、办公提效，还是客户服务等方面，如何将更好的将大模型进行业务场景化落地，始终是企业关心的核心问题。

百度作为全球领先的技术公司，率先推出了文心大模型等系列大规模预训练模型，这些模型通过整合海量数据和知识，成为多个应用场景的技术基础。

今天，百度的文心大模型在金融、医疗健康、旅游、专业咨询服务、内容创作与AI作画方面的应用均展示了其在跨模态、跨语言情景下的深度语义理解与生成能力，以及在搜索问答、内容创作生成、智能办公等众多领域的应用潜力。

在其自主研发的百舸AI算力平台，更是通过对底层硬件资源的优化，提高了模型的运行效率和资源利用率，帮助企业更高效地进行大模型的开发和部署。

尽管AI大模型已经B端爆发，为各行各业带来巨大价值，但在下游行业的大模型落地中，仍面临一系列相关场景挑战。比如投入成本大于可见收益、应用效果不达预期、以及后续模型效果退化等问题屡屡出现。

11月6日，百度智能云举办百度世界大会AI应用媒体沙龙，特此分享百度TO B市场的企业级应用产品的落地效果，并邀请百度智能云技术委员会主席孙珂、百度智能云数字人产品部总经理张裕翔、百度智能云智能客服与智能内容产品部总经理张红光等三位专业人士在现场做了分享和交流。

以下是媒体与三位嘉宾在会上的对谈实录，雷峰网在不改变原意的情况下做了编辑和调整：

01用户正向反馈，百度智能云“客悦”帮助企业节省运营成本

Q：关于百度智能云客服客悦这款产品的用户反馈如何？

张红光：过去智能客服无法感知到用户情绪，比如说复杂的多主语问题，但现在客悦有能力去解决这些问题，通过语音引擎（ASR/TTS）来识别和表达用户语音，专门适配电话场景、定义沟通场景和回答方式，并对通话数据进行结构化分析和标签打标，提升业务洞察能力，最关键的是，能在一定程度上减少转人工率，节省了企业的运营成本。

张红光：这次我们在世界大会推出的大模型智能外呼，还能够帮助企业节省人力成本。这是因为有很多企业在做线索筛查和联系用户时，80%时间都是在拨打一些无效电话，大模型智能外呼可以替代人工重复性工作进行初筛，甚至还可以洞察出某些高意向用户，转人工跟进进一步沟通。并且与用户沟通过程中能够保持拟人、友好的交互，这些都是大模型加持下的智能客服，给客户带来的新的产品体验。

Q：针对不同行业的落地应用，百度有哪些定制化？如何降低定制化工作的成本以达到最优状态？

张红光：以智能客服客悦的市场经验来看，目前大部分应用还是在一个场景里横向满足用户需求，定制化主要体现在企业使用的过程当中，比如作为一个客服，既要跟CRM、销售管理流程贯穿，还要在数据收集系统里，所以就需要对接不同的系统，这就需要定制化的工作。

张裕翔：以百度智能云的数字人为例，提升它的应用集成效率速度，就能降低数字人在不同端的训练能力和开发成本。比如过去最早做定制项目可能30%是数字人相关，70%和用户相关，关注的是系统要如何融合打通的问题。但现在转变过来，整个业务里70%-80%都是跟数字人效果能力强相关的，比如怎么在一个视频里去优化数字人的动作等，这背后都是源于客户对于大模型认知的转变，客户开始更加关注应用场景的落地价值。

目前百度智能云在标准SaaS场景应用中，也会更侧重于大场景上的通用能力，比如数字人视频，虽然很难将教师视频、医疗视频，甚至一些非常大的场景做的非常细致，但在整个数字人的生成合成层面是可以做到最优的。

02解析数字人的应用场景，以及定制化解决方案

Q：站在数字人角度，现在更被大家所接受或者大家愿意应用的是2D还是3D？

张裕翔：整体来看，头部企业客户喜欢用3D，中小客户和广泛用户喜欢用2D，这也跟客户的使用场景相关。

比如，在一些科技类企业，要做金融报告的解读和对外宣传时，会倾向于使用3D形象，包括在一些文旅、地方科技馆的服务场景，也会使用3D形象多一些，因为3D形象更具备科技未来感，能够从互动感受上带来更新颖的体验。

Q：针对SMB客户和KA客户，如何定制化解决2D跟3D的数字人的产品形态？

张裕翔：其实差别并不大，因为基础应用场景无非是视频、对话、直播这三个场景，虽然从技术角度看，数字人视频一对多异步渲染、数字人对话是一对一的实时渲染、数字人直播是一对多的实时渲染，但是其实从底层能力的角度来看是几乎一样的，无非是驱动人像技术及其算法模型应用上略有差别。

比如要解决2D形象如何拍视频的问题，让动作呈现出更多样性，突破原来的拍摄内容。理想情况就是用自己的形象拍一张照片或者一个视频，通过授权后，无论是在出席发布会或者做讲解视频等场景下，都可以把形象做出来，这就是未来理想化的一个状态。

3D层面则相对简单一些，因为3D本身在游戏场景中就包含了动作系统和语言系统，但问题在于，如何让普通人以更低的成本，或者像企业级应用那样，实现高指向性和准确性的驱动，这是目前正在解决的调优问题。

03解放双手，文心快码如何助力程序员

Q：文心快码往外推的时候，程序员对文心快码的信任度高吗？

孙珂：其实从内部的测试来看，一开始推广的时候程序员也会有排斥心理，但随着他的使用频率增强，逐渐会感受到对工具的依赖性也在慢慢变高，就会发现他的代码生成量占比和采纳率在往上涨。

整体来看，程序员群体对新技术接受度还蛮高，但他们关注的点不是信任与否，而是产品本身能否跟程序员做一些交互上设计。

Q：如果要将文心快码推广到市场，中间会不会经历所谓的教育用户过程？

孙珂：其实这个过程我认为不是教化逻辑，更多是互相成长，如果仔细观察就能发现，在市面上有非常多的代码辅助类产品，但却有三个不同的区别，一个是比较常见的用IDE加plugin的一种形态，跟程序员进行一个陪伴式的编程；另外是稍微接管多一些，在IDE里面会帮你尝试做更自动化的编程尝试；还有一些很激进的厂商或创企，它会直接迈到所谓Out coder的过程，从PRD开始自动生成。

因此，整个过程其实是逐步根据当前应用基于大模型，针对程序员需求的一些解法逐渐进步，而最终大家都会趋同都会走到那个平衡点上。

Q：文心快码目前在哪些行业应用成熟？

孙珂：首先是金融行业，特别是银行、证券等对代码类的工具需求非常多，第二是泛科技或者泛互联网行业，这些新兴企业也应用比较广泛。

第三是传统的软件开发，最后一个则是制造业，包括一些汽车行业、工业行业等。

Q：站在基础设施角度，这次我们产品升级带来哪些差异化优势？

孙珂：基于一个统一的底层架构具有诸多优势，其中之一在于我们的模型服务。

无论是大模型还是传统的AI模型，如何运行这些模型并提供一个稳定的接口，以保证其吞吐量，包括如何对这些模型进行优化是一个重要的问题。百度智能云千帆这样一个PaaS平台在应用之下为我们提供了完整的相关服务，包括模型效果、推理性能等系列工作，千帆平台都提前为我们做好了，这极大地提升了我们产品的研发效率。

其二，还需要适配底层的硬件资源和基础中间件。目前可能有几十种底层的硬件配置方案，要想让应用程序高效地适配所有这些配置，是一项非常复杂的工作。如果每个应用程序都需要直接适配各种底层硬件配置，那么复杂度的数量将是一个天文数字。

但在我们的底层基础设施百舸平台上，无论是公有云还是私有化部署的环境下，都可以屏蔽底层硬件相关的适配工作，让我们可以更聚焦产品本身的工作。因此，对于我们开发应用而言，实际上只需要关注一个平台即可，而且只需要关注一套效果。

这对我们整个上层应用的蓬勃发展和提升效率都是非常有帮助的。