“算力的重要性要被空前重视了。”汇智智能联合创始人兼CTO刘黄骁烈说道,在之前任何一次AI浪潮中,这个现象都没有像现在这么明显,“甚至有钱也买不到。”
AIGC这么火,实属有些出乎刘黄骁烈的意料。
三年前,彼时OpenAI刚刚发布GPT3。因为在一些通用问题上的正确回答,GPT3引起了刘黄骁烈的关注,但也仅仅把它当作一次技术上的突破,毕竟面对再难一点的问题,它就只能“胡说八道”。更为重要的是,实在想不出它还有哪些具体的落地场景。
没想到,三年后,ChatGPT的出现,就像在水中投掷一颗巨石,惊起的涟漪持续扩大、蔓延到一个又一个的领域。
刘黄骁烈意识到了不同,这一波AIGC浪潮,技术的突破让用户看到了明确的应用场景,且能够快速落地。
机遇与挑战,一同奔涌而来。
算力与电力基础设施,作为制约AIGC发展的两个重要因素,自然引起业界的关注与重视,尤其是算力,得到了空前重视。
但又何止是算力。在AIGC长长的发展链条中,每一个环节都至关重要,每一个领域都充满了冒险与探索的想象空间。
汇智智能是一家专注于AI智能体领域创新与研发的企业。刘黄骁烈告诉雷峰网,在意识到大模型技术能力后,就在思考该如何借助这种能力去帮助用户做更多的事情。最终,他们选择智能体这一概念,把各种AIGC能力综合到一起从而让智能体成为用户的个人助手、数字分身,“让AI力量成为每个人的天赋”。
以下是雷峰网和汇智智能联合创始人刘黄骁烈的对话:
这一波AIGC浪潮,落地应用场景更丰富
雷峰网: 你最早是什么时候关注到AIGC的,吸引你的地方是什么?
刘黄骁烈:最早是在2020年,当时GPT3刚刚发布。让我印象深刻的是,它不仅能回答一些通用问题,还能回答很多以当时的技术来说它不太可能正确回答的问题。比如欧盟的GDPR政策,以及数据保护等网络安全领域的专业知识,它都能提供比较正确的答案,不过确实很生硬,没有今天这么流畅。
但也有缺陷,比如无法处理对精确性要求比较高的任务,而且对提示词的理解也不是很到位。
因此,我认为GPT3虽然很有潜力,但受到它当时能力的制约,应用场景十分有限,距离实际落地还有很长一段距离,并不看好它。
没想到,2023年ChatGPT发布后,它的回答变得非常流畅。我意识到当时的判断可能不太准确,这三年,GPT的版本有了很大的进步。
雷峰网(公众号:雷峰网):那你觉得从GPT3的默默无闻到GPT4的爆火,背后的原因有哪些?
刘黄骁烈:一方面肯定是模型自身不断迭代、演进,带来性能能力的快速提升,这个能力是指用户感知到的能力,因为它自身的能力很难进行量化评估。
另一方面,它的产品设计比较成功。CNN之父Yann LeCun认为,ChatGPT本身并没有特别大的技术创新,只是把Transformer 的架构给做得特别大、特别复杂。但是它的产品化非常成功,基于用户的角度去考虑、优化产品,从而让用户直观感受到它可以在一些应用场景应用,所以才能火起来。
雷峰网:相较于上一波AI浪潮,这一波的AIGC浪潮有什么不同?
刘黄骁烈:AI行业经历了好几波浪潮,整体呈现螺旋式上升的发展形式。
前几波浪潮中,AI发展起来主要是因为技术上的突破,比如第一次是深度神经网络,第二次是反向传播算法。上一波,2017年左右的浪潮来临是因为AI技术真正达到一个可应用的阶段,它有很多可以落地的应用场景,这是前两波浪潮都没有的。
而2023年的AIGC浪潮其实是一个复合型的,一方面有技术上的突破,大模型被推到公众视野上;另一方面是技术落地应用的场景更丰富,比如说智能助手、语音聊天等,虽然之前也能实现,但不像现在大模型做得这么好。
所以,两者之间的区别在于,上一波是预示着AI从一个偏向学术理论的研究课题变成了一个成熟的产业,而这一波是在已经有了AI这一比较成熟的产业基础上,技术的突破让用户看到有明确的应用场景且能够快速落地,从而掀起浪潮。
雷峰网: 在这一波浪潮下,除了大厂,很多科学家或知名企业家也纷纷去做大模型创业,你觉得跑出来的机会大吗?
刘黄骁烈:我觉得他们去做大模型是非常适合的。
要做一个大模型需要很多资源,先不说研发上的投入,光是算力和电力这些基础设施,甚至都不是有钱就可以买到的。基础设施上的不完善,会成为制约大模型发展的“卡脖子”难题。而像科学家或有知名度的企业家, 这样自身带有IP属性的创业团队做大模型,有足够的背书去争取这些资源。
基础设施的不完善,是制约大模型发展的“卡脖子”难题
雷峰网:那你觉得,面对AIGC的发展需求,对基础设施领域带来了哪些挑战?
刘黄骁烈:我认为,AIGC对基础设施的挑战非常明显且影响深远。
刚才提到AIGC发展的两个制约因素——算力和电力。算力的重要性要被空前重视了,在上一波AI浪潮中,这个现象没有这么明显,如今算力甚至成了国家间需要管控的资源,有钱也买不到。
另外要发展AIGC行业,电力同样是一项需要提前布局的基础设施,这也是前所未有。比较直观的说法就是,大量的GPU“跑”起来会消耗大量的电力,这就类似于当年的矿机挖矿所面临的情况。随着对GPU的需求空前增大,它也将成为一个制约因素,直接制约AIGC行业发展。
大家都明白,大模型到底能不能做,很多时候不光看技术水平,还要看能不能协调到这些基础设施的支撑。
雷峰网:那这里面会不会有一些机会?
刘黄骁烈:机会是有的,但是像算力和电力这两块,其实创业者不太好入局。不过在其他一些基础设施上也涌现了很多产品,比如向量数据库、多模态数据库等。所以说AIGC浪潮肯定会为基础设施领域带来一些机会,但这些产品暂时还不能去解决AIGC领域一些核心问题。
我认为,AIGC浪潮下基础设施的机会可以考虑和信创、国产化做结合,把产品的目标定义为推动行业生态和建设AIGC产业。这个机会适合有一定资源和耐力的创业团队,因为它短期内难以盈利,并且基础设施的发展依赖于AIGC市场,但这个市场还不是特别成熟。
总体而言,发展基础设施的意义重大,尤其是对于整个行业来说,任重而道远。
雷峰网:你觉得,相对于大厂和科学家、知名企业家,中小企业该如何把握住这一波浪潮下的机会?
刘黄骁烈:中小型企业要看团队自身的背景,不同背景的团队适合不同的机会。
比如科学家、企业家有自己的IP,能通过融资等方式去获得更多的资源,那他们就可以挑战做一些通用大模型的事情。因为通用大模型只要达到一定水平,或者在哪一个领域有好的表现,就可以获得比较核心的市场地位。
而对于中小型企业,比如我们团队在短视频营销领域有积累、有经验,那就比较适合深扎应用端,虽然它对基础设施等资源也有需求,但是轻量级的,关键是需要对目标客户的需求有深度认知和把握,并且要做好产品、市场和运营。只有这样,才有可能形成自己的产品壁垒,确保在行业占有一席之地。
找准自身定位,才能抓住机遇,形成自己的行业壁垒
雷峰网:汇智智能选择聚焦AI智能体,是出于一种怎样的考虑?
刘黄骁烈:首先,汇智智能的理念是“让AI力量成为每个人的天赋”。
我们接触到大模型技术,对其进行分析调研后发现,它的很多应用场景都是辅助用户去提效,就是提升用户自身的能力,那我们就在思考:能不能把这些大模型的能力综合在一起去帮助用户做更多的事情?比如通过文生文类的大模型实现一种更好的语言交互,包括信息搜集、文本撰写;通过文生图的大模型,帮助用户更快、更方便地创造素材等。
基于这些想法,我们选择了智能体这一概念,把各种AIGC能力综合到一起从而让智能体成为用户的个人助手、数字分身,实现我们的理念。
雷峰网:智能体的概念已经出现很长一段时间了,在AIGC的加持下,它能够焕发出怎样的活力?
刘黄骁烈:一方面,从用户角度来看,现在的智能体更加智能,更像人了。
另一方面,AIGC技术使它在一系列的应用场景中真正落地,能力变得更广泛,比如辅助用户生成高质量的文案、图片、视频;帮助用户搜集、归纳信息,甚至帮用户写代码。这在AIGC技术火起来之前,传统的智能体根本做不到。
雷峰网:有没有具体的案例?
刘黄骁烈:最近,我们基于AIGC技术以及在短视频营销领域的行业经验,推出了一款垂直场景小模型——应用于短视频营销的旺氪智能体 ,它本质上是“智能体+营销行业”的垂直领域智能体,除了传统功能,它还具备智能客服、信息提供、利用自然语言优化程序的交互等能力,主要就是帮助用户提升效率。
我们的客户主要是中小型商户,他们都有强烈的营销需求,但是传统的短视频营销,需要他们自己拍素材,还需要美工或者程序员帮他们调用各种工具制作视频。而旺氪智能体,通过大语言模型能力实现智能交互,用户可以直接通过自然语言去调取相关业务,完全不需要像传统做法那样操作。
另外,我们还整合了AI做视频、海报的能力,用户也不需要有自己的美工、程序员,可以一键式直接生成营销视频。
雷峰网:你们调用的是哪家的AI大模型接口? 选择过程中会综合考虑哪些因素?
刘黄骁烈:目前这款产品我们是与百度合作的。
我们之前有做过评估。一方面会考虑大模型的性能,从商业角度看固然是看它的准确性,但这没有统一标准,主要还是围绕业务需求进行测试,不具备通用领域的完备性。
另一方面主要考虑安全合规的要求,以及数据泄露的风险等,倾向于选择国内可信任的,而且在安全合规这一块做得比较好的供应商,最终,我们选择了百度。
雷峰网:接下来有什么打算?
刘黄骁烈:我们打算打造一个AIGC行业的开源社区“微言大义”,帮助广大用户深入了解大模型应用价值,提升智能体和AIGC工具运用能力。
在做智能体业务过程中,我们意识到所有大模型最后都是要给用户使用,但是对很多用户来说,AIGC入门门槛很高,就算直接给他,他可能也用不好。所以我们想做一个开源社区,微言大义平台想要做的是为中国AI行业提供源源不断的教培工具、行业内容和科技人才。
一方面为用户提供使用技巧上的指导,同时接入与我们合作的供应商的大模型,让用户使用、评估,找到适合自己的大模型。我们也会把配置好的智能体,在得到用户许可的情况下作为案例发表在社区里面,展示具体的行业应用案例。
另一方面,国内做大模型的企业已经有很多家,等到市场竞争到一定程度,一些企业可能会越来越弱势,但原因不全是技术上的,也有可能是宣发不到位、没有找到明确的应用场景,尤其是垂直领域的大模型。我们希望社区帮助这些模型实现他们自身价值,匹配到垂直领域的用户。
让市场活跃起来,AIGC才能获得更大的发展机会
雷峰网:结合汇智智能的经验,你认为,AIGC在具体场景落地应用过程中,难题和挑战是什么?
刘黄骁烈:一方面,我们的很多客户来自传统行业,不了解AIGC,我们需要开发市场,告诉他们AIGC具体能帮你做什么事情,这是由用户的需求和自身认知决定的。
另一方面是数据,用户使用效果的提升,不是由数据“量”而是由“质量”,即如何使用数据决定的。这就意味着对数据处理,把它变成模型能理解的知识变得至关重要,有一定技术上的研究成本,而且有些数据特别是行业知识,对定制化的要求比较高。比如说出版行业,它会要求一个大模型把《红楼梦》里面的所有情节讲清楚。
还有一点就是数据传输过程的安全问题,对于涉及用户商业数据内容时,用户是不大愿意直接放出来的,需要我们提供安全的数据交换策略。
雷峰网 :有种说法是目前AIGC在国内外的发展侧重点不同,国外在钻研技术,国内更注重落地。你怎么看待这种观点,原因是什么?
刘黄骁烈:某种程度上来说是这样,我认为其中一个原因是资本活跃度不同。
数据显示,今年从4月到6月,中国做大模型的企业拿到的种子轮+A轮融资一共只有30笔,但是同期在美国每个月都有30笔以上。做大模型在资源上的开销非常大,虽然有的资源即便有钱也买不到,但融资肯定能缓解很大一部分问题,可国内的资本不如美国活跃,很多想做大模型的创业者可能没有机会去做。
另外,这也与基础设施有关,总的来说还是资源的问题。
雷峰网:那在这种情况下, 我们要追赶国外的AIGC发展,发力点应该放在哪些方面?
刘黄骁烈:基础设施肯定是要追赶的,但短时间想要赶超像英伟达这样的基础设施供应商明显很难,这个事情肯定需要去长期推进。
另外,资本市场不活跃主要是因为市场不成熟,我刚接触时也意识到这一点。我们需要做的就是,一方面开发市场,对用户进行引导和教育,展示成功案例,增加市场的信心,另外需要AIGC的从业者去发掘更多可以落地的场景,让市场活跃起来。
8月14日,一次与刘黄骁烈面对面交流的机会
今年2月份到现在,大模型在国内火了已经将近半年的时间,这段时间国内涌现出了各种各样的通用大模型和垂直大模型,参数量也是千差万别,可以说国内大模型已经进入到了白热化阶段,相对应的算力竞争也愈演愈烈,但是伴随着国内对算力的重视程度越来越高,被卡脖子的阴谋论终将被粉碎。
接下来的一周,在8月14-15日,一群人工智能开拓者将齐聚新加坡乌节酒店,为第七届GAIR全球人工智能与机器人大会,带来最为激荡的思想碰撞。这是国内首个出海的AI顶级论坛,也是中国人工智能影响力的一次溢出。
算力、数据、infra作为大模型时代的超级基建的组成部分,在这次AI顶级论坛上,刘黄骁烈与一众业界大牛也将一同出席,围绕《大模型时代的超级基建》主题来进行一次深刻探讨。论坛邀请了重磅嘉宾包括UCloud董事长季昕华,新加坡国立大学校长青年教授尤洋、汇智智能联合创始人刘黄骁烈,Zilliz创始人星爵,云启资本合伙人陈昱。
他们将会共同探讨大模型时代的超级基建的雏形,如何在大模型时代做好超级基建这一底座等话题。