很多从业者都在问,最近特别火的ChatGPT和它背后的通用人工智能(AGI)与AR之间究竟有什么关系?
杭州灵伴科技联合创始人向文杰给出了答案。
“未来人类跟通用人工智能的交互方式具有两个特点:第一是自然交互,第二是多模态。从这个角度来看,AR是人类与通用人工智能之间交互的入口,也是最佳载体,AR代表了未来的交互方式。”
聚焦于人机交互技术的杭州灵伴科技在九年成长史中多次转型、自我革新,见证了AR行业从兴起到爆发的历程。
眼下,以ChatGPT为代表的通用人工智能技术来势汹涌,当AR遇上通用人工智能技术又会有什么化学反应?
近日雷峰网(公众号:雷峰网)与杭州灵伴科技联合创始人向文杰进行了探讨。
以下为雷峰网和向文杰的对话:
未来的大模型像云计算一样,变成基础性底层技术
雷峰网:怎么评价 ChatGPT 这个产品 ?
向文杰:ChatGPT的表现超出了大部分人的想象,让人们看到了强人工智能的曙光,也带来新的商业机会,给各个行业带来颠覆。
雷峰网:未来 ChatGPT 的终极产品形态,会是什么样的?
向文杰:说一个我们期待的形态,未来的ChatGPT会从通用化变成个性化,进化成类似《钢铁侠》中的“贾维斯”或者是《HER》中的“萨曼莎”,成为个人的人工智能助理。
ChatGPT的底层的通用人工智能未来会成为基础技术,类似云计算的基础设施。新的生态将会基于它们来构建。
雷峰网:怎么看当提问者对 ChatGPT 输出的答案有异议时,ChatGPT 会立马改口这种现象?
向文杰:这个现象让人觉得ChatGPT更智能,更加智能并不是绝对正确,而是更像人的反应,会犯错,会不懂装懂,这些都更像是跟人在互动。
雷峰网:ChatGPT和国内大模型有代差,国内大模型的机会点在哪里?
向文杰:从我们之前的经验来看,做第一个突破是特别难的,当然正常情况下回报也更高。技术一旦突破之后,后面的跟进会很快,目前GPT已经实现了技术路径的突破。其他跟进的大模型接下来就是投入问题和时间问题。
雷峰网:大公司做大模型,那么中小创业公司的机会点在哪里?
向文杰:这个跟云计算也类似,中小创业公司要做的就是在通用领域做上层应用和服务,或者结合行业特点做垂直领域的模型。
AGI带动AR产业,AR是人与大模型交互最佳载体
雷峰网:为什么说AR是最合适的多模态终端设备?
向文杰:首先我们现在跟ChatGPT交互的方式是以文本输入和输出为主,这个还是太麻烦了,更好用的是直接跟ChatGPT讲话,通过对话的方式进行互动,AR作为穿戴式设备天然具有这方面优势,我们所有AR设备在语音交互上做的非常成熟。
其次ChatGPT未来是支持图像理解,视频理解,对外部直接的感知不需要人类来输入,可以直接理解和感知,AR是穿戴式设备,天然有摄像头、TOF等多种传感器,传感器的信息可以直接给到ChatGPT,让它自己来理解环境并提供支持。
最重要的是,未来我们跟ChatGPT的交互方式是多模态交互,我们可以通过语音、手势、文字、图形以及视频等多种方式输入信息给ChatGPT,它反馈给我们的信息也可以是文本、语音、图像、视频以及3D模型等多种方式。AR天然具备环境感知,手势、语音交互,多模态展示等,可以通过AR的能力把ChatGPT的交互做的非常简单和丰富。
相比于传统的家庭大屏、车载大屏、智能手机、平板电脑、智能手表等传统设备,AR是一个更好的载体。
雷峰网:接下来3年,杭州灵伴科技在 AGI上有什么规划吗?
向文杰:未来的生态体系中,AIGC的提供方会非常多,我们的重点是将AR的交互能力持续迭代,跟AIGC或者AGI方面的交互体验持续打磨,做最好的载体。
从AI到AI+AR,迭代人机智能交互方式
雷峰网:杭州灵伴科技从 AI 到 AI+AR转型是基于什么考虑?
向文杰:从外部视角来看,我们是从做语音智能赛道切换到AR赛道。实际上,从公司内部的视角来看,我们并没有切换赛道,公司一直聚焦下一代交互产品,基于AI+AR的全新的交互方式。
单独的语音AI能够提供的交互能力有限,只有AI+AR结合起来,才能实现全新的多模态交互方式。
所以我们在14年成立了AI-Lab,专注于语音智能;16年成立了AR-Lab,专注于空间计算和手势交互。在2018年推出了第一款基于全语音交互的AR智能眼镜Glass,后续又推出了面向工业端的AR智能眼镜X-Craft ,还有今年推出的面向消费端的Max。
聚焦于AI+AR打造新的交互产品,改变人们的生活、学习、工作方式一直是公司的使命,这点从没有改变过。
雷峰网:你们早期先做 ToC 还是 ToB?是如何进行转型的?
向文杰:很多人觉得杭州灵伴科技很厉害,同时能做好ToB和ToC两条线,而且从外部来看是先ToB然后转型ToC,实际上不是这样的。
从开始切入AR方向的时候,内部就一直有两条产品线在推进,因为2018年到2021年这个期间,ToB端市场更成熟,所以更早地让大家看到了我们ToB端的产品,但是公司内部ToC的产品一直在保持迭代和用户验证。
到了2021年C端的大门开始打开,也是因为之前的持续准备,我们站在了大门的最前排,2022年在C端取得了行业最好的成绩。
我们在技术和组织能力上一直在深耕。ToB和ToC的产品在底层算法,软件硬件技术上有很多共同点,可以很好的复用。此外, ToB 和ToC 方向上有相应的企业文化和配套组织机制,所以我们能同时支持好两个团队、做好两个市场。
总体来看,ToB有更好的利润,ToC有更快的成长,两条腿走路,走的会更稳。
发力工业元宇宙,AGI是工业元宇宙新方向
雷峰网:在工业元宇宙赛道,杭州灵伴科技对比其他玩家有什么竞争优势?
向文杰:到今天,行业对工业元宇宙还没有形成统一的认知,但是大家都有一个意识,即工业元宇宙是工业数字化发展向前推进的下一个阶段。
在大数据、感知智能、通用人工智能、5G、数字孪生、IoT等各个技术都越来越普及的时候,把相关的技术融合起来,用新的终端赋能给到使用者,包含了管理者和一线的工人。技术围绕人来展开就是工业元宇宙跟传统工业数字化最大的区别。
公司一直都聚焦在交互技术上,AR设备会是工业元宇宙的入口,我们一直在持续打磨技术和产品,目前的AR产品在工业场景下有很强的竞争力,在全球范围内也有广泛的影响力。
雷峰网:要做好工业元宇宙,需要解决哪些关键性问题?
向文杰:工业数字化发展到今天, 5G、云计算、IOT等技术已经成熟并且不断普及。新的需要突破的技术包含了三个方面:
首先,通用人工智能技术在工业领域落地,极大的提高一线人员的工作效率, 把大数据的价值充分发挥出来;其次,AGI有效的降低数字孪生的构建成本,更快更好的构建虚拟世界;最后,AR设备和相关的空间计算的成熟和普及,普惠到每一个一线人员。
雷峰网:有人说,AGI是元宇宙的新方向,你怎样看这个观点?
向文杰:应该是一个必要的技术,能更快的、更低成本的构建数字孪生世界。
雷峰网:你说元宇宙的核心是人,为什么?
向文杰:刚才讲到了我们认为工业元宇宙是工业数字化向前发展的下一个阶段,通过通用人工智能把数据的价值发挥出来,通过数字孪生和空间计算实现新的展示和交互方式,最后通过AR设备把这些能力赋能给到一线人员,实现“科技赋能于人”,打造更高效、更安全、更有成就感的“超级工人”。