从2023年年初ChatGPT的突然爆火到2024年年初Sora的横空出世,大模型在不断刷新人类的认知。似乎前一秒大模型厂商还在苦苦研究如何让文生图技术更加精湛,后一秒Sora的诞生就为大模型厂商开辟了一条关于多模态的新赛道。
反观国内大模型市场的关注点也从早期的大模型技术本身过渡到了上层应用。因为无论从商业化的角度还是技术发展的角度,大模型其实就是一项新技术,如果不落地到具体的场景中,不仅没办法变现,也没办法体现大模型技术的价值。
基于此,从中小企业到大型央国企,从地方政府到中央都把AI作为发展重点推进,今年两会期间,“人工智能+”被首次写入了政府工作报告中,再次把以大模型为核心的AI技术推向了又一个新高度。
目前,全行业几乎都开始做AI+的尝试,就像当时互联网+的概念出来时一样,诸如教育、医疗、电商、营销等纷纷将自家的原有产品和AI进行深度融合,值得强调的是,它们所做的研发不是简单的接一个AI接口,而是用AI技术对产品进行重构。
术业有专攻,通用模型很难解决垂域问题
“每次技术革命并不完全是带来了新的技术,还带来了全新的生产力的供给。比如工业革命带来了全新的力量供给,以前可能举不起一吨重的石头,现在通过机器就能轻松的举起来。芯片带来了全新的计算能力的供给,互联网带来了全新的连接能力的供给,AI带来了全新的智力的供给,”之于大模型对人类社会发展的意义,值得买科技CTO王云峰如是说。
雷峰网了解到,在这样的契机下,值得买推出了AI购物助手“小值”并在“什么值得买”App上线。
据值得买相关负责人介绍,“小值”是值得买科技基于值得买消费大模型自研的Agent产品,能通过对话深度理解用户需求,基于全网实时消费经验、价格信息进行快速总结,提供口碑总结、商品对比、商品推荐、全网比价等服务,为存在不同决策难点的消费者提供个性化的建议,从而提升消费决策的质量和效率。目前用户进入“什么值得买”App,点击“我的”页面右上角机器人图标,或搜索“AI小值”关键词,均可直接调用“小值”。
众所周知,AI产品应用的开发路径通常有三种:一是外接一个AI端口,二是在开源模型的基础上做研发,三是自研一个垂类模型,然后在此基础上进行研发。三种研发路径各有千秋,前两种投入的时间成本、人力成本较少,但效果一般。第三种,投入的成本较大,但效果明显要比前两种好得多。
所以基于目前的发展情况来看,大部分会选择外挂接口和开源大模型的路径,但是值得买却选择了自研。对此,王云峰特别解释道,一方面希望把自身的技术能力积累对外展现出来,另一方面是现实世界需要我们来做一个新的垂类大模型。
但是从值得买的业务出发,后者才是最重要的原因。因为从大模型的整体发展来看,通用大模型不能很好地解决垂直领域中的问题,聚焦到消费这一垂类领域的知识密度又不够,无法真正为消费者的购物决策起到助手作用。
雷峰网(公众号:雷峰网)了解到,在小值的研发过程中,值得买测过各种国内外各通用大模型的效率,其中就包括GPT4,但结果显示在垂直领域里面它的知识密度和逻辑推理能力其实都不太适用。
原因在于,与各垂类大模型相比,消费行业存在特殊性,诸如,AIGC刚刚爆火时,医疗、法律、金融等领域都陆续训练出了自有大模型,这些领域存在一个共通点,知识的比例相对更大,经验的比例相对更小,不管是金融也好还是医疗也好法律也好,更多是确定性的知识。在这种情况下,大模型结合静态内容的训练是可以完成应用落地的。
消费行业的难点恰恰在于“经验多、知识少”:变化的商品价格、主观的用户评价,包括每个个体不同的需求和感受,不仅影响着消费者的决策判断,也让当前大模型结合静态内容训练’的方式效用减弱,无法真正解决消费者的决策难题。
所以早在2023年,值得买科技就把AIGC列为重点战略,率先开展AI在消费内容应用上的研究。同年3月,从各部门抽调出一部分人成立了AI Lab,后续发展成为独立的AI事业部。
众所周知,数据、算力、算法是模型训练的三大重要因素,哪个环节出了问题最终都会影响模型的训练效果。
在数据方面,值得买科技从全网数十亿数据中,筛选1.2亿条消费相关优质训练语料,同时基于数万轮对话数据,训练整个模型的意图理解和交互能力;在意图理解方面,基于真实购物场景进行对话数据整理以及数据构造,训练模型对于消费意图的理解;在数据增强方面,增强了动态信息的来源,应用向量化技术,通过语义检索与用户问题相关的经验,支持消费领域的检索增强;此外,覆盖全网跨平台近70亿(商品10.2亿,内容57.4亿)条消费内容,筛选优质高销商品进入用户商品推荐库。
在算力方面,值得买更是提前储备了一批H100算力卡,并与国内头部大模型公司、云厂商,包括各大高校实验室建立了合作关系,从人才、算力、模型等多重资源层面,以保障公司在AI领域的深度探索。
“目前公司已经训练出了消费大模型,对于模型层来说,还会持续迭代优化,”王云峰表示。
AIGC应用层出不穷,如何做好是重要课题
时间回到2023年下半年,彼时和大模型一样火的Agent概念迅速出圈,国内各厂商为了抢热点纷纷将精力转投到Agent上,就像当初大模型刚出来时一样,很多厂商都说要做Agent,甚至在该概念火了还没多长时间,就已经有厂商对外官宣了自家的Agent。
值得注意的是,大部分的厂商对外宣传的点是代替人执行复杂的任务,从而实现“提质增效”的目标。当然,小值就是这样一款产品,且相较于其他产品来说,已经进入到落地环节。
对于小值能解决什么问题?
具体到业务中,当用户开始与小值对话,小值能快速判断用户使用需求:如需商品口碑,可优选值得买内容库中覆盖全网的超2.5亿条实时有效的优质消费内容,总结商品的真实优缺点;如需商品比较,可基于值得买内容库,通过参数及评价等比对,帮助消费者挑选更适合的产品;如需商品推荐,则通过内置自研意图识别模型,引入多轮对话系统,帮“选择困难症”梳理需求、精准推荐;如需实时价格,则基于值得买商品库中覆盖全平台的优质高销商品,进行实时价格比对,找到全网最“值”好价。
对此,值得买将其功能总结为评、挑、荐、省。也因此,王云峰认为,相比内容生成,小值更大的价值在于能够帮助用户进行消费决策,“是一个融合感知、分析、推荐和执行能力的AI购物助手,解决不同消费者个性化的决策难题。”
当然,基于大模型,值得买自研的产品不只有小值,早在去年8月的时候,值得买还推出了AI 评论机器人、AI购买建议、神灯素材助手等应用。其中,“AI评论机器人”能根据平台相关内容,自动生成对用户购买决策有价值的评论,同时用户可以与机器人进行互动,不断提升社区互动氛围。“AI购买建议”则是对于手机、数码、家电等价格较高、决策链路复杂的商品,总结出商品的购买建议,包括优势、劣势及建议,帮助用户快速获取决策支持。
但话说回来,AI给人带来的影响有利也有弊,我们不能只看到其利,而忽视其弊,而是要在这个基础上,学会扬长避短。
以AIGC为例,王云峰表示,AIGC和消费的深度融合已经成大势所趋,但是对消费者有好处也有坏处。好处是 AIGC 能极大地提升内容生产效率,丰富消费者所能看到的内容量。但相应的问题是内容太多,反而增加了用户对各个平台看内容的时间,很可能出现买一个东西需要做很更多功课的问题。
但最棘手的是,用户很难分辨内容的真假,比如,以前文字分不出是真是假,后来变成图片,更分不出来真假,现在多模态出来后,对消费者而言,视频内容增多,分辨内容的真假好坏,就会变得更难了。
简言之,一方面,新工具确实能帮助用户节省大量时间,看到更优质的内容,提升决策效率。但另一方面,也会让其陷入信息过剩的环境里。
“在这方面,值得买跟一些科研机构合作,在做AI对抗相关的基础性工作。对行业而言,谁能够更好地把优质和真实的内容呈现在消费者面前,谁就能在未来有更大的发展,”王云峰如是说。
据悉,小值有内部版、商业版和用户版。目前已经上线的是用户版,未来会把小值的能力以 API 的形式释放出来,给其它合作伙伴来使用。
正如前文所言,目前小值实现了评、挑、荐、省四大功能。但在王云峰看来,小值想做的远不止于此,“未来希望小值成为站在我旁边的一个人,能给我的任何消费提供建议。一方面能理解我的消费喜好,知道我说的性价比指的是什么,到底是注重便宜一点还是说其实要质量好一点?知道我的日常喜好是什么?比如同一款衣服习惯选黑色还是白色。也知道我喜欢什么样的对话方式,甚至要比我自己更了解我自己。”
从2023年到2024年,大模型的发展已经有一年多的时间,各厂商的比拼也已经从技术本身过渡到了应用层面,未来的应用一定是百花齐放,百家争鸣的阶段,如何做好一款能解决实际业务场景问题的应用,将成为重要的课题。