作者:袁柏林
编辑:董子博
“数智人必将为我们社会带来翻天覆地的变革。我作为内容创作者,实地的感受真的是太震撼了。”作为腾讯云智能2D小样本数智人体验馆刘兴亮如是说。
图:刘兴亮的数智人分身与本人对比
(来源:腾讯云智能)
随着人工智能技术、云计算、5G移动通信技术等的技术发展,数智人行业不断加快的各种应用场景落地。数智创研院的《2022数智人分析洞察报告》显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达102.4亿元。
在过去,要完成一个超写实、高精度数字人的制作,可能需要数十小时的烘焙和渲染——而在今天,一项数智人技术的突破,或许会让这项技术,变成以后每个人都共有的“标配”。
元宇宙兴起后,数字人赛道成为各大互联网企业争逐之地。关于数字人,雷峰网(公众号:雷峰网)曾在Meta元宇宙「寒气」逼人,数字人用「内功」驱寒文章里详细叙述过。简而言之,数字人是元宇宙重要的组成部分,且接近C端用户,具备强大的变现能力。
而数智人则与数字人,虽一字之差,但截然不同。
数智人,如同它的名字,是智能的数字人。因此,数智人不仅具备数字人强劲的变现优势,而且数智人更拥有智能化与交互性特征,这也是“数智人”与普通的数字人最大的区别。
在AI技术、5G技术、XR技术以及深度学习等技术的支撑下,数智人将拥有更智慧的头脑、更灵活的动作、更丰富的表情以及更人性化的心智等特征。
去年7月底,依托多模态人机交互技术,国家博物馆就与腾讯SSV数字文化实验室联合打造出首个虚拟数智人“艾雯雯”,成为国家博物馆虚拟世界的代言人,助力让文物活起来,成为文化数字化战略发展的典型案例。
图:国博虚拟数智人“艾雯雯”
(来源:国家博物馆公众号)
一年未到,腾讯这次达到了从制作时间和成本上突破数智人发展上限:利用短短3分钟视频在24小时内高效生成数智人。
4月25日,腾讯云智能首次对外重点推介的2D小样本数智人,只需3分钟视频即可在一天内定制专属数智人分身。
腾讯优图实验室研究总监汪铖杰表示“我们看到的是3分钟的视频做训练,但是背后是有一块很大的多模态数据在支撑。”
3分钟的小样本视频背后是基于大数据的学习,即对引入自监督机制的通用多模态模型进行训练,将视频里的语音、文本与数智人像的表情、口型进行关联,并且自监督式的模型可以让数据自己约束自己,以此节省更多数智人标注时间。
这让数智人行业完成边际成本到固定成本的进阶。
相较于之前训练一个数智人,需要几十小时,甚至更长时间的语料或者视频素材,现在只需要通过通用模型的学习,就可以变成一次性的固定成本,后面每一个新的数智人的定制,包括形象、音色等的边际成本都会比较小。
可想而知,先把底层通用模型训练好,再制作多少新的数智人也不过“添个人就是添双筷子的事儿”。
这种一次生成、多次获利的模式促进数智人的制作时长实现从月级别降到小时级别,数智人的制作成本从百万级别降到千元级别。
此外,2D小样本数智人技术结合3D技术,即在从“文本或音频信息”到“3D人像驱动”,最后实现“2D人像视频”的模式上,腾讯云智能已经有较多技术积累,这将能够使生成更加精确、2D小样本数智人细节打磨更加精致。
目前小样本数智人不仅实现了“皱纹级”形象还原,还达到“音素级”音色复刻的效果。
外貌表情、举手投足的真人风貌复现,让人惊叹:“世另我”!
图:小红书营销讲师苏歆老师与她的数智分身
(来源:腾讯云智能)
总而言之,数智人背后的技术支持,促使数智人行业得以完成快速生产、成本精益、效果精良的蜕变。
此前,数智人主要服务于公司企业或者高层管理等部分精英人员,覆盖传媒、医疗、金融、教育等各行各业。
对于集团来说,数智人能够助力企业数智化转型升级,降本增效,打造更好的7*24全天候客户服务;对于精英人员来说,数智人能够跨越时间和空间的限制,帮助其处理闲锁事务,节约时间成本,解放生产力,将人的注意力放到更有价值的事情上去。
但是,要社会的整体进步发展,数智人的门槛必须往下拉一拉。
而腾讯云智能所训练的2D小样本数智人将生产成本的大幅度降低。且客户可以自己开账号、下单购买、上传素材、自行训练、确认效果,完全实现自助式服务。
可以预见,随着技术发展,生产成本和使用门槛将会越来越低。对于个人,尤其是普罗大众来说,做自己专属的数智分身将是触手可及。
人人都有数智分身的未来,并不是梦。