雷峰网按:始于2016年的“全球人工智能与机器人大会”(GAIR),历经五年,见证数次潮水的转向,成为目前为止粤港澳大湾区人工智能领域规模最大、规格最高的学术、工业和投资领域跨界盛会。
在12月10日举办的第六届GAIR全球人工智能与机器人大会上,紫为云CEO顾友良分享了《共建AR交互真实世界,共创“和谐元宇宙 ” 新未来》的主题演讲。
简介:顾友良从事智能视频和人工智能行业22年,曾任海康威视国内营销中心副总经理、佳都科技董事高级副总裁,提出“立体安防”、“云脑使能”、“数据量子态”、“Zee引擎”等研究观点,获评“改革开放40年中国安防卓越人物”。
顾友良指出,元宇宙的核心内涵是“互”,即“互、互相、互联网、互联互通、互交超链接、互动虚实融合、互生互补生态圈、互惠互利市场循环、互敬互爱人类共同体”。
同时,紫为云有两个主要的设计抓手:“数”与“人”。
“数”,就是紫为云自研的Zee引擎。顾友良说,在Zee引擎的加持下,紫为云可以在三个方面赋能人在元宇宙中的体验:一是多模态算法,对图象、声音、文字等各类算法结构化的技术;二是沉浸式计算,保持元宇宙里的低延时,从网络、数据、通讯各个方面进行算力的优化;三是AR交互技术,我们现在已经做到通过单目的摄像头实现对人体姿态、表情的精准采集。
而在“人”的部分上,紫为云也致力于用产品设计来优化元宇宙交互体验,为用户提供AR增强现实产品、交互智能平台产品、沉浸式场景解决方案和智能硬件等主要产品。
同时,顾友良坚信元宇宙未来的市场空间会存在一个大的增长。紫为云也希望基于Zee引擎技术,全力向最实用、最广泛、最经济、最接地气的市场进军,将Zee引擎应用到更广泛的产业数字化场景中。
以下是顾友良现场演讲的全部内容,雷峰网作了不改变原意的编辑与整理:
顾友良:1991年1月7日,我来到了深圳。围绕监控这个领域我已经做了20年,2019年1月7日,我获评“改革开放40年中国安防卓越人物”。说起来我有个特长,和我打了电话五六次的人,过了一年左右,我接到电话的声音都能够判断出对方是谁。所以圈子里的朋友都说,我做视频监控是基因的选择。我本人也是中南大学的“秀才当成兵”,特别喜欢写文章和书法,参加学生会竞选时被选为保卫部部长,专门保卫学生安全。所以,人生的经历就是这样的巧合。
2019年我离开佳都科技,2020年北上北京,清华的咖啡馆和周边的火锅店被我吃个遍,与清华的人工智能博士聊人生、趋势、选择、奋斗、奉献。于是有近十个清华的奋斗者,也有北大的奋斗者,跟着我一起南下广州,开始了我们的元宇宙之旅。
元宇宙的核心内涵是“互”
我今天讲的主题是“共建AR交互真实世界,共创和谐元宇宙新未来”。元宇宙是什么?元宇宙在西方的观念里面是虚拟空间,我认为在中国还是要强调一点,就是实干兴邦。我们要有国家的情怀、社会的责任和企业的使命,要真真实实的把科技和产品服务于人,要共创和谐元宇宙未来。
当前元宇宙的“玩家”,突然间扑面而来,排山倒海,我们周边的同事很多朋友对我讲:友良,你是搞监控的,是否对元宇宙也比较了解?刚开始,我真不了解,小说《雪崩》我也是刚刚看。我把清华大学沈阳教授的PPT研究了两天,不懂的词就去搜索,一点点进入了元宇宙的世界里,去积极的拥抱它,去认知它,去思考它。所以我在想,元宇宙只是属于头部企业的吗?元宇宙只是一些技术大咖的吗?我相信不应该是这样的。我的感觉是什么呢?元宇宙属于每一个人,更属于一些有思想、有情怀,有自我的平台、企业和个人。
元宇宙究竟是什么?其实就一个字——互。也很巧合,这也是我们公司的一个商标。从1到9,我把里面的关键字定为:“互、互相、互联网、互联互通、互交超链接、互动虚实融合、互生互补生态圈、互惠互利市场循环、互敬互爱人类共同体”,形成一个句型,尤如燕子叫的声音,叫做“燕叽体”。这也是我对元宇宙里面最关键的“互”的理解,它是普遍联系的,不是虚实对立的,而是虚实融合的。
这是我们紫为云的宇宙观,也是我经过学习之后的认知结果。我认为在现实的世界里面,我们通过人工智能技术不断对现实世界进行结构化,进行孪生,离不开的是数据。类似于阴阳太极,有虚实两面。现实里面有个虚的点就是数据,在虚拟里面最实的是人。我们不能成为虚幻飘渺的,我们时刻不能忘记在虚拟的世界以人为中心,以人为本。坦白讲,虚的部分怎么是“火”呢?现在元宇宙在虚的层面上虚火太盛,某些方面是在炒,所以我们更要冷静地去看这一点。紫为云的宇宙观是辩证统一的宇宙观,是和平共处的宇宙观,是和谐开放的宇宙观,是和美共享的宇宙观。
“以人为本”,真实互动
这是我们紫为云宇宙观“数”和“人”的体现。先是“数”,就是紫为云的Zee引擎,它包含几部分:一是多模态算法,对图象、声音、文字等各类算法结构化的技术;二是沉浸式计算,保持元宇宙里的低延时,从网络、数据、通讯各个方面进行算力的优化;三是AR交互技术,我们现在已经做到通过单目的摄像头实现对人体姿态、表情的精准采集。大家可能都听说过微软的Kinect摄像头,我们的单目RGB高清摄像机“AI+AR”技术处于世界领先地位,实现了真实世界与虚拟视界的无缝链接和互动。
下面是我们的技术示例。例如,我们可以用单目对场景进行三维建模,也可以通过单目摄像机对平面2D人和3D数字人进行驱动。现在,很多虚拟主播,是用重算力模型来做支撑的,我们可以用轻算力模型做到。大家想一想,你手机放在边上,用支架一架,把优美的姿态、美妙的声音映射到一个虚拟的沉浸式场景里面去,这是多么沉浸的体验。我们还可以做投影交互、动态手势的识别。
此外,我们还可以用手势精准识别;也可以做职业教育培训,将一些传统的老师傅很精准的操作手法演绎成数字模型,通过这个帮助新手对照,当新手产生不恰当动作的时候会被系统识别,并及时提醒;还可以用到健身场景,现在健身很多是在健身馆里面,是私教一对一或者一对少数人的健身。未来有精准的姿势识别,线上可以有十几个教练对着下面一百个、两百个健身馆的学员,都是有可能的。
我们紫为云“以人为中心”的产品界面,一个是App端,一个是Web端。这款产品叫做“把视互动”,理念是“把视频互动起来”。我做视频监控22年,以前做视频都是通过监控采集,把现实的世界复现并存储起来。而现在是通过多模态算法、沉浸式计算、AR交互等技术,实现把识别的内容进行创新。可以想象,它应用的场景不再只是安防、可视化管理,而是可能应用在生活的每一个领域。
从产品演示视频中可以看到:有的是翻书工具,包括隔空手势控制翻页,在里面画圈、划重点;有的是幼儿园的产品,可以不断的蹦跳;还有通过消病毒,消的姿势如果录下来也有可能就是一个舞蹈,可能是在练八段锦,也可能是在练太极拳;还可以是健身开合跳或者练习天鹅颈,让自己的身体更加婀娜多姿。通过这些简单的动作融合,我们把它放到手机里面就能实现以上的功能,我们现在使用的硬件就是市面上最普通的个人手机,能够实现全实时的体感交互。
在AR方面我们还在做什么?基于人的各种行业应用,包括教育、体育、童趣、健身外,还有培训、舞蹈、游戏。更加刺激的是什么呢?还有在广告场景。我们经常看电视,看完了广告如何去触发?我们通过手机可以用触摸屏触发,我们看电脑的时候用无线鼠标触摸。但是在看电视、进入游乐场的时候,很多屏的交互因为手不具备即时的接触式控制器,怎么办?如果我们用这样的一个前端的摄像采集,每个人都可以用手势去触发。这里我们Zee引擎刚刚突破了一项核心技术,单目摄像机里面可以同时容纳10-20个人同时触发。意味着什么?突然出了10-20个气球,上来10个人去抓去抢,我们通过姿态的识别,去抓的时候能够识别准。这样想一想,大场景的娱乐互动是否更加有意思?这都是Zee引擎技术带来的元宇宙超现实沉浸式体验。
在解决方案方面,我们可以将多项产品进行整合,在特定场景里应用。例如社区场景,社区的资讯宣传栏、广告处、电梯广告、文化驿站等等。
云宇宙,是片广阔市场
讲了这么多的技术和产品解决方案,那么紫为云的市场是什么?当下元宇宙火了之后,有多少人真正体验到元宇宙VR产品?还有多少人去体验过AR产品呢?很多人体验过,可能还不知道那个是AR。从当前的市场份额上来讲,我个人认为,在被认知的市场里面,元宇宙VR产品的比例可能会高一点,但从体验人数来看,更多人是没有体验过VR的。
未来会怎么样?我做了对比。可能VR和AR市场都在快速的发展,刚才沈阳教授讲是40%,学者往往在市场判断上比较谨慎,我个人来讲,至少是倍数级的增长。我坚信元宇宙市场将会有一个大的增长,尤其是AR市场,基于增强现实的元宇宙市场。紫为云基于Zee引擎技术,全力向最实用、最广泛、最经济、最接地气的市场进军,我们要在很多场景用上我们的Zee引擎,变成数字化场景,即产业数字化。我们还要把数字内容化,把内容到一线去应用起来,让更多企业或个人能够做出自己特色的AR元宇宙。
我们希望和合作伙伴一起,更多的企业和个人建立和谐的宇宙,不是自己独家做到所有。信息技术革命时期变化太快,我们在变化的快里面怎么样才能够有更紧密的合作伙伴?就在于你是否够透明、开放、真诚。是否愿意主动担当那个最后分粥的人,这取决于你能够做多大、多广、多深。紫为云通过Zee引擎与生态合作伙伴联合共建和谐的元宇宙,包括软件开发、门户平台、行业解决方案等各领域提供商甚至个人。我们也可以帮个人做自己的2D人或者3D数字人,在个人专业场景里面打造个人的元宇宙。
我们把紫为云定义为做未来事情的平台。本人有一个习惯是做一年看三年,不代表看得对,但是一直努力的在看。本人在十几年的职场里面注重“十看”,我姓顾,也叫“顾十看”。第一是看到变化,第二是看清趋势,第三是看准机会,第四是看透竞争,第五是看好未来。这是外部的因素。第六是看明自己,包括看自己的团队,第七是看榜样。看清自己之后向哪个榜样去学习,去丰富自己,变强自己。第八是看准执行,第九是看重激励,第十就是看远人生。基于以人为本,基于对现实看到的变化,我们要做未来的事情,要有这种心态。
我经常和做战略、学术研究的人交流,特别希望和宏观规划的、能够接地气的人合作,要有仙气,还要能接地气,这样才能踏踏实实去享受现实的生活。所以我把紫为云定位为一个“做未来事情”的平台,核心基于三点:一是AI+AR,二是真交互;三是正能量。人做一件事情,成功都是别人来定义的,不是自己来定义的,失败是自己定义的。面对未来的不确定性,要坚守当下的确定性,只要能够确定活着就应该去为不确定的未来做事,而不是安于现状。
尤其在我们现在看,社会变化太快,习总书记讲过,百年不遇之大变局。技术变化、产业重构这么快,我们面对变化的时候关键是心态,给团队定目标的时候把态度放在第一位,什么样的态度匹配什么样的目标。紫为云就有这样的理念,要基于看到变化,总结、合作、开放,一起做未来的事情。
最后是紫为云对“互”字的理解阐释。紫为云(zeewain)是源于清华人工智能产业孵化项目,“zee”谐音“紫”,表示清华紫,以清华大学校训校风为企业文化内核; “wain”谐音“为”,表示企业奋斗的方向,像北斗七星,引领人工智能技术发展,将清华AI技术应用到“田间地头”,就是恪守“为人民服务”的宗旨;“3”指三生万物;“∞”是无穷大。大家看我们的商标,“互”是两个“Z”,也是两个“W”,下面是现实世界,上面是虚拟世界。“W”变换一下就是“3”,三生万物,两个“3”合在一起,就是“∞”,就是Metaverse,即元宇宙的无穷大。
所以,我希望紫为云和我们的合作伙伴一起共建中国特色的元宇宙,坚守一个“互”字,互惠互利,互赢互敬。有这样的理念,我们更能以开放的胸怀,团结可以团结的力量,整合可以整合的资源,打造一个接地气的元宇宙,成为中国的“meta”。为国内的大循环,新经济的增量,人工智能和数字经济的发展做出自己应有的贡献。
谢谢!
(雷峰网(公众号:雷峰网))