2015年,VR主题公园The Void的首部宣传片在YouTube上放出时,顿时获得了数百万的点击量。许多人对其展示的震憾体验啧啧称奇,甚至有读者在雷锋网的报道后面评论称为了体验愿意付出一个月的工资。
The Void给人震憾在于其创造的一个逼真的虚拟与现实结合的世界。用户身处一个大空间里,眼前看到是虚拟的游戏场景,感觉却是如此真实,因为他看到的游戏人物就是另一个真人,他感受到的风吹、雨淋,不仅是视觉上的观感,也有身体的感受。
那么创造这样一个世界到底需要怎样的投入呢?从技术、产品,到内容和运营,这都是一个全新的事物。
本期公开课我们请到了MANAVR的CTO王锐,为大家解答有关这种VR主题公园的所有问题。
王锐Array,毕业于清华大学,全栈工程师,致力于探索虚拟现实与人机交互的各种可行性。
虚拟现实行业从业者,现任神秘谷MANAVR联合创始人&CTO。
1997年作为早期成员参与开源图形引擎OpenSceneGraph的核心开发,该引擎为世界级VR引擎,曾应用于NASA航空研究。著有《OpenSceneGraph 3.0 Beginner's Guide》(英文)与《OpenSceneGraph.3.Cookbook》(英文),作为大师级专著,入选美国陆军和海军研究生院教材。编译业界人称红宝书的《OpenGL编程指南》。
开发过数控机床和数字地球,同时还是知名的网络小说作家。
以下内容整理自公开课演讲。
我觉得用一个最朴素的词语就可以解释The Void与一般体验店的区别,那就是“大”。这里说的“大”不仅仅是空间上的大小差异,因为现在我们也随处可见占地上千平米的VR体验店,但是其中可能包含了几十种不同的展示内容。而The Void从一开始就强调了自己独一无二的一点,就是场景的一致性。
一致性这个词有点抽象,简单解释一下的话,它包含了两层意思。一,The Void这类主题公园在整个空间上是完整而一致的场景;二,The Void在环境体验上是完整而一致的。
The Void在盐湖城第一个体验中心占地200平米,整体上描述了同一件事情,最早的宣传视频里是在飞船里去探险,后来体验厅里整个是一个闹鬼的房子。他们在宣传视频里也说得很明白。
现在很多VR体验店,就是这块放一个蛋椅、坦克车,那块放个HTC Vive体验区,再加上个VR吊桥,弄个40平米的多人体验空间,这种虽然前2个月可能客流量不错,但是后面销量就不太乐观了。
这种把内容堆砌起来的方式,和以前的街机厅没有多大差别,它的收费模式和街机厅也类似,比如按项目收费,或者是游戏卡,120块钱一个小时。但现在的VR游戏的粘性远远不如以前的游戏,像街霸那样。而且现在人们的口味也很叼了,真开一个街霸的店可能也赚不到钱。
回到刚才说的,The Void除了场景上是一个一致游戏的世界观,同时在环境的体验上也是完整而一致的。这一点构成了The Void和各种超大空间的多人定位体验或是街机厅式的体验的本质区别,比如Zero Latency也是200-400平的大空间,也是基于同一个世界观,它的名气也不小,但它和The Void其实有本质的区别。
比如,Zero Latency的实际空间是完全被清空的,不能有墙,不能有支撑柱,你可以在里面跑,但其实一般也不敢跑。游戏的内容,同理,也不能有墙和支撑柱,可能是你在一个空地上,四面八方的树木里有僵尸出来。否则你看到一堵墙,伸手摸不到,或者直接穿过去,这是很违和的。我体验过一些做障碍物的密室逃脱体验,进去第一把先走到墙外去了,看看有没有鬼,但这就违背做VR游戏的初衷了,也是很多做内容的人遇到的一个难题。
The Void提出的概念是“环境交互”,也就是说,虚拟和现实的空间环境是统一的。你可以扶着虚拟场景里的飞船舱壁前进,因为现实中这里真的有一面墙。你也可以在虚拟空间打开一扇门,因为在现实空间真的就有一扇门(但有一个问题是前一个人开门了,后一个人再开需要有工作人员先把门关上)。比如在这有一个触摸屏,你把手伸过去真的可摸到一个面板,在实际中这可能只是一块木板,但你看到的是触摸屏。这就构成了很好的用户体验流程。
通过这些墙壁,立柱,大门的设计,也很容易做到用户行为的引导,而不是让人在一个孤零零的大场景里不知所措。很多人玩大场景的多人定位体验,跑不起来不敢动,就是站在原地开枪。因为一般人的思维模式是这样的,你看到一个什么都没有的大场景,下意识地认为不要乱动,因周围可能潜藏着危险。我觉得这是人心理的一个自然反应。
要点:
The Void形式的VR主题公园和一般VR体验店的最主要和最显著的区别在于The Void「大」。
主要体验在,第一,The Void在整个空间上是完整而一致的场景
第二,The Void在环境体验上是完整而一致的
而目前的大型VR体验店堆砌内容的方式和以前的街机厅并没有差别
还是扣住刚才说的核心差异,第一是The Void场景世界观是一致的;第二它的环境体验虚拟空间是一致的。在这两个核心差异的基础上我们再来谈它的主要技术。
首先,为了确保场景大而且统一,我们需要足够精确的空间定位技术;为了确保真实的环境体验,我们需要支持自然的交互过程。
这两点也就构成了The Void类型主题公园的核心技术——空间定位和自然交互。
空间定位的方案很多,实现精度,成本,维护难度,人数支持,抗干扰能力都各有不同,以前在雷锋网也撰文概述过,要深入的话一个星期不一定讲得完。因此这里只提出几个最起码的需求:
1、能够支持足够大的空间和相应的定位精度;
2、能够支持足够多的体验人数;
3、能够适应空间的不规则形状;
4、便于实施和维护,成本可控。
The Void到目前为至一直使用的是光学捕捉的定位方案,说实话这种方案要适应各种真实场景的要求是有难度的。了解光学定位方案的应该知道,其实在场景的天花板,横架上去安装摄像头,成本是很高的,水很深。
通过空间定位要定什么呢?首先是头部,然后是双手,人的双手是交互的起码需求。如果要有毫无限制的游戏,手的交互是起码的。进一步来说,脚部的追踪也很重要,要看到自己在走路,下蹲、跳起,这些都是一个The Void体验空间中的需要的最起码的自然交互。
而且大空间多人游戏体验中,别人看到你的虚拟角色应该是你真实的动作,你跳起来,他能看到,冲他打招呼,他也能看到。所以,如果最终极的体验,是需要在这个系统中包含全身动作捕捉系统的,这也是我们
The Void采用的是大空间光学定位,捕捉是通过光学Mark点捕捉你在空间中双手和枪的位置,它还有另一种方案是通过Leap Motion来追踪双手。我们采用了一种不一样的方案,我们通过铺地板识别人在空间中的位置,通过运动捕捉,包括惯性捕捉,把人的姿态建立起来,可以说The Void在天上,我们反其道行之,在地上搞。
ManaVR多人大空间VR体验场示意
我们管这个系统叫全域传感系统。目标是欺骗自己的大脑,在虚拟世界中平滑表达自然交互的过程和肢体的动作,同时有一个真实的空间定位以及与虚拟场景的交互过程。
除了核心技术之外,还有几个不得不注意的技术问题。其一是为每个玩家配备“高性能的移动计算设备”,简单就是PC背包,还有就是有足够运算能力可以承载计算需求的移动设备,总之是不能有一根线拖在后面,这对体验来说是不安全的。
其二是确保低延迟的网络数据传输。因为The Void游戏强调多人体验,在交互过程中另一个玩家看你,应该是流畅和自然运动的,不能滑步或掉帧。这对游戏服务器端实时调度的需求是很高的,这在一般网游上是不需要的。
The Void的另一个重要的技术概念是通过外部设备提供全局交互体验,比如靠近火山口,吹热风,或是朝着玩家喷雾喷水。这种技术并不神奇,以前做舞台工程见得很多,它没有一个明确的规范,完全根据游戏剧情来定制,所以这里也就不作赘述。
要点:
核心技术有:足够精确的空间定位技术、支持自然的交互方案
基本需求也有:一,能够支持足够大的空间和相应的定位精度;二,能够支持足够多的体验人数;三,能够适应空间的不规则形状;四,便于实施和维护,成本可控。
两个技术问题:其一是为每个玩家配备“高性能的移动计算设备”,其二是确保低延迟的网络数据传输。
目前我们看到的构建体验馆或者主题公园的技术方案,大体上可以分为以下几种:
一,VIVE游戏,动感座椅,以及一些道具和内容的简单组合。
二,大空间多人游戏方案,这里通常只运用了空间定位这个核心技术方案,具体原理包括但不限于光学定位(被动Marker),PSMOVE类的主动光学定位,UWB定位,LightHouse类定位,贴满房间的二维码定位,SLAM(Inside-out类)定位,靠嘴【声音】定位等等。
三就是万向跑步机的方案。
然后还有The Void自己的方案,采用自研的VR头显和背包系统,OptiTrack光学定位方案,注重虚实结合的环境交互体验,以及完整的游戏逻辑流程。事实上它也并没有多少硬科技创新的地方,但是理念上确实和前几者存在着根本的差别。
第四种,就是上面提到过的ManaVR平行宇宙全域传感系统解决方案。
我把这个问题理解成两个互相不关联的部分。一,空间定位方案中的多人游戏问题;二,游戏场景数据的无线传输问题。
目前最为流行也最稳定的就是被动式Marker点的光学定位,例如OptiTrack,Vicon,MotionAnalysis等等。
光学定位的原理很容易理解,在空间中设置足够数量的摄像机,而人身上粘贴高反射特性的Marker小球。摄像机上安装的红外LED阵列照射小球,反射到摄像机画面中形成高亮的画面。同一个Marker只要能够被至少2台摄像机同时观测到,就可以测算它在空间的位置。
很显然,场地内如果有无法被2台摄像机同时看到的死角,那么定位就会失效;而同一台摄像机看到的Marker点越多,定位混淆的可能性就越大。并且对于不规则形状的场地空间来说,实施的难度和成本是很高的,因为每台摄像机的价格不菲,而不规则的场地中可能形成死角的区域会大大增加。而同场参与游戏的人数过多或者过于密集的情况下,也可能会出现识别失准的问题。
再说另一个方案就是UWB,超宽带的定位方案。在空间内架设多台传感器设备,然后游戏者佩戴的标签发出UWB脉冲信号并且被至少两台传感器接收,传感器通过信号到达的时间差,以及信号到达的俯仰和航向角度来计算每个标签在空间的绝对位置。从理论上来说,它具有速度快,穿透力强,抗多径干扰,且同时支持上千个标签识别。
其它方案大多也存在类似的问题,比如:支持的空间大小有限,定位精度不高;支持的体验人数受限,1人为主,2人就是技术革新,4人就放鞭炮了;支持的空间形状大多为矩形,必须完全空场,难以引导游戏者行动。此外实施问题和运行稳定性的问题也就不再赘述了。
有关第二个问题,即游戏场景数据的无线传输问题。我这里并不想过于深入,因为这更像是一个具体的网络游戏开发的话题。但是我们可以择取一个有趣的点来阐述一下,就是无线VR头盔的解决方案。
HTC VIVE刚刚宣布开始预售他们的无线版头盔,基于TPCAST提供的无线双向传输协议,预计延迟能够在30ms以内。这种低延迟的无线图像传输方案本质上依然是WHDMI标准,采用60GHz频段信号,因此信号的衰减是非常快的,穿墙更是几乎不可能。并且因为画面编解码本身可能耗费的时间,延迟也很难做到低于20ms. 而WHDMI方案为了低延迟传输基带信号所以不是窄频道而是一个很宽的频道,这样造成了多机工作的时候互相干扰注定了同时不能有很多人一起玩。而且频率高衰减快,适合家庭而不适合体验馆。
要点:
目前最为流行也最稳定的就是被动式Marker点的光学定位,但光学定位容易有死角、Maker点越多,定位混淆可能性越大
UWB的超宽带定位方案,方案存在共存和互相干扰的问题
HTC采用基于TPCAST提供的无线双向传输协议,信号的衰减非常快,穿墙几乎不可能
可以从淘宝购买一部分设备,如何把它们合理地安置到游戏场景当中,才是VR主题公园所需考虑的重点。譬如在虚拟空间里走近窗户,感受到电风扇吹来的冷风;或者游戏中的飞船落地,在玩家身边激起干冰的烟雾。
事实上,在虚实结合的场景中,会遇到很多需要通过传感器对真实场景中的用户交互信号进行采集的需求。这类传感器设备主要包括:位移传感器,角度传感器,加速度传感器,压力传感器,流量传感器,声音传感器,温度传感器,磁传感器,亮度传感器,色彩传感器等等。如果把多个传感器的数值进行融合,相互弥补弱点,填补空白数据和响应区间,然后计算得到更为精确的关联数值,就是我们常说的Sensor Fusion了,Aurax™Hern九轴惯性传感器和惯性运动捕捉的核心算法也就体现在这里。
除此之外,我们也可以选择基于Leap Motion来做虚拟的触摸屏,基于Kinect或者CV识别的手段来做玩家面部或者运动趋势的识别,基于RFID来做接近物体的识别(例如握住门把手,拾起桌上的武器等)。这些交互设备和方法往往都是新媒体互动展示行业用到的常见工具,但是与VR主题结合之后,足以焕发更新的活力。
要点:
一些特效工具在淘宝采购可能更便捷
如何把设备合理地安置到游戏场景当中,才是VR主题公园所需考虑的重点
多人VR游戏的软件开发,本质上也就是网络游戏软件的开发。因此诸如消息/事件系统的建立,多机之间共享数据对象,延迟和数据一致性的处理,这些网络游戏系统架构相关的课题也是VR网络游戏所需要考虑的。当然有了Unity和Unreal这样优秀的游戏引擎支持,我们可以节省很多自己去实现这些后台架构的精力,但是依然有几个需要注意的地方。
1,游戏数据的传输策略。
2,如何表现某个客户端眼中其他玩家的姿态。
3,局域网游戏和展馆布置时经常会遇到的,就是中央控制系统,配置
要点:
多人VR游戏的软件开发,本质上也就是网络游戏软件的开发
我们需要考虑:游戏数据的传输策略、如何表现某个客户端眼中其他玩家的姿态以及中央控制系统
The Void类型的游戏体验可以说是强定制性的,需要把虚拟场景和实际环境完全结合起来才能发挥最好的效果。因此,传统的VIVE或者Oculus游戏内容是难以直接复制到大空间当中的。不过能够实现全自然交互和环境交互的游戏方式,对于第三方开发者来说也有很大的发挥空间,而不是在有限的交互手段遏制下捉襟见肘。
当然,如果大空间是一个完全清空的矩形场地,完全可以直接对空间的坐标进行重新映射,然后替代VIVE的交互手柄;另一种可能性是替代VIVE游戏的“瞬移”特性,真的让游戏者走到期望的地点,不过这样对于整个游戏逻辑以及空间的设计都有很高的要求,能够直接转化的只有场景资源而已。
如果要自己完成The Void类型的游戏开发,要注意的问题除了前面提到的交互方式的改变,网络数据通讯以及玩家姿态之外,还要考虑一个特殊的游戏逻辑处理,也就是玩家的死亡和复活机制。
要点:
传统的VIVE或者Oculus游戏内容是难以直接复制到大空间当中
除了交互方式的改变,网络数据通讯以及玩家姿态之外的问题,还要考虑玩家的死亡和复活机制
首先,VR主题公园与传统主题公园相比,它的主要优势在于低廉的装修成本,以及互动内容的快速更替。当然VR游戏本身所带来的前所未有的沉浸感也是它的主要价值之一。
如果选择与传统主题公园深度结合,或者在景区中搭建VR体验空间,这种保障客流和复购率的盈利模式是可以预期的,并且避免了自主运营的复杂问题,只是单纯从门票收入分成的模式。另一种可能的模式是与具体的规划馆和科技馆结合,不过这更偏向于toB或者toG的需求了。
安装和维护的难度则直接取决于开发者所采用的核心技术本身。
要点:
安装和维护的难度则直接取决于开发者所采用的核心技术本身
光学定位需要专业人员深度参与场地的测算和安装
VR主题公园的装修成本测算比传统公园要更为简单,因为并不需要非常复杂的内饰和软装修,空间风格也有据可循。因此我们需要讨论的成本主要来自于设备,内容开发和人力三个部分。
设备也就是前文里提到的所有技术要素对应的硬件产品:头显,PC背包,定位系统,自然交互(例如运动捕捉)系统,舞台和交互设施,以及整个场地的网络设备。
要点:
成本主要来自于设备,内容开发和人力三个部分
设备是指所有技术要素对应的硬件产品
军事训练、工业仿真、影视制作、高危行业培训等
王锐:我之前去参加一个会,当时是华谊兄弟的副总,提出了VR与主题公园有三种不同的结合方式:
1、把传统的主题公园VR化,比如坐过山车每人戴一个头盔;
2、新的VR体验项,比如新增加VR密室逃脱体验;
3、完全融合VR概念的主题公园。
例如,The Void今年有一个捉鬼敢死队的体验馆,这个馆首先是腊像馆,所以是有传统展示方式的。在这个馆中The Void除了提供大空间的VR体验外,还提供了与传统展示空间相结合的体验。
这其实是一个慢慢正在进行的趋势,就是VR和传统主题公园慢慢整合在一起,方式就是刚才说的三种。
第二大趋势就是以后会有完全VR化的主题公园,它会有自己的IP,在IP的基础上展现一个始终或是大部分时间都戴着头盔的体验的超大场景,一个数千平甚至上万平的空间,在这个空间中所以网游的概念都可以拿入进来,包括传统主题公园的概念也可以进来。
王锐:事实上,目前的VR主题公园和体验馆盈利是不太乐观的,它主要收取的是用户第一次体验的新鲜感带来的红利,几乎不会有第二次消费的可能性。包括The Void,它的二次消费比例也不会很高,因为它所展现的更多是一种技术实力的展现,而不是一个完整有粘性的游戏内容。
在我看来为什么会有这样的问题,就是受限于之前说的两个核心的The Void可以表现而其它的体验馆无法表现的特点,第一就是场景足够大有统一的世界观,第二就是场景有很好的自然交互体验。
当场景足够大,有统一的世界观,才能够把网络游戏的一些概念带入进来,能够将多人在一个足够大的场景中进行游戏、社交,下副本和升级;当你有了自然的交互体验,才不会让人很快将装备卸下来,又或者在场景中有很强的不适感。事实上,正是这两个特点还没有做到位,我们才会看到目前的VR主题公园很难吸引到二次消费,,而不是局限于目前的交互方式下怎么做出有趣的游戏来。
比如2048这个游戏,很多朋友都在玩,但这个游戏可以形成一个门类吗?我认为肯定不能。以目前交互手段所局限的VR游戏,未来有没有可能出现爆款?我认为有可能,但是会不会因此形成一个门类,我觉得不会。怎么样让VR游戏形成一个门类,这才是最终赚钱的手段,而不是依靠一两个爆品,而且现在连爆品都没有。
所以我们说,如果想在一个全新的行业赚钱的话,最有效的方法就是把已有的经验带入进来。所以,我总是说将网游带入到VR游戏。有些朋友会说这是一个全新的领域不用一个全新的方式去思考,还要用传统的思维,很无聊。确实很无聊,但这是我们怎么考虑赚钱最直接的方法,就是想我有什么方法将传统游戏的概念带入进来。
王锐:为什么VR游戏的内容这么受限,常见的各种各样的塔防枪战、鬼屋、密室逃脱,这些看起来和VR没有关系的游戏形式,放到头盔里。其实内容是受制于目前的交互方式本身,所以没有一个能够体验差异化的爆品内容出现。
VR主题公园很火其实是说VR体验店很火,这个领域现在是一个红海。所有的体验店,无非有两种目的,一种是验证一些最新的技术,背后可能是有技术实力的公司;另外一种是想赚一笔快钱,或者听了别人的说法,购置一些设备看有没有赚钱的空间。这种火在我看来是有水分的,最终应该会有一些精品存活下来,但还是要有一个思路转变的过程。
我们为什么一直在问题中反复强调VR要有一个一致性的场地和世界观,要有一个一致性交互和环境体验。这其实就是解放了内容开发受到的约束,你能够让游戏者在场地中运动起来,能够用一些障碍去引导,能够用自然交互方式去进行游戏。我觉得有这些前提下才能够将内容开发者的思维放开,Vive的空间只有这么小,只能用一些很不协调的方式去娱乐。包括现在为什么没有一些大型VR游戏的诞生,因为场地就这么大,如何保证一个两小时的体验,是个问题。
比如玩一个像上古卷轴、仙剑奇侠传这样大型的RPG,如果场地总共就这么小,总是瞬移的话玩家很容易就厌烦。有足够大的场地,才能把这种概念带入进来,包括网络游戏的概念,它们首先也是建立在有一个足够恢宏的场景,足够恢宏的世界观,足够多的敌人和同伴世界观。要囊括这一点,我觉得还是要回到我们最初提到的,VR主题公园最大的一个特色就是大,只有够大,才能把这些特色带进来,内容开发者才有的放矢。在目前约束的条件下,我觉得内容的问题还是硬件和交互的问题,内容为王前提还是硬件和交互体验要做到极致,
王锐:首先,当我们说毫米级精度时是两个问题,就是究竟是虚拟空间中与现实空间中精度的差异,还是当你重复走到一个地方重复精度的差异,这个精度的讨论有时候是很含糊的,所以毫米级的讨论可以先放到一边,因为定义都还不是很清楚。
当我们讲全域传感、UWB或者是光学定位方案时,本质的问题在于当我们去识别一个人在空间里的运动时,需要它在空间中的一个绝对参考系,绝对参考系中的一个标记点,这是空间定位需求一个本质的核心所在。我们说惯性传感器做空间运动不准确,因为它只能保证角度的准确性,位移只能通过速度去推算的话,会存在误差,而这个误差没有绝对位置去纠正的话,就会越来越偏,越来越漂。
用光学的方案去避免零漂移,也就是每走一步输入的误差都会被绝对参考系去纠正,这个绝对参考系的参考点来自摄像头定位。当我们说用全域传感时,同理,地板上的每一个点就是绝对参考系下一个足够精确的点,当我们踩在地下时同样可以用这个点去纠正漂移,得到非常精确的定位。而且重复的精度是非常高的,甚至可以说是趋近于零的。
王锐:我去年10月在知乎发表过一篇文章,有关2016年被誉为VR元年大家怎么看,后来根据这篇文章整理了一篇发表在雷锋网上。
这篇文章主要有三个观点:
1、交互、空间定位方案不完整,或者根本没有;
2、在硬件条件不健全的条件下,内容很发展;
3、各种蛋椅之类的体验过程是完全不合理的。
现在到了16年底,我觉得当时说的这几个点还是都说中了的。
回过头来看,2016年VR的发展是很迅猛的,从交互设备、空间定位方案、头显方案、游戏内容都有很长足的发展。现在很多人也提出了内容为王的口号,基本就是硬件都到位,就看内容了。
但是正因为有这种口号做引导,现在很多人看VR会持稍微悲观的态度——不是硬件都具备了吗,怎么还没见到杀手级的内容,是不是这个行业根本不靠谱,VR充其量就是个投影机,这种情况下从事这行业是不是个错。这是很多人有的一个悲观的观点,在我看来其实恰恰是它的前提是有问题的,现在还没有到一个万事俱备内容为王的时候。
现在很多游戏和视频内容开发者遇到很多问题,正是因为整个针对VR交互的体系还没有健全,相关的标准还没有建立,我觉得现在谈内容可以,但要说爆发,还尚早。
2017年会如何发展,我觉得把2016年积累的各种知识、产品,去其糟粕取其精华,最后留下来的是真正为用户、开发者所需的东西,这些东西会构成行业逐步发展的基石。VR不是呼之即来,挥之即去的,它的发展过程就是一个去粗存精去伪存真的过程,我们相信很多不恰当的概念会被摒弃,留下来的良性产品会奋而前行。这个产业能够飞速发展,是我们所期望的,也是我们需要为之而努力的。