微软在Win 10发布会上推出的HoloLens就像两年前Google IO上的Glass一样:开完会后老外说“Amazing”,国人说这玩意“超越时代”。不同点在于两年前,我们说到Google Glass,我们说的是智能眼镜,而现在讲起Hololens我们聊的是AR、光学和三维视觉。在过去两年时间里,国内外媒体把Google Glass由内到外,从技术到隐私、从前景到困难,未必系统但十分全面地扒了数遍。
以上,不少的国内团队认为这是两年多来Google Glass对AR最大的贡献。
早在HoloLens出现十几年前,国内早有团队在做AR。早期AR大致是通过摄像头识别一些固定模式的图像(比如二维码),然后在屏幕上显示增强后的效果。这种朴素的增强现实方式输入和输出都比较固定。
在Google Glass出来后的第一年和第二年,国内不少的团队开始研究类似的See Through设备,也就是我们常说的智能眼镜(关于这部分可以参见雷锋网2014下半年出品的《中国智能眼镜白皮书》)。
See Through的智能眼镜试图随时随地地增强信息,但实际在类Google Glass的设备上,虚拟图像和现实融合得并不好。比如Google Glass更多时候只是一块近眼可交互的屏幕,跟环境没有太大关系。
致力给VR和AR开发交互设备的Ximmerse联合创始人贺杰评价HoloLens是“第一款真·AR设备”。雷锋网早前报道过的Depth VR创始人李今则认为,HoloLens绝大部分的单一组件,如See Through的弧面显示,全息的内容制作工具HoloStudio,可能都需要一个至少中型的团队来开发。
HoloLens解决的3个问题
如果要达到Win 10发布会上Alex Kipman所展示的效果,HoloLens至少已经解决了3个问题:
1. 对空间的感知。官方视频中有一段,用户戴着HoloLens扫视周围,一幅房屋的模型就精确地落在了茶几和沙发上,也就是虚拟信息和现实世界完美拼在了一起。这是HoloLens和Google Glass最大的区别。
而关于HoloLens空间感知的实现,各路说法不一,一说为结构光的三维测量,另一说为红外光景深相机,类似Kinect。
2. 高强计算能力的小型化。HoloLens是一个独立设备,它最大的负荷在双目的景深图案采集和全息画面的实时渲染。作为参照,业内人士告诉我们Intel的3D摄像头RealSense采用自家专门定制的处理器,但在处理景深时CPU的占用率基本都在一半以上。
3. 输入和交互方式。HoloLens的摄像头同时完成两件事:一件是对环境的识别,另一件是对手势交互的识别(并且是徒手的精确识别)。后一点恐怕是非常高的考验,纽约时报的记者Farhad Manjoo在体验HoloLens样机时表示,手势操控很不准确,难以做出想要的操作。
同时,徒手的手势识别还面临一些其他的问题,比如当视野内出现两双手时如何判断。
关于HoloLens的实际完成度,无论是国内还是国外目前都没有公开的样机,只有少数媒体在“严格的限制条件”下体验了微软的产品,我们无法知道HoloLens真的戴在眼前是什么感受。
但关于开发者版和量产,几支国内团队对这个时点的判断至少在半年以上,甚至有团队认为会是4-5年。
做“大而全”和“小而精”
其实在任何领域做产品都会面临做大而全还是小而精的问题,但AR和VR的特例在于国内这一领域的团队几乎都是清一色的小创业公司。如文章开头李今提到的,HoloLens分解开的任何一个单项工程(如光学、处理器)都是巨型工程。所以目前AR上有很多小公司在做很有意思的“单项工程”。
广州的Ximmerse在做一套介于Nimble VR和Razer Hydra之间的输入设备。Ximmerse带有双目的红外摄像头作手势和环境跟踪,配套的手套中植入加速度传感器和光源信标,另外还配合一枚类似Hydra的控制器。Ximmerse的联合创始人贺杰说他们专注做输入设备。
北京李今的团队则在去年完成了一款能够追踪用户视角的3D显示器,之后他们还开发了基于图像识别做空间定位的软件算法,现在他们在做一款能够追踪头部的虚拟现实手机眼镜盒。但总得来说,他们核心在空间定位和追踪。
像Ximmerse和Depth VR一样在AR领域(同样可以应用在VR)主攻单项技术突破的公司还有很多,比如去年在KS上筹了50多万美金的诺亦腾。这些公司团队精细,专注一个细分领域,同时在AR变成消费级之前能取得尚可的现金流,是国内AR/VR里跑得快的一支。