3D体感的技术是光学精密仪器与制造、模式识别、图形图像、机器学习和神经网络技术集大成者,跨越多个领域的高精尖技术。所以,在2010年微软Kinect推出以来,鲜有第二家公司和研究机构完全突破体感交互的所有技术环节。3D体感核心技术包括3D拍摄、人物提取和骨架识别。我们来浅析一下3D体感技术每个核心环节的技术特点。
骨架识别的技术解决方案主要由数模逻辑推理和机器学习两种方案。数模逻辑推理是通过有人体的某个关键可识别的关节点,通过人体特征推理出人体每个关节点的位置,这种方法简单易实现,但是人体是柔性、易变形,随机动态变化的,没有一种逻辑推理方案能够把人体的运动给模拟出来,导致识别准确率不高没有实用价值。这就是OMEK(被Intel收购)和Softkinetic(Intel合作伙伴)几年也不能推出商用化产品的原因。机器学习的方法是通过大集群计算机“学习”几千甚至万亿的人体行为样本,来得到基本人体行为模型,就像小孩子成长的过程。但是机器学习和神经网络是近几年来逐步兴起的技术,还不是太成熟,选择什么样的“学习”方法和什么样的特征样本是至关重要的,是需要不断试验的。但是大集群计算机计算本身成本就异常的高,动则千万人民币,没有扎实的研究基础,一般厂商不敢轻易尝试。
对于人物提取来说,就是要把复杂的动态的环境去除,把真实的“人”提取出来。这个在工程上也是有较高的难度,比如人与桌子接触,人与人握手和人体被局部遮挡。抽象理解就是人体分割和人物跟踪在现有的基础条件下,不会有完全精确的解决办法,只是相对的解决。
人体的动作是三维的,当然对人体动作的测量也必须是三维的。3D拍摄或测量技术实际上是相对比较成熟的技术,具有多种解决方案,比如单彩色摄像头,双彩色摄像头,光干涉,超声波、结构光散斑和TOF(测量光的飞行时间)等等。除了TOF,其他的测量方式可以说都是基于三角测距的原理,不同在于对特征点的提取的不同。
对于人体动作来说最主要的难题就是三维测量的实时性和3D测量数据对骨架识别的适用性,人眼的反应时间一般小于120毫秒,也就是说3D测量到骨架识别最大允许时间必须小于100毫秒,才能够与应用对接,这就要求三维测量的计算量不能太大,要不然成本太高就不适合消费级产品使用。
彩色摄像头是以颜色和纹理为基础的,光线细微的变化都会带来图像处理上较大的差别,对于纹理的细微分别决定了彩色摄像头只能局限在近距离(0.8米以内),这就是我们可以看到三维拍摄的图像都是黑白的灰度图的原因。彩色图像颜色提取的方式,抗光线和同色系干扰的能力极差,原理上决定很难把不同的物体区隔出来,得到的三维图像体感也是无法使用的。这就是为什么leapmotion必须是室内向上拍摄,通过LED把手掌点亮的原因。
光干涉的原理精度高,但是计算原理就决定了该方法计算量超大,为了减小计算,就要想办法省略掉物体的整体构建,只计算物体的边缘轮廓。但是物体的边缘轮廓的三维信息根本就做不出骨架识别的训练算法。Intel的realsense,还有Pepplesinterface面临的困境,可以三维测量,却不可以体感。
Primisense的结构光散斑测量方法,就是在测量精度和计算量上面向体感技术做出平衡的最优方案之一。Primesense的精度为厘米级,判断人体动作已经足够了。
TOF的方案分辨率很难再提高了,而且测量光飞行时间的晶振芯片和摄像头模组技术难度太高,从图像质量和成本的角度,TOF在很长一段时间仍然落后于结构光方案。超声波的精度太低,远距离实用性不强。
国内现在体感宣传满天飞,手柄是一类,只能够识别人体几个点而已,用户体验与微软Kinect相差太大,也不可能有很大的市场机会。其他的所谓体感技术都没有人物提取和骨架识别技术,妄图采用苹果释放出来的OPENNITE骨架方案,这样做是要不从技术原理上根本就无法对接,即使能够对接的,也是赤裸裸侵犯苹果的知识产权,苹果产品推广在即,想苹果没有剧烈的反应都难。这样的后果就是中国永远只能做低端的山寨,也无法根据客户定制性需求提供技术服务,无法达到3D体感技术全社会推广的目的。
华捷艾米(微信号:IMI_NANJING)研发团队经过5年的潜心研发,突破了3D体感技术所有的技术环节,开发出具有完全自主知识产权、多平台(windows、Andriod、Linux)、低成本、高准确度、嵌入式的体感交互产品,包括 IMI-3D传感芯片、IMI-3D体感传感器、骨架识别软件、SDK中间件等产品和全套软硬件技术解决方案。与该公司的交流过程中,深深的感觉到了公司管理层的危机感和使命感。
华捷艾米软件科技公司总经理杨高峰表示:3D体感技术的应用最大的瓶颈是应用的开发,华捷艾米旨在和投资商一起打造共同打造“人眼“智能生态链,深度挖掘体感技术应用空间。没有一家公司有这样的实力把生态链都做了,3D体感技术的根本前途在于全社会的参与。
华捷艾米技术总监李朔表示:与国内厂家相比,我们是全球第三家具有完整自有知识产权3D体感技术方案的公司,我们在3D传感器上充分的考虑了用户的使用特点,在算法层面就考虑的设备摔打变形等客观因素照成的影响,最大化的考虑了环境噪声的影响。与微软相比我们的技术层次是没有差距的,但是在对用户消费行为的特点理解和工程化工具的开发和表现形式还有一定的差距,我们正在努力降低这种差距。
路漫漫兮修远兮,祝福华捷艾米,祝福中国的技术宅。