十年前,微软发布了一款划时代的游戏设备:Kinect。
这款设备颠覆了传统游戏的单一操作,不需要使用任何控制器,依靠相机捕捉三维空间中玩家的运动轨迹,就能对游戏进行精准操控。
遗憾的是,一度被认为引发了人机互动革命的Kinect,几年后终因游戏内容生态不足而被砍掉。
而这,也带来了3D体感技术在世界范围内的一度沉寂。
幸运的是,Kinect所采用的3D体感技术后期并未折戟沉沙,而是换了条赛道,悄然应用在医疗健康、新零售等领域。
「或许Kinect 作为游戏控制器的时代已经结束,但现在它又以另一重身份进入到大众视野中,尽管我们可能完全不知道。」外媒IGN如此说道。
其实,微软之外,国内很多厂商也意识到了3D体感技术的“高能”,并积极探索。
华捷艾米,就是其中之一。
成立于2014年的华捷艾米,自2010年就开始专注于3D体感交互技术和深度学习的研发,并推出了3D感知芯片、3D感知模组、体感设备等一系列产品和解决方案。
“3D体感交互的本质就是‘人、物、场的数据化’。数据化后,就能理解人的想法,帮助人更好的控制一颦一笑、动作行为,从而与机器进行互动。人和机器交互模式,就会发生一场革命。”华捷艾米董事长李骊对3D体感交互,显然有着更大的期许。
各大公司在3D视觉及体感布局已久,但一直未出现大规模应用。其中,硬件是制约因素,而算法的复杂性,以及未找到合适的应用场景则是主要原因。
那么3D视觉及体感技术,适合的应用场景在哪里?
苹果开辟了先河的手机3D人脸解锁及支付领域,首先是兵家必争之地。
2017年,苹果率先将3D结构光带到了手机上,也逐渐引发了3D人脸解锁及支付的新潮流。如商汤、旷视等厂商都加入到提供软件解决方案的行列中,而如华捷艾米等厂商则提供软硬一体的解决方案。
华捷艾米的布局在于3D Sensing手机前置与后置结构光方案,除摄像头等重要器件外,也植入了3D结构光、AR尺子、3D建模等关键算法。
而在零售上,除了目前已逐渐落地的刷脸支付外,实现人员进出、人物追踪、取放物体识别等诸多功能的无人货柜,也在落地尝试中。
华捷艾米介绍道,通过顾客拿取物品的手势,方案能自动识别物品属性并将其加入购物车,通过多个摄像头对手势信息、脸部信息、骨架信息的共同标定,多维度确认,能实现30秒自动刷脸结账。
“通过刷脸进店后,就能绑定个人信息,实现轨迹跟踪、行为识别和行为分析。若有偷盗行为,后台还能直接进行报警。”李骊介绍道。
目前新零售正从单纯的监控设备服务向数据服务转变,不过目前数据服务还不够成熟。华捷艾米在做的,就是逐渐从全程获取用户行为数据,整合零散数据,实现路径规划、行为分析等。
而在安防领域,由于目前监控摄像头多采用的是二维人脸识别,受光线、角度等因素影响较大,并难以进行活体识别。因而,3D体感也逐渐在安防领域打开市场。
3D体感在安防的应用,更多是在人证核验、智能门锁等场景。而如监狱等场所,对识别犯人是否有肢体冲突等要求较高,通过三维深度信息更好对其进行判别,也是3D体感落地的方向之一。
华捷艾米在此方面,则和安防厂商合作,发力智能门锁,并在地铁、火车站等进行人证核验等。
在医疗领域,华捷艾米还能通过智能大屏,内置深度摄像头与体感控制模组,结合自主研发的人脸识别、三维重建等核心技术,读取30多项人体体脂、体维数据。
除此之外,在软件之外,华捷艾米研发了硬件设备3D 摄像头。其自研的3D 摄像头,基于散斑结构光原理,获取目标的深度信息,适用于0.28 ~1m的近距离人脸识别、深度数据采集,立体与平面判断等。
由于对使用距离的要求较高,如新零售的人脸支付、火车站的人证核验等,相对近距离物体识别场景,是目前3D 摄像头落地的主要方向。
但3D体感在落地过程中,也还存在一系列难点。
3D视觉及体感的产业链,可大致分为器件、芯片、模组、系统和方案设计厂商、算法厂商,及产品和应用厂商等环节,目前产业分工上,其实还较为模糊。三维产业的链条还需要厂家自己捋顺和打通。
华捷艾米在方案的实施中也发现了这一问题。仅靠产品体系其实并不能实现长远的增长预期,在具体的行业应用场景中,往往涉及到一系列专业算法的运用,尤其现有芯片不能满足相应需求。
李骊认为,“3D技术的行业应用和芯片间的关系可以用‘零和一’来形容。没有合适的芯片,整体的应用就很难顺畅的进行。”
目前,复现一个MR的场景,至少几个算法同时运行。而以常用的传统芯片进行调试,只能放置两个算法。
另外,3D的视频带宽也很大,约为180M,难以上传。因而,就需要通过芯片在前端对视频进行解析,数据化之后再进行传输,才能更好的实现端云分析。
再有,人的行为动作反应很快。从想到做一个动作再到实施,整个过程只有8-12毫秒,单纯通过软件的方式很难大幅提高运行效率。
因而,这就需要一个单独的服务芯片,去集中解决商业问题。
基于以上判断,华捷艾米从2016年起便自主研发专用MR芯片,目前已研发了三款提供3D测量解决方案的芯片,包括IMI1180、IMI3000芯片及用于提供嵌入式解决方案IMI2280。
其中前两款芯片主要解决原始数据成像问题,不具备分析功能。IMI2280芯片则搭载了华捷艾米自研的3D骨架算法、3D SLAM、3D手势识别、3D场景结构化等九大算法,可实现人体识别、物体识别、环境识别,及本地化分析。
“3D体感技术,微软研究了20多年,苹果投入200多亿美金,研发了七年。对于初创公司而言,这项技术若要重新开始复制,至少需要4-5年。如突破各类算法就要一年半,数据采集就要一年多,芯片开发也要两年多时间。这其中的技术壁垒就是我们的竞争优势。”李骊说道。
积十年之功,华捷艾米这样形容自己的领先优势。
3D体感的技术是光学精密仪器与制造、模式识别、图形图像、机器学习和神经网络技术集大成者,跨越多个领域的高精尖技术。
2010年微软Kinect推出以来,鲜有公司和研究机构完全突破包括3D拍摄、人物提取和骨架识别等的体感交互的所有技术环节。
不过,麦姆斯咨询认为,3D成像和传感技术已经在高端市场的“庇护”下逐渐成熟,并逐步取得了成功。
继双摄像头时代的下个时代会是什么?
如华捷艾米等公司给出的答案,是不断突破3D体感技术的技术环节,开发出低成本、高准确度、嵌入式的体感交互产品,并在手机支付、新零售、安防等多个场景推动落地。
国产的3D体感技术,正在逐渐打开一个新的市场。雷锋网雷锋网雷锋网