人工智能大概可以分为两个层面,一是感知,一是算法。在感知层面,3D摄像头无疑是最重要的组件之一,它就像人眼一样,给2D的图像叠加了一层深度信息,让感知更立体,可以实现人脸识别、手势与肢体识别、3D建模等功能。目前,像电视、服务机器人、无人机、VR设备,甚至是手机平板,都逐渐加入了3D摄像头。
3D摄像头这个行业其实已经有比较长的时间了,最早的一家公司是以色列厂商Primesense。它与微软合作开发了第一代体感设备Kinect。当时,微软想以体感体验与任天堂的Wii和索尼的PS争夺家庭主机市场。此后,微软有意收购Primesense,但由于价格没谈拢而作罢。在失去最大的客户后,Primesense估值下滑,最终被苹果收购。
奥比中光的工作人员告诉雷锋网,做深度摄像头主要有三种方案,结构光、双目与TOF,他们各有优劣势。
TOF测量的精准度和稳定性较好;但结构光可以做得更小,功耗小,测量分辨率也相对高;双目模拟了人眼结构,但它属于被动光,无法适应暗光环境,前两者是主动光。更重要的是,结构光方案供应商比较多。而TOF方案对镜头的要求比较高,能做供应链厂商很少。所以综合来看,奥比中光选择了应用范围更广的结构光方案,目前的产品主要是Astra系列3D传感器模组。
奥比中光的相关人士表示,目前全球能量产结构光方案3D摄像头的,只有四家公司:苹果,英特尔,微软以及奥比中光。而目前公司的产品已经和国内除了小米外的电视机厂商都有合作;机器人公司也有近七八成在用他们的产品做视觉;安防方面,如格林深瞳与海康威视等,也都有在用其摄像头做主动监控产品。
但3D摄像头产品的进展并不是一直这么顺。
奥比中光告诉雷锋网,最开始他们找到一些手机厂商合作,但没人搭理。也就是后来,关于苹果要在新一代iPhone中配备3D传感器的传闻越来越多时,才有厂商主动找了过来。“新的东西,国内厂商少有愿意尝试,如果没有苹果的带动,很难去主动推。只有当一个强劲的对手推出新功能,才会逐渐有公司开始动手,因为这就有了风向标。”
所谓苹果的传言,是指它会在下一代手机前置3D摄像头,而技术很可能是收购Primesense得来的结构光方案。
当然,一项技术的应用也并非仅受限于外界的心态,更有客观的技术、硬件规格和成本的限制。
比如Primesense最早出来的时候,不仅与微软有合作,也在国内有拓展。据称,当时这家公司找过TCL、康佳和长虹等电视机厂商,其中不少也表示出了兴趣,但一看价格就望而却步了。而且当时电视机的处理能力也弱,体感信息就会把电视的性能吃没了,什么内容也跑不了,没法商业化。
而现在电视的性能越来越强,四核八核往上堆,用来看电视绰绰有余,对付3D内容也不在话下,所以未来2-5年3D传感器很可能成为标配。
除了最早开拓的电视机市场,奥比中光看到,机器人对视觉的需求也很明显,用3D传感器可以做交互、建模与避障。另外他们也十分看重在手机上的应用,目前看来主要会用在前置摄像头上。“国内有很多厂商在做深度视觉的事,通过设备获取多维的人与环境数据。”
电视端Astra产品体验
而在公司层面,奥比中光告诉雷锋网,公司也经过财务困难的时期,虽然公司的天使轮融资就是5000多万元。最主要的原因就是,要设计自己的芯片。“我们的芯片会自己流片,一次就花掉千万元。”
而之所以创业初期就选择这种Hard模式,是因为“希望整个产品是我们的,其中就包括最核心的芯片。当时产品的确认过程是用FPGA来做的,但做完后发现,功耗不适合量产,因此必须要芯片化,这样才能适应量产与商业化。”
而最终的结果是,“全球能量产结构光3D摄像头模组的只有我们与苹果、英特尔还有微软”。这很大程度上要归功于公司的上海团队,其中有不少成员是IBM、MTK等公司出来的,属于在芯片行业做了七八年的老工程师。
奥比中光还表示,公司在3年前成立,到2015年开发出原型产品,速度很快。尽管未来会有很多厂商跟进,但技术能力上很难超越。因为整个3D传感器模组要综合的部分非常多,包括算法结构和各期间的参数调试选型,不是只做一部分就行。“我们在各个产品上都有对应的人才,在国内聚齐这些领域的人才就很不容易”。
至于3D传感器如何会像手机一样普及,在奥比中光看来,最大的障碍还是在内容上。而且产品还是处于初期状态,没有通用的标准。
“我们硬件部分已经准备得差不多了,没有太多的障碍,主要是内容。就像iPhone刚出来的那段时间,还需要愤怒的小鸟那样的游戏来让用户接受全触屏手机。”
也正是因为如此,作为一家硬件为主的公司,奥比中光也有自己的内容团队。在最早与电视机厂商合作的过程中,公司团队做了十多款游戏给到厂商,现在也与腾讯和一些体感游戏厂商有合作。在3D扫描和一些行业应用上,也有厂商在做针对性的开发。
“年底的时候在安防、人脸识别和机器人领域会有基于我们产品的应用出来,虽然量不多,但都有涉及。随着各行业内容的不断优化,成熟之后3D传感器的普及会很快。我们的核心是做视觉,也算是风口型的公司吧。”