接上一篇,雷锋网介绍了用多点触控做大屏交互的X-Board智能茶几,并盘点了当下在大屏幕上的各种交互方式。继多点触控之后,基于视觉的手势和姿态识别也是这两年大屏幕交互的热点。最早普及的如Kinect,2013年最火的硬件当属于Leap Motion,而上个月微软发布的HoloLens则被好多业内人士仰慕,号称“有神一般的视觉识别技术”。而这次,雷锋网采访了uSens的费越博士,他们团队恰好在做与HoloLens中的视觉识别非常相似的产品。
费越是一位研究人机交互12年的专家,前后在诺基亚、摩托、松下和亚马逊的研究院工作,参与过很多神奇项目的项目的研发。这些神奇的项目包括一套Windows XP/2000时代便上线的3D桌面,能用空鼠操控的3D电视UI,能够凌空互动的广告机,视觉识别跟大屏幕互动的方式非常之多。有意思的是,我们发现当下并没有普遍在大屏幕应用的这类方式,而费博士团队现在主攻的方向是将视觉识别用在虚拟现实。
uSens(凌感科技)成立于2013年,费越是创始人之一,在uSens成立之前,费越以及他的团队就致力于进行人机交互方式的研究:
2002-2004年,费越就利用业余时间开发了一套Win XP时代便上线的3D桌面;
2008年-2009年,在松下工作期间,费越和他的团队又开发了一款触摸式遥控器, 中间是一个常规的按钮,两侧为触控面板,搭配3D电视UI,实现智能化的人机交互;
2010年,费越又进一步研究出了集成了触摸和空中手势动作的三维遥控器,并制作了相结合的三维电视界面。这个系统提供了酷炫的体验。 并在2012年变成产品开始和电视一起销售;
2011年,费越和团队研发出了3D虚拟现实墙,用户通过体感设备,在一面100英寸的液晶屏前,通过走动、手部动作、语音可以产生一种沉浸式的体验;
2012年,他们又研发了虚拟现实体桌面,通过头部跟踪实现了具有全息视觉效果的虚拟现实显示,通过手势识别,可以让人直接和虚拟物体交互 (类似阿凡达里的三维地图/沙盘);
2013年,费和他的团队成立了uSens,他们是在美国留学及工作多年的中国高科技工作者,有多年在硅谷世界著名大公司从事人机交互,电子产品设计,软硬件设计的经验,uSens的核心技术是以三维手势识别、头部跟踪为主的三维输入技术和虚拟现实的三维输出技术。
目前,能从uSens官网了解到的具体产品是指感一体机(FVT Fingo virtual touch )和凌指(Fingo),FVT是一台能够"凌空互动"的广告机;而Fingo是一个由一个小型传感设备和一套软件系统组成的体感设备。硬件主要是传感设备,可以捕捉手指的各种形态及活动。软件分为4个主要部分:底层的算法,用于处理手的图像;手势识别库,储存了一些人类最常用的手势;可以给第三方二次开发使用的SDK及可编程接口;第三方可以用该接口来开发一些手势识别的应用程序。
Fingo作为一种近距离、高精度的手势识别设备,适用于大屏、小屏和‘无屏’;通过蓝牙/Wifi方式与智能电视、手机或者平板电脑相连;提供手写输入,三维交互功能,Android应用可以不加改动就可以在电视上使用。
uSens的CEO何安莉告诉雷锋网,目前他们正在做一款设备,并计划将把它放到Kickstarter上进行众筹。
Windows 和鼠标带来个人电脑的普及,触摸屏和 iOS/Android 带来移动设备的全面推广,但对于大屏幕而言,触摸类的应用并不适合大屏幕,大屏幕的应用场景与手机、Pad等中小屏幕也不尽相同,那末,体感技术在大屏幕上能做些什么呢?
1、体验休闲娱乐类的游戏,进行轻量运动。例如Kniect就涵盖竞速、舞蹈、格斗、冒险等众多运动类型;
2、代替遥控器完成浏览、换台、点播等功能,当你坐在沙发上看电视,可以轻轻挥手,在不同的界面之间自由操作,听音乐、换频道、浏览页面,一应俱全。当然,语音技术也是实现这一操作不错的选择,但二者也并不矛盾;
3、玩高精度、重型游戏。轻量级的游戏可能无法满足发烧友们的需求,随着体感技术的发展,大屏能提供的体感游戏也会更加精彩。
费越告诉我们,体感技术在大屏幕上应用,可以通过两种方式来实现,一是直接生产如凌指这样的智能硬件,然后把它与电视或盒子无线连接;另一种就是与终端厂商合作,把技术集成在智能电视或者盒子中。
在费越看来,在大屏幕上进行休闲游戏以及轻度运动等,Kinect目前可以满足使用,
Kinect这类技术分为两部分: 1代能够采集深度图(depth map)的硬件,2代根据深度图计算出人体形态动作的算法。
Kinect 1代的硬件是基于结构光方法,由以色列的PrimeSense公司开发。这类技术现在已经不少公司都可以做到。但2代计算人体动作的算法技术要求很高,目前只有微软掌握成熟的算法。
此类设备不需要任何计算机视觉方面的计算,但硬件成本高,目前的市场看,还远不到爆发的程度,芯片设计,摄像头的成本都比较高。而且主要的交互还是停留在大肢体动作,使得用户体验上不是很好,勉强应付舞蹈,运动这类应用。这个低精度严重限制了应用范围,都是小众市场。
另一类产品便是基于多角成像这一技术的生产的Leap Motion和uSens公司的Fingo。这种技术的基本原理是使用两个或者两个以上的摄像头同时摄取图像,就好像是人类用双眼、昆虫用多目复眼来观察世界,通过比对这些不同摄像头在同一时刻获得的图像的差别,使用算法来计算深度信息,从而多角三维成像。
费越还告诉我们,多角成像是三维手势识别技术中硬件要求最低,但同时最难实现的,技术要求较高,多角成像不需要任何额外的特殊设备,完全依赖于计算机视觉算法来匹配目标,相较于结构光或者光飞时间这两种技术成本高、功耗大的特点,多角成像能提供“价廉物美”的三维识别效果。
谈到第二类实现方法,费越告诉雷锋网,uSens更偏向于做整套系统,其核心商业模式是卖整机,以及授权技术。而在中国进行授权合作,却并不容易。
以智能电视为例,已有国内的电视制造厂商与uSens进行合作洽谈,将uSens的体感技术集成在电视中,这样既可以获得现金收益,也有益于将uSens的技术向市场转化。但鉴于广电总局的规定,usens无法自行开发UI,只能在电视机原有的操作系统上进行适配,而且电视中的OS往往并不是电视硬件制造商开发,而是第三方比如阿里云OS开发。所以和智能电视的适配和整合不是一朝一夕可以完成的。因此,在授权技术方面,uSens遇到了阻力,想必这也是电视生产厂商遇到的阻力。
费博士告诉雷锋网,体感技术不仅可以通过大屏展现,还可以和虚拟现实相结合,具体的发展方向包括:
1、休闲类的游戏,轻量级游戏,将体感技术与虚拟现实想结合,不一定要借助大屏才能玩游戏,可能带上一个眼部设备,你就会有身临其境的渗透感;
2、军事、医疗的模拟教学,比如可以根据已有资料建模,进行模拟手术,That’s cool !
3、虚拟现实的界面交互,未来的UI,会从二维变为三维,你将不仅仅在一个平面的环境里进行办公、购物、娱乐,你去到一家餐厅,菜单是三维立体的;你在淘宝上购物,你浏览的每一件衣服都可以在身上试穿,等等。
系列回顾: