【编者按】作者艾韬,深圳市易瞳科技CTO,毕业于多伦多大学计算机工程专业。多年跟随“世界穿戴电脑之父” Steve Mann教授,专注于智能眼镜的基础研究。
前不久,一篇AI下围棋的新闻炒得沸沸扬扬,围棋AI在人类历史上第一次战胜职业选手。然而,就像当年被“深蓝”打败的国际象棋大师Garry所说的那样,这并不意味着电脑在象棋领域取代了人类。不仅仅是下棋,AI再聪明,它也取代不了人。我相信,最终取代人脑的不是电脑,而是“人脑+电脑”。未来的象棋或围棋大师,不是人也不是电脑,而是最会用电脑分析棋局的人。一个相信计算机,并且能和计算机兼容的人,叫Cyborg(赛博格)。这个人机共生体,实现的不是AI,而是HI。
上一次在概念篇(《神奇的虚实世界:关于你可能还不那么了解的智能眼镜》)中跟大家探讨了智能眼镜中的一些概念,基本上覆盖了所有智能眼镜的形态,也就是大家正在做的是什么。但我觉得,比“做什么(What)”和“怎么做(How)”更重要的是“为什么(Why)”。这是一个框架,也代表了一个愿景。更重要的,这是一个核心。
所以,今天要给大家介绍的东西叫Humanistic Intelligence(HI),由穿戴电脑之父Steve Mann教授于上世纪90年代提出。在电子科大陈东义老师(国内最早研究穿戴电脑的学者)的笔下,HI的中文翻译是“人文智能”。HI凝聚了上世纪顶尖学者的心血,在过去的30多年里,智能眼镜的发展方向是以HI为指导思想的。而实现HI中的“人机共生”,就是我们做智能眼镜的初心。
前年底当我快要离开实验室的时候,实验室的名称已经从之前的“EyeTap Personal Imaging Lab(ePI Lab)”改成“HI Lab”了。去年底,回实验室拜访教授时,他让我在实验室的宣传视频中向多伦多大学的新生们介绍一下我对HI的理解。所以,在我向你们扔出密密麻麻的文字之前,可以先看一看下面这段小视频。在介绍从实验室走出来的各个黑科技创业公司的同时,我也把我心目中所理解的HI给大家简单地说了一下。视频中的翻译字幕,我放在文末尾,不想看视频的去看字吧。
小毛衣不错是吧?好啦,言归正传。传统意义上的“人机交互(HCI)”把人和计算机分开成两个孤立的个体,它们通过各种I/O进行通讯,从而传达信息。鼠标,键盘,耳机和触屏都是我们熟悉的交互方式。然而,由HI所提出的“人机共生”把计算机和人当作一个整体。在这个体系中,计算机是人的第二个大脑,辅助佩戴者工作的同时,在使用者的指导下学习并改变着这个世界。所以,就像视频中提到的那样,你觉得自己在玩儿计算机,其实计算机也在玩儿你。
接下来,我会跟大家简单讨论一篇论文的内容。这是98年IEEE期刊的封面文章,比较系统地阐述了HI的各个方面,同时也对HI如何指导智能眼镜的研发有一个很明确的叙述。由于我水平有限,需要注意的是,以下内容是一个小工程师对一个大师思想的反刍倒嚼。是我进食后经过一段时间从肚子里吐出来的半消化物。大家品尝的时候要注意,大神们请从文末链接直接下原文。
HI描述的是零距离的人机关系,所以HI的实现就需要人与机的紧密结合,而所有人机交互中,智能眼镜可以把需要传达的信息量实现到最大化。从大方向说,实现HI所需的系统有三种运行模式:
第一,Constancy(恒定模式)。这个系统必须恒定持续地运行(Operationally Constant,OC),它偶尔会进入睡眠状态,但它不应该完全断电。现在大家用手机时就可以深切感受到OC的重要性。没电的手机就失去了OC,令人崩溃。另外,这个系统必须恒定持续地可交互(Interactionally Constant,IC)。也就是说,它随时处于待命状态。从这个意义上来说,IC就意味着OC,但OC不一定代表IC。读到这里,Apple为什么要多出一个iWatch的原因就很清楚了。手机在兜里,虽然持续运行,但不可持续交互,所以没有实现IC;为了缩短“交互距离”,手机就需要多一块表。通常人们不一定能意识到恒定模式的重要性,所以大多数电子设备的“交互距离”是很大的。作为HI的最基本的运行模式,恒定模式是实现智能眼镜的第一步。有恒定模式的人机交互如下图所示,人与机互相通讯,共同作业。
第二,Augmentation(增强模式)。传统的人机交互的观点通常把计算(Computation)本身作为最主要的任务。然而,HI的观点是把计算融入更重要的人的任务中去。实现增强模式的应用有一个特点,就是人在用计算机的同时,还在做一件别的事情。而通常来说,这件对于计算机来说的“别的事情”才是这个人机共同体的主要任务。例如某人在用导航的时候,首先他要开车要看路,他不能总是盯着屏,所以路径图要在视线范围内的一个方便的位置并加上语音辅助;其次计算机给出的所谓最短路径并不是唯一方案。某人(我不会开车,所以不是我)要去接个女性朋友,他就不会考虑最初给予的最短路径而希望系统持续更新并重新规划路径,实现了增强模式的系统示意。如下图,人可以同时接受来自物理世界(真实环境)和数字世界(虚拟图像)的信息,并同时和两个世界进行交互。
第三,Mediation(介导模式)。当上述两个模式可以被某种系统实现之后,这个系统可以通过介导模式将人机更紧密的结合起来。这个时候,计算机的输入和输出就和人的感知和运动无缝地连接在一起了。实际上,我们说介导模式就是计算机对人的一种封装。拿智能眼镜举例子,有增强模式的智能眼镜可以让佩戴者同时看到自然光和数字光,而有介导模式的智能眼镜先通过传感器采集自然光,并对这些数字化过后的光做出需要的调整,最后把这些数字化的光通过设备重新还原出来。这样佩戴者会感觉到他看到的世界以一种新的方式呈现出来。然而,现实是没有变的,被改变的只是佩戴者的感官。如下图,这种封装既能使人从现实中脱离出去,又能使人以更强的感官去感受现实。从这个意义上来说,介导模式增强了人的能力。
综上所述,HI的三个模式是可以并存于一个系统之内的。对于人来说,听觉和视觉信号是可以数字化的信号。而视觉信息所能传递的信息量比听觉要大很多。因此,计算机的交互发展会以视觉为主导。在智能眼镜当中的概念(VR,AR,和MR),即虚拟现实,增强现实和介导现实的实现也必须以上述三个模式来运行。如下图,结合三个模式并可以相互转换的话,我们就有了一个完整的HI示意图。
当然,既然是科普,有些东西不会讲的特别细。系统运行当中的六个基本信号流程及其作用本质我这里就不多做说明了。能读到这里感觉味道还不错的同学我建议你们去下载教授的原文,原文中会对下图所示的完整HI进行详细的阐述。
最后,附上原文链接和视频字幕。
HI代表的是 Humanistic Intelligence,它是我们实验室里进行各种工作的指导思想。
大家经常问我对人工智能的看法,人工智能确实酷,但同时,它是冰冷的。
对我来说:HI是有心灵的人工智能,它是为了改良一个物种,而非创造一个新的物种。
在HI反馈环里,人和计算机实质上是一个整体。
我们在研究穿戴电脑的时候,遵循的是人机共生的思想。
你觉得自己在玩计算机,其实计算机也在玩你。
过去我们一直想培养具有STEM素养的人才,也就是科学,技术,工程和数学,但这种理念漏掉了对心灵的培养。
教授Steve提出DAST,认为全面教育应该包括:
设计,艺术,科学和技术。
所以我们相信:在HI 实验里,优秀的学生不仅仅要写出没有BUG的软件,或做出高速运算的硬件。
我们希望你尝试去找到真心喜欢和特别擅长的契合点。
我觉得对你来说,这个点才能让你成为一个走心的工程师。