她有一个漫长的过去，却只有短暂的历史

2015/10/01 09:00

她有一个漫长的过去，却只有短暂的历史

“深蓝”电脑打败人了？

“水是最好的”（Water is best），这句话是西方“科学和哲学之祖”泰勒斯（Thales，约公元前624年 —— 公元前546年）的名言，无独有偶，与他同时代的东方圣人老子（约公元前571年-公元前471年之间）也曾说过 “上善若水”。正如东西方的这两位先贤对水的青睐一样，人类科技发展的初始动因也源自对水的利用，因对尼罗河、两河、恒河、黄河的开发治理诞生出了四大古国的灿烂文明，使得数学、物理、化学、天文、地理等科学技术知识纷纭而至。面对繁重的劳动量，人们发明制造出了可以减轻生理负荷的各种机械装置（蒸汽机、电动机是它们中的典型代表），随着科技的飞速发展，人们劳动中的生理负荷不断下降，而认知负荷却日益上升，如何减轻不断增加的这些脑力负荷呢？人们终于发明出了计算机这一机器，并且在1997年5月11日，名为“深蓝”的电脑毫无悬念地在标准比赛时限内击败了国际象棋男子世界冠军卡斯帕罗夫的人脑，从而证明了在有限的时空里“计算”可以战胜“算计”，进而论证了现代人工智能的基石条件（假设）：物理符号系统具有产生智能行为的充分必要条件（Newell and Simon，1976）是成立的。更有意思的是，2011年2月17日，一台以IBM创始人托马斯·沃森名字命名的电脑在智力问答比赛中狂虐两位最聪明的美国人而夺得冠军。自此，人机之间却也衍生出了一种微妙的不服气：物理符号系统具有产生情感行为的可能吗？也就是说能产生心理符号系统吗？

心理与认知

心理学一词起源于希腊文，由“灵魂”（ψυχή）和“研究”（λόγος）所组成，意思是关于灵魂的科学。随着科学的发展，心理学的对象由主观的灵魂逐渐变为了客观的心灵。德国心理学家艾宾浩斯（H.Ebbinghaus，1850-1909）曾这样概括地描述心理学的发展历程：“心理学有一个漫长的过去，但只有短暂的历史。”

在这漫长的过去中，群星灿烂，异彩纷呈，其中包括有约翰·洛克（John Locke，1632-1704）、巴克莱主教（Bishop Berkeley，1685-1753）和大卫·休谟（David Hume，1711-1776）创立并发起的联想主义心理学派，其基本理念是：心理事件是由联想规律控制的，在意识中发生的一切是由心理事件彼此之间的联系决定的，我们之所以相信因果关系并非因为因果关系是自然的本质，而是因为我们所养成的心理习惯和人性所造成的。

然而，联想主义秉持的内省—观念范式遭到了许多心理学家的质疑：主观的意识研究能否被称为科学探索呢？接下来，对此的批评和质疑直接导致了在20世纪初的美国和德国分化出了行为主义心理学派和格式塔心理学派。以华生（John B. Watson，1878-1958）、斯金纳（B. F. Skinner，1904-1990）美国心理学家为代表的行为主义心理学学派主张：“寻求理解特定的环境刺激如何控制特定类型的行为”。其主张心理学应分析先行的环境条件，即在行为之前出现、而且为一个机体产生反应或抑制反应提供活动场所的条件。主张心理学应该研究可以被观察和直接测量的行为，即刺激-反应范式，反对研究没有科学根据的意识。

而德国的格式塔心理学派是以马科斯·韦特墨（Max Wertheimer，1880-1943）、沃尔夫冈·苛勒（Wolfgang Köhler，1887-1967）和科特·考夫卡（Kurt Koffka，1886-1941）三位心理学家在研究似动现象的基础上创立。他们不反对研究意识，但认为人脑的运作原理是整体的，“整体不同于其部件的总和”。例如，我们对一朵花的感知，并非纯粹单单从对花的形状、颜色、大小等感官资讯而来，还包括我们对花过去的经验和印象，加起来才是我们对一朵花的感知。另外，格式塔派除了研究似动、整体以外，还有一个重要的研究领域：顿悟，也许这些概念都是需要未来人机交互领域仔细打磨的范畴吧！

她有一个漫长的过去，却只有短暂的历史

格式塔心理学派著名的猩猩实验

几十年来，这些心理学派众说纷纭，莫衷一是，各持己见，令很多其他科学领域的学者很是困惑：一个无法定量说明刺激-反应内在规律的行为主义以及一个只用“似动”、“整体”、“顿悟”等神秘的字眼加以解释意识（似乎不能满足理论说明的要求，也无实际指导意义）的格式塔派怎能归属经得起客观逻辑验证的科学领域呢？

这种质疑和否定一直持续到了20世纪40年代末，这个时期的数学（信息论）和电子学（计算机）的迅速发展，使得信息这一神秘的事物不但可以量化存储而且还可以逻辑计算，在这两门学科突变的直接带动下，20世纪50年代中期在美国兴起了认知心理学思潮，作为人类行为基础的心理机制，其核心是输入和输出之间发生的内部心理过程。它研究人的高级心理过程，主要是认知过程，如注意、知觉、表象、记忆、思维和语言等。其主要代表人物是奈瑟尔（Ulric Neisser，1928-2012）、乔姆斯基（Noam Chomsky，1928-）和纽厄尔（Alan Newell， 1927-1992）和西蒙（Herbert Alexander Simon，1916-2001）。

正是由于诸多学科的不断融合交叉，形成了探究人脑或心智工作机制的前沿性尖端学科需求。1975年，由于美国著名的斯隆基金的投入，美国学者将哲学、心理学、语言学、人类学、计算机科学和神经科学6大学科整合在一起，研究“在认识过程中信息是如何传递的”，这个研究计划的结果产生了一个新兴学科——认知科学，并迅速地引起了全世界科学家们的广泛关注。这6个支撑学科之间互相交叉，又产生出11个新兴交叉学科：1、控制论；2、神经语言学；3、神经心理学；4、认知过程仿真；5、计算语言学；6、心理语言学；7、心理哲学；8、语言哲学；9、人类学语言学；10、认知人类学；11、脑进化。

作为20世纪世界科学标志性的新兴研究门类，认知科学实际上悄悄地指明人与机的未来研究方向，同时，它再一次地证明了科学其实和社会遵循着相似的发展规律：合久必分，分久必合。

自发秩序与自动控制

1952年弗里德里希·哈耶克（Friedrich Hayek，1899-1992）发表了《感觉的秩序》（The Sensory Order）一书，该书主要研究人的各种感觉产生和变化机理，其中有关联结主义（用神经元Hebbian Synaptic的互联网络描述心理现象）的设想形成了神经网络和许多现代神经生理学的基础。后来他把生物感知器官的作用机理应用到了社会、经济、法律、政治等领域，认为很多自然情境下人们之间的活动并不是经过刻意介入产生的（亦即存在没有设计师的设计），而是由“自发性秩序”或者称之为“由人类行为而非人类设计”产生的秩序所领导。这与其表兄维特根斯坦（Ludwig Wittgenstein，1889-1951）的后期观点“创造一套严格的可以表述哲学的语言是不可能的”相似，因为日常生活的语言是生生不息的，这是哲学的基础和源泉，所以哲学的本质应该在日常生活中解决，在“自发”中理解“秩序”。哲学如此，人机交互的基础亦如此吧。

她有一个漫长的过去，却只有短暂的历史

路德维希·维特根斯坦

实际上，在人类的认知领域中感知、意象和感情的自发性常常表现为bottom-up机制，在不知觉、无意识中被外界的刺激所激发、唤醒。这与目前人工智能中的机之计算机制很类似，两者遵循着刺激-操作-反应范式；但是人的认知过程中还应包含着按照经验规则运行的方式，这种机制常常被称为top-down机制，非常有意思的是，研究人的心理学上的这两种机制正好对应于研究机器的控制论上的自动和控制这两种机制：bottom-up对应着“自动”，top-down对应着“控制”。自主的个体学习可以奖惩计算体系来说明，群体之间的协同学习可能与买卖算计关系（买者高价不买，卖者低价不卖）有关。在直接学习和间接学习中，自发和控制的上下交替如同市场与组织的调节作用，在预期与实现、理性与感性间达到某种平衡。作为趋势分析中的决策机制，top-down（控制、组织）机制优于bottom-up机制（自动、市场）的常见原因之一就在于不确定性的消除。

在真实的人机交互领域中，人的情景意识（Situation Awarensss）SA、机器的物理SA、环境的地理SA等往往同构于统一时空中（人的五种感知也应是并行的），人注意的切换使之对于人而言发生着不同的主题与背景感受/体验，类似基督教中的三位一体。在人的行为环境与机的物理环境、地理环境相互作用的过程中，人的情景意识SA被视为一个开放的系统，是一个整体，其行为特征并非由人的元素单独所决定的，而是取决于人机环境系统整体的内在特征，人的情景意识SA及其行为只不过是这个整体过程中的一部分罢了。

另外，人机环境中许多个闭环系统常常是并行或嵌套的，并且特定情境下这些闭环系统的不同反馈环节信息又往往交叉融合在一起，起着或兴奋或抑制的作用，不但有类似宗教情感类的柔性反馈（不妨称之为软调节反馈，人常常会延迟控制不同情感的释放），也存在着类似法律强制类的刚性反馈（不妨称之为硬调节反馈，常规意义上的自动控制反馈大都属于这类反馈）。如何快速化繁为简、化虚为实是衡量一个人机系统稳定性、有效性、可靠性大小的主要标志，是用人工智能的快速搜索比对还是运筹学的优化修剪计算，这是一个值得人机领域深究的问题。

不可靠的部件可以组成可靠的系统，反之，可靠的部件可以组成不可靠的系统也常常发生。这也许正是人为什么会犯错误（有意或无意）的主要原因吧。机器呢？由于小系统的单纯性，错误常常是可以在一定程度上减少的，一旦系统复杂性不断提高，组成的多系统之间的前/反馈（刚性、柔性）系统往往混在一起，可靠的部分会渐渐变成不可靠的整体。西蒙对此提出了一个聪明的对策：有限的理性，即把无限范围中的非概念、非结构化可以延伸成有限时空中可以操作的柔性的概念、结构处理，这样就可把非线性、不确定的系统线性化、满意化处理。

她有一个漫长的过去，却只有短暂的历史

赫伯特·亚历山大· 西蒙

语言与信息

1956年9月MIT的一次会议上，乔姆斯基（N.Chomsky）的论文“Three Models for the Description of Language”和纽厄尔（A.Newell）与西蒙（H.A.Simon）的论文“The Logic Theory Machine”（IRE Transactions on Information Theory, IT-2, no.3（September 1956））都是最初提交的，此事标志着现代转换语法和信息处理心理学这两个理论体系从诞生（自同一母体 —— 即现代数字计算机的发展激发出的思想所组成的母体）起就具有密切的关系：虽然计算机是用硬件体现出来的，但它的灵魂是程序（机器的语言）。

对于人类而言，儿童的语言或信息学习常以模仿为主，词语或认知组块能力较低，大多通过重复和比较实现，而成人的学习常以自主为主，词语或认知组块能力较高，大多通过检索、迁移实现。

在特定的情境下，人的信息认知是有差异的，正如看同一部电影、听同一首歌、读同一首诗、吃同一样食物、抚摸同一个人的头发、闻同一朵花香，评价一个事情等，总体上，这是一一对应的，即一一映射关系，是个体的主观体验与客观现实之间不断交互修正的结果，其过程是独立的；人类的各种语言是有局限性的，用音乐、诗歌、图、画、表情、肢体动作等方式可以弥补或完善其准确性，同时也可能增强抑或是加大其模糊性，简而言之，生活语言模糊性较大，社会化语言准确性较高。

语法在语言学习中的作用是有局限的，孩子在最初的学习语言过程中是没有太多的语法概念的，他们是根据外部的客观刺激进行信息输出，他们没有约束地建立起自己的注意和理解方式，当咿咿学语时，最初的也不是规范的语法指导，正常情境下是父母自然性的字词或短语说明，最后才有生活句子学习、建立，当在学校进行系统语法学习时，很多语言的自然属性纷纷被规范化、程序化、大众化，而说者意图表达的个性、独立性、准确性同时在减弱、下降；语法可能是在一般情境下正常交流的规范，是一种消弱个人意指性的规则体系，对社会来说，这可能是优点，对个人而言，这也是缺点。

在正常生活面对面交流过程中，语言的语调等可以使人准确地理解彼此的真实意图，“讨厌”这个词被赋予不同音调时，一般都能知道其真实情感表达，而在目前网络文字交互表达中，虽然也可以结合上下文进行情感判断，但在较复杂的连续的多人干扰的无音调的实时交流环境下，这种情感判断的准确性往往会大打折扣，常常会演变成更丰富的多维理解，进而增强了非单一映射关系。

人机相比，人的语言或信息组块能力强，有限记忆和理性；机器对于语言或信息组块能力弱，无限记忆和理性，其语言（程序）运行和自我监督机制的同时实现应是保障机器可靠性的基本原则。人可以在使用母语时以不考虑语法的方式进行交流，并且在很多情境下可以感知语言、图画、音乐的多义性，如人的听觉、视觉、触觉等具有辨别性的同时还具有情感性，常常能够知觉到只可意会不可言传的信息或概念（如对哲学这种很难通过学习得到学问的思考）。机器尽管可以下棋、回答问题，但对跨领域情境的随机应变能力很弱，对彼此矛盾或含糊不清的信息不能反应（缺少必要的竞争冒险选择机制），主次不分，综合辨析识别能力不足，不会使用归纳推理演绎等方法形成概念、提出新概念，更奢谈产生形而上学的理论形式。

人与机器在语言及信息的处理差异方面，主要体现在能否把表面上无关之事物相关在一起的能力。尽管大数据时代可能会有所变化，但对机器而言，抽象表征的提炼亦即基于规则条件及概率统计的决策方式与基于情感感动及顿悟冥想的判断（人类特有的）机理之间的鸿沟依然存在。

她有一个漫长的过去，却只有短暂的历史

人机交互是人类发展到一定阶段而必然产生的一门学科，她既包括人，也包括机和环境两部分，所以也可以说是人机环境系统方面的一种学问。她同样“有一个漫长的过去，但只有短暂的历史。”—— 她的起源可以追溯到旧石器时代类人猿的工具制造，在历经了许多历史时期之后，她的历史可以说是在第一、二次工业革命浪潮中逐渐拉开的序幕。弗雷德里克·泰勒（Frederick Taylor，1856-1915）的《科学管理原理》诞生了现代意义上的工效学（Ergonomic，人机工程在欧洲的泛称），第一、二次世界大战大大加快了该学科发展的进程，剑桥大学圣约翰学院的伊莱斯（Gordon Iles，1908-1983）和克雷克（Kenneth Craik，1914-1945）二人1940年研究的剑桥飞机座舱模拟器（Cambridge Cockpit）基本确定了人机研究的方式和趋势 —— 人、机、环境诸多学科的交叉融合并进，20世纪50年代兴起的认知科学，进一步把人机领域的研究范围扩展到了人类学习、生活、工作的方方面面，到目前为止，研究人机的学科粗粗算来，不但包括生理、心理、物理、数理、地理等自然科学技术领域的知识，而且还应涉及到哲理、伦理、法理、艺理、教理等人文艺术宗教领域的道理。

总之，人机的研究不仅仅研究脖子以下的部分，更重要的是脖子以上的部分，这是人机研究的前景和趋势。

【编者按】作者@刘伟，北京邮电大学自动化学院岗位教授，北京航空航天大学人机与环境系统工程工学博士，剑桥大学访问学者。北京邮电大学人机交互与认知工程实验室主任。