与计算机相比,人类对图像的认知能力高出太多,为了让计算机有所提高,最近一项新的测试使得我们能更好地测量计算机对图像的理解达到了什么程度。
来自布朗大学的研究人员在美国国家科学院院刊上发表了一篇论文,文中提到了一种“visual Turing test(视觉图灵测试)”,这将有助于科学家们对计算机的图像认知能力进行新的评估。
为了更好地评估计算机认知能力,视觉图灵测试所测的不仅仅是计算机能否识别出人像,还会测试对图像中对象关系的理解。研究人员会就捕捉到的画面提出一系列的问题,计算机以简单的“对”或“不对”的回答来完成测试。测试所用的每一道题目都是息息相关的,每个新的提问都是基于前面问过的内容。
问:指定区域是否有人?
答:是
问:指定区别是否有一个特别的人?
答:是(1号)
问:指定区别是否有一个特别的成年人,而且没戴帽子?
答:是(2号)
研究人员将所提的问题被分为4类:
存在判断
独立性判断
属性判断
关系判断
存在判断和独立性判断这两类问题用于引导计算机对所提问内容进行认定,随后计算机会对其标记(如人物标为1,车辆为3),这样提问内容就会被计算机保留下来。通过物体的标记进行属性和关系的提问(人物1是否挡在了车辆3的前面)来让计算机学会如何进行图片认知。
测试的目的是让计算机能像人类那样描述一张图片。现在有些问题计算机已经能回答得不错了,不过由于目前计算机的能力有限,在一段时间内,测试过程中是需要工作人员同步来给定正确答案的。至少在短期内,人类不错被计算机取代。
via motherboard