近日,在由北京师范大学与科大讯飞联合主办的人工智能与教育大数据峰会 ·2019上,北京师范大学校长董奇教授做了题为《面向未来的智能化教育评价》的主题报告。
他表示,当下科技飞跃、经济全球化的时代对于人才素养提出了新要求,但传统的教育评价受限于技术等因素,对这些重要的素养难以进行客观的评估,因此需要整合多方面的科技进展,使教育评价能更好的反映学生德智体美劳的全面发展。
在董奇看来,未来社会对人才素养提出了四大新要求:
一是面对变化的、不确定的未来,必须学会学习、坚持终身学习,必须具有人机结合的思维方式;
二是面对科技发展、信息爆炸的未来,必须具备信息素养、科技素养和数据素养;
三是面对人工智能无处不在的未来,必须具备高阶思维能力、创新能力和问题解决能力;
四是面对人类成为命运共同体的未来,必须具备核心价值观、社会责任和全球意识。
同时,董奇指出,当前我国学生发展仍存在一些突出问题,例如学习负担过重、实践动手能力较弱、创新能力不足、体质健康状况下降等问题。上述问题主要与国内教育实践中存在的六大问题相关,这六大问题分别是:一是重分数轻能力;二是重知识轻素养;三是智育轻德育;四是重共性轻个性;五是重学习轻健康;六是重结果轻过程。
我们年复一年地试图解决这些问题,但是一直成效甚微。
他认为,造成这些问题的原因虽然很多,但其中一个重要原因是教育评价,我国教育质量评价与督导体系还不健全。
未来教育评价发展的新趋势
董奇认为,技术发展为教育评价带来新动能,主要有三个方面:
一是云计算、大数据、5G、物联网及智能终端技术的发展,是支撑智能评价环境构建的新要素;
二是VR/AR/MR支持的沉浸式情境营造、AI支持的智能识别技术及可穿戴设备支持的数据采集,为开展真实情景下的教育评价创造了新契机;
三是教育数据的建模、分析和可视化,成为支撑智能评价全过程、多维、高效的新方法。
董奇认为,所有这一系列技术的整合、结合将推动教育评价进入新的发展阶段。教育评价事实上已经开始进入新的发展阶段,就是智能化的教育评价新趋势已经出现,一共有七大趋势:
一是评价可实现目标的变化。从过去的注重知识、基本能力的评价,到关注德智体美劳全面评价。
二是评价功能的变化。从过去的甄别、选拔,到精准改进、促进发展。
过去,只能基于简单有限的方法,用于选拔和甄别。现在我们可以发挥评价更重要的功能,那就是用于改进、促进学生各个方面的发展,进行精准的改进指导,包括提供改进的方法和内容。
三是评价对象的变化。从过去采取抽样的方法选取部分学生,到面向所有学生,关注每个学生。现在使用新的技术,使得我们可以面对所有的学生,甚至不用取样了,用整体取样的方法就够了,还能给每一个学生进行个性化的评价、指导。
四是评价信息源的变化。从过去较单一模态的信息,到多元化、丰富化、多模态化的信息。
过去我们收集的数据只能用比较简单的文本信息或者一些图片信息,视频信息都很有限,以及做研究用视频信息成本太高。现在我们可以用大量的更丰富的多模态信息,而且能对这些信息进行自动化的智能化的分析,加工评判。
五是评价任务的变化。从过去的非典型场景,到真实化、生活化、趣味化。
过去我们的评价是在一些非真实的典型场所。专门的考场,特定的时间,特定的要求。时间可能就是高考那两天。过去我们不能在真实的生活学习工作过程中,在真实的情景中对人进行评价。现在智能化的评价使我们对这样一种工作成为可能,例如通过游戏建构接近真实的问题场景,在交互操作中测量学生的高阶思维能力。
六是评价方式的变化。从过去显性化、总结性的评价,到嵌入式、伴随式、隐形性评价。
过去的评价就是考试,无论小考还是大考,就是测验。现在的评价考试可以潜入你的日常行为和学习,协助老师日常的教育,带有一些伴随性和隐形性的特点,增加了评价结果的真实性。
七是评价结果反馈的变化。从过去的滞后反馈到即时反馈,从过去面向群体反馈到面向群体+个体反馈。
过去的评价分析成本很高,通常需要延迟反馈和指导。现在可以做到即时反馈和指导,而且是有针对性的个性化的推送。
董奇表示,所有这些都是在一系列新技术发展整合的条件下,我们能够实现随着未来新技术的发展进一步的发展,这方面的能力会越来越强大,集成创新将是智能化教育得到发展的一个重要前提。现在世界各国,包括我们国家已经在应用智能化教育测评方法方面取得了一些重要的进展,这些进展尽管是初步的,但是随着时间的推移,随着我们应用的深入,随着不断地研究研发,我相信它的应用水平会越来越高。
智能化教育评价新进展
随后,董奇介绍了智能化教育评价的一些新进展,例如对学生情绪情感、社会技能、语言表达、信息和科学素养等方面的评测案例。
情绪情感评测。以深度学习、增强学习、迁移学习为支撑,探索文本分析、语音分析、图像识别、血谱成像应用,实现对个体情绪特征的识别与判断。
比如说学生在学习过程中,在身心健康发展中,情绪是很重要的一个维度。我们对情绪、情感怎样进行评价?如果能了解学生平时学习过程中的真实情况状态,比如说数学学习过程中,有的孩子是有数学学习焦虑的,有的甚至很严重,那我们可以将学生学习过程中的情绪状态和他的成绩关联。
我们也可以看一个数学课的教学结果,老师产生的效果是什么?不仅是数学成绩的高与低,还包括学生对数学学习的情绪,情感热爱程度以及自信心如何。这些都可以利用文本分析、语音分析、图像识别的技术以及学谱仪等一些新的方法对它进行评价。
社会技能测评。“人人交互”实时记录多个学生合作完成任务过程中的对话与关键行为,形成过程流数据,从数据中抽取证据,评价学生的社会技能水平。
在如今的社会,人的社会技能是非常重要的。无论在线下还是线上虚拟世界,人与人之间都会发生很多的社会交往。
我们通过两个及以上同学间的群体的合作过程中形成的过程性的数据,从中抽取关键有用信息,能对学生社会交往的水平进行评价。但对线上和线下交往水平的评价可能是一致的,也可能不一致。有的人线上线下的社会交往水平都差不多,有的人可能线上线下是有较大差异的,我们都可以对它进行更深入的研究。
语言表达能力评测。人机交互的测评模式,实现口语数据的自动化采集,模仿专家打分建立评分模型。
语言表达能力很重要。我们要花很多时间学习母语,花很多时间学习第二语言。那么有了人工智能和相关技术,使得我们对人的语言评价有了进一步的扩展的能力。
过去我们对人的评价更多集中在阅读,对口语和听力评价比较困难,做研究成本也非常的高。现在语音技术以及人工智能技术的发展,使我们无论对母语,还是对中国人学第二语言,还是对外国人学汉语,都提供了前所未有的新的可能,也包括对我们国家少数民族的孩子学好普通话都提供了新的可能。
信息素养测评。计算机环境下交互式的测评任务,基于学生的任务表现测评ICT素养。
我们可以在学生实际的人机互动过程中,了解他的信息素养状况,更接近孩子真实的生活工作中利用信息技术促进提升自己的工作效率和质量的状况。
科学素养评测。在STEAM教学课堂中实时采集教与学全过程数据,课程结束时自动生成评估报告。
在今天这样一个科技飞速发展,科技和社会紧密结合的时代,科学素养也有了新的含义,那么科学素养可以说现在高度重视的是这种课程对学生进行过程性的评价。
问题解决能力与创造力测评。模拟真实问题情境的问题解决能力测评,基于人工智能技术评估学生的高阶能力。
今天这个时代我们有很多时间,从复杂繁杂的日常简单劳动中解放出来,有更多时间去从事复杂的创造性问题,人类会有更多的时间去从事自己想做的很多有趣的事情。那么在今天这个时代,高阶的问题解决能力,创造性极其重要,所以需要我们对它进行客观的评价。
体质健康测评。基于运动手环等IoT设备,实时采集学生运动与体质体能的相关信息,从而实现对不同学生的个性化体质与健康评估。
对学生体质的测量需要用表现行为方式,表现性的方式就出现评价的困难。现在用新的信息技术和方法,包括可穿戴设备,使得我们能够在日常学习、锻炼过程中,大大提高结构性评价的精度和准确性。
艺术素养测评。在书法方面,基于OCR智能书写评测技术,评价学习者作品,如重合度、大小、重心、空间分布等。在演唱方面,基于智能语音技术的音乐评价,可对学习者的音乐素养进行大规模的监测。此表现型测评可实现全过程电子化采集、存储于分析。
艺术素养不能只是填问卷。了解学会欣赏,更要学会艺术的表达。我们现在可以用新的语音技术来推动对学生表现型的艺术素养部分的测试。比如今年的5月,我们能够在同一天同时对20万的中小学生进行演唱的艺术素养的测试,实现对全国范围内600多个区县全程化的测评储存,分析和加工。
与此同时,董奇针对智能化教育评价提出来几点建议:
一是在国家层面上,把智能化教育评价纳入国家相关战略;
二是加强高校间、高校与科研院所的合作,推动智能化教育评价理论和方法创新;
三是加强高校与企业的合作,推动研究成果在教育领域中的及时应用;
四是在国家层面简历智能教育评价平台,加强开放与共享。
董奇最后强调,教育与人工智能结合,与其他技术的结合,涉及到一系列伦理、安全、隐私保护的问题,例如数据的采集和获取、数据的流转和保护、数据的授权和应用等。这项工作要走好走稳,我们必须要高度重视这样的问题,在这方面出现了任何问题,将会严重干扰我们推进这块工作,这也是行业共同合作要遵循的一些基础。(雷锋网雷锋网雷锋网)