雷锋网 AI 科技评论按:由CCF 主办的CNCC 2019 于10月17日—10月19 日在苏州金鸡湖会议中心举办。本届大会以“智能+引领社会发展”为主题,有1000多家机构代表,8000余人参会。在17日下午举办的“人工智能赋能未来教育”论坛上,哈工大人工智能研究院副院长、哈工大社会计算与信息检索研究中心(HIT-SCIR)主任刘挺教授做了题为《智能教育的理念变革与技术落地》的报告,展望智能时代下的未来教育。AI科技评论在征得刘挺教授的同意下,回顾和整理了本次报告的精彩内容。
刘挺教授作为教育部人工智能科技创新专家组成员、教育部电子信息类、计算机类两个教指委的人工智能专家,对传统教育所面临的困境及智能教育所带来的革命做了深入的探究。在报告中,刘挺教授根据自己的研究经历介绍了大量NLP技术在智能教育中的落地应用案例,并对智能教育的未来做了具有指导性的展望。
刘挺,哈尔滨工业大学长聘教授,哈工大人工智能研究院副院长,人工智能专业负责人,计算机学院社会计算与信息检索研究中心主任。国家“万人计划”科技创新领军人才,教育部新世纪优秀人才,教育部人工智能科技创新专家组成员,教育部高校电子信息类专业教指委人工智能专业建设咨询委员会成员、计算机类专业教指委人工智能专家。黑龙江省中文信息处理重点实验室主任,黑龙江省“人工智能”头雁团队带头人。多次担任国家863重点项目总体组专家、国家自然科学基金委会评专家。中国计算机学会理事,中国中文信息学会常务理事、社会媒体处理专委会(SMP)主任,曾任国际顶级会议ACL、EMNLP领域主席。主要研究方向为人工智能、自然语言处理、智能教育和社会计算,是国家973课题、国家自然科学基金重点项目负责人。2012-2018年在自然语言处理领域顶级会议发表的论文数量列世界第6位。主持研制“语言技术平台LTP”、“大词林”等科研成果被业界广泛使用。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖等。
以下为雷锋网AI科技评论根据报告内容整理而成——
(演讲正文)
今天的报告主要是向大家汇报一下我最近对教育的观察和思考,因为一年前教育部成立一个人工智能专家组,我也是其中的一个成员,所以觉得我自己有义务和责任去观察和思考人工智能与教育的关系。
我报告的题目是《智能教育:理念变革与技术落地》,主要分为四个方面:传统教育的困局;智能教育的革命;人工智能技术在教育领域的应用案例;以及智能教育的未来。
在考虑人工智能与教育时,我们不能脱离教育的本质,因此我们需要去思考“到底什么是教育?”这个问题。德国著名哲学家雅思贝尔斯在他的著作《什么是教育》中曾提出:
“所谓教育,不过是人对人的主体间灵肉交流活动,包括知识内容的传授、声明内涵的领悟、意志行为的规范、并通过文化传递功能,将文化遗产教给年轻一代,使他们自由地生成,并启迪其自由天性。”
我们把这段话拆解来看,其实教育主要有三个方面:
价值塑造:让人成为人。受教育的人和没有受教育的人本质的区别是教育能陶冶人的情操,使人更加富有理性,获得更加全面的发展,人能更容易在以后的发展道路上获得幸福。
能力培养:获得学习能力,以及生存技能,包括技术能力、社交能力。在所有的能力中,学习能力又是第一位的。
知识传授:已有知识的传承。
从这个角度,我们来看当前中国教育,其实面临着很多的问题。
从教育的过程来看。首先,由于学生数量很多,教师很少,因此不可避免地会忽视学生的个性,做不到因材施教。其次,教师个人的经验难以充分的展示。我们使用的教材都是经过教育部严格审定的,教师想要充分的展开自己对课程的独特见解并不容易,或者根本不可能。无论是从经济角度还是时间角度来看学习成本都非常高,而另一方面学习效率却非常低,学生们非常辛苦,经常熬夜,但学习的效果却并不一定好。
从教育的结果来看,应试教育是一种对创新能力的扼杀,标准答案容易固化人的思维。这个我有很深刻的体验,许多博士学生从小学到博士,一路考来,很适应应试教育,但结果在做研究时却做不了创新,只能去读国外的论文,拿回来修修补补。另一方面,学校里学到的知识和社会的需求之间存在着巨大的鸿沟,学生往往是学习知识有余,学习「能力」很难。
当然中国的教育也同样造成了教育的不公平问题,主要体现在优质资源分布极为不均,城乡之间存在巨大的差异,在城市里出现各种学区房的现象。
传统的教学模式,往往教师是学校制定的,而非学生选择的;而学生也非常多,教师没法关注到每个学生的个性化差异并予以照顾。而学生所学习的教材也是教育部指定的纸质课本,主要以文字为主,配以少量插图。教学的方式则主要以课堂教学为主。
但是伴随着信息时代到来,传统教学模式受到了巨大的冲击。学生获取知识的途径不再仅限于教师,学生可以通过互联网上各种公开课或百科来学习比教师所教授地更多的信息,而且学生之间还能够建立社交网络相互之间进行答疑解惑。而教材选择上也不再局限于某一本课本,而是可以自由地选择,而且可以从网上下载许多电子课件。学生许多的学习时间都是在课堂之外。
当教师可选,教材可选的时候,“教”与“学”之间面临着巨大的矛盾。那么这个矛盾中,谁才是矛盾的主要方面呢?有人认为“名师出高徒”、“严师出高徒”等,教师在教学过程中发挥着主导作用。但也有人认为“师傅领进门,修行在个人”,应当依据学生的个性化来定制学习路线。例如有人建议将知识点碎片化,然后学生根据个人的特点开发自己的学习路线。但我认为,学生本身是有惰性的,而且知识(特别是理工科的知识)是有次序的。因此也应当注意“教”的重要性。
不过我们要认识到,现在的教学逐渐在朝向以学生心智为主导的方向发展。随着学习的展开,学生的心智应当发生变化,从而能够更好地适应环境,这不但是一个知识量的增加,更重要的是心智结构变得更为复杂。在这个过程中教师和机器都是学生成长的助力。
随着人工智能的再次爆发,现在大家都在提“人工智能+教育”。据我的观察这其实包括了三个方面,由于大家名词不加区分,所以这三方面经常交叠在一起。第一个是人工智能教育(ArtificialIntelligent Education, AI Education),讲课的内容是教人工智能,旨在培养掌握人工智能技术的人才,形象的表示如下图:
第二个是智能教育( Intelligent Education ),是用AI来辅助教学,人工智能知识教育的手段,用来促进教学流程的自动化、智能化,来提高效率,提升效果:
第三个是计算教育学(Computational Education),这个是通过人工智能的技术来进行教育学的研究,通过统计分析来研究教育学的原理:
在这里,我想要讨论的是第二个,智能教育,即如何利用人工智能的技术来促进教育。我们用一张图来看下教育、人工智能与智能教育三者之间的关系:
教育是由人教人,由有知识的人教知识匮乏的人;人工智能是人来教机器;而智能教育是机器来教人或者机器辅助来教人。这是它们三者之间的关系。其实有时候计算机的学习方法对我们人类学习也是有帮助的。我们能教会计算机,同时也可以用这种方式来教人。
我也将传统教育与智能教育做了一个对比,如下表格:
传统教育主要是发生在教室,智能教育发生在空间里面,资源空间、物理空间、社交空间都可以;传统教育主要是知识的传递,而智能教育则代表能力的提升,是知识获取的引导者;传统教育是知识灌输,智能教育是互动探究式的学习;传统教育一般是以文字为主配少量的插图,我们知道只是用文字这种单一的形式会丢掉很多原汁原味的东西,文字的教学可能会限制我们的思维,智能教育则具有多元化、多模态的数字教育资源;传统教育只需要简单的技术支持,而智能教育则需要高级的数字化技术以及智能技术的支持。
从学习评价来看,传统教育受结果导向,主要表现是应试教育,智能教育是数据驱动的过程化评价,由于学生的整个学习过程可以被数字化的记录下来,所以我们可以在过程中像切片一样来看他们的学习过程。传统教育以分数为评价机制,智能教育是多元化综合评价,逐渐形成一个定量的精准化评价。
从学习路径的规划来看,传统教育是模块化的,智能教育比模块化还要更加细致和碎片化。由于有碎片化所以内容点之间可以形成一个复杂的网络。在智能教育过程当中,学生可以动态的调整学习路径,每个学生可以有自己的学习路径。
如果将规模化和个性化作为横纵坐标。在农业时代的教育(例如私塾),是个性化教学的,孔子对子路、颜回会有不同的教育方法,同时,不同老师的独特经验也可以传授给学生。随着进入工业时代,为了培养大规模的人才,就制定了标准化的培养方案,教师严格遵循教育部审定的教材、制定的教育大纲,大规模的教学主要以文字为主体,只有少量配图,只有极少的多模态,这也导致从学校出来的人的能力和企业实际的需求有很大的差距,因为并没有得到基于实际的能力锻炼。到智能化时代,我们说智能革命,是在两个维度同时突破。它的规模比工业时代更大,同时又实现了个性化。这种学生的个性化培养能使老师的个人经验得以传承同时又是多模态化的,使我们能在时间和空间的两个维度上都突破限度。在时间上随时学不需要非得上课学,碎片化学习提高效率,还有终身的学习,在空间上随时随地可以学习。
这里可以借鉴下机器学习的三种学习模式,从规则系统的角度来看,规则学习很像是填鸭式教学,人制定标准的规则,让机器照着去做(直接告诉学生知识,技巧)。然后是神经网络,大量的训练数据(大量做题)。其次是强化学习,在与环境的互动中得到反馈,进而得到提升(在探索中学习)。
在教育系统中的主要角色(学校、教师和学生),他们的主要工作以及在智能教育中所产生的产品形态,如下:
智能教育的目标如下:
致力于培养智慧型、创新型的人才
把老师从重复性的劳动中解救出来;
促进教育公平、区域教育发展平衡;
促进教育效果、教育体系运行效率和教育投入的效益。
在政策方面,人工智能+教育演进的速度非常快,最大的一个标志就是2017年7月国务院出台了《新一代人工智能发展规划》;随后在2019年2月国务院又出台了《中国教育现代化2035》,将“加快信息化时代教育变革”列入战略任务。
在这些主要的政策中,其主要思路有六条:
推动教学改革,探索基于人工智能的新教学模式,推动教学方法改革,重构教学流程;
智能校园。变革组织结构和管理体制,优化运行机制和服务模式,实现校园精细化管理;
智能评价。教学过程监测、学情分析和学业水平诊断,精准评估教与学的绩效;
在线学习。开发立体综合教学场、基于大数据智能的在线学习教育平台;
个性化。以学习者为中心,提供精准推送的教育服务,实现教育定制化;
终身教育。服务全民终身学习。
今年 5 月份国际人工智能与教育大会上,习总书记在讲话中提到人工智能与教育,一方面是要培养人工智能人才;另一方面就是智能教育。关于智能教育,他提到了终身教育,平等教育,个性化教育和开放灵活的教育。
国家各个部委响应国家的政策组建了F06,然后把人工智能和计算机和自动化并列组建了一个学科,叫F0701,专注于研究教育智能化、教育信息化。
我们讲下 AI 在教育领域的应用案例。下面是我从理工科的角度画的一张布局图,主要分成五个层次:
人工智能的核心技术包括自然语言处理、视觉、听觉等等都会在教育领域找到用武之地。我们从技术出发来找应用场景:
我最近在和学校的几位老师推动“智能监考”这件事情,其技术实质就是把异常行为检测应用到监考当中。我们学院唐降龙教授将机器视觉技术应用到体育运动当中,
例如分析滑雪的动作是否规范、什么时候应该有什么速度等。用在教学中,我们同样可以通过视觉行为分析对学生在化学实验中的实践操作过程与精度进行缺陷检测,并给出其优化学习指导,提升学校实践教学质量。
哈工大做知识图谱已经有很多年了,我们的成果是2014年推出的《大词林》,2019年推出了2.0,拥有1000万个实体,上位词十八万,目前很多企业(包括腾讯、阿里、科大讯飞、360、搜狗等多家企业)都在付费使用。大词林的优势在于当给你一个课本时,无需手工参与,能够自动构建而成知识图谱。因此可以先把一门课构建成知识图谱,然后学生在学的过程中不断对学生进行评价,构建一个个性化的知识图谱,例如红色表示不会,绿色表示会的,黄色表示半懂不懂。这样能够引导孩子更好的学习。我的孩子在上高中时会有一个错题本,事实上错题本正是这样一个知识图谱。
我们做的情感分析技术可以用在教育资源的评价上。例如网上有很多老师讲“C语言”,但到底哪个老师讲的好?我应该跟着哪个老师来学?网上会有一些讨论,根据对这些讨论中的情感分析,我们可以给这些课程资源进行好坏的打分。
另外我们与科大讯飞合作的工作曾经在国际权威阅读理解评测中多次夺冠。现在的阅读理解技术虽然在评测中能够取得很高的分数,但还不能做到可解释。我们希望能够做到,当一个学生在选择答案时,机器不仅能够告诉孩子他的选择是否正确,还能够告诉他为什么正确或为什么错误,即解释阅读理解中的推理过程。
另外是自动校对。我的硕士研究就是自动校对,但自动校对很难,特别是中文更加复杂。不过随着深度学习以及大数据的出现,这方面确实有很大的进展。我们希望能够把这项技术用来帮助孩子在写作文等方面起到辅助作用,例如能够自动校对语法错误等。
我们曾在国家863计划的支持下研制了首个中文作文自动写作系统,就是你给我一个主题,机器能够自动生成一篇文章,例如篇章结构、事实论据、点名主题等,一般自动生成的文章在满分50分的情况能够获得33~35分的成绩。
此外也可以用来辅助写作,例如为写作提供素材,生成同义词、反义词、近义词等,对句子进行润色或翻译,或者直接写篇诗歌后作文作为参考。哈工大不仅做知识图谱,还做事理图谱,不同之处在于前者的节点是名词,而后者是动词。我们根据实例图谱中记录的不同事情发展的脉络可以写出不同的故事。例如我们曾参加国际故事结尾预测(storycloze test)评测比赛,获得了第一名(相关工作发表在IJCAI 2019以及Coling2018),如下:
此外,我们也和科大讯飞合作了中文作文评阅系统:
中文作文评阅系统现在已经能够达到和人类相近的水平。我们的思路并不是机器取代人类阅卷评分,而是辅助。例如在高考中,阅卷老师会给作文打分,之后机器会快速地对已经打分的作文进行扫描并打分,如果人和机器之间的分数差别太大,再用专家进行二次审核。
我们也做了人机对话技术,这项技术在教育中的一个应用就是智能答疑系统。一个老师可以给几十万人进行授课,但却无法做到对每个人进行答疑。智能答疑系统能够自动地对用户的问题进行回答。
另外就是能够自动地生成问卷,根据用户知识点的确实自动构建覆盖其知识点的题库。以上这些是我从我自己的老本行NLP出发,给大家汇报一些潜在的应用。这些应用做出来,会帮助提高自动化,推动智能教育的革命。
对于智能教育的未来,我这里主要谈下最关键的个性化问题。
现在的教育最大的问题是陷入了盲目低效的学习困境,导致培养出的人才千人一面。有统计显示有约60%的题目训练是无效训练,要么是重复训练,要么是超出了孩子理解难度的范围。另外孩子在日常测试中有约50%的错题在期中或期末考试中还会出错,原因在于孩子认不清到底是哪个知识点出错。
我觉得要想走出困境,最为重要的是智能评价。在医疗和金融领域,常常会根据评价来改进个性化服务。同样的,智能教育领域也应当以评价为核心推动个性化发展。只有检测才能实现个性化。学习者在学习某个知识点时出现学习障碍,可能是因为学习者对于与当前知识点相关的其它知识点没有掌握,于是我们可以通过构建领域知识点间的逻辑结构关系来帮组进行诊断。然后根据诊断结果,定制个性化教材和课程,自动推荐个性化学习内容和练习题。
举个例子。这是真实的一个案例,一名同学4月份在金属部分的测试中仅得了54分,这里红色代表他还没有掌握的知识点,绿色代表他已经掌握的知识点,黄色介于二者之间。经过个性化学习后,5月平均分达到74分,6月份便达到了96分。
现在的教学主要是对知识进行考察,但是其本质则是在考察能力。例如历史,如果问你“商鞅变法”与“王安石变法”之间的异同,这在课本里是找不到的,这里考察的包括表达能力、推理能力、创新能力等。其他也是同样。因此我们应当从以知识图谱为中心的教学方式过渡到以能力图谱为中心的教学方式中。
目前智能教育落地存在的问题包括数据壁垒,市场认识不足,学科的壁垒。应用模式上也存在一些问题,例如本来AI+教育是为了降低教师和学生负担的,但现在却反而加重了他们的负担,好比因为原来学生们都只有步枪,现在大家都配上了机枪,甚至是坦克,应用模式没有改变,反而加重了他们的负担,成为教育领域的军备竞赛。所以要回归初心,看看本报告开头关于教育本质的阐述,教育第一位使命的还是提高价值观让人能够更加幸福,切不可让人工智能技术成为应试教育的帮凶。
最后我总结一下,智能教育引导重大变革,最关键在于因材施教;国家的政策支持使智能教育的社会地位和经济价值不可估量;人工智能教育的各项技术在教育领域都有用武之地;自然语言处理技术在自然语言学习和知识学习方面将发挥重大的作用。
雷锋网报道。