雷锋网 AI 科技评论按:11 月 15 日,「全球 AI+智适应教育峰会」在北京嘉里中心大酒店盛大开幕,峰会由雷锋网联合乂学教育松鼠 AI,以及 IEEE(美国电气电子工程师学会)教育工程和自适应教育标准工作组共同举办,汇聚国内外顶尖阵容。
在大会上午主论坛上,ALEKS前主席,现首席产品Wilmot Lampros进行了演讲《人工智能学习和评估系统ALEKS的介绍》。以下为他的演讲内容,雷锋网 AI 科技评论整理。
大家好,我必须要拿纸质版的演讲稿,别人说我逻辑性非常强,但是我的记忆力不太好,所以这对我来说是一个挑战。今天我来跟大家分享一下在ALEKS工作方面的经验。
我之前是这家公司的主席,但是之后这家公司被收购了。ALEKS是一个产品,它是以AI为基础的。在美国的教育当中,我们也正在接受这样的产品。今天我们会跟大家谈一谈当前我们AI教育面临的挑战,以及AI运用在这个产品当中的挑战。我不知道对AI教育的抵触在中国会不会发生,我当然不希望发生,但是我觉得在美国我们还是有这样的一些挑战,很多人对此有着抵触情绪。
有很多人比较保守,我们要克服这种抵触情绪,让产品真正的使用起来。在很多情景下,我们面临着这样的现实,就是很多人不喜欢这样的产品。那ALEKS到底是什么呢?有些人可能不太了解ALEKS,包括ALEKS的运作方式,还有一些细节。
1.ALEKS是一种基于知识理论的人工智能学习评估系统
我们知道今天的很多观众都是来自于数学和自动化领域的,但是我们是以知识为基础对学生进行评估。这是一种人工智能的评估系统,通过对学生进行提问来评估学生的学习情况,了解学生已经掌握的知识点以及接下来需要学习那些知识。刚刚提到了知识点,我们希望能用人工智能来发掘哪个知识点、哪个知识层面、哪个话题学生已经掌握了,哪些学生还没有准备好学习,或者哪些学生已经准备好学习了,所以我们也在不断的优化学生评估的整个过程。
ALEKS的理论框架是基于知识的理论,那么什么是基于知识的理论呢?我们用知识空间来描述需要学习的知识,如知识域或者是主题。比如说今天很多人数学学得都很好,我们会把领域做一个模型,会以每个话题进行建模,就是话题类型、问题类型。当前的挑战就是我们要把每个主题都进行建模,而且要做得非常完整,与此同时学生可以掌握所有的话题,能够非常详细的掌握话题中的所有问题。所以在传统的教学上,我们会发现在一本书中有的话题会有一两万个问题,但是老师只会选择其中一些问题来解释。因为其中会有很多变数,老师自己会选择一些问题让学生来解决,所以学生只能按照老师选择的问题来学习。但是在人工智能体系中我们会有这样的假设,我们希望学生能掌握所有的类型的问题。
如何来应用人工智能呢?我们会构建这样一个架构,换句话说,对于一个真正的学生来讲可能会掌握哪些问题类型,把这样一些问题类型进行架构的构建。因为我们知道,对于一个学生来讲不可能有所有的知识状态,也不是每一个知识状态都是可行的。其中一个不可行的方法比如说我们不应该有一些逻辑或者教学方法相关的内容,不应该以教学方法和逻辑为基础。如果还没有学会简单的运算的话,就来学习有符号的正负数的运算,那就是不符合逻辑的。
基本上来讲,ALEKS这个产品是有这样一个假设,也就是说,所有的知识状态都是可以被描述的,而且在这个过程中我们认为在学生和知识之间是存在某种函数关系的,应该可以被利用,当然它仍然还需要认证、验证。也就是说这个学生知道这个话题不知道另外的话题,他知道这个话题的60%或90%,这也是没有什么意义的,表示没有完全掌握这一个概念。所以我们必须要理解哪一个知识状态是可行的,哪一个是不可行的。比如说我们会发现,对于一个数学学生来讲,如果他还没有掌握求解线性方程,那么他就没有办法掌握线性不等式,这都是通过数据来计算的。
我想跟大家说一下学习空间这个概念。学习空间也是一个系统的理论概念,是一个分级良好的知识空间,比如说在数学方面它也是可访问的知识空间。我们在这方面也要构建非常复杂的数学系统和模型,这种复杂的数学模型就是要创造相应的软件,创造AI的软件帮助学生学习。
其中一个原则使用的是边缘定理,也就是说,如果你知道这个学生学习的知识系统,知道掌握了哪些知识,你就能知道下一步要学习哪些知识,这也是ALEKS的关键点,ALEKS这个系统能时刻知道这个学生下一步应该要学习哪些知识。
比如说有500个、600个、700个不同的主题在同一个学科下,我们假设每一个学生都掌握了300个主题,也就是1/2个主题,这样我们就可能有数百亿个掌握知识点的组合。比如一个班上有30个学生,他们掌握的这300个不同的主题,肯定不是完全相同的,他们真正掌握的知识点肯定是不一样的。所以我们以此推理的话,就可以看到不同的学生下一步可以学习什么,或者准备好了学习什么,这也是基于数学的框架,而不是基于原来直觉的框架。
我们可以看到这样的微型知识空间,就像我刚才所讲的,我们的关键就是要弄明白这种知识空间之间的关系。比如说一个学生处在一个知识空间,可以移动到哪些其他的知识状态中,或者可以学习哪些技术的东西。如果说一个学生学习了话题J,我们就会把J放在他的知识状态里,也可能是学习I或者H,再往下走可能会学J、H或者I、J。如果学习了J、H这两个主题,接下来可能会学J、H、I,再往后进一步学习。从这个架构来讲主要是两个话题,一个是A一个是C,如果这个学生学了A之后,就可以再学习C,会学A、C、I、J。或者他学了C,就会变成C、I、J、H,在这种微型知识空间中,学生是一步一步的把知识点掌握了,有五个知识点在里面。
对于这五个知识点,我们可以看到它也有很多不同的排列组合,在这里一共有32个小的框框,也就是说有32个可能的学习状态。在实践中我们也知道,这样完美的或者是纯理论的情况也是不存在的。在很多的微型知识空间中,比如在这里我们只有40个学习主题,有5000个学习状态,大家可以看到这才是真正的学习架构的状态。
微型知识空间是因为我们知道对任何一个学科来讲不可能只有40个主题,这只是一个假设的情况,还有可能有的学科有1万亿甚至更多的主题,这样的话它的知识状态就会更多。
比如说在11年级数学学科中有400多个问题类型,这个过程中学生就可能有数千亿不同的知识状态,也就是说,我们怎么样来找到某一个学生到底处在哪一个知识状态呢?在这个过程中我们就有这样基于概率论的算法,可以确定学生的知识状态,就是基于计算机的算法来实时的评估学生的知识状态。对于ALEKS这个产品来讲,最有名的就是它的初步评估体系,首先会问学生一系列的问题,让他们来解决问题,比如说一个数学问题。而且我们在这个过程中不会用多选题,结果就是他掌握了或者是没掌握这个题。
对于几万亿个的知识状态来讲,如果我们要通过25个问题就找到所处的知识状态的话,那么每个问题都是非常关键的,不能浪费,所以我们会针对不同的人群制定不同的问题。对于ALEKS上面的问题,答对的话我们就会问下面的问题。每答对一个问题就可以缩小知识状态的范围,一步一步的缩小,最终就能找到支持它的知识状态,这应该是非常简单的过程,也是我们初步评估算法所采用的方式。
如果一开始就没有答对的话,我们就会减少它的难度,来找到那些不包含这些问题的知识状态再进行测试。大家可以看到这就是我们知识状态的演变概率分布,我们在这个过程中也有很多不同的问题类型,大家可以看到这样几个示例。比如说我们在热动力学中会有一些不同的概念,一开始测试学生的时候就会问他一些非常基础的问题。如果从这里开始的话,就会发现在这个图中,大家可以看到所有红色的圈都是“谁知道呢”这样的一个情况。我们也是研究了不同的人群,给了他们不同的问题选择,对于这样一个人群我们首先知道他可能回答正确的概率是多少,比如说对于A问题学生答对了,我们就会给他另外一个问题。比如说问他一个F的问题,如果他没答对的话,我们就会再进行改变。最后我们完成了评估,我们的目标就是要尽可能的缩小这个知识空间的范围,找到他的知识空间。
再给大家简要重申一下我的观点,ALEKS的人工智能会建立一些知识结构,我们会使用这些知识结构来发掘学生到底了解什么,还有哪些没了解,应该怎么样来学习。
2.ALEKS是一个一体化、一站式的辅导老师
还有另外一种可能,我们已经看到了教育的一种模式。比如说学生已经掌握了Y问题的话,他掌握X问题的可能性有多大?我们需要建立自己的标准,如果学生已经掌握了X问题的话,是不是有70%的概率掌握了X问题以外相反的问题,这样我们就能画出它的知识结构。我们会知道所有的关系都存在着一种波动的可能性,由于这种联系的可能性,我们就可以追溯到知识结构和空间状态。所以我们就是要让机器去学一些东西,如果这些已经学到了,学生就能够跟机器进行合作,机器就不需要人的帮助了。机器在帮人,但是人不需要帮助机器。
ALEKS到底是什么呢?刚刚我们说了很多,我们想要强调的一点是,ALEKS是一个自动化的辅导老师,是一个一体化、一站式的辅导老师。为什么会说是一站式呢?因为我们有很多的内容都已经把它放在了ALEKS中,我们会有自己的一些内容,内容对于ALEKS来说是非常重要的。我觉得所有的产品、理论都需要内容才能实现。我们往往会接收到非常多的内容、信息,但我们并不是把这些内容整合到我们的内容当中就是AI了。我们会有这样一站式的服务体系,在这个服务体系的基础就是学生适合学什么东西、学生应该选择什么样的课程或者话题。
ALEKS能够提供所有的积极因素,让学生能够学到更多的科学知识。我觉得积极学习是一种非常好的现象,对于教学来说非常重要。
在美国我们并不是说要用ALEKS来取代老师,因为我们觉得学生的学习还是要有人的参与才能让人和人类有所进步。在美,ALEKS往往是作为人类老师的助手,所以ALEKS要找到每一个学生适合学习的话题。对老师来说,他可能时间不够,但ALEKS就能够快速地去完成这样的一个事情。
哪怕是面对无限数量的学生,ALEKS也可以去完成这样的一些事情,这对ALEKS来说并不是一个非常大的挑战。在美国往往会面临这样的情况,学生已经准备好学习了,ALEKS会让学生预习这样的课程,这样的话学生的一些学习方面的差距就能够提前被ALEKS找出来。但是,有的时候学生在学了之后的课程之后会忘记之前的知识点,所以我们用ALEKS帮助人类导师让学生提前进行相关课程的预习,同时,ALEKS也可以进行作业辅导。
我们也会有翻转课堂,美国非常地流行,也就是说在课堂中学生会跟计算机一起、跟ALEKS一起学习,但当他们有问题而ALEKS解决不了的时候,他们可以向老师求助,我觉得这是一个非常有效的模型。事实我们并不一定需要数学系的博士来帮助学生解决数学题,我觉得这种做法还是有很多优势的。
所以知识结构中我们会有一站式的服务,我们会有导师制的方式,所以导师还是要控制他们学习的进度。老师也必须要牺牲对主题选择和时间的控制,这是我们体系当中的一个问题。
我们也会对学习的内容有一个检查,每次他们学了20到25个题的时候我们就会进行检查。首先我们会进行回顾,在这方面也是做了很多的研究,同时我们也用这样的一个检查来进行对学生掌握知识的核实,这样一个非常仔细的核实来看一下他们是否丢掉了一些主题的知识。在最开始的阶段,我们是想要ALEKS和真正的教育系统相适应,我们想要让教师可以使用这些内容。比如有400个课程,或者是600个话题或问题的类型,我们在这个过程中就需要让老师参与进来,让他们看一下哪些问题类型是有用的,怎么样把它们进行区分,或者是进行挑选,让AI进行后续的工作。这样的一个过程也是非常有意义的,而且也非常地成功,我们让老师来添加和删除内容。但对老师来讲,有时候他们做的决定也不是很明智,所以,有的时候也会删除一些他们选择的材料。
3.ALEKS可以帮助老师对学生进行差异化辅导
另外,ALEKS这样的一个概念是基于知识空间理论的,我们当时是觉得人群是类似的,可是即使是在一个班级,这样的一个小的团体里也能看到个体的差异是非常大的。大家都在学七年级的数学我们就把他们放在一个数据库里面,在我们的数据库里面就包含了很多不同的学生,让机器学习一下他们是如何学习的,以及他们学习的方式、获得知识的方式。我们通过大量的数据来进行分析,但是AI在这方面有时候会没有办法确定优先关系,或者是确定好学生的知识状态。可能一开始有10亿的知识状态,后来由于数据量的增大变成了1万亿的知识状态,对它的知识结构的界定也是有很大的挑战的。在这个过程中我们投入了大量的人力物力来发展相应的软件、硬件,来应对这样大的数据。
再说一下下一个方面,我们还有一个另外的适应过程就是对知识检查和算法进行重新的设计,它事实上也能够看一下学生的在学率,看一下他们学习的效果,这是一个非常复杂的算法。它并不是对先前掌握知识的严格的检查,而是另外一种学习的工具。
在座的各位,我希望你们不需要来接触这一点,也就是在软件方面的功能。事实上我们想让这些软件特别简单,就像我们20年前使用的那样,让它越简单越好。我们想让教师可以跳出AI,就像和其他没有AI的国家一样来进行他们自己对学生的评估。有的时候他们做的这样的评估可能也没有办法真正地帮助学生。
从我的角度来看,我觉得有一点非常有意思,就是不知道我们的老师怎么想,事实上如果我是教一单元的话,我只想让我的孩子多学点一单元,我也不希望别的学生来学这节课。这个可能是AI的一个优势,因为AI知道现在学生在学哪个单元,但是老师却不知道,虽然老师教的一单元但他不知道学生学的哪单元。但这方面老师事实上是非常在意的,他想知道学生到底现在在学什么。所以这方面我们开发了另外的一个技术,也就是说让学生在某一个阶段只可以学习老师教的这部分的内容,这样的话就能够很好地满足老师的需求。同时,我们也可以让AI来帮助老师进行教学。
ALEKS可能现在是唯一的一家在这方面的使用AI并且惠及不同的学生的美国公司,可能还有一两家其他的公司,但现在我都记不得他们的名字了,当然我可能还需要谦虚一点。今天早上也说了,在2018年前9个月,我们已经有300多万名学生在使用软件了,这是一个非常大的规模,这就是我的报告。