雷锋网按:继AlphaGo与李世石、柯洁接续对弈之后,「人机交战」真的火了。其中,尤以教育这一领域极具代表性。不论是日本AI专家研发的Todai Robot,还是参加2017年数学高考的Al-Maths,这些AI公司或科研机构主导的人机对战可谓此起彼伏。
然而,人工智能智适应教育机构乂学教育近日在郑州发起的一场「人机交战」,却有点不太一样。
雷锋网注:乂学教育在郑州发起的人机对战实验的现场
据雷锋网了解,这次活动的主角是乂学教育开发的智适应教学机器人和三名17年平均教龄的中高级老师。活动共招募了78名初中生,先对其进行一轮数学摸底测试,再就成绩分为对照组和实验组,然后两组在四天时间里分别接受真人教师和教学机器人的针对性和集中教学辅导,结束后再进行一轮测试,以核算两组学生的分数提高情况。
为确保这次人机大战的公平公正,乂学还采取了五重措施来保证参加测试样本的真实有效。
1、所有的前测卷和后测卷都是由第三方教育局教研室资深老师独立出题。
2、四天的试验过程都进行了实时直播和录像供所有人监督和回放复核。
3、试验过程中有媒体、艾瑞和其他教育机构做观察员实地监控。
4、测试卷和智适应教学机器人上的试题经过媒体抽样调查保证无重复或类似试题。
5、使用智适应教学机器人的学生访谈都有录音记录备查。
最终,这次大战的结果显示:智适应教学机器人以最核心的平均提分36.13分(机器教学)完胜人类的26.18分(真人教学),而在最大提分和最小提分两项上,机器组也分别高出真人组5分和4分。
对于教育领域来说,这次大战的结果可谓具有标杆性意义。因为其不仅有助于解决教育资源不均的问题,对于机器人取代人类的进程更是有直接推进作用。但显然,业界对之在颂歌的同时,必定存有疑问之嫌。比如,人类是否夸大了机器之用?未来乂学还会拓展其他学科的「人机交战」吗?此次参加活动的初中生为78名,样本量会不会相对较小?是否相对影响了比赛结果...针对这些问题,雷锋网采访了乂学教育的创始人栗浩洋,以获得这次大赛的第一关联人的权威解答。
雷锋网注:乂学教育创始人栗浩洋
雷锋网:在举办这场人机对战之前,是否有设想过预期结果?与实际结果差别大吗?
栗浩洋:原本预计,在正常情况下,机器会比高级教师提分高五分左右。因为之前在跟其他系统做对比的时候,不论是魔方格还是新东方,一般都是三到六分的获胜比例。最后的结果既是出乎意料也是意料之中,因为经过三年研发,这款产品已经是第三代了,无论是用户感受、流程还是教学效率等,都比过去提升了很多。
雷锋网:不同学科在知识点的逻辑梳理、考核方式等方面也不尽相同,这在接入AI技术、机器学习和智适应学习系统,会有哪些差异?
栗浩洋:事实上,哪怕是在同一个学科里面也会有这样的问题。比如说英语,听力的知识点分拆和词汇、语法、阅读、作文的知识点分拆完全不同,因为各逻辑不同。这里的难点是怎么把那些难拆分的都拆分出来,比如说把听力拆分出一些比较难以理解单词的知识点、容易混淆的单词、连读、吞音以及听力中的生活场景等等,通过拆分成这样的一些知识点题、细节题、主旨、人物关系题等,做到标签化、系统化的学习。其次,不同学生的教学流程不一样,在不同流程中所用到的后台算法也不一样,乂学会根据学习科目和科目中不同种类的特性来应用不同种类的算法。
雷锋网:在进行比赛之前,这套花了3年时间研发的数学智适应系统,是否已经进行过商业应用?情况怎么样?
栗浩洋:从今年三月份产品正式上线以后,已经有上万名学生使用了这一系统,学生的续费率达到了80%以上。单个学生的收费从第一次交费的5000-7000元,已上升至第二次续费的20000-50000元。到目前为止,乂学智适应学校已经开到了全国24个省120个城市,共计246家分校,年底会开到300家。
雷锋网:这次比赛用的是数学智适应系统,相对而言,它在所有学科中在应用AI上有独到优势。未来乂学教育有拓展其他学科的人机交战的计划吗?
栗浩洋:数学做智适应是有先天优势的,因为该学科的知识点与知识点之间的结构信息、逻辑、线条非常干净。比如说哪个知识点是另外一个知识点的前序知识点,二者之间的相关性、相关度非常强,不像文科类不是那么固定和清晰。所以从全球来讲,智适应以数学作为切入点是最容易见效的方式。
但是乂学也考虑到这样一个现状,三年前在研发初期就拿了文科的英语去做主要的突破性尝试,因为做英语智适应的尝试难度是要远高于数学的。我们比竞争对手多花了三、四倍时间和资金成本去研发英语产品,效率提高了更多。到了16年初,乂学的英语智适应在跟竞争对手的对比试验报告里取胜。而且大部分情况下,在六个人机大战中英语、语文和物理的智适应系统能够胜过高级教师。
所以明年乂学不但会推出全学科的人机大战,并且也将在部分学科挑战特级教师,提升更高的难度。
雷锋网:此次参加活动的78名学生,样本量是否有点小?拿技术研发、市场应用、与学校和机构的合作等来看,乂学接下来还有哪些其他计划?
栗浩洋:这次试验是在严格控制、严谨设计、全程直播、多家第三方媒体机构监控下进行的,保证了试验的公平公正性,试验的结果是有效的,所以这次试验的样本量已经可以作为一个合理的取信值。在这次实验之前的三年时间里,乂学已经做了数千个学生的临床实验,这些实验都证明了机器的教学效果是超过人类教师的。所以,AI对于知识的学习能力和掌握能力是无限的,再加上它无限的运算能力和非常优秀的AI算法,未来AI全方位超过人类只是时间问题。
关于乂学教育的下一步计划,具体有如下几点:
第一,不断提升算法和系统的有效性,能够在所有学科里和特级教师进行PK,进一步拉大机器教学和人类老师在教学学习效率的差距,真正帮助和实现学生减负。
第二,真正干倒学区房。接下来我们会开展全学科的试验计划。今年底会把年龄段扩充到6岁至15岁,明年底则扩充到6岁至18岁,并且覆盖所有学科。
在技术研发上,我们会持续投入。此前,我们已经和美国斯坦福国际研究院(SRI International)成立了人工智能自适应学习联合实验室。
商业计划:在线上希望像VIPKID一样能够获得几十亿上百亿的收入;在线下会在所有省份和其12345线城市,部署几万个线下无人教师。
雷锋网:机器对学生知识点、题目、错因等各种复杂状态的掌握能力是无限的,同时也是未知的,从理性的角度来讲,人类是否有过于夸大机器的作用?
栗浩洋:我们认为人类不但没有夸大其作用,反而一直是在低估机器的作用。机器对整个人类劳动的取代在当年就起到了不可思议的作用。所以,现在AI在智力劳动率上能够比人的效率提升一百倍不是什么新鲜事,而是一个必然的事。
雷锋网:就目前国内的AI教育市场来看,大众认知水平仍然是阻碍其大规模应用的一大因素。对此,乂学教育将作何应对?
栗浩洋:在很多类似AlphaGo的人机大战事件的影响下,所有消费者会被不断普及AI的成功之处。随着更多AI企业的宣传,大家会了解更多。而跟我们合作建立联合实验室的斯坦福研究中心也会在明年举办一个比AlphaGo轰动十倍的人机大战,它是用一个钢铁机器人去和人类最强的摩托车赛车手比赛摩托,这样一个高难度的新挑战如果获得成功,将进一步颠覆和刷新人们对AI的认知。
雷锋网:在中国国情下,AI教育要撼动应试教育这根大梁依然前路漫漫。那么,AI在教育领域的应用还有哪些空间?
栗浩洋:第一是AI教育能够解决减负问题。现在我们通过知识点侦测、学生用户画像和算法,来修正某位学生的学习路径和学习内容以达到个性化学习。
第二是我们能达到通过能力去促进应试的作用。在乂学做AI教育的过程中,我们已经颠覆了海外Knewton所做的研究,当时除了针对知识点结构之外还引入了提升学习方法和能力的系统。有些孩子题目做的不好,其实是能力问题,那么通过能力培养和训练,不仅能让其增长知识,更能提升他们自身的思考水平、判断能力、归纳能力、识别能力、理解能力以及综合能力。
第三,我们在研究和实验,预计在一两年以后就可以推出对于学生的想象力、创造力方面的一些训练。怎么能够让小孩学会进行突破式创新、进行无边际的想象,用创新的方法去面对这个世界,解决更多综合性的问题。