2017年高考今天就结束了,跟往年一样的是作文题目出来以后引发网友吐槽和创作、交警组织送考车队、以及帮迷路和丢失准考证的考生及时赴考。不一样的也有,那就是来自清华大学苏州研究院的高考机器人AI-MATHS和来自教育机构“学霸君”的智慧教育机器人Aidam,它们都通过数学试卷和人类一绝高下。
考试结果是,AI-MATHS在2017文科数学北京卷获得105分,在2017文科数学全国卷II获得100分;Aidam在2017文科数学全国卷获得134分,不过它需要人工为机器人输入题目,审题难度大大降低了。
下面雷锋网 AI 科技评论就来聊一聊他们两位都是什么情况。
2015年,科技部公布了国家高新技术研究发展计划(863计划)信息技术领域2015年第一批项目,科大讯飞股份有限公司牵头的“基于大数据的类人智能关键技术与系统”项目获得立项支持,安排863计划专项经费概算超5000万元,“高考机器人”就是项目中的重要研究目标之一。科大讯飞作为牵头单位,联合清华大学、中科院自动化所、北京大学、北京理工大学、中科院软件所、南京大学、电子科技大学、哈尔滨工业大学等超过30家科研院校和企业共同负责项目的研发与实施,科大讯飞执行总裁胡郁任项目的首席科学家。整个项目分成了许多不同的子项目,比如有专门做语文的、做数学的,科大讯飞除了牵头之外还要提供一些底层的平台技术给大家分享,还要设计测试方法和测试平台对每个子项目成果进行评估。
据雷锋网 AI 科技评论了解,今年应试数学的成都AI-MATHS团队就是国家863类人答题项目组成员,主要负责攻关数学学科。 “AI-MATHS”之父林辉是清华大学苏研院大数据处理中心主任,同时也是该中心智慧教育事业部从2013年开始技术孵化的成都准星云学科技有限公司CEO。除了这次应试数学的AI-MATHS机器人,准星云学还研发了准星智能评测机器人(即准星智能评测系统),能对学生答案正误、错误知识点、错误原因进行智能判定。准星云学还亮相2016年“十二五”科技创新成就展并获得荣誉证书。
AI-MATHS诞生于2014年,于去年5月宣布参加高考,今年2月以较高分通过中期评测。林辉介绍,AI-MATHS是通过综合逻辑推理平台来解题,而非学习储存题库。“它可以学习小学到高中的7000多个考点,运算量可达2的800次方。”
“AI这次是系统阶段性成功公开测试,由于此次活动无法与高考同时同台进行,所以命名为模拟高考,但最关键的是整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。”林辉介绍,近1年多来,AI在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关,“AI是通过综合逻辑推理平台来解题,而非学习储存题库,因此在完全掐断题库、断网、无人干涉、仅有12台服务器、1.2万道题的小样本训练量的诸多限制下,在今年2月时取得了93分的成绩。”
昨日傍晚6点,离2017年全国高考数学科目的考试结束只有1个小时,AI在位于成都高新区天府新谷一个关闭外部网络的房间内,通过内部服务器的计算,在2小时内作答两份高考数学试题,之后由教师批改答卷。
经过共2小时的解题、等待、评分后,AI-MATHS此次模拟高考成绩为:2017年高考文科数学北京卷获得105分,用时22分钟;2017年高考文科数学全国卷II获得100分,用时10分钟。2份考卷对比2月中期评测的基础上均有大幅提升。相比试前林辉110的目标,差距已经很小了;而这个答题速度则是人类根本无法比拟的。
值得一提的是,这款机器人目前仍有一些漏洞需要不断改进,比如,AI-MATHS欠缺对常识的理解能力,这导致AI-MATHS不能理解一些题目,在解答题中有0分答案的出现。这次挑战的结果将运用到该公司对AI-MATHS的技术验证和准星产品迭代中。“此后AI-MATHS将接受大样本训练、测验弹性扩展能力,乃至于迁移到其他领域的学习能力。”林辉说。
昨晚在北京,教育机构“学霸君”请到6名去年的理科状元来和他们的智能教育机器人Aidam进行同台对决,共同解答今年高考文科数学试题。
六名高考状元在高考数学结束拿到试题后,立即开始答题,答题时间是五十五分钟。人机双方分别完成了包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。经过数学特级老师、奥赛教练韩兆勇的评审,Aidam的分数最终公布:134 分。三组高考状元陪他一起进行测试,状元一组得分119分。状元二组得分140分。状元三组得分146分。
三组高考状元平均分135分,Aidam与平均分只差一分,但是离最好成绩还有一段距离。另外据雷锋网 AI 科技评论了解,现场是人工为机器人Aidam输入题目的,这将会导致难度大大降低,因为直接跳过了审题、提取信息这一解题过程中非常重要、也很有难度的一步。所以Aidam的通用性比AI-MATHS要差一些,离我们理想中严格断网、断库、自然语言理解的答题机器人也要更远一点。
不过学霸君的思路强调大题库(已经有超过7000万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识组件和解题模式。
相比高考状元们花了将近一个小时才完成考试,Aidam仅仅在10分钟内就完成了所有的答题。学霸君创始人张凯磊坦言自己很紧张,“就像送自己的女儿参加高考”。他表示,为了展示,Aidam昨天答题放慢六倍速度,平时每道题完成时间应该在七至十五秒。
Aidam解题全程展示
Aidam放慢的原因是不仅需要把题目做对,还需要给大家展示他是如何做到的。根据要求,Aidam会通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。
参加了昨晚对决的2016年河北省理科状元孟祥熙现就读于北京大学光华管理学院,他受访时表示,“人机大战赢了很开心,但是机器人技术很先进,想知道自己解题错在哪里”。
“想知道自己解题错在哪里”正是学霸君想要帮学生达到的重要目标之一。
学霸君是一家以技术为驱动的创业公司,自成立之初就一直致力于人工智能服务教育领域的探索,目标是通过机器理解为老师和学生在薄弱知识点的学习提供丰富的支持。学霸君潜心研究的智能教育机器人就是机器理解技术的一种典型应用,也是人工智能领域的重要挑战。学霸君推出的同名手机app就在为学生和老师提供着解题、答疑相关服务。
作为863“高考机器人”项目的“领头羊”,科大讯飞认为,研发“高考机器人”的主要目标并不是PK掉人类考生,而是为了更好地服务人类,利用相关技术成果可以在教育全过程中起到非常大的帮助,技术和算法的突破后,同样的成果可以用在医疗、用在客服、用在越来越多的领域。
“像在客服系统、还有一些车载的人机交互系统里,都需要我们预先对一些行业知识的理解,同时基于这个理解的结果能够做一些决策判断、一些相关问题的回复。”科大讯飞轮值总裁吴晓如介绍说,“现在,我们已有一些中间技术应用到一些行业里面了,比如说教育领域中作文的自动阅卷;还有机器翻译这块,我们已经推出了相关的口语对口语的翻译系统。所以,虽然现在我们还没有向社会公布我们这个系统在高考中的最后得分,我们在不同的行业里面已经形成了一些应用。”
根据吴晓如介绍,在研究中除了答题,讯飞的高考机器人还有阅卷的功能。应用在大学的普通话等级测试时,他们请了一组最权威的专家留下了很多测试样本,以这些测试样本作为机器学习的对象,然后建立模型来测试。最后的结果是,一组21个人的平均分,机器和专家的丝毫不差;分数排序的相关性也很高。以后作文阅卷也可能交给机器。
在科大讯飞研究院院长胡国平看来,高考机器人战略也将是中国人工智能实现“弯道超车”的一个助推器,同时,巨大的应用市场、高水平的人力资源将确保中国在人工智能发挥实效上前途无限。“我们的高考机器人从开始的时候就已经很清楚,我们的目标就是高考,而且是中国的高考。实际上,和东京大学自主命题的考试一样,难度是非常大的。我们一开始就是奔着这个真正有难度的任务去努力的,所以换个角度来说,中国在整个人工智能领域特别在内容智能领域持续领先的可能性会更大。”胡国平对整个高考机器人项目表示了信心。
AI科技评论招业界记者啦!
在这里,你可以密切关注海外会议的大牛演讲;可以采访国内巨头实验室的技术专家;对人工智能的动态了如指掌;更能深入剖析AI前沿的技术与未来!
如果你:
*对人工智能有一定的兴趣或了解
* 求知欲强,具备强大的学习能力
* 有AI业界报道或者媒体经验优先
简历投递:
lizongren@leiphone.com
相关文章: