专访先声教育CTO秦龙：专注AI技术研发，做教育行业的“DeepMind”

先声教育 AI+教育

作者：张莉

2018/09/27 15:11

近几年，随着国家频繁出台教育信息化相关政策，信息化产品及服务在教育领域落地步伐逐渐加快，各大科技公司也在相关领域大力布局，围绕教育信息化的各项创业项目也势头强劲，根据IT桔子公布的数据显示，今年上半年，教育信息化赛道共发生了七起投资事件。

此外，随着最新中高考改革政策的发布，英语口语机考正在全国各地普及。这给专门提供英语口语测评服务的教育机构带来了机会。

成立于2016年4月的先声教育，将公司定位为一家“目前落地在教育领域的人工智能技术服务商”，从AI技术切入，瞄准B端，赋能行业与场景，致力于成为教育行业的“DeepMind”，为教育机构提供AI技术解决方案。

先声教育CTO秦龙博士毕业于卡内基梅隆大学，于2014年加入著名语言学习平台Duolingo，负责平台上的多语种语音识别技术，是 Duolingo 第一位中国工程师。

近期，雷锋网来到先声教育办公室，对先声教育CTO秦龙博士进行了专访。

专注B端，为教育机构输出AI技术

专访先声教育CTO秦龙：专注AI技术研发，做教育行业的“DeepMind”

据介绍，先声教育基于语音识别、自然语言处理等核心技术，自主研发了智能口语测评、智能写作批改、自适应学习、智能对话以及情感识别技术解决方案。

当雷锋网问到先声教育为什么没有考虑C端业务，而是聚焦于B端，秦龙答到：”我们是一家技术驱动型公司，所以为B端的教育机构提供技术服务可以充分发挥我们的技术优势，而像英语流利说那样的产品驱动型公司，会更适合C端场景。我们也会像IBM一样，不仅向客户提供技术，同时也提供技术咨询服务，针对不同企业的技术使用场景做调试，并协助培训企业内部工作人员，使得我们提供的技术解决方案能够契合他们的不同产品和应用场景。”

目前，先声教育自主研发的五大AI技术模块中，成熟应用的有智能口语测评技术和智能写作批改技术。

专访先声教育CTO秦龙：专注AI技术研发，做教育行业的“DeepMind”

其中，英文智能语音测评技术在2年内已建立成熟的跨平台跨终端体系，除判断英语发音的对错外，还可以精细化到音素、重音、语调、断句及韵律等多个维度。可为K12领域学生提供实时纠错，多维度学习结果反馈功能，帮助学生有效提高英语听说能力，应对英语听说考试。

据介绍，智能写作批改技术也已于今年6月正式对外开放，同时与百度、京东建立了合作。业务方面，先声已服务数百家行业头部企业，如百度、新东方、好未来，海云天科技等。

秦龙详细介绍了先声教育自主研发的写作批改系统：

“我们的写作批改系统面向K12领域初高中学生，基于国内中高考英语考试评分标准，提供打分和改错两大基本功能，贴近真实考试环境，同时从词汇、语法、内容和可读性等多维度给出全面反馈，帮助学生提高自身英语写作能力。”

专访先声教育CTO秦龙：专注AI技术研发，做教育行业的“DeepMind”

Singsound 自动作文评分系统(AES)从单词拼写、用词、语法、句子结构的复杂度、切题程度、可读性等维度综合评价作文在相应学段中的水平。采用语言学特征提取与深度学习相结合的方法，主要采用了词嵌入、词法分析、词性标注、句法分析、主题模型等自然语言处理技术，同时结合了迁移学习、模型融合等技术。
Singsound 语法改错系统(GEC)采用了统计翻译技术(Phrase-based model)：该系统先利用 IBM translation model 提取训练数据中的词组信息，根据具体语境将错误的词组映射到语法正确的词组。并对统计翻译模型得到的初步改错结果进行句法解析、词法解析，分析具体错误类型，并对修改结果进行校正，从而进一步地提高改错的效果。

据雷锋网了解，英语流利说、科大讯飞等公司也有语音测评的产品推出，秦龙认为先声教育的优势在于，只服务于垂直的教育机构，技术研发更有针对性，其他公司是“大而广”，先声教育要做到“小而精”。

自适应学习不是某项技术，而是一个庞大的概念

由于人工智能技术的快速发展，主打个性化教育的AI自适应学习成为当下产学研三界关注度最高的热点话题之一。雷锋网曾报道过AI自适应学习火热的原因。

在国外，自适应学习已经有20多年的历史，从最早规则化的自适应发展到现在基于人工智能的自适应。并且早已开始应用，覆盖了不同国家、不同年龄层，从小学、初中、高中到职业教育的几百个学科。其效果得到了很好的验证，无论对小学生还是初中生，文科生还是理科生，都可以带来成绩的提升。

在人工智能的加持下，个性化教育的步伐在不断加快，为了与传统的自适应教育区分，目前做人工智能自适应教育的公司都倾向于称自己为“智适应教育”，人工智能自适应学习是对传统自适应学习的升级，也是对新型的学习方式的探索。

自适应学习可以分为两个阶段：

（1）以推荐系统为基础的浅层自适应阶段；
（2）以学习行为建模为基础的深度自适应阶段。

目前国内大多数企业仍处于浅层自适应阶段，据介绍，先声教育自适应系统已率先步入自适应学习的核心深度阶段。

秦龙解释道：“我们先声团队使用的 CLUF 是一种基于深度学习的 Encoder-Decoder 模型，它由四个 encoder 构成，分别是语境编码器 Context Encoder、语言学特征编码器 Linguistic Encoder、用户信息编码器 User Encoder、题型信息编码器 Format Encoder，最后由解码器利用编码器输出的高维特征作出预测。”

“语境编码器用来编码句子的语言环境，它由一个字母级别的编码器与一个单词级别的编码器构成。字母级别编码器是一个层级式的循环神经网络结构，单词级别编码器则是一个双向长短期记忆神经网络 LSTM；语言学特征编码器也是一个 LSTM 结构，主要用于编码提取的语言学特征，为语境编码器提供额外的信息；用户编码器是一个全连接的结构，用于记录用户的第二语言能力与学习历史；题型编码器则是用来编码题型、答题方式等信息。”

秦龙认为，自适应学习其实并不是某项单一技术，而是涵盖教育学、心理学、认知科学、计算机科学等多学科知识在内的一个庞大的概念。

“现在绝大多数中国公司做的自适应学习，其实是题库+推荐，首先建一个非常大的题库，然后题库里的每道题会标注一定的信息，即所谓的打标签、知识图谱，就是用人工去标注一些知识点上去（labor intensive work），然后让学生做题，如果题做错了，下一步就是推荐类似习题。”

“目前绝大多数公司做的推荐题的系统和今日头条推荐新闻的系统没有本质的区别，甚至用的是一样的技术，你这个题错了，我就去题库里找和这个题接近的题，然后把这个题推荐给你让你做。这套东西覆盖了国内95%以上所谓做自适应学习的公司。”

自适应学习技术难点有待突破

据秦龙介绍，自适应学习最大的难点在于 knowledge tracing，它需要判断一个人学习了一段时间以后，对于过去的知识点的掌握程度，目标就是在最短的时间内判断的越准确越好。

“这个事其实蛮难的。最终只能通过做题、考试，根据学生做题的正确率来判断。”

“包括现在大家都在说的 DKT（Deep Knowledge Tracing ），其实，学术圈对DKT并没有定论，并没有说 DKT 会比传统的 KT 的效果要好，还存在争议。实际上 DKT 是在2015年发表出来的论文，2016年，有几个不同的机构发表了两三篇论文，从理论上分析是否 DKT 比传统的 KT 方法要好，另外也去按照作者开放的代码复现实验结果，但是在有一些数据集上复现出来的结果并不是很好，学术圈当时对此有一些质疑。2017年以后至今，又有一些论文发表，主要研究怎么才能把 DKT 做的更好，并且借鉴了传统的 Knowledge Tracing 的一些方法，所以其实整个DKT还是 ongoing research,不能说正在研究的方法一定就好，这是一个误解。”

据秦龙介绍，目前大部分公司其实做的还是推荐，真正涉及到 Knowledge Tracing 的可能不到5家。

秦龙认为，自适应学习替代老师基本不可能，但有一定价值，比如可以给学生一定的指导，并且可以提高刷题效率。

最后，秦龙用两个词总结了先声教育的核心优势，即“准确”和“专业”，准确是指技术层面针对不同公司的需求做到精度最高，专业是指先声教育更懂教育。真实情况的教育场景千差万别，不能一概而论，先声教育会对每一个具体场景深入调研，未来，先声教育也会在技术方面做进一步深入研究，同时，除了技术服务，也会做内容上的研发，打造整体的教育解决方案。

前有“老大哥”，后有“新势力”，AI+教育江湖谁主沉浮？

CNNIC最新报告：K12英语在线教育火爆，AI+教育驱动产业升级

专访先声教育CTO秦龙： 专注AI技术研发，做教育行业的“DeepMind”

专注B端，为教育机构输出AI技术

自适应学习不是某项技术，而是一个庞大的概念

自适应学习技术难点有待突破