作者|王玥
ACL 2022官方发布消息称,清华大学自然语言处理与社会人文计算实验室获得ACL 2022最佳演示论文奖(Best Demo Paper Award)。
该奖项是ACL系列会议对System Demonstration论文授予的最佳论文奖项,每届会议基于评审人员评估的系统贡献度、完成度、影响力及会议演示综合效果的综合评价评选出一篇获奖论文。
图注:ACL 2022 官网宣布奖项页面
据悉,清华NLP此次获奖的论文题为“OpenPrompt:一种用于提示学习的开源框架(OpenPrompt: An Open-source Framework for Prompt-learning)”。作者为丁宁*,胡声鼎*,赵威霖*,陈雨琳,刘知远,郑海涛,孙茂松(*代表共同第一作者)。
论文地址:https://arxiv.org/abs/2111.01998
该篇论文提出了OpenPrompt,这是一个统一的易于使用的提示学习(Prompt-learning)编程工具包。
图注:OpenPrompt的总体架构
提示学习是现代自然语言处理驱动预训练语言模型的新范式,提示学习通过插入额外的上下文和标签映射,直接将下游任务组织成模型的预训练任务(如Masked Language Model)来进行训练,在多种NLP任务上取得了很好的表现。
然而,目前尚且没有一套针对提示学习的编程框架,现有的提示学习代码库往往在传统的微调范式下做出改动,只为特定场景提供有限的实现。由于提示学习是预训练任务与模型、NLP下游任务、先验知识的综合过程,在实现中往往需要考虑很多细节,如模板(Template)和标签(Verbalizer)映射生成策略等等,这些细节问题在实践中可能会给编程者带来诸多障碍。
这篇文章提出了OpenPrompt。据介绍,它具有高效、模块化和可扩展性的特点,同时其可组合性允许使用者在一个统一的范式中自由组合不同的预训练模型、任务形式和提示模块。使用者可以方便地部署提示学习框架,并不受限制地评估它们在不同的NLP任务和模型上的通用性。OpenPrompt在GitHub上已开源,目前已收到约1500颗星标,受到了业界的关注和认可。
清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于20世纪70年代末,最初在黄昌宁教授的带领下从事中文信息处理方面的研究工作,是国内开展自然语言处理研究最早、深具影响力的科研单位。
THUNLP 实验室学术带头人为孙茂松教授。据清华大学官网介绍,孙茂松教授为清华大学计算机系教授,清华大学人工智能研究院常务副院长及博士生导师。他的主要研究领域为自然语言处理、互联网智能、机器学习、社会计算和计算教育学。
图为孙茂松教授
孙茂松教授在国际刊物、会议及国内核心刊物上发表多篇论文,Google Scholar总引用数约2,4300次。
THUNLP的亮点工作,要属孙茂松教授带领的THUAIPoet团队研发的“九歌”中文诗歌自动生成系统。“九歌”支持集句诗、绝句、藏头诗、词等不同体裁诗歌的在线生成。作为目前最有影响的诗歌生成系统之一,“九歌”曾于2017年登上央视一套大型科技类挑战节目《机智过人》第一季的舞台,与当代优秀青年诗人同台竞技比拼诗词创作。
图注:“九歌”工作界面
2017年上线至今,“九歌”已累计为用户创作超过700万首诗词,并于全国计算语言学学术会议(CCL)荣获最佳论文奖(2018)和两次最佳系统展示奖(2017, 2019)。
THUNLP实验室瞄准以中文为核心的自然语言处理前沿课题,在中文信息处理、机器翻译、社会计算、智慧教育和知识图谱等方面开展系统深入的研究,不仅手握“九歌”这样的亮点工作,更取得了一系列有世界影响力的原创成果,培养了一批人工智能优秀人才,在国内外具有较大的学术影响。
参考链接:
https://www.2022.aclweb.org/
https://www.2022.aclweb.org/best-demo-paper-award
http://114.215.64.60:8094/site2/index.php/en
https://www.cs.tsinghua.edu.cn/info/1121/3554.htm
https://openhownet.thunlp.org/about_thunlp
https://scholar.google.com/citations?user=zIgT0HMAAAAJ&hl=en
雷峰网(公众号:雷峰网)