雷锋网 AI 科技评论按:7 月 9 日,自然语言处理顶会 ACL 公布了最佳 demo 论文的四篇候选论文,名单如下:
CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation
Out-of-the-box Universal Romanization Tool
Platforms for Non-Speakers Annotating Names in Any Language
YEDDA: A lightweight Collaborative Text Span Annotation Tool
值得注意的是,四篇论文中有三篇论文的一作是中国研究者,他们分别是目前任职于三星美国研究中心的 Yilin Shen,伦斯勒理工学院博士生 Ying Lin,新加坡科技设计大学(SUTD)博士生 Jie Yang。最佳 demo 论文奖将在主会最佳论文 session 环节揭晓,届时雷锋网 AI 科技评论将会第一时间带来现场报导。
本文将对这四篇论文进行简单介绍。
CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation
CRUISE:基于迭代语料生成的冷启动新技能开发
论文摘要:我们提出了 CRUISE 系统,它可以指导普通软件开发者从头开始构建高质量的自然语言理解(NLU)引擎。构建该引擎是给个人助手(智能语音助手)添加新技能的基础步骤。与开发者或众包手动标注大量语料的现有解决方案不同,我们设计了一种基于规则和数据驱动的混合方法,该方法可以迭代生成越来越多的语料。我们的系统只需要少量人工在迭代中修改错误语料即可。CRUISE 系统会生成一个「训练有素」的 NLU 引擎,同时还会生成一个大型已注释语料库,第三方可以基于此来开发自定义技能。通过使用基准数据集和自定义数据集,我们收集到了现实世界的设定,NLU 性能比赛和人类评价则证实了 CRUISE 生成语料的高质量。我们的工作大幅降低了人类认知负荷,同时缩短了人工剪枝时间。
论文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin
Out-of-the-box Universal Romanization Tool
开箱即用的通用罗马化工具
论文摘要:我们想介绍 uroman,这个工具可以把五花八门的语言和文字(如中文、阿拉伯语、西里尔文)转换为普通拉丁文。该工具基于 Unicode 数据以及其他表,可以处理几乎所有的字符集(包括一些晦涩难懂的语言比如藏文和提非纳文)。uroman 还可以将不同文本中的数字转换为阿拉伯数字。罗马化让比较不同文本的字符串相似性变得更加容易,因为不再需要将两种文字翻译成中间文字再比较。本工具作为一个 Perl 脚本,可以免费提供,可用于数据处理管道和交互式演示网页。
论文作者:Ulf Hermjakob, Jonathan May,Kevin Knight
Platforms for Non-Speakers Annotating Names in Any Language
未知语言标注平台
论文摘要:我们将演示两个标注平台,在该平台上,英语母语者即使不熟悉某种语言也可以用该语言进行标注。这些平台可以为低资源语言提供高质量的「银标」注释。平台目前在 LoreHLT20171 上的奥罗莫语和提格里尼亚语上取得了最佳成绩,在 TAC-KBP EDL2017 的十项语言上取得了最佳成绩。我们讨论了平台的优点和局限性,并与其他的未知语言标注方法进行了比较。我们将向研究者们公开该工具。
论文作者:Ying Lin, Cash Costello, Boliang Zhang, Di Lu, Heng Ji, James Mayfield,Paul McNamee
YEDDA: a lightweight collaborative text span annotation tool
YEDDA:一种轻量型文本范围注释工具
论文摘要:在论文中,我们将介绍 YEDDA——一个轻量、高效且全面的开源文本范围注释工具。Yedda 为文本范围注释提供了系统化的解决方案,涵盖了用户协作标注到管理员评估与分析等需求。Yedda 可以用命令行和快捷键对文本进行标注,并以此克服传统文本标注工具的低效率,用户可以自定义命令行和快捷键。Yedda 还可以通过学习最新标注文本智能化为用户提供标注意见。我们还开发了管理员客户端用以评估多个注释器的标注质量,并为每个注释器生成详细的比较报告。实验表明,相较于现有标注工具,我们的系统可以节省一半的时间,使用智能推荐还能再节省 16.47% 的时间。
论文作者:Jie Yang, Yue Zhang, Linwei Li and Xingxuan Li
via:https://acl2018.org/2018/07/09/best-demo-candidates/
雷锋网 AI 科技评论将会第一时间为大家带来 ACL 现场报道,敬请关注。