被Diss造假，科大讯飞说从未提出过“AI同传”概念

科大讯飞 AI同传

作者：李诗

2018/09/21 18:21

随着各大公司都在推AI同传，同传从业者似乎都面临着饭碗不保。

AI同传真的能取代人类同传？

9月21日，众多媒体报道，科大讯飞AI同传被指造假。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

事件起因是，9月20日，一位ID为Bell Wang的用户在知乎发文“科大讯飞，你的AI同传操（qi）作（zha）能更风骚一点吗”，狠狠Diss了科大讯飞 AI同传，指出科大讯飞在现场和直播展示的AI同传其实用的是人类同传翻译结果。这件事情随即引发了微博上不少同传从业者的讨论和众多媒体报道。

科大讯飞董秘江涛对记者回应称，“讯飞从没讲过AI同传的概念，始终强调是人机耦合的模式。”

随后，科大讯飞官方也给出了解释：

被Diss造假，科大讯飞说从未提出过“AI同传”概念

科大讯飞的意思是他们提供的是语音识别技术，并不是AI同传，也并没有提出AI同传的概念。但是在这次事件中，科大讯飞的做法确实引起了误解，事件还存在多处争议，例如科大讯飞是否有意混淆AI同传与人工同传，科大讯飞的人机耦合具体如何操作？

我们先来回顾下Bell Wang描述的事情经过。

9月20日早上，Bell Wang来到上海国际会议中心，支持2018创新与新兴产业发展国际会议（IEID）的高端装备技术与产业分会的现场同传工作。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

大会的第一位嘉宾是日本教授，由Bell Wang的同事进行英文转中文的同声传译。大会现场有三块屏幕，中间是发言人的演讲PPT，左右两边分别以中文和英文的方式呈现演讲字幕，两边屏幕都有 “讯飞听见” 的logo。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

（图片来自知乎用户Bell Wang)

Bell Wang发现英文字幕跟日本教授的说话内容有很大出入，“可以说是胡话连篇了”，也就是说“讯飞听见”难以听懂日本教授酸爽的英语。

但是呢，另一边的中文字幕却是相当连贯，显然不是机器翻译的。他也给出了实锤：

被Diss造假，科大讯飞说从未提出过“AI同传”概念

（图片来自知乎用户Bell Wang)

上图这句话里有“就是”这样的连词，这是同传人员顺句驱动时用于联系语句用的。还有就是讯飞听见将“Davos Forum”听成 “Devils Forum”的时候，中文翻译却正确地显示成“达沃斯论坛”。

按照正常流程，讯飞听见是先识别英文，然后翻译成中文，如果英文的识别错了，如何能翻译正确呢？

Bell Wang认为，“讯飞听见”Logo会让人误以为中文字幕也是来自“讯飞听见”，不过他也意识到，讯飞并没有直接说中文字幕是自家AI翻译的。所以他在文章也说他当时能脑补出科大讯飞被戳穿后的辩词：“我们这次使用的产品是讯飞听见，识别同传的翻译打在屏幕上方便听众，并无意冒充AI同传，对恶意造谣者，我们保留诉诸法律的权力”。

Bell Wang说自己当时的心态是觉得恶心，但是也只能忍了。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

真正让Bell Wang起心要Diss科大讯飞是大会直播。知领直播介绍称“国际高端会议听不懂，知领更懂你！本次知领直播引入科大讯飞智能语音技术，实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报，带给你不一样的试听体验！”

Bell Wang用手机录了一段直播视频，直播里是一位说中文的教授，然后讯飞AI说出的是英文。视频中，教授在说：“讲者说可以挖掘数据，放入图表”，但是讯飞却说的是“put it in charge”，如果是讯飞将中文翻译成英文，绝不可能出现这样的情况。实际情况是讯飞识别了同传人员的翻译“put in chart”，误听成了“put in charge”。

也就是说，讯飞不是在做AI同传，而是识别了同传人员的语音翻译然后念了出来。Bell Wang声称自己事先并不知道讯飞会用语音识别将同传转化为文字，同时也不知道直播会用AI识别同传人声翻译再播报出来，是没有征得同意就冒名使用翻译成果。

最后Bell Wang说道 “也许有一天AI真的能做到理解自然语言，也许有一天我们这个职业会失业，但绝不是现在；真正突破性的技术也不可能由一个没有操守的公司研发出来。技术是无罪的，但以技术为名吸引资本的目的会不会导致虚假包装和营销呢？呵呵呵呵。”

以上是雷锋网编辑根据Bell Wang在知乎的发文进行的事件还原。

结合科大讯飞的回应，雷锋网认为有不少关键点值得讨论。

首先，科大讯飞是不是在造假？

IEID大会上，科大讯飞用“讯飞听见”识别了演讲嘉宾的发言，将语音转化为文字呈现在了屏幕上，同时也将同传人员的语音翻译转化为字幕呈现在另一块屏幕上，这次大会上讯飞没有用到自家的AI翻译，但是却没有表明翻译是来自于同传人员，会让人误导全程是“AI同传”。同传人员翻译的成果明显好于AI，则会进一步误导大家“AI同传”已经达到与真人翻译一样好的效果。

大会现场，语音识别转文字有很好的优势，因为很多时候要听英文，又要听同传耳机中的中文翻译会干扰人的注意力。那么，直播为何不用同传的原声呢?科大讯飞的解释是，避免收听不畅。

科大讯飞先识别了同传人员的语音翻译结果，然后再用AI将翻译结果语音播报出来。可是，AI语音播报时却出现了多次错误，这是不是有点多此一举？

科大讯飞全程没有用到AI翻译，但是知领直播却介绍说：“引入科大讯飞智能语音技术，实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报，带给你不一样的试听体验！”

其次，人机耦合模式到底是啥？

讯飞从没讲过AI同传的概念，始终强调是人机耦合的模式。

从科大讯飞的说明中我们可以看出科大讯飞的人机耦合和AI同传确实不是一回事，“在十位嘉宾演讲中，除了三位是由人工同传的语音转写探索人机耦合模式，其余的全部是机器全自动转写。并且，为了让观众看得清楚，机器全自动转的都采用中英文同屏显示，人工同传转写的都只显示一个语种”。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

可以看到，大会上两个屏幕分别显示中文和英文，没有同屏显示。但是这样微弱的区分，谁能清楚掌握？更合适的方式或许是直接表明此次大会的同传由人工提供吧。

况且，这次大会是纯人工，也没用到所谓的人机耦合。除非，科大讯飞所谓的人机耦合就是讯飞听见”将同传人员的翻译结果转成文字吗？这样的话，机器并没有做任何与同传、翻译相关的事情。

最后， AI同传目前究竟什么水平？

其实，AI同传因为能力不济在大会上出洋相的例子很多。

今年4月，博鳌亚洲论坛有4场分论坛应用了腾讯AI同传，结果，腾讯AI同传现了单词乱码、连续出现同一个单词的卡机状况。

被Diss造假，科大讯飞说从未提出过“AI同传”概念

最囧的是，腾讯AI同传将“一带一路”变着花样翻译成了好几种不同的说法。

此外，到目前为止，支持数百场会议的搜狗AI同传，在大会上也时常出现各种错误。目前AI语音转写的准确率只有90%左右，转写过后再翻译的话，准确率自然更低。

所以，科大讯飞董事长刘庆峰多次表示，AI目前的翻译水平还达不到同传的要求。也一直强调AI不可能取代同传从业人员，未来会是人机耦合。

AI同传水平不济，但是大家却已经没有耐心等待其完全成熟。在雷锋网看来，不断试错能促进发展，但是直面弱点才能有所成长吧。