前段时间,一则新闻几乎刷遍了整个网络。Google新发布了神经机器翻译(GNMT:Google Neural Machine Translation)系统,并称该系统使用了当前最先进的训练技术,能够实现到当下机器翻译质量上最大的提升。
有从事翻译职业的网友甚至这样形容:
作为翻译看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。
这种看法未免有点杞人忧天。尤其是在业内专家看来,机器翻译的效果还远未达到取代人类专家翻译的水平。实际上,谷歌此次应用的技术并非最新的“黑科技”。早在2015年百度就已经发布了基于深度神经网络的端到端翻译系统,微软的必应翻译也同样使用神经网络技术来改善自身的翻译质量。 与传统的基于短语的翻译(PBMT)相比,基于神经网络的翻译系统对整个输入句子进行编码,能够更充分的利用上下文信息,生成较高质量的译文。
最近大家热议的Google神经机器翻译目前只是在应用在中译英中,所以以下测试都是在中译英部分下进行。分别从几个角度来参看百度、Google、必应等几个翻译软件的实际使用效果如何:
复杂语句翻译
1. 定语从句(用一个句子修饰一个名词短语):
我没有可以跟你说的事情。
从上至下依次为Google翻译、百度翻译、必应翻译
2. 多个修饰形容词
从上至下依次为Google翻译、百度翻译、必应翻译
3. 长短句翻译
从上至下依次为Google翻译、百度翻译、必应翻译
4. 俚语翻译
从左至右依次为Google翻译、百度翻译、必应翻译
可以看到,在定语从句部分Google与百度的翻译结果相差无几,语句通顺连贯,两者比较的话Google翻译的结果更为接近标准答案一些。另一方面,必应翻译的结果则与本意有所出入。
在多个形容词部分,三者翻译出了大概意思,但是遇到黄老板以及黄山这类在名词与形容词中易混淆的部分时,似乎百度翻译要更为准确一点。
在长短句部分,Google翻译与必应翻译都出现了同时翻译两次时态及动词“have seen"的情况,虽然百度翻译并未出现这种情形,但是其在两个名词之间并未翻出连接词"and“,对语句理解有一点影响。
涉及到俚语翻译部分时,Google翻译几乎完全是根据词组翻译出了字面的意思,而必应则出现了奇怪的省略情况,语义并不连贯。相较之下,百度翻译将原句引申含义也翻译了出来,并保持了语句连贯与准确度。
口语化表达翻译
1. 修饰词,如:的、了、好
2. 省略与重复叠加短语句子
在口语化翻译部分中,涉及到修饰词部分,Google与百度翻译大同小异,必应翻译与本意出入较大。
但是在重复叠加短语部分,从主观上来看百度翻译将”冒着“翻译为”Take“,相比Google与必应的”Brave“,其在语义通畅易读以及连贯度上表现要更好一些。
1. 短段落
2. 长段落
在段落整体翻译部分中,三者对于段落基本语义都翻译出来了。其中Google翻译在某些连接词的翻译上更为简洁一些,而百度与必应则会在某些位置增加一些连接词汇。
但是在涉及到长短句、语气词、多重修饰词部分,三者在某些地方都表现一般。
例如:“父亲是一个胖子,走过去自然要费事些。”
Google译为“Father is a fat man, go over the natural to be more trouble. ”
百度译为“My father was a man, go to some trouble.”
必应则译为“ Father is a fat man, walk naturally want to bother about.”
三者从连贯性来看都不算太好,但是从语义上来看Google翻译更为优秀一些。
再如:“于是扑扑衣上的泥土,心里很轻松似的,过一会说,“我走了,到那边来信!”
Google译为“So flutter clothes on the soil, and my heart is very easy to like, after a while that, "I go; to the other side of the letter!””
百度译为“Then suddenly the dirt on the clothes, he looked somewhat relieved and said after a while, "I will go over there; letter!"”
必应则译为“ Poop clothing and boots, felt very relaxed, one would say,"I'm leaving; to write! "”
此处三者的翻译都不太好,从对应词组的翻译来看,必应翻译的效果要好一些,但在缺少主语的情况下翻译成“One”并不正确。Google翻译直接理解将整个句子中的主体都默认是一个人,百度翻译准确识别出了讲话的是父亲,即“He”,但其在从句部分结构有错误。
1. 离线翻译
在离线翻译部分,从测试的语句来看,Google翻译的效果勉强能看懂,百度需要先购买离线包才能进行翻译,必应则不提供离线翻译功能。
2. 图片翻译
图像翻译部分使用今日头条的统一页面
从左至右依次为Google翻译、百度翻译、必应翻译
其中谷歌翻译可以做到手机放在图片前面,不做任何操作开始实时翻译。按拍照按钮后,涂抹想翻译的部分,然后翻译出相应的结果。
相比谷歌翻译,百度没有放在图片前面不做任何操作开始实时翻译的功能。不过百度翻译在按拍照按钮后,也能涂抹想翻译的部分翻译出相应的结果。但百度翻译的个性化功能最全,有
实物翻译
长句翻译
菜单翻译
单词翻译
四大类,且自定义功能最完善。
另外,百度翻译提供的实物翻译与菜单翻译功能在某些场合也能派上用场。
必应翻译只能先拍照再进行翻译,也无自定义功能选项。
3. 语音翻译
在语音翻译部分,正确的句子是:你好,我想打死李某。 Google和百度的翻译效果差不多类似,必应则不提供语音翻译功能。
此外,Google翻译提供多种语言的语音输入功能,百度目前只提供中文、英文、粤语(Google翻译中并未提供)语音输入功能。两者的语言识别输入功能也都十分不错,准确率很高且语句通顺连贯。并且两者都能以对话模式呈现,相信在商务或者旅行过程中会带来不少便利。
从上至下依次为Google翻译、百度翻译
从上面的各项对比中可以看到,采用了神经机器系统的翻译相比之前基于短语的翻译确实要进步了许多。再也不是之前那种读起来总感觉哪里不对的感觉,甚至有些翻译结果已经到了稍加修改勉强能用的地步。
但是具体到使用过程中,比如需要对复杂语句以及口语化表达进行翻译时,大部分时候Google翻译与百度翻译的表现相对优秀一些。不仅在流畅度、语义保持上效果相对优秀,而且在句子错误率以及单词错误率上也要相对少一些。
另外,在图片翻译部分,Google翻译能做到实时翻译的效果,且准确度不错。百度翻译虽然没有实时翻译的功能,但是其自定义功能最完善,且能选择四大类个性化功能,针对性更强。
综上所述,添加了神经网络的机器翻译相较于往日的确不可同日而语了。在某些方面已经隐隐约约接近人类翻译的水准,所以有相关翻译人员担心也不算夸张。不过对于普通人而言,在有相关翻译需求时,综合词语、段落准确率以及语义流畅度来看,百度翻译目前是一个不错的选择。