谷歌翻译十周年,神经网络机器翻译系统现在更讲逻辑和层次 ...
对于很多依然在学校里埋头苦学的学生来说,谷歌翻译可能是日常学习中最常见的翻译工具,但是可能很少有人知道这项服务在昨天已经迎来了十岁的生日,而谷歌也Google Research的官方博客中隆重介绍了未来的神经网络机器翻译系统。
在十年前谷歌试用的是“基于短语的机器学习系统(PBMT,Phrase-Based Machine Translation)”,这个很多人都有体验,在试用中英互译的时候,翻译往往跳出了对话的逻辑和上下文的联系,很明显翻译的重点在于字词与字词之间的对应。
谷歌在博文中表示他们在几年前开始尝试利用“循环神经网络(RNNs,Recurrent Neural Networks)”建立输入语言和输出语言之间的映射。早期的PBMT往往将输入语言分裂为若干单词和短语再单独翻译,因此我们早期如果将作业和论文利用谷歌翻译会看到极为碎片而分裂的结果,而神经机器翻译系统则更智能地将翻单位进化为句子,也就是一句一句完整的翻译。自此谷歌的研究人员便在神经网络翻译系统上加大投入,通过下图的示意图我们可以看到谷歌神经机器翻译系统如何将一句中文翻译为英文。
谷歌表示在多个样本的翻译测试中神经落网机器翻译系统减少了55%-85%甚至更多,通过下面的翻译样本对比我们可以看到最早期,也就是基于短语的翻译系统一如既往的分裂和碎片化,而谷歌神经网络机器翻译系统虽然和人工翻译效果虽然尚有差距,但是基本的逻辑已经正确采集。
其实谷歌现有的网页版和移动版的中英翻译系统已经完全使用神经网络机器翻译系统,每天的翻译量为1800万条,这看上去确实是一个不小的量。我们特意对比了谷歌翻译和必应翻译的翻译结果,小编随便打了两段话,可以看到谷歌和必应对于整段话的逻辑、语义都捕捉的八九不离十,具体的用词、过度和用法的评价还是交给读者吧,小编个人更喜欢必应的翻译(以下对比图支持点击放大)。
谷歌中译英
必应中译英
谷歌英译中
必应英译中
关注微信号expkf01,第一时间获知精彩活动和原创科技资讯。