距离机器翻译的“语言全球化”还有多远?

在全球化迅猛发展的大环境下,工作、学习、出行、社交......各领域中跨语言交流早已不再罕见,在人工翻译无法完全满足各种条件下的翻译需求时,机器翻译的使用便成为一种必然的发展趋势。

翻译性能的高低无疑为衡量机器翻译引擎的一条重要标准。机器翻译发展至今,基于神经网络的机器翻译技术已然成为主流,再配以大规模的语料训练,使得许多翻译引擎之间在大语种上的翻译质量并未有过于悬殊的差距。

然而对于用户来说,是否支持自己所需要的语言,才是决定是否选择这套机器翻译引擎的决定性因素。
随着全球化进程的不断推进,贸易往来已不仅仅局限在各主流国家间,更多较为冷门的国家及地区也跻身于世界贸易往来的行列中。基于此,市场对于小语种的翻译需求正在与日俱增。
市场需求驱使机器翻译引擎在“语言全球化”的路上不断行进,各家研发团队早已不满足于主流语言的翻译研究,马不停蹄的开始对于一些小众语言的语料训练,在提高翻译性能的同时也在致力于突破更多的语言数量。打开某家翻译引擎,许多我们连读汉语名字都拗口的语言已然上线。
近日,小牛翻译团队对于小牛机器翻译引擎目前所支持的140个语种的全球覆盖情况进行了统计,其中包括63个”一带一路“周边国家及地区、190个联合国会员国
“一带一路”国家及地区贯穿亚欧非大陆,并不设立具体的地理边界,目前共有65个相关国家及地区,其中包括1个东亚国家、10个东盟国家、18个西亚国家、8个南亚国家、5个中亚国家、7个独联体国家及16个中东欧国家,共54种官方语言。
目前小牛翻译已经支持其中的51种官方语言(黑山语、迪维希语和宗喀语三种未支持),覆盖了63个国家(马尔代夫和不丹未覆盖)。
联合国共有193个会员国,共116种官方语言,目前小牛翻译已支持其中的89种官方语言,覆盖190个国家(不丹、马尔代夫和帕劳未覆盖)。
剩下未覆盖的3个“一带一路”国家的官方语言及27个联合国会员国的官方语言,是小牛翻译明年和后年的奋斗目标,我们将为更多用户解决跨语言交流障碍。
目前世界上已经查明的语言有5651种,其中包括1400多种还未被人们承认为独立的语言或正在衰亡的语言。在全球化进程中,即使是被极少数人使用的语言也有可能被需要到。
如此庞大的语言数量,对于机器翻译引擎研发工作者来说,无疑是巨大的挑战。
小牛团队不会停下在机器翻译领域研发的脚步,希望有一天我们的机器翻译引擎所支持的语言能够覆盖全球所有国家和地区的官方语言,任意两种官方语言能够实现自动互译,实现小牛翻译“为全球用户提供机器翻译服务能力”的目标。
互动时间
#既然任重道远,不如鼓励一下#
(0)

相关推荐