用帽子戏法打破次元壁:当武磊牵手科大讯飞
最近留心体育行业的人会发现,体育界正和AI界产生奇妙的交织。
西班牙当地时间8月5日,科大讯飞旗下消费者产品讯飞翻译机与皇家西班牙人足球俱乐部及武磊签约仪式在巴塞罗那正式举办。自此武磊正式成为科大讯飞翻译机首位品牌代言人,讯飞翻译机则成为皇家西班牙人足球俱乐部官方翻译合作伙伴。
在人们的普遍印象里,体育明星接的代言大多是运动品牌。这次武磊与讯飞翻译机牵手,一个是国际足球赛事上知名的中国面孔,另一个是中国AI领军企业推出的经典产品,两者之间的次元壁,为什么会突然破裂呢?
从一位球员的异国之旅,
看我们为什么需要翻译机
首先我们需要了解到的一点是,当很多人没有接触过翻译机时,往往会产生疑惑——手机上有大量翻译软件,我们为什么还需要翻译机?
其实对于武磊这样身处异国的体育从业者来说,他们所面临的困难,恰好是与翻译机产品的功能相匹配的。我们不如想象一下,当一位球员开启异国之旅时,在语言上会遇到哪些困难?
比较典型的是,当我们赶赴海外时,很快会发现大语种的普及率远没有想象中那么高。就拿官方语言是西语的西班牙来说,也会有不少说着小语种的移民。即使他们会说官方语言,也常常因口音问题出现难以理解的情况,尤其对于足球运动员这种工作环境相当国际化的行业来说更是如此。
这时想要与当地人进行通畅交流,光凭手机软件上的几种官方语言显然是远不足够的。
另外当我们想到与他人交流时,下意识涌入脑海的通常都是问好、点菜等等旅游日常用语。实际对于武磊这种深入异国生活工作的人来说,每天面对的却是大量行业术语。举例来讲,Sweeper一词,在日常用语中是清洁工、扫地机器人的意思,但在足球行业中的解释却是“自由中卫”。
这一点别说是翻译软件,恐怕就连人工翻译面对不同的领域都不一定能顺利完成任务。
当然还有最常出现的网络问题,在海外很多地方,互联网信号铺设是远不如中国的。当网络情况不支持翻译软件的云端数据请求时,依赖互联网的翻译软件显然无法发挥作用。这一点对于频繁出差,常常要面临无网络情况的球员来说尤其如此。
总之我们可以发现,在海外沟通需求上,还有很多场景存在的痛点,是单纯的翻译软件无法解决的。
讯飞翻译机3.0的帽子戏法
在科大讯飞最新推出的讯飞翻译机3.0上,我们就能清晰地看到翻译机产品是如何解决上述问题的。
首先是两项“特殊能力”,方言翻译和行业翻译。
通过对海量方言语言数据的收集和标注,科大讯飞获得了独有的方言数据集,增强语音识别算法的鲁棒性。其中不仅包括中文的粤语、东北话、四川话、河南话,也包括了外语中颇令人头疼的“印度腔英语”、“澳大利亚腔英语”等等。这一系列方言都可以被精准识别,从而保证翻译的正确性。
面对复杂的行业术语,科大讯飞根据行业数据累积集合专家知识,构建了用于不同行业的知识图谱,包括体育、医疗、金融、法律等七个行业。如此以来,就可以很好地避免同一词汇在不同行业术语中寓意不同而造成的翻译错误,提供更专业精准的翻译,也方便那些在海外生活、工作的人应对不同场合的沟通需求。
除了特殊能力之外,讯飞翻译机3.0上还能看到讯飞扎实的“基本功”。
其中包括原创自进化离线引擎,通过终端算力与引擎的配合,支持弱网络、无网络情况下的翻译需求。同时还有拍照翻译能力,通过OCR识别从图片中提取文字,进而能满足纸张、路牌、菜单等等语音之外的文本翻译需求。
从特殊能力到基本功,讯飞翻译机3.0使出了一套漂亮的帽子戏法,满足了人们在翻译上的三层需求。
1、 在沟通对象上的广泛性。除了与服务人员这类官方语言标准的对象进行沟通外,人们同样也有与非服务人员沟通的需求,比如药店的医生、警察局里的警察等等。如果在海外工作、学习和生活,更要和各种各样的当地居民打交道。而方言翻译的能力,就可以满足人们在这方面的需求。
2、 在沟通内容上的深入性。随着中国在国际化道路上越走越远,我们在海外沟通上的需求也越来越多样。大量中国人开始赶赴海外投资、就业、读书,所涉及到的专业领域也越来越多。只有行业翻译能力越来越丰富,才能满足这种趋势。
3、 在沟通能力上的稳定性。想要人们对技术产生信任乃至依赖,保持继续在各种环境下的稳定表现是很重要的。其中就包括了不同网络环境和不同的翻译内容介质。一个人想要依靠机器翻译能力在海外顺畅的游玩甚至就业,自然需要翻译机在各种网络环境下都能平稳运行,并且能应对语音、文字、图像等等多种翻译需求。
通天塔的砖石:科大讯飞的技术底气
和球场上一样,神奇的帽子戏法不是天降奇迹,而是来自于球员长期以来的累积。
讯飞翻译机3.0的对于三层需求的满足,究其根由来自于科大讯飞在机器翻译技术上的累积。
科大讯飞的翻译技术由神经网络机器翻译驱动,相比统计方法的机器翻译技术,神经网络机器翻译可以将语句向量化,转化为计算机可以理解的形式再生成译文。这样一来,可以极大地加快语料学习速度,并提升译文的流畅性。
从科大讯飞发布过的论文《基于中断循环神经网络的文本分类》来看,科大讯飞通过对CNN和RNN进行变体,用全新的模型捕捉长距离依赖信息,理解语境和上下文,又可以很好地抽取关键短语信息,保证翻译的准确性。
建立在技术底气之下,科大讯飞机器翻译技术取得了很多让人印象深刻的成绩:2018、2019年,科大讯飞在智能语音及人工智能领域获得20项世界冠军,在语音识别、语音合成、机器翻译等领域都占据国际领先优势。作为最早将神经网络算法应用于机器翻译领域的品牌,讯飞翻译机中英离线翻译准确率高达95%,接近于大学英语六级水平。讯飞翻译机所使用的机器翻译系统达到了国家翻译专业资格认证考试(CATTI)技术标准,比肩专业译员水平;并连续十四年获得 “国际语音合成大赛”冠军。此外,讯飞翻译机所使用的语言识别技术已经连续两届获得CHiME Challenge(国际多通道语音分离和识别大赛)冠军。在刚刚结束的Blizzard Challenge 2019 国际语音合成大赛中,科大讯飞再次夺冠,拿下了该赛事的第14个冠军。
凭借技术上的能力和口碑,科大讯飞还为整个行业制定下了AI翻译标准——清、懂、准和美。听得清、听得懂、语义准、语言美。可见科大讯飞的目标,是让机器翻译达到人们日常沟通对话时的标准。从这一标准中我们也能发现,翻译的本质,就是“沟通”,让不同语言、不同文化、不同行业之间的人进行顺畅沟通。
结束语
讯飞翻译机与武磊,机器翻译与体育运动,这些看似毫不相及领域之间次元壁的破裂,实则证明了AI与文体结合之后,所碰撞出的强大力量。这一次合作背后,也展示出了科大讯飞借以讯飞翻译机更高效打入C端应用市场的决心。
相信未来我们将会看到,科大讯飞在追求技术高度的同时,将不断推出更多适用性广泛的软硬件,把技术能力赋能到生活场景,让AI在真正的应用场景破土生长。