当科大讯飞还在博鳌上刷存在感,搜狗已经准备好引领AI翻译机的下一波浪潮
如最近进行中的博鳌亚洲论坛,科大讯飞就让新品讯飞翻译机2.0露了个脸。但看到科大讯飞的新品,我们却想问问搜狗旅行翻译宝——领先行业整整一代,是一种怎样的体验?
对手换代,为什么搜狗还能领先?
科大讯飞新品讯飞翻译机与上一代产品晓译相比,主要有两处不同。第一处是增加了LCD屏幕,让被翻译的语言可以通过屏幕显示出来。第二处则是增加了拍照翻译的功能,利用OCR技术识别图片中的文字,无需手动输入或朗读即可进行翻译。
如果读者对此前我们介绍过的搜狗旅行翻译宝还有印象,会发现在搜狗翻译宝一月份的产品发布会上,就已经推出了拍照翻译、离线翻译和大屏显示这些创新功能。如今科大讯飞的跟进,更证实了智能翻译机的进化路径。
从智能联网翻译对话的翻译硬件与耳机,到今天升级拍照翻译,wifi热点等,智能翻译机厂商的竞争对手不是同行,而是手机。智能手机在中国有着巨大的保有量,加上先进的翻译App,大部分时候用户语音翻译、文字翻译、拍照翻译方面的需求都可以被很好的满足。这种前提下,智能翻译机几乎没有生存空间。但搜狗旅行翻译宝所作出的改变,就是为了抓住那些不适用手机,却又有翻译需求的场景。比如出境旅行没有网络服务时,或者是在地铁、街头等环境嘈杂不适于手机收音的地方,以及不适合保持手机开机的会议场景等等。
应用于这些场景,搜狗旅行翻译宝在硬件角度做了几方面的提升:
首先搜狗旅行翻译宝搭载了GPU芯片,成为了业内首款搭载GPU的智能翻译机。GPU带来的算力提升让搜狗可以进行终端计算,基于transformer结构进行离线机器翻译。这样一来搜狗旅行翻译宝就可以在离线的场景下,利用终端计算即时实现对照片语音等材料的翻译。在强大的算力加持下,搜狗旅行翻译宝可以实现翻译延迟被控制在1s以内。这种速度对现实场景应用的要求来说已经足够。
其次是添加了高效的拾音技术。全指向性I2S数字双麦克阵列+多项拾音技术,让搜狗旅行翻译宝的收音和识别能力更加强大。在地铁、街头等嘈杂环境,搜狗旅行翻译宝可以有效地规噪声并进行远场拾音,保证翻译的效果。即便是在多人低声交谈的室内,搜狗旅行翻译宝也能准确地收音并即时地进行语音识别。这就扩大了用户的使用场景范围。
最后,搜狗旅行翻译宝加入了拍照翻译功能。500W像素的摄像头和3.1寸 的高清屏幕,再加上搭载的能够处理“复杂背景、光线弱、拍照抖动、文字折行”等问题的OCR文字识别技术,搜狗旅行翻译宝能够实现对用户在旅行中看不懂的问题的“即拍即翻”。这样既能避免费时费力地输入外语,又提高了识别翻译的精准度。
科大讯飞对这些功能的跟进也充分说明了搜狗对翻译机领域的卓识和远见。相信未来智能翻译机整体行业也都会向同一方向发展,通过硬件进化,对不适宜应用手机的场景进行补充,从而找到整个品类的立足之地。
从会议场景到消费场景,
离线翻译才是市场赛点
科大讯飞跟进之后,无疑将提升产品的场景应用能力。但相比搜狗旅行翻译宝,讯飞翻译机2.0仍然不能满足消费市场对翻译机的需求。
比如在屏幕方面,相比搜狗旅行翻译宝搭载的3.1寸的高清屏幕,讯飞翻译机2.0的LCD屏幕的显示面积十分有限。老年用户在使用时很可能会感到不便,更小的屏幕所容纳的信息量也更少,用户需要进行多次翻页等繁琐的操作。
在最关键的翻译功能上,根据清明节前最新一次升级,搜狗旅行翻译宝目前已经能够支持24种语言的的互译,是目前市面上数一数二的能够支持超过20种语种翻译的产品。在离线翻译方面的领先,也是搜狗旅行翻译宝本行业布局的重要一环。毕竟在会议场景中,主办方会为与会者提供强大的网络支持,翻译机可以在联网状态下完成工作。可在现实应用中,比如乘坐交通工具和出境旅游时,智能翻译机的离线翻译能力才是最关键的市场赛点。
正是对这些实用功能的超前预判和提前布局,再加上自身语言产品传统的优势,搜狗旅行翻译宝才能深植于翻译市场,成为模仿的对象。
在别人刚刚从会议等领域抽身的时候,搜狗已经抢先一步占领了消费市场的先机——搜狗翻译宝在京东预售时,仅一个小时就被消费者抢购一空,销售额突破了1000万。在这样一个小众的产品领域中,一款产品销量的暴增,就意味着其他产品生存空间的缩小。而随大出货量而来的,还有用户在使用时产生的语料累积,通过不断的使用反馈帮助搜狗加快机器翻译技术进步的步伐。从而形成一种滚雪球效应,让搜狗在技术和产品经验上不断领先。
在智能翻译机市场,搜狗翻译宝已经领先了众对手一个身位。未来智能翻译机市场将走向何方,搜狗也许会告诉我们答案。