智慧评测|靠谱吗?398搜狗录音翻译笔体验语音识别与同声传译
5月15日,搜狗 AI 第二款产品——录音翻译笔在京东首发开卖,同样支持全球 17 种语言与中文即时互译,售价 398 元。那么,398的搜狗录音翻译笔的实际应用效果究竟如何呢?今天,胖胖老师就和大家第一时间分享使用体验。
第一次“亲密接触”
作为搜狗AI人工语音识别智能硬件的第二款产品,搜狗录音翻译笔的价格的确很亲民,398元就能在京东上入手。
当然,如果你能够成为王小川的微信好友,还能私信获得100元的优惠券,可惜胖胖老师不是“王的小伙伴”。
不到24小时,京东快递小哥,便把这款搜狗录音翻译笔送到了,第一时间上图开箱。
搜狗录音翻译笔在产品设计上呈现简约科技风:黑色圆柱形机身,长度123mm,直径为17.3mm,重30g,犹如一支马克笔,方便携带;笔身为磨砂质感,LED指示灯设计可提示翻译、录音、连接和电量状态等。
记得首次入手,需要把外面的保护膜撕掉,因为保护膜会挡住拾音口。
开箱全家福,整个设计很简约,如同产品设计一样。
智能体验:app+硬件
搜狗录音翻译笔采用的是“智能硬件+专属app”的语音识别翻译解决方案,因而要能用上它,我们还得在手机上安装“搜狗录音翻译”这款app。
和当下不少智能硬件类似,录音翻译笔需要开启定位与蓝牙权限,否则无法准确查找识别我的录音笔。
首次连接蓝牙会提示“配对请求”,直接点击“配对”就好。
3分钟搞定首次绑定激活。
首次打开app,会有录音翻译笔主要功能介绍
三大主要功能:录音速记、对话录音和同声传译。
通过蓝牙与手机连接,翻译笔可将录音同步转化成文字,搭载搜狗的语音识别和语义理解技术,官方给出的识别准确率数据为97%,支持最快每分钟400字听写,用户可实时在手机上查看文字速记内容。识别完成后,机器会自动将录音文件传输到手机中,支持在手机上保存、编辑和一键分享。
软件应用的主界面,可以看到功能很简洁,不仅可以在app上点击相关功能,录音笔上的相关按钮也能够直接调用相关功能,右上角会显示设备连接情况和剩余电量,内容页有50秒的产品介绍。
实战应用,效果如何
尽管来自搜狗官方对产品的介绍中,这款智能翻译笔采用了高清双麦克阵列与科胜讯远场DSP,支持6米范围内拾音,定向波束帮助机器找到环境中最强的声音,跟踪它以消除噪音干扰,同时语音增强的技术帮助放大原声,从而更好地识别语音信息,语音识别率达到97%,不过真实效果究竟如何呢?
采用触屏和按键模式启动对话翻译功能,尽管支持远场收音,但实际使用条件下,建议离开话筒不要超过1米,同时注意不要遮挡收音口。
对话翻译中支持多语种切换,胖胖老师尝试了英日法德与中文的互译功能(呃,日法德语的发音绝对谈不上标准,英语估计浓浓的Chinglish味道),实际感受是日常用语的翻译还是可以基本没有问题的。
而录音笔记功能,则支持离线录音模式,大约可以支持40小时离线录音,实际测试电量充满情况下,开启蓝牙连接状态下录音笔可以连续支撑4小时左右,离线录音连续使用情况略好,约在5小时左右。(提示开启蓝牙会加快手机电量消耗哦,我的zuk2 pro电池容量3050毫安,开启蓝牙,自动息屏状态下每小时耗电11%,约320毫安每小时耗电。)
连接设备会自动离线,离线支持断点续传,离线文件上传时无法选择管理,采用顺序同步。由于采用的是边同步录音边识别的策略,所以20分钟录音离线同步也需要20分钟(在wifi环境下)!同时个人感受,离线录音的识别情况不如实时识别,精彩会有些令人啼笑皆非的情况。
录音文件支持编辑,不过和“搜狗听写”不同,这里的文字编辑与语音播放条不同步,增加了长时间语音定位编辑的难度。
录音文件只支持识别文字的分享,录音文件似乎不支持导出,也无法查看到录音文件的采样率、压缩率与文件大小等信息。
同声传译功能中的语音识别与翻译,根据网络情况,会有3-5秒的延迟,从流量监控情况来看,5分钟的同声传译约需3MB左右流量,使用流量也不心疼。不过,需要注意的是有些wifi环境下的延迟情况比移动数据情况下更严重。同时,同声传译的语音识别质量有待提高,例如下图中存在的漏字情况。
翻译录音笔,想说爱你不容易
经过近10小时的连续使用,胖胖老师对这款智能录音产品有这样的一个评价。
应该说作为一款录音笔,他还缺了容量显示,作为一款翻译笔,他还缺了独立运行的能力,作为一款高清拾音头,他还缺了对于人声以外声音的高清拾取,不过胜在便携,能够作为一款日常使用产品,也算合格。
个人认为这款录音产品在软硬件方面的体验还可以在以下几个方面做得更好:
智能硬件
在不过多增加物料成本的前提下,是否可以提供录音笔常见的液晶屏显示基本信息,如电量、内存容量和连接状态等信息,多功能指示灯的设计虽然简约,但效果不佳。
是否可以让智能硬件成为高清收音头,通过专用蓝牙适配器在平板、电脑上使用。
当前不管是手机还是录音翻译笔,对于来自功放扩音的音源识别效果很差,而在大型会议、教学展示中这样通过音箱播放的音源又是主流,是否可以考虑提升这类环境下的收音分析能力。
离线笔记目前存在同步时间过长的问题,是否可以采用先同步录音、再异步识别的同步策略,支持离线文件选择性同步或删除。
笔记的编辑功能可以参考师出同门的“搜狗听写”,支持笔记与录音时间轴同步,甚至可以考虑兼容“搜狗听写”,成为其智能外设。
对话翻译是否可以提供文本导出功能,在对话采访这样的应用环节有相关需要。
同声传译是否也可以提供文本编辑功能和导出功能。
录音文件是否考虑导出或者分享。
最后,应当说作为一款智能语音识别翻译的硬件,398的体验还是物有所值的,如果在软件层面有更好的使用体验,相信会有更多人发现语音识别的更多乐趣。