超越小鹏成为目前最强语音系统?现在的理想同学有这个自信

自从理想ONE通过OTA升级到2.1版本之后,全新自研的理想同学语音系统正式上线,升级后的版本增加了四音区锁定、唤醒打断、对驾驶模式的语音操控等新功能,可以说将理想ONE的语音能力整体抬上了一个台阶。现在,理想同学又进入了第二个阶段,2.2版本系统在2.1版本的基础上增加了自由连续对话、可见即可说、情感化语音合成等高阶能力,语音交互能力堪称史上最强。

这次的2.2版本主要是为了解决一个“自由”的问题,语音输入的不自由、指令的不自由、一人说话其他人得闭嘴的不自由、重复命令的不自由。总之,理想这次要达到一个“服务全家人的自由对话”的目的。

而提到语音系统,很多人都会想到去年就开始发力的小鹏汽车,P7上的“小P”也算目前中文语音交互的最强之一。更重要的是,像连续对话、可见即可说这些功能在小鹏的语音系统中也存在,甚至比理想发布的时间还更早,双方都拥有目前为数不多语音能力这么先进的产品。那么我们倒要看看,理想同学和小P到底谁更胜一筹,于是我们让理想ONE和小鹏P7来了一次短兵相接。

自由连续对话下,聊天绝对更自在

在这次大幅更新语音系统之后,理想同学的底层架构引入了思必驰+微软的技术,上层核心功能自研,这一路线与小鹏非常类似,小鹏的底层也使用了思必驰平台的技术。有了新技术的加持,理想同学的唤醒速度、识别准确度、语义理解能力都得到了大幅度的提升,这些基础能力已经非常成熟了,甚至我们可以从屏幕上清楚地看到系统以及可以极高地识别出我们所说的话。

在这一点上,理想和小鹏都表现的都已经足够优秀,不过依靠四个座椅的独立高灵敏度麦克风,可以更加精准地直接实现四音区定位,理想ONE在唤醒和识别准确率上比小鹏P7还要略胜一筹,在几天的测试下几乎每次唤醒都能即使响应,识别也几乎没有错误。而且在这基础之上,理想同学在2.2版本中新加入了自由对话能力,可以一次唤醒、连续对话,让整个语音交互上了一个大台阶。

现在,我们跟理想同学的对话不再拘泥于“唤醒-命令-执行”这个单一过程,理想同学在一次唤醒之后会持续聆听,你可以一直对它发出各种指令、查询各种信息,直至你不说话20秒后再退出。这就大大提高了语音交互的便利和效率,不用一次次地唤醒,而且可以在过程中任意打断进行下一个指令,比如在理想同学正播报天气时直接调整空调、播报股票时放一首歌,做到真正的“对话”。

而如果你注意到,我们所说的话都会在屏幕上识别出来,但这并不会导致误触发,理想同学在对话的过程中加入了对话抑制。当我们车上在跟理想同学对话时,即使同时在跟其他人说话或车上仍有其他人聊天,都不会影响正常的人车交流,理想同学只会提取真正的有效信息,也就是我们所说的无效文本拒识。甚至,我们可以直接说“不要听左后音区的”来单独关闭左后麦克风,不让后排小朋友们捣乱。

因此在车上,我们现在只需一句“理想同学”,就可以一直跟车辆进行各种对话,还不怕别人打扰。从前,我们最早是在小鹏P7上看到的类似功能,不过在多音区上,小鹏P7只支持双音区语义识别,后排采用的是按键唤醒锁定的方式,也是另一种解决方案。但现在理想ONE一举追上,从实际体验上来看,理想ONE的独立麦克风四音区锁定相比按键还是更加直接一些,颇有点后来者居上的意思。

如何让语音充当车机的鼠标?

我们经常会在使用语音的时候遇到这样一种情况,不知道具体指令的名称、想通过菜单浏览的时候,往往不知道如何下嘴,还是要手动划动屏幕。这就要提到理想同学这次的另外一项重要的功能——可见即可说,看见什么就说什么,通过语音也能起到像鼠标一样点击屏幕的效果。

比如,直接通过“动力运动”来更改动力模式、“车门车锁设置”来切换到车门车锁设置页面、“往下翻”来将页面向下滑,目前都可以通过语音系统操作选取一/二级菜单页面,也包括主页面的左右划动。但更重要的是,我们即使在QQ音乐、喜马拉雅这样的APP当中也可以一样使用。比如,我们直接说“喜马拉雅”、“发现”、“往下翻”、“郭德纲”就可以直接在现有的音频中选择一段相声,而且支持直接通过几个“关键词”就能选取。这样,尤其在我们只是想浏览一下,看看有什么感兴趣的内容的时候就更好用了。

小鹏P7上同样支持可见即可说功能,而且或许由于理想同学的新版本刚上线不就,小鹏的小P在这一方面的表现其实要更加稳定一些。不过小鹏P7目前只支持系统层级的菜单,并不支持其它的第三方APP,像音乐、有声内容也仅支持对小鹏音乐的操作。从这个角度来说,理想同学虽然也只是支持QQ音乐和喜马拉雅,不过毕竟大大增加了内容生态,而且在未来将会做到支持全系统APP的支持。

这么一看,在这项功能上,两款车型的表现各有千秋,小鹏在功能支持的范围内表现稳定优秀,不过对第三方APP的支持目前还不够完善。而理想同学则覆盖了更多的功能,尤其是在支持QQ音乐和喜马拉雅的情况上,大大增加了这项功能的实用效果。

自然、舒服,才是正确的交互方式

其实,我们在体验两款车的过程中,另外一个非常直观的感受就是,理想同学的声音非常接近人声,语音语调也很很有亲和力,几乎完全摆脱了机械化的发音。原因在于理想同学基于深度神经网络的云端语音合成技术,通过动态网络融合方案保证合成效果及稳定性,字里行间的连接也丝毫不生硬,让人听了觉得很自然,从感官上就更加愿意与它进行语音互动。而相比之下,小鹏P7的人声就会略显生硬,更新后的理想同学在这一点上明显占据了上风。

同时,这次的理想同学也更懂你了,可以实现跨音区的上下文语义理解。比如像空调、座椅、车窗这种车控甚至是歌曲进度条,除了可以通过百分比精确调整之外,一次不到位的话只需要说“再大点/小点/冷点/热点”就可以在其基础上再调整。更方便的是,我们自己调好之后,一句“副驾也是/后排也是”就可以让其它乘客一次同步到位,直接省去了把这些设置再说一遍的重复指令。

另外,两款车都在安全上进行了一定的贴心设计。在自动驾驶辅助的相关功能上,理想同学可以通过语音对驾驶模式、路面模式等进行操作。对有关驾驶的功能,如果是副驾下指令,理想同学会说“抱歉,这个操作我只能听从驾驶员的”;而对它认为需要谨慎的项目,比如车道保持辅助、自动紧急制动等,在语音关闭时会回答“为了驾驶安全,请手动操作一下吧”。这一点在小鹏P7上也类似,在相关功能上会再多问一句“仍然关闭吗?”。

可以看出,在拟人化和情感交流上,目前看来理想同学还是下了不少功夫,在可以回应执行基本的指令之外,让我们感到自然、舒服。根据理想的数据,多人用车场景下的语音使用率已经达到了62%,也说明更多人愿意使用理想同学。最后还有一个彩蛋,我们分别问了理想同学和小P怎么评价对手的产品,还挺有意思:

车云小结

通过对理想ONE和小鹏P7这两台车的对比,我们认为它们几乎可以代表目前市场上语音能力最强的产品了,双方在功能覆盖和交互体验上都给了我们很深刻的印象。不过理想ONE凭借后发制人的优势,整体给了我们更多的惊喜,不仅在功能覆盖上几乎不逊于小鹏,而且拥有更自然更流畅的交互体验。如果说小鹏是此前最强语音之一的话,那么理想ONE现在已经绝对有挑战甚至是超过它的实力。

其实面对理想或小鹏这样在语音能力上都已经很强大的产品时,一些常用的指令类、查询类的常规语音交互已经满足不了我们的胃口,它们的交锋更多存在于更深层次的能力和拟人的交互体验。换句话说,它们给我们提供的已经不是一个单纯通过语音完成任务的语音助手,而是在追求能真正像朋友一样跟我们交流互动的方式。我们期待理想同学下一次版本给我们更多的惊喜。

用产品说话:从ID.6 CROZZ对比Model Y看一汽-大众反击决心

可生长的汽车丨OTA迎新监管,蔚来3.0大升级

智能车型终极PK,车界最强大脑竟然是TA!

董明珠的烈酒 雷军的新忧

我就知道你“在看”
(0)

相关推荐