搜狗智能导航实现与汽车全程对话,车内语音交互要火
在近日于上海举办的2016年亚洲消费电子展(CES Asia 2016)上,无人驾驶、智能汽车等相关技术成为最大热点。在CES Asia上,搜狗地图发布了“搜狗智能导航”,最大亮点是可实现车内的全语音交互,而交互并不局限于地图导航本身,几乎可实现驾驶之外的常规车内交互,包括打电话、发短信、查天气、歌曲播放等等。这款产品可运行在智能手机上,还可通过车机互联协议使之运行于汽车屏幕,如果汽车厂商与搜狗进行前装合作则可独立运行于汽车的OS上。基于庞大的POI数据和人工智能技术,搜狗地图在国内首次实现了车内的全语音智能交互。
在搜狗发布智能导航之前,一些汽车已经支持语音交互了,但痛点却很多,用搜狗地图总经理孔详来的话说是,“现在车内语音导航使用体验不理想,比如功能的设计缺少人性化,语音识别的准确率非常低,这不是在帮助用户,反而成了用户的累赘。”笔者对此深有同感,我买车时为语音交互功能多交了几千块钱,却只支持可选的英文命令,形同虚设。
为何语音一直没在车内普及?
Siri掀起的智能语音在这些年突飞猛进,最典型的应用场景是汽车。在驾驶过程中,用户有80%的精力会投入到驾驶中,双手和双眼都没空,语音交互就可解放双手和双眼。因此,语音一直被视作是汽车交互的杀手锏。一些汽车早已支持语音操控,而智能手机上语音助手更是成为标配,但是,车内语音交互却从来没有真正普及过。问题出在哪里呢?
1、汽车语音交互存在技术壁垒。
语音交互需要大量的云端计算,过去汽车与互联网是割裂的。并且,驾驶时气流和地盘导致的噪音很大,而过去语音的抗噪和识别能力不够好。还有人工智能技术不够成熟,而语音识别、语义理解和语音搜索均需要人工智能技术支持,这是语音交互在车内普及的技术壁垒。
2、各路玩家未将语音场景整合。
过去车内语音交互的探索者有许多,科大讯飞等专业语音厂商,Apple CarPlay内置Siri实现了部分语音交互,汽车厂商比如宝马内置了语音交互功能,如果算上手机语音助手玩家就更多了。这些玩家都存在一个问题:未能将车载语音交互场景整合起来,CarPlay地图存在短板,科大讯飞只有语音,汽车厂商的语音只能打电话,功能都十分单一,并未真正与用户驾驶场景结合起来……
3、车厂缺乏语音交互推广动力。
车厂态度很大程度阻挠了语音在汽车中的普及速度。传统汽车厂一直被诟病“不思进取”,因为受不了传统汽车糟糕的体验,Elon Musk创建了Tesla被视作是下一代汽车的典范,其核心改变正是在交互上——通过一个大平板让汽车有了自己的操作系统。而在语音这件事情上,传统车厂会将其作为可选配置,用户需要付出上万的代价,而买来之后体验却十分糟糕,比如国产车还要求用户必须使用指定的几十个英语语音命令,十分可笑。
语音将是车联网的入口
有了车联网之后,不论是汽车直接联网,还是基于智能手机,车与互联网连起来了,与此同时,4G高速普及让汽车在大多数时都能接入高速网络,这给语音交互带来了基础条件。
与此同时,许多配套技术同步发展为语音交互在汽车内的普及带来可能。
一是语音识别技术。包括在线和离线语音技术,搜狗介绍其语音技术的命令词识别准确率高于 98%,随便说高于 93%,实时率低于 0.5 倍实时;通用识别准确率高于 97%,已达到车内应用标准。
二是语义理解能力,三年前语音只能将语音转化为文字,现在语音技术还能理解背后的意图,比如你可以对Siri说“帮我设置一个明天下午五点的日历,去书店”,它就去完成相关设置。搜狗智能导航则支持多轮对话,你说去“国贸”,它会问你去国贸哪里,再继续帮你选择目的地。
三是人工智能技术。语音技术本质是人工智能技术,不论是语音训练、语义理解、语音合成,均需要大量的AI技术,AlphaGo战胜最顶尖的围棋选手标志着人工智能技术已经达到又一个新的水准。
基于上述几点,可认为人与汽车对话已经具备普及的硬件和软件条件,而让语音交互在汽车普及的最大推手,将是互联网巨头。
互联网巨头正在纷纷往车里挤,阿里与上汽合作造车、百度进军无人车、Apple 上马CarPlay,大家都想拿下汽车这一黄金场景……互联网玩家尤其是搜索引擎,在AI技术上有先天优势,几乎都有布局语音、地图,接下来将扮演车内语音入口的重要争夺者。汽车厂商依然动作缓慢,但互联网玩家已等不及想要拿下车内场景了,其中语音将是关键入口,搜狗总经理孔祥来甚至认为,“以后在车联网时代,语音在车的地位,就相当于浏览器在PC端。”在互联网巨头竞争入场的情况下,语音交互必将加速在车内的普及。
搜狗地图做语音导航底气何在?
在搜狗地图之前,已有一些地图支持语音导航,或语音控制,不过均是面向手机这一通用场景设计的,并未进行针对性优化,在车内实现多场景的语音交互,搜狗地图是第一家,为何能成为第一个吃螃蟹的人呢?
一是车内语音导航现在还存在着许多痛点,存在着机会,尤其是给互联网巨头留下了许多机会。而另一个角度来看,语音在垂直领域将更有机会,因为可针对场景优化,比如搜狗瞄准的汽车,未来还会进入智能家居场景;
二是搜狗在语音和AI技术上的积累。搜狗智能导航最大的两个不同是,更准确的识别和更智能的理解。
在Siri发布之后,搜狗是中国最早发布语音助手的互联网公司,在语音技术上有较多积累。根据其公布的数据来看,在线识别、离线识别、抗噪技术、语音合成这些语音技术搜狗都取得了不错的进展。针对车内语音交互,搜狗做了许多优化,比如针对车内环境下的风噪,底盘发动机的噪音都做了优化,现在行车100公里时速情况下开窗户做语音识别几乎和车内完全静音是相同的。
在更好的语音识别技术支持下,基于AI,搜狗智能导航可实现与用户自然对话,比如用户说要去“首度机场”,搜狗助手会问是去哪个航站楼,是接机还是送机,还可进行航班信息提示,在用户旅行时,则可提示路过的地方、建筑的相关信息。人工智能被贯穿在识别、理解、搜索、推荐诸多环节。
三是搜狗智能导航本质是车载语音搜索。在地图导航上,搜狗地图一直专注于出行,语音让交互更方便,基于语音,搜狗在理解用户意图基础上,还能搜索和推荐更多与目的地或路程相关的信息,就是说,搜狗希望面向车联网打造一个基于语音的搜索工具。
搜狗地图做语音智能导航优势很明显,但也有挑战。传统汽车厂商、Tesla等新兴大厂、后装导航设备、Apple等科技巨头,均不会错过语音这块“肥肉”。搜狗必须凭借此杀手锏尽快跑马圈地,在巨头们正在加大对汽车智能语音的投入,留给搜狗的时间不多了。