Google Allo上手体验:别不信,百度度秘比它强大
看到标题,百度黑们就要喷我了,在他们眼里Google在做人工智能,百度在做外卖嘛。然而,我在周末体验了搭载Google 人工智能技术的Allo 之后,得出如题的结论,事实上,不只是我有这样的感觉,最近还有许多科技大佬和发烧友做了几款人工智能助手产品的对比测评,都对Allo的表现略微失望,竟然是百度的度秘压过了它成了大黑马,包括《纽约时报》记者在尝试了Allo五天以后,给出的结论也是:谷歌这个助手真的有待改进。
Allo早在今年5月的Google I/O大会上就已推出。这场大会的关键词是人工智能,最能体现“人工智能”元素的应用就是“Google Assitant(谷歌助理)”,Allo是消息聊天应用,与Facebook Messager、微信等聊天应用最大不同是整合了Google Assitant。跟中国的阿里巴巴一样,Google在社交这个事情上一直在努力,从来没成功,从IM时代的GTalk再到SNS时代的Google+,均惨淡收场,这一次携着人工智能技术通过Allo再战社交市场。
Allo能做什么?Google官方宣称,它整合了智能回复功能和Google助理,“让数字助理变成真人助理”是这款软件的初衷。在发布会上Google I/O演示了Allo智能回复朋友的信息,点评收到的照片,而Google助理则可在群聊时帮助用户预订意大利菜。真正的体验是怎样的呢?Allo 上周登陆了Google Play和AppStore,眼下对英语支持比较好,但也支持中文,先来看看上手体验。
判断人工智能助理的能力一般可从三个方面来看:一是“听懂人话”即理解用户意图的能力;二是“给出答案”即能让用户感受到它的聪明机智;三是“完成任务”即是否可在给出答案之外提供信息之外的服务。图灵测试是计算机历史上的经典测试,“如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。”现在AI助理通过图灵测试太容易,但要100%像人一样给出答案,尤其是100%像人一样完成任务,就太难了。Allo的“真人助理”理念很好,但其能力却距离一个合格的“数字助理”都还有差距。
Google助理:理想很丰满,现实很骨感
Allo是一个消息聊天应用,你可以跟朋友发送表情、文字、照片、位置等信息,前提是对方也要安装并登录Allo,Allo与通讯录打通,让用户可方便地邀请好友使用Allo。而要使用其“智能助理”功能,即可在聊天时@Google,也可与其内置的联系人Google Assitant(Google助理)对话。Google Assitant(Google助理)会在用户首次点开之后进行引导,告诉用户有订阅、运动、旅行、外出、新闻、笑话、游戏、行动、翻译、天气、问答等11大场景。
与Google助理的对话界面,与普通联系人对话界面没有什么区别,支持文字、语音、图片等类型的消息格式。在听懂人话方面,Google助理基于Google在自然语言处理和Google Now在语音技术上的积累,表现还是不错的。我说英语,说中文,它基本都可听懂,对于比较复杂的句式能很好地理解,你可以给Google助理发送一张鸟儿的图片,它可准确地识别出来,在你继续提问时,就给你WIKI百科的词条。
在给出答案这一点上,Google助理很依赖搜索引擎。说附近好玩的、附近的饭店、附近的星巴克,都会收到Google地图的搜索结果。如果说来一个好看的视频,会收到Youtube的一个视频,支持评分、随机、最新等方式。如果问最近的电影,它会给你一组电影海报和名称,点击之后又是搜索结果。总的来说,在答案上,Google助理非常依赖搜索,且用户点击之后,都会调用Chrome浏览器打开,没有实现内容的内嵌,体验不好,感觉Google助理就是搜索导流工具,十分依赖Google搜索并且还要用浏览器打开结果:
在完成任务这一点上,Google助理就更加孱弱了。我说“I want to go to BaiYunShan”,它给我白云山的简介,没有如我预期一样调用打车应用。
饭店、星巴克、酒店、航班之类的预订更是想都别想,均是给你Google或Google地图的搜索结果。
Siri我用得比较多的是用语音设置闹钟、日历等等,Google助理官方也提示这是其11大应用场景之一,实际测试是都不支持:
可见,Google助理还停留在信息层面,只能给用户答案,还不能执行什么具体的任务。
整体来说,Google助理理解用户意图能力不错,但是给出答案方面太依赖搜索,能完成的任务很少。
百度度秘:聚合服务更多但也有不足
喷子们先别急着喷,看下我的体验再说。
百度度秘是一款单独的应用,其与社交没什么关系,而是一款单纯的AI助理,与Siri不同,它支持文字、图片和语音等方式。在应用场景上,度秘有一个“功能板”,将用户最常用的助理类功能内置在了聊天界面,主要有生活、电影、美食、外卖、写诗、笑话、天气、聊明星、打车、酒店、计划等,Google助理支持的功能场景只是其一个子集。
在理解能力上,百度度秘在中文语音和文字的理解能力上比Google助理更强,比如我给度秘发送“帮我预订一个附近的七天酒店今晚入驻明天离店”,它可以理解我要订七天酒店并推荐,Google助理的结果是无法理解,对于这种自然语言理解能力单个case意义不大,我试了不少case才得出这个结论。
度秘也支持多轮对话、支持图片识别,给出答案的方式比Google助理给出搜索结果要好很多。同样是识别鸟儿,百度度秘给出的答案相对于Google助理给出WIKI百科,更自然和智能:
在给出答案上,百度度秘不会直接扔给用户搜索结果链接,很多时候会提炼出文字答案直接给出,甚至可以回答类似于“王宝强的老婆是谁”“林志玲的生日是多久”这样的问题:
在推荐餐厅等常用问题上,度秘有更细的划分,可以跟你不断对话,了解你的口味偏好、价位要求等等,再给你推荐餐厅。在推荐电影、推荐酒店、推荐航班、问天气、聊八卦等方面,度秘都更像是“助理”,而不是搜索引擎。
在完成任务上,百度度秘可以说是完胜Google助理。你可以要求它给一部电影预订作为,你可以要求它给你叫一部车,你可以通过它订一份外卖,你可以让它给你订航班,虽然它现在还不会直接帮助去执行这些动作,但已经可以准确判断意图,并且调用百度外卖、百度糯米、滴滴打车、携程旅行等App并直接打开界面,并且,许多服务实现了内嵌,不用再打开第二个App,用户可减少输入,比如打开航班界面时你说的目的地和自动识别的出发点已被自动填充。
用度秘买电影票:
用度秘订滴滴车,虽然不能直接定,但可预估费用和打开滴滴App:
滴滴面向Siri提供了打车功能,Siri在打车上可一键叫车:
用度秘叫外卖:
用度秘订机票:
还有一个是提醒功能,我尝试让它提醒我明早去爬山,它可以准确记录并按时提醒。
总的来说,百度度秘比Google助理更能理解中文,更不依赖搜索答案,能完成更多任务,比Google助理强大太多了。只是在一些回复速度及图片识别的准确度上还需加强,目前来看,度秘想要呈现的内容极为丰富,但如何做到所提供的每一项服务都精准优良是百度下一步不得不思考的命题。
为什么度秘比Google助理好很多?
不少人看到这个结论肯定是颇有微词的,他们一方面是对百度有偏见,偏执地认为Google在做人工智能百度在卖盒饭,另一方面他们不相信中国互联网公司能比美国巨头做得更好。然而事实就是如此,不信可以去体验。为什么会这样?原因很简单:
1、百度度秘有先发优势。人工智能助理是一个与时间打交道的事情,它不断积攒数据、学习知识、强化技能,做得越久,对垂直领域的需求理解、数据积累和服务整合就越深。百度度秘推出已有一年多时间,Google助理正式上线才几天,在数据和服务上的积累很弱,Google Now虽然做的早,但之前安卓用户也没有接受这玩意儿。因此,Google助理和百度度秘都可准确地识别一段语音,但给出答案和完成任务的能力却相差甚大。做得早的度秘在多轮对话技术、用户需求理解上也有优势。
2、AI助理的关键是内容和服务整合。百度与谷歌都是做搜索引擎的,但百度在三年前就提出要转型服务化,收购糯米、做外卖、电影、出行、教育、医疗,更早之前还有去哪儿(已与携程合并),这些服务与度秘都有很好的整合,百度度秘可以做很多事情。但Google还没有服务化,订车、订餐、订酒店、订航班肯定不能依赖自家业务,得看第三方服务商的态度。Siri开放是iOS10最大亮点,这表明Google也希望Siri能做更多事情,滴滴、点评已适配它,用户可通多Siri叫滴滴,订餐厅,Google想走Siri的道路,但这些平台会不会支持Google助理?不确定,第三方服务商是否重视并支持,是Google助理的成败关键。
3、度秘在中国市场上的本土优势。这很容易理解,Google助理中文理解能力没有百度好是事实,而且在本土服务和内容整合上,谷歌也不可能比百度做得更好。
眼下孱弱的Google助理有机会
Google助理也不是一无是处,在我看来至少有几个大的突破。
第一,明确了对话式的人机交互方式。之前的Google Now跟Siri一样只支持语音,Google助理将语音当做一种输入方式,同时还支持文字、图片、位置等信息,就是说,Siri是一个只会听的助理,但Google助理更希望做一个你可通过聊天对其发号施令的助理。百度度秘也是采取“对话式”,而不只是强调语音,相信Siri未来也会不执念于语音,与iMessage等应用更好地整合。
第二,在多轮对话上有巨大的进步。Siri和Google Now最初是不支持基于上下文的理解方式的,就是说用户与它们的对话都只有一轮。现在你可以先让Google助理“帮我找下附近的好吃的”,然后说“我想要法国的”,听到第二句时它记住了第一句话,可以准确地响应。百度度秘、Siri最近一年在多轮对话技术上的进步可以说是突飞猛进,多轮对话交互算是AI助理的一大突破。
第三,实现对各种场景的无缝渗透。Google助理在Allo的聊天中,在Google Home这款音箱中都有存在,它跟Siri的概念有所不同,不是一个单独的应用,而是一个引擎,可以渗透到不同的用户使用场景,给用户一种无处不在的感觉,这种理念将是AI助理的方向,AI助理不会只是一款应用或软件,它会是一个渗透在软硬件中的“AI引擎”。在这一点上,比百度度秘和Siri还停留在“应用”的理念更靠前一些。
整体来说,Google助理刚刚推出,人们觉得“没什么用”很正常,一年后、三年后(如果这个项目还在做)再看。AI助理一方面需要培养用户使用的习惯,并更好地理解用户的语言和需求;另一方面,则需要整合更多垂直领域的服务和内容,进而实现从给出答案向完成任务的跨越。Google助理的理想是做“真人助理”,百度度秘、Siri们又何尝不是。人们对新技术在短期的影响总会高估,对Google助理失望也正常,但其理念和未来却不容低估,未来可期。