谷歌秒杀苹果:AI冒充真人打电话,服务员竟完全听不出来!
猝不及防!这次,Google“造人”了!
昨天,谷歌召开一年一度的Google I/O大会。谷歌CEO直接祭出了这次大会的王牌:AIGoogle 的人工智能助理 Google Assistant,它最近学会了真人的技能:冒充真人给餐馆、发廊、酒店、咖啡馆、电影院…
不信?请看下面的视频:
翻译:
Google 助手:你好,我想帮客户约一个女士理发的服务。
理发店:您想预约什么时候呢?
Google 助手:你觉得3号可以吗?
理发店:我需要查查Jim老师的档期,请稍等。
Google 助手:嗯哼(全场笑声)
理发店:3号12点不行,Jim老师有预约了。
Google 助手:那10点到12点呢?
理发店:您的客户是想剪发还是烫发?
Google 助手:简单修剪一下。
理发店:ok,那没问题,我们10点见。
这个智能过人的Al让人看完不禁倒吸一口凉气……
明明就是真人对不对!
之前我们应该都听过 Google Assistant 的声音是什么样的。现在的这个女声,是一位真的女生在Google的总部花了几个月的时间将虚拟助手训练出来的。
而在过去,Google Assistant,以及Siri、Cortana、Alexa 等所有虚拟语音助手,都用的是一种标准的、近似于语言课上标准发音、语速等的发音方式。然而人类在现实中说话,有着各种各样的口音、语速,语调在不同字和词上有轻有重,在思考跟不上说话的时候会用“嗯”、“那个”之类的填空词。
在2018年Google开发者大会的主题演讲中,Google CEO 颂达尔·皮柴表示,Google Assistant部门的一个最重要的目标,就是让用户和虚拟助手的对话变得更加自然,就像和真人交流那样。
注意到在刚才这通电话中,这一边扮演顾客的 Google Assistant 在整个对话中多次出现了类似于真人的反应。
比如一开始,对面说出了“好的,请稍候一小会”,之后是短暂的沉默。对方虽然说出了一个请等候的祈使句,在正常的人际交流中,顾客这边应该表示“好的”、“没问题”之类的意思,但对于虚拟助手这种以完成指令和回答问题为主要工作的人工智能而言,它没有理由对这一句做出任何回复,然而它还是在稍等了大约一秒钟后做出了一个“嗯哼” (Mm-hmm) 的表达。
再比如,在通话中间,对方告知中午 12 点左右没有空,最近的是下午一点多。Google Assistant 的应变方式不是接受这个预约,而是给了对方一个新的时间范围,并最终完成了预约。
以假乱真的语音生成能力之外,即兴是 Google Duplex 技术的另一个最主要的特色。看一下当天的另外一个案例就更清楚了:
首先,有经验的朋友们大概已经听出来了,对面这是个中餐馆……餐馆老板的英文表达能力有限,并没有严格符合标准的英语语法,但扮演顾客的虚拟助手还是能够理解。
注意通话中间,餐馆老板告知“4个人不用定位,可以直接来”时,原则上虚拟助手到这里就可以挂电话了,因为订位的任务已经完成。然而它没有挂掉,而是做出了一个堪称优秀的即兴追问:“通常等位时间有多久”。
如果之前就挂掉,这只是一个普通的通话而已,而这个即兴的存在,在 Google CEO 颂达尔·皮柴 看来,让双方之间交互得更“优雅”(gracefully) 了。
除了 Duplex 技术之外,在今天的 I/O 大会上,Google 也宣布了虚拟助手其它非常多的功能更新,其中有不少十分强大……
1/ 新的声音:可能用户已经听腻了 Google Assistant 的标准声音,这也是为什么 Google 决定为它再增加 6 种不同的男声和女声。其中就有一种来自于曾经在《爱乐之城》里出演过的美国歌手约翰·传奇 (John Legend)。
不过,厉害的并不是请来约翰·传奇,而在于 Google 为 Assistant 生成新声音的效率有多高。
DeepMind 训练出了一个深度神经网络模型 WaveNet,能够高效地生成原始音频。利用 WaveNet,只用很少量的语料,辅以强大的计算,Google 就可以制作出和原始语料相似度极高的语音形象,用时从几个月降低到了几百小时。
2/ 多轮对话能力进步:在过去,跟 Google Assistant 对话,需要每一句前面都加一个唤醒词 “Ok Google”。从今天开始这个设定终于退役了,因为 Google Assistant 获得了增强的多轮对话能力。不仅如此,它还能理解你是在跟它还是跟别人说话,不会尴尬地加入到聊天当中。
3/ 多重任务处理 (Multiple Actions):自然语言交流的一个特点就是复杂性,一句话里面可能同时表达多个意思。最直观的例子,“请看一下今天的天气发给安妮”、“今天纽约和奥斯丁的天气怎么样”,或者“把厨房的灯和厕所的换气关掉”。
只要记性不差,正常人都能完成,而且多半会下意识将它们看做是同一个任务。问题是在过去,别提多重任务,某些虚拟助手连一个简单的任务都完成不了。
不过从今天开始,Google Assistant 将能够一次性处理多重任务了。
4/ Gmail 智能写邮件 (Smart Compse):你应该知道 Gmail、Inbox 支持智能回复,但过去只有“感谢”、“就这样”之类的简单回复。很快,Gmail 就将获得一个强大的智能写邮件功能。就像搜索引擎的自动完成一样,Gmail 也会根据你写的上一个单词自动建议下一个单词,直到你把整个邮件都写完……
听起来挺扯淡的,但不妨看看效果: