House还是Home,这是智能音箱的一个问题

2017年,中国智能音箱市场的“百箱大战”硝烟四起,大大小小的厂家一时间纷纷涌入。硝烟散去,蹭热点的最终被热点抛弃,真正沉下心来做技术的仍在砥砺前行。

去年7月,搭载了AliGenie1.0的天猫精灵一经推出,就为人机交互带来了更具差异化的体验。在短短的八个多月中,其销量超过200万台。与此相较,目前行业最畅销的亚马逊智能音箱完成这个任务则花了一年多的时间。

市场的需求倒逼着产品的推陈出新。3月22日,在“万物有灵——阿里巴巴人工智能实验室2018春季发布会”上,阿里推出了具有视觉认知能力的人际交流系统AliGenie2.0和搭载了AliGenie2.0系统的 “天猫精灵火眼”等产品。

慧眼独具,AliGenie2.0

让人机交互告别盲目时代

作为阿里巴巴推出的第一代中文人机交流系统,AliGenie1.0主要是通过“听”和“说”来进行人机的交互;AliGenie2.0则在“听”和“说”的基础上引入了视觉能力,能够进行视觉认知、多模态交互、情景感知等,从而构建一个更聪明的人机交流系统。

其中,AliGenie2.0的视觉认知能力包括达到了国际领先水平的图像识别、人脸识别、物体检测,多模态交互能力可以通过对语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式。而情景感知能力,则可基于上下文、对话场景自主学习,深刻理解情景需求。

这一升级将重新定义机器和人的交互方式,让机器和人的交流更像是人与人之间的交流。人与人之间的交流,尤其是面对面的交流,综合了语音、图像、触觉等多种方式,是一种多模态融合的交互。基于这些自然能力的交互,是人机交互未来的趋势和方向。

因此,打通了视觉和语音,天猫精灵就能更全面、更智能地感知外面的世界,进而更好地理解用户的需求和付诸行动,人机交互也就告别了盲目的时代。

火眼炯炯,机器也有人性的温度和情感

毫无疑问,AliGenie2.0所具备的视觉能力将在天猫精灵X1上首先落地。然而现实的问题是,X1本身并没有可进行视觉处理的硬件。

基于此,阿里专门为天猫精灵手机APP搭载了“精灵火眼”功能。通过一个类似于Google Cardboard的硬件小配件XHolder,便能够把视觉和语音两个模态打通,在几乎没有增加硬件设备成本的情况下就可实现对“精灵火眼”和天猫精灵的组合,使其具备视觉识别能力。

“精灵火眼”的命名意味着,天猫精灵从此将有一双炯炯的火眼,能看见、能感知外部的世界。“精灵火眼”拥有两大核心能力,即“视觉认知”和“表情系统”。

通过图像识别,结合智能语音互动、声音朗读,天猫精灵可以帮助儿童读书、识字。为此,阿里联合了中国少年儿童出版社、安徽少儿出版社等国内顶尖的出版社,精选了3岁到8岁儿童的117套图书来供其使用。而针对老年人视力不佳的问题,“精灵火眼”则针对性开发了识别药盒的功能。其与阿里健康合作,能够识别4万种药盒,覆盖中国家庭常用药。只要用“精灵火眼”扫一扫药盒,就能用语音播报药名、功效、过期日等信息。

在未来,“精灵火眼”还将引入万物识别、人脸识别等功能,其覆盖的物体范围更广,也将拥有更加广阔应用前景。

表情系统则更注重用拟人化的方式表达情感,体现出天猫精灵的娱乐性。用户在互动时得到的表情反馈,承载着阿里对人机交互的理解——人机交互不仅包含语言交互、视觉交互,还有情感的交互。

在整个人工智能行业崛起的过程当中,阿里的行动总是快人一步,无论是硬件、系统,还是系统的升级。当行业里大部分人还在说音响的时候,其又已经引入了视觉能力,无疑将是行业里面的一股清流。

对阿里来讲,其对人工智能的理解并非是简单的工具。屏幕不仅仅是展示信息的工具,人工智能助手也不是遥控器。用户需要的不仅仅是一个house,更应该是home。而阿里的产品在技术层面的创新,就是同生活的点点滴滴进行结合——如改变一个药盒的浏览方式,来为用户打造一个充满温度的home。

(0)

相关推荐

  • 买买买!阿里智能音箱天猫精灵 X1 发布,才 499 元约否

    ◆  ◆  ◆  ◆  ◆   外观精致小巧且有趣 此次发布会由阿里相关负责人进行新品讲解.首先,该智能音箱的型号为"天猫精灵 X1".它的第一个亮点就是体积小,在与 Echo 音 ...

  • 天猫精灵的底牌

    3月初,天猫精灵宣布整体销量突破千万,成为继亚马逊和谷歌后,第一家进入千万俱乐部的中国智能音箱品牌.接下来,中国智能音箱大战将会上演更加血腥的洗牌:千万俱乐部是一道门槛,能进入的却只会是少数,不能进入 ...

  • 再玩天猫精灵CC10

    电池升级,场景拓展 这次系统率先升级的主要是三款产品:天猫精灵CC10电池版.天猫精灵CC MINI和IN糖2智能像素屏音箱,我们首先入手的还是把玩过很多次的天猫精灵CC10电池版.比起之前的天猫精灵 ...

  • 智能音箱把语音交互吹上了风口

    今年的7月注定是个让我们惊奇的月份,智能科技新品的发布,犹如这炎热的季节,火爆上演. 无人零售的淘咖啡体验店,在阿里造物节获得了拿了就走的完美体验:李彦宏乘坐百度无人驾驶汽车赶赴百度AI开发者大会,发 ...

  • 今年过节不收礼啊,收礼就收......“智能音箱”

    智能音箱的爆发是在消费升级的背景下,人民日益增长的对美好家庭生活的需求和科技进步的一次碰撞. 智能音箱在即将过去的 2018 年迎来了狂飙突进的一年,中国的互联网巨头纷纷进场.据测算,2018 年中国 ...

  • “物联网开发实战”学习笔记-(四)智能音箱制作和语音控制

    这次来造一个属于自己的智能音箱,这里详细介绍了智能音箱的语音控制的实现. 智能音箱的技术架构 智能音箱主要涉及拾音.前端信号处理.语音识别.自然语言处理和语音合成等技术,现在一些产品甚至提供了声纹识别 ...

  • 智能音箱产业链全景解析

    智能音箱的关键特性包括语音交互.内容分享.互联网服务及智能家居控制. 最开始功能以播放音乐和语音助手为主,随着市场竞争愈发激烈,应用场景不断增加. 从最初的语音助手增强人机交互性,到现在的智能音箱与其 ...

  • 智能音箱产业链深度解析

    智能音箱的关键特性包括语音交互.内容分享.互联网服务及智能家居控制. 最开始功能以播放音乐和语音助手为主,随着市场竞争愈发激烈,应用场景不断增加,从最初的语音助手增强人机交互性,到现在的智能音箱与其他 ...

  • IoT的趋势2020,见证智能音箱的发展

    自从发明了电话以来,通信领域可能又将处于一个最具革命性的时刻--"物联网".连接世界上所有的东西,物联网是互联网本身的逻辑顶点,已经可以看到IoT对生活和商业的影响. 智能手机.平 ...

  • 智能音箱场景下的性能优化

    QCon是由InfoQ主办的综合性技术盛会,今年是Qcon举办的第10个年头,半吊子全栈工匠有幸作为演讲嘉宾分享一个近两年来的实践经验--智能音箱场景下的性能优化,隶属于曾波老师出品的"场景 ...

  • 热点前瞻:网络游戏+天然气+智能音箱+智能电表

    热点一:网络游戏 逻辑概述:谷歌宣布其云游戏服务Stadia将于11月19日正式上线.同时,该服务将在美国和加拿大等14个市场推出.此前微软宣布,xCloud云游戏服务将会在2020年正式推出.业内表 ...

  • 热点前瞻:智能音箱+跨境电商+铁路基建+数字货币

    一.热点前瞻 热点一:智能音箱 逻辑概述:10月23日消息,据国外媒体报道,数据调研机构Canalys发布最新数据预测,2021年全球智能音箱预计出货量将达到1.63亿台,整体增长21%.Canaly ...

  • 热点前瞻:石墨烯+农业种业+智能音箱+石油化工

          一.热点前瞻 热点一:石墨烯 逻辑概述:今年两会将重点讨论如何通过优化产业.能源结构和科技创新等举措实现碳达峰.碳中和的目标.石墨烯作为新型碳材料中的"王者",在实现碳 ...

  • 智能音箱硬件结构总结(内容较多,请先收藏)

    首先说明一下,本人并没做过智能音箱类结构,至于为什么会写有关智能音箱相关的内容,主要原因是想通过自己总结下智能音箱类硬件结构的共性点以及注意点,以便日后能用得上,在写本篇之前,本人也拆解过自己的音箱, ...