同时,有一种新的交互方式随着智能音箱的普及刷新了我们的生活——语音交互。连屏幕都不用看了,想听啥歌张嘴就行,真正解放双手。八过,这几种交互体验都非常单一。在小雷看来,它们都不会是未来的主流交互方式。打个比方,语音交互就有个硬伤:必须喊唤醒词才能启动。
一个人工智能产品,非得喊名字才能用,这使用率能高吗?
说到这,大家肯定开起了脑洞,未来的交互方式会是什么呢?
电影里那些还摸不着边的科幻概念就不说了,有没有什么已经出现,又能引领未来的新技术呢?小雷不负责任推测,有 88% 的人听到它都是介个表情↓这啥玩意?干嘛的?下面小雷就用大白话给你们科普一下。
这个创新概念是在 2015 年 12 月,图灵机器人团队推出 Turing OS 机器人操作系统时提出的。
手机有操作系统,机器人也要有操作系统。Turing OS 机器人和人之间的交互方式,就叫做“多模态交互”。模态也就是英文里的“modality”,翻译过来就是感官。而多模态就是把“文字、语音、视觉、动作、环境”等多种方式融合在一起。
小雷盘了一把国内 AI 领域,发现势头很猛的自动驾驶也有独立的操作系统,可以结合数据库做出决策,但它并不算“多模态”。因为在目前的技术条件下,自动驾驶并不能像人类一样完全独立思考。
那问题来了,多模态交互难道又是一个摸不着边的概念吗?在此之前,图灵机器人已经和好几家公司合作,推出了搭载 Turing OS 的智能机器人。但是这个嘛,离我们的生活还是有点远,至少小雷作为一个单身狗是用不上的。
真正把“多模态交互技术”产品化的,是移动办公领域大佬钉钉。
就在快要召开“未来组织大会”的前几天,钉钉和阿里达摩院联手打造了全世界第一台“多模态交互技术”智能办公硬件——智能无人前台 M2S 。这不是钉钉第一次推出智能办公硬件了,各位大老板应该都听说过,钉钉出的智能打印云盒、智能门禁、智能会议盒子等产品。
作为一个积累了超过 700 万家企业组织的平台,钉钉一直都深谙办公领域痛点,并为此布局了很久。
在 M2S 之前,钉钉曾推出过一台 M2人脸识别考勤机 ,可以结合钉钉 App ,完成无人前台考勤。M2 采用的是活体人脸识别技术,也就是说,不能用照片代打卡。鹅且识别率精准,在1.5m内,可以五个人同时打卡,省去了员工排队打卡的麻烦。
它好是好,但假如公司来了访客,还是需要前台在门口登记迎接,并不是真的无人前台。
而采用了多模态交互技术的 M2S ,完美地解决了这个痛点。就是说嚯,你走到 M2S 1.2 米处,它就会识别出你是员工还是访客。然后根据你的身份和预约情况,主动给你不同的反馈。
假如我是员工,M2S 会记录好我的打卡时间,并主动打招呼“小雷早上好~”假如我是第一次来的陌生人,M2S 会主动问我“请问你找谁呢?”,我说找“机老师”,然后录入信息,它就会通过钉钉帮我拨打机老师的视频电话。在机老师确认接待后,我就能刷脸进去了。整个过程完全不需要前台和纸质登记。
它最大的亮点,就是具有精准识别身份然后提供定向服务的能力。能同时识别 10 个人,识别时间只需 0.5 秒。上班打卡争分夺秒,这个是妥妥的福音。
公司行政部小姐姐逢年过节要给大家发邮件发贺卡,要花很多时间去统计执行。
但有了M2S,我一打卡机器就会跟我说“小雷,生日快乐”“小雷,今天是你入职1周年纪念日!”有趣又省力。小雷上面吐槽过了,市面上的语音助手,基本都需要念名字才能唤醒。
至于 M2S ,是看到人来了就会自动打招呼,“xxx早上好”“辛苦了”“请问你找谁?”,就跟真人对话一样,没毛病。
鹅且它还能喊出不同人的名字,亲切程度堪比《超能陆战队》里的大白。大家回忆一下,以前公司有客人来访,都是用一个厚厚的大本子手写记录。
字迹不容易辨认,而且填的信息也没法考证。最主要的是,导出还特别费时间。
如果用 M2S ,就不存在这个困扰了。因为来访者都是在钉钉 App 上登记自己的信息,而且只用登记一次,这个资料会自动上传到魔点访客后台。
当访客第二次来时,M2S 可以准确地叫出他的名字,而且会问“这次还是来找xxx吗?”小雷只能想到一个词:一劳永逸。
如果是推销人员啥的,M2S 还可以把他拉黑,以后都甭想进门了。安全程度可见一斑。这最最重要的一点呢,别忘了,钉钉的智能办公硬件,都离不开钉钉软件应用生态。打个比方,M2S 和钉钉智能人事系统是打通的。手机只要登录钉钉 App ,全员考勤记录,甚至每月的员工工资,都可以自动统计,无需人工核算。
这一切,只需要把钉钉 M2S 和魔点门禁关联起来,通过钉钉 App 就能实现。
M2S 的好处是显而易见的,小雷随手就能列出好几点:
①打造一种全新的办公方式。员工不需要跑下楼去接人,公司也不用再制作门禁卡参观卡了,来访者无需手写登记表,真正做到无纸化办公。②最直接的一点,就是省钱。一个前台工资少说也要 3000 元,M2S 是完全可以省去这笔钱的。③提升公司形象。M2S 摆在门口,任谁看了都会赞叹一句“高科技”。
这个“多模态交互技术”产品对钉钉来说,是一次产品迭代。但在小雷看来,它对钉钉系统生态以及国内 AI 领域的发展,具有极其重大的意义。钉钉智能硬件的负责人易统说过,钉钉做硬件不是为了将某一款硬件智能化,而是为了打造一个软硬件一体的生态,为企业提供从物理空间到信息系统,及管理思想的全链路数字化。他介绍道,企业数字化就要求物理办公空间的数字化,空间数字化就需要 M2S 这样的智能办公硬件。是的,对企业来说,M2S 真的是办公必备硬件了,我们老板看了都说要买一台。
别看小雷说得这么简单,但想要把“多模态交互技术”产品化并不容易。
钉钉能成功,最主要的原因是深度整合运用了阿里达摩院多项 AI 技术。
比如,在技术上,M2S 通过多模态语音前端处理引擎,解决了多人同时说话带来的身份分辨问题。而在语义理解上,智能前台使用了最新的结合知识的神经网络模型,如 Knowledge-BERT 等,来检测说话人的行为意图,远远甩出“人工智障”几条街。
M2S 还顺便引入知识图谱技术,结合钉钉的组织关系和能力,实现智能匹配。
最后的结果,就是将多模态交互产品量产商用,送到我们的身边。
说实话,AI 这个词近几年已经有点烂大街了。阿里钉钉突然放出这么个大招,让小雷觉得,还是有人在默默地做一些牛逼事儿的。钉钉这次野心不小,但作为一个推崇高效的办公平台,他们的技术突破,又完全在预料之中。