汽车多模态交互研究：交互方式日渐多元化，多模态融合有待进一步加强

2024-04-29 21:01:54

佐思汽研发布《2021年中国汽车多模态交互发展研究报告》，对主流汽车品牌交互方式进行了梳理总结。

目前在汽车人机交互方面，呈现两大特点：

1、在交互方式上，除了触控、按键、旋钮等传统交互外，语音、手机已成为汽车人机交互的必选项。除此之外，人脸、手势、车灯也成为交互方式扩展的热门选项，更有部分品牌开始尝试眼部追踪、声纹、指纹等新型交互方式。

2、在品牌布局上，合资品牌在交互方式上相对保守，除语音、手机交互外，新型交互方式搭载较少，但豪华品牌成为多模态交互先锋。例如奔驰在其最新一代MBUX系统上，配备了人脸、手势、眼部、指纹多种新型交互。相比之下，自主头部品牌在新型交互方式的应用上更为积极，如长安汽车的视线唤醒、长城汽车的声纹识别等。

国内外主流汽车品牌部分人机交互方式如下（●量产车搭载 ○概念车搭载）：

来源：佐思汽研《2021年中国汽车多模态交互发展研究报告》

语音作为常规交互方式之一，功能正在不断完善

语音交互在原有性能之外，连续对话、音区锁定、音色切换、语音自定义等特性已成为主流品牌的下一发展方向。

1、连续对话、音区锁定已有多个品牌搭载。

具备连续对话的语音交互系统能够在一次唤醒后，一定时间内无需再进行唤醒，提高指令响应的连贯性；音区锁定则可以定位语音指令的发出者，在执行“开窗”、“调节空调温度”等指令时更加精准。搭载这两项功能的品牌主要有吉利、长安、长城、奇瑞、上汽荣威、广汽传祺、小鹏、蔚来、理想等。

吉利星越L--银河OS的“主驾极客模式”支持主驾24小时免唤醒，具备四音区锁定

小鹏汽车--语音助手小P，具备全场景语音功能，支持30秒连续对话、双音区锁定

2、音色切换指语音系统除了默认语音声音外，可提供其他声音供用户选择，如明星、游戏人物的声音等。搭载品牌有吉利、长安、长城、比亚迪、荣威以及新势力品牌蔚来、小鹏、理想等。如，上汽荣威RX5搭载的斑马智行维纳斯系统可提供亲和女声、知性女声、磁性男声、稚嫩童声、热情女声五种音色供选择。

吉利星越L--银河OS支持至多10种音色切换

3、语音自定义包括语音音色自定义和语音功能自定义。

“语音音色自定义”指用户上传自己或家人的声音后，系统将该声音应用于语音响应、导航播报等场景。搭载品牌有吉利、长城、上汽荣威、广汽传祺以及R汽车等。

“语音功能自定义”指用户可自定义语音指令及该指令对应的操作，可极大地提高语音系统的可玩性，满足用户的个性化需求。搭载的品牌有小鹏汽车。

吉利星越L--银河OS 支持用户定制个性语音，自定义的真人声音可以全场景应用，包括导航、应答等。

小鹏汽车--小P私人定制，小鹏汽车的车主可通过手机APP自定义语音指令及对应的操作

手势继语音、人脸之后，成为第三种新型交互方式

手势交互主要通过车内摄像头来判断手势动作，并将数据传递给车载系统控制单元，由控制单元调出与识别出的手势相对应的功能。相较于语音控制，手势控制操作更加精准、快速，且更容易学习掌握。

搭载手势交互的品牌有宝马、奔驰、长安、长城、上汽荣威、广汽传祺、岚图、R汽车、北汽极狐、小鹏。其中长城、小鹏支持车外手势识别。

WEY摩卡--支持在车外通过手势控制车辆点火、前进、后退、暂停、熄火。

长安福特EVOS--全新一代SYNC+2.0支持手势控制静音、音乐播放、界面分屏以及返回主界面等操作。

车灯交互上车奔驰、高合、智己等品牌

车灯交互通过车灯闪烁动作、车灯投影、灯组显示屏等方式向外界传达信息，车灯交互为驾驶员与车外交通参与者的互动提供了渠道，在自动驾驶落地之际，车灯交互使自动驾驶汽车能够与周围环境进行通信。目前奔驰、奥迪、大众、长城、比亚迪、高合、智己、小鹏等品牌搭载了该交互方式。

奔驰--投影大灯将警告标识、标记辅助等与驾驶辅助系统相关的信息投射在前方道路上。

智己L7--投影大灯可投射车语、导航、警示等交互信息，并且可结合高精地图提供车道级的导航引导；灯组显示屏可提供多种图案样式，展示座舱内用户的状态；交互尾灯支持显示文字、表情，如感谢、行人提醒、充电状态等信息。

除了车灯灯组外，部分品牌尝试在车身前后增加显示屏来向行人传递信息，如北汽、三星等。

北汽Lite 300--在车辆前后配有LED显示屏，可显示文字、表情、动画以及充电信息等内容

多模态融合是下一发展方向

单一模态下的交互，对交互体验的提升有上限。未来在提高交互体验上，多模态融合是明显可行且高效的选择。目前在研的品牌有奔驰、宝马、华为、长安等。

1、语音+视线

语音交互对包含“这个、那个”等模糊指代词的识别能力几乎为零，这种情况下若加入视线追踪，由视线锁定的方向，再通过语音发出指令，可极大提高指令的响应率。

奔驰“MBUX Travel Knowledge”--驾驶员可通过视线锁定一栋建筑物，并说：“我想知道这栋楼的用途”，即可获取相关信息。该功能由Cerence Look提供技术支撑。

2、语音+唇动识别

在语音交互的过程中，对指令的准确获取是最关键的一步，而座舱复杂的环境、噪音和密集的人员增加了语音识别难度，近年新增的音区锁定在一定程度上缓解了该难题。但受限于语音单模技术瓶颈，采用单一语音技术的交互对体验的提升有限。

与唇动识别融合下的语音交互将极大提高语音识别性能，不同语言下的唇部动作不同，在嘈杂的座舱环境下，即使系统接收到声音很小，结合唇部动作也可以保障较高的语音识别率。

北汽极狐搭载的华为鸿蒙OS唇动识别（在研阶段）

—END—

智能汽车“底盘”之上，蔚来、长城、宝马谁能更好诠释“语音交互”？

前几日,微软官宣了一项重量级收购,花费160亿美元收购Nuance,这也是微软继260亿收购Linkedin之后的第二大收购.Nuance是美国最大语音识别公司,被称为美国版"科大讯飞&qu ...
【e汽车】存量竞争时代，看长安UNI-K如何捅破天花板搅局未来

中型SUV市场走势,越来越像一门玄学. 说它玄,是因为与其它细分市场相比,这部分市场不确定性更大,不可预测性更强. 纵向来看,它经历过增长.爆发,平稳,节奏之快让人猝不及防: 横向来看,这个市场走马灯 ...
上海车展 | 新车汇总：56寸大屏、三激光雷达、L4自动驾驶……这些新车值得一看

文/海拉鲁上海车展已经接近尾声,各家车企都在车展上放了大招,比如L4级自动泊车的威马W6,超级快充的极氪001,56寸"大彩电"的奔驰EQS--那么除了这些车,车展这一周还有哪些 ...
以智能交互系统为核心，爱医声成立一年便获数千万元投资，未来锁定医养市场

7月17日,人工智能医疗器械创新推进会在北京召开,人工智能医疗器械创新合作平台成立.国家对人工智能的关注源于当前人工智能技术与传统行业的不断融合发展.其中,医疗行业已成为人工智能技术应用较为广泛的领域 ...
9 个小软件，很实用，免费无广告，安卓ios都有~

搜罗君,每日优质搜罗之前有发过软件的集合很多小伙伴都说感觉不错所以今天再发个补充篇大部分都是搜罗君自己平时一直在用的软件所以也都是很实用的软件 1.创意氢壁纸制作氢风格的壁纸上传喜欢的 ...
再玩天猫精灵CC10

电池升级,场景拓展这次系统率先升级的主要是三款产品:天猫精灵CC10电池版.天猫精灵CC MINI和IN糖2智能像素屏音箱,我们首先入手的还是把玩过很多次的天猫精灵CC10电池版.比起之前的天猫精灵 ...
3颗激光雷达，算力1000+，威马M7能否对标小鹏P7？

10月22日,威马汽车第一款纯电动轿车产品--M7正式发布.新车最大的看点是搭载了3颗自主变焦高精超视激光雷达及多个摄像头和雷达,为日后的L4级别智能驾驶辅助做好了准备.据悉,新车将在2022年年内实 ...
多模态交互之DPL 2.0

AI带来的最大改变之一就是人们交互方式的改变.从传统的键盘/鼠标到触摸屏点击操控,终于迎来了智能语音交互.随着智能语音应用逐渐普及和发展,我们仿佛可以捕捉到到智能交互发展轨迹.在一次大会分享中,我们谈 ...
阿里小蜜数字人多模态交互实践

编辑整理:贾惠然北京理工大学出品平台:DataFunTalk 导读:直播作为一种新的电商形态,电商直播化与直播电商化的现象已经逐渐普遍.本次分享主要围绕多模态与人机交互技术在电商直播中的应用.小蜜 ...
AI公开课：19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟

AI公开课:19.03.06何晓冬博士<自然语言与多模态交互前沿技术>课堂笔记以及个人感悟导读:AI与产业界结合,算法还是很重要的. 计算机能不能思考?会不会思考?把哲学问题转为科学问题 ...
让机器像人类一样多模态交互，会是物联网的胜负手吗？|A与T的协奏曲<四>

技术这个事情,很多时候不是一蹴而就的. 更多时候,是大家先看到了一个东西非常美好,结果左发展右发展也发展不起来,在吃瓜群众们兴奋地送上一首<凉凉>之后,搞不好哪天却突然一个胜负手抛出来,一 ...
汽车处理器产业研究：进口替代新赛道新机遇

(报告出品方/作者:中金公司,陈昊.彭虎) 核心观点 L3 或将成为 ADAS 硬件架构分水岭,AI SoC 部署将对 MCU 需求形成替代.从各大车厂现行方案来看,我们认为 L2 及以下 ADAS ...
基于全过程可视化建设的汽车物流优化研究

文|一汽物流(成都)有限公司向先文.隋艳辉.龙增.钱强全过程可视化是汽车物流优化发展的重要支撑和方向.结合Y公司汽车物流模式及可视化现状分析,通过AIoT(人工智能物联网)等技术应用,优化完善可视 ...
【e汽车】北京R SPACE落地 R汽车高端电动布局日渐清晰

北京SKP,这是一个寸土寸金的地方,就像北京这座古老的城市一样,充满底蕴又富有活力. 从2011年开始,北京SKP每年都位列内地商场销售榜第一.根据英国建筑师事务所Sybarite与GlobalDat ...
汽车处理器产业研究：进口替代+新赛道新机遇|电子|控制器|芯片

(报告出品方/作者:中金公司,陈昊.彭虎) 核心观点 L3 或将成为 ADAS 硬件架构分水岭,AI SoC 部署将对 MCU 需求形成替代.从各大车厂现行方案来看,我们认为 L2 及以下 ADAS ...
氢能源汽车动力系统集成研究

来源:摘自<北京汽车> 作者:谭元文丨武汉格罗夫氢能汽车有限公司 1 氢能源汽车动力系统的优势氢能源汽车采用氢气作为动力能源,在燃料电池系统里与氧气发生化学反应产生电,经过DC/DC( ...

汽车多模态交互研究：交互方式日渐多元化，多模态融合有待进一步加强

相关推荐