中国信通院在虚拟数字人领域又有新突破,主导的两项国际标准在ITU-T成功立项
国际电信联盟第十六研究组(简称ITU-T SG16)于2021年4月19日至2021年4月30日召开全体会议,来自中国、美国、德国、巴西、西班牙、俄罗斯、瑞士、加拿大、英国、韩国、日本等国家和世界卫生组织等国际组织的百余名代表参加了此次为期两周的在线会议。
会上,由中国信息通信研究院提出的ITU-T F.DH-FM 'Framework and metrics for digital human application system'(数字人应用系统基础框架和评测指标)和ITU-T F.DH-2D 'Requirements and evaluation methods of non-interactive 2D real-person digital human application system'(非交互式2D真人形象类数字人应用系统指标要求和评估方法)经过与英国、美国、日本等国际专家的深入研讨,最终正式立项。
虚拟数字人(简称“数字人”)是指基于现实世界设计、通过计算机生成、再借助电子屏、VR等设备载体显示的虚拟人物,是一种融合了包括计算机图形学、计算机视觉、智能语音、自然语言处理等多种技术的人机交互应用。在人工智能、虚拟现实等新技术浪潮的带动下,虚拟数字人制作过程得到有效简化、各方面性能获得飞跃式提升,开始从外观的数字化逐渐深入到行为的交互化、思想的智能化。目前数字人技术已在传媒、金融、教育、政务、新零售、通信等多个领域实现技术落地,衍生出虚拟主播、虚拟员工等典型应用。随着该技术的不断普及和进步,其应用场景将不断丰富,发展空间将不断拓展。
数字人作为新型人机交互应用,基本保障了各场景的需求,但还存在数据和基础技术积累不足、产品质量参差不齐、智能化程度尚有空间等问题,在不同系统平台的产品化程度、安全性、扩展性、性能等方面表现各异,造成各行业对于数字人产品及应用的信心不足。为此,需强化数字人产品的测评工作,提升数字人相关系统的功能完备性与成熟度,提高市场对数字人产品及应用的信任。目前,关于数字人功能与性能测试方法及测试流程的标准尚处于空白阶段。如何衡量数字人系统是否满足相关功能与性能要求成为困扰整个产业向前发展的一个问题。
在2021年4月ITU SG16的全会上正式立项的两个数字人标准规范,ITU-T F.DH-FM 'Framework and metrics for digital human application system'(数字人应用系统基础框架和评测指标)和ITU-T F.DH-2D 'Requirements and evaluation methods of non-interactive 2D real-person digital human application system'(非交互式2D真人形象类数字人应用系统指标要求和评估方法),是全球范围内首次提出的关于数字人的评测标准。前者提出了基于AI的数字人应用系统的评测框架,涵盖形象、语音、动作、大脑、显示等维度的主客观指标。后者则是在前者的基础上,主要聚焦于目前商业化最为成熟的一类数字人应用系统,即2D真人形象类数字人应用系统的指标要求和评估方法。
这两项数字人国际标准由中国信息通信研究院牵头并担任编辑人(Editor)。其评测指标和测试方法均采纳了联盟评估规范和中国通信化标准协会行业标准的相关内容,参与单位包括百度、腾讯、搜狗、南京新一代人工智能研究院有限公司、凌云光、网易、思必驰、央视网、科大讯飞、北京航空航天大学等20余家企业、高校及科研机构。
数字人国际标准的正式立项,标志着我国在数字人领域评测能力得到了国际认可,也是我国数字人科研人员对国际标准化研究的重要贡献,将为我国数字人技术、产品和评测走出国门开辟了道路。
ITU(国际电信联盟)为三大国际标准化组织之一,ITU-T即国际电信联盟电信标准分局 (ITU-T for ITU Telecommunication Standardization Sector), 它是ITU管理下的专门制定电信标准的分支机构。ITU-T SG16是国际电信联盟标准化局非常活跃的研究组,主要研究领域为多媒体与e-Services。目前,SG16的研究范围覆盖了视频与音频处理与压缩编码、视频监控、内容分发、大数据、区块链、人工智能等众多热点标准化研究方向。