嵌入式语音识别技术

应用领域语音识别将声音转换成文本和命令,从而达到语音输入、语音控制的目的。随着各种电子产品、移动产品的大量涌现,利用语音识别技术可以大大改善人机交互的方式。嵌入式语音识别技术,可以应用于多种基于Windows、WinCE、Linux等的应用系统、移动设备,可以通过语音来达到控制、查询和有限输入等“声控”目的。为顺应市场的潮流和推动语音识别技术的产业化,自动化所专门针对各种电子产品和移动电子产品,开发了一套基于连续语音识别技术的可变词汇、非特定人、命令词语音识别引擎 Pattek ASR/ESR, 这是一个具有良好接口的语音识别SDK引擎,该引擎在各种噪声环境、各种口音下,识别率具有稳定的识别率,且支持汉语、英语以及混合语言,支持Push-to-talk, Click-to-talk 和全声控等多种工作模式的应用。

Pattek ASR3.0/ESR主要特性1、  用户无需实现训练,为说话人无关系统,具有很好的抗口音能力;2、  识别准确率高,在常规语音拨号词表下(500左右)首选识别率可以达到95%;3、  卓越的抗噪性能:在大街上和汽车内等嘈杂的环境下仍能保持实用化的准确率;4、  占用系统资源少:系统程序空间98K,运行空间100K,模型空间270K,总共约475K;5、  能可以实现真正的Hand free操作,人与麦克风只要保持在30cm距离,系统都能正常工 作;6、  系统在要求下处于监控状态,能主动抓住系统所需要辨识的关键词和句型,而有效地拒绝非关键词和非定义句型;7、  句型可以由用户自行定义;8、  支持多个词表之间的切换和增词、减词功能;9、  任意提供多个识别候选,提高二次交互的准确率等;10、   具有良好的识别操作实时性,识别可以实时完成;11、   系统具有良好的实用性,可以在各种环境中使用,识别效果良好;12、   产品代码极其优化,占有很少的存储空间和运行空间。Pattek ASR3.0/ESR主要性能指标Pattek ASR3.0/ESR嵌入式系列识别引擎采用标准C语言编写,支持移植到任何第三方操作系统,实现强大的语音人机交互功能。已经实施移植过的支持的操作系统包括微软的WM5、PPC2002、2003,SmartPhone2002、2003等;Symbian联盟的Symbians60,嵌入式Linux如移软Mphone系统、博动OPNA系统,类Linux环境Nucles,低端运行环境REX,基带专用系统MTK等。Pattek ASR3.0/ESR 引擎可以根据CPU的性能特点进行裁减,在超过20MIPS运行能力的芯片上均可正常运行。如Intel的Xscale,PXA, TI的OMAP和TMS-54x/55x DSPs AD,高通的基于ARM9的5500系列,Philips Dragon Fly,展讯的6600M系列,MTK 62系列, ARM7/ARM9,BroadCOM等。下表为主要参数:内容描述缺省支持扩展支持录音数据采样率8k16k等,可定制数据表示16bit支持采样精度10-16bit通道数单声道最大录音时间3秒可定制识别命令集词编码GB2312Unicode等词形式汉字、数字、拼音英语命令集最大个数2可定制命令集名称最大长度10可定制RAM资源分配方式动态分配、静态分配ASR初始化内存13kASR词表内存3-4k(每100词)ASR一次识别过程所需内存63k(识别完释放)可调整TTS内存5k(一次支持20汉字)可定制ROM资源ASR程序(lib库)72k平台相关、优化TTS程序80k平台相关、优化ASR数据283k优化TTS数据671k优化识别速度20MIPS CPU、通常词表不超过2倍实时平台相关

(0)

相关推荐

  • 智能语音识别(ASR)应用领域

    沃丰科技GaussMind智能语音识别(ASR)主要用来提升效率.解放人力,深耕垂直行业,集中应用于客服.教培.医疗.金融等领域. 客服:企业呼叫中心的智能转写功能,实时记录客户询问问题.语音客服机器 ...

  • 从熵增定律理解AI在呼叫中心应用

    视频来源 | 客户观察·2021(第五届)华东峰会 分享嘉宾 | 普强销售VP张治 分享主题 | 从熵增定律理解AI在呼叫中心的应用 本文速览: 1.熵增定律 2.客服中心管理过程中的问题分解 3.价 ...

  • ASR征服A

    ASR征服A

  • 人工智能教程-语音识别技术

    语音识别技术是人工智能技术中的主要方向之一,为了能够深入了解人工智能技术信息,那么必然需要对语音识别技术相关信息进行了解. 语音识别演示系统展示了计算机自动将人类的语音内容转换为相应文字的能力.语音识 ...

  • 2021全国声学大会语言声学分论坛报告—第三代语音识别技术初探(1)

    根据3月29日在上海召开的全国声学大会语言声学分论坛上的现场报告整理而成.报告较长,为方便阅读拆分成两部分.本文为第一部分. 未完待续... 永久福利 直投简历 (简历投递):yuyinzatan@1 ...

  • 常见的语音识别技术类型有哪些?

    随着人工智能技术的发展,人工智能技术类型也更加的广泛,并且这些技术也在各行各业当中,广泛应用开来.如果想要在人工智能行业当中长久发展,必然需要了解这些.那么常见的语音识别技术类型有哪些呢? 目前具有代 ...

  • 语音识别技术的发展与展望

    一般来说作为人工智能工程师,不仅需要提升自己的能力,同时也要了解清楚人工智能技术的发展趋势等信息.接下来小编带你去了解一下,语音识别技术的发展与展望: 回顾语音识别的技术发展历史,我们发现,技术的突破 ...

  • 语音识别技术的常见应用有哪些?

    众所周知人工智能方面的人才,既可以受到企业的重视,同时还可以获得良好的待遇,所以吸引了很多人想要转行进入人工智能行业.为了能够顺利进入人工智能行业,需要明白人工智能技术分支的应用.那么语音识别技术的常 ...

  • 语音识别技术概述

     深度学习数据集 Author:louwill From:深度学习笔记 语音识别(Speech Recognition)是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类的语音.除 ...

  • 语音识别技术分析:语音变成文字其实没有那么神秘

    描述 简要给大家介绍一下语音怎么变文字的吧.希望这个介绍能让所有同学看懂. 首先,我们知道声音实际上是一种波.常见的 mp3.wmv 等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如 Win ...

  • 人机交互的语音识别技术

    语音识别技术 自动语音识别技术,简单来说其实就是利用计算机将语音信号自动转换为文本的一项技术.这项技术同时也是机器理解人类言语的第一个也是很重要的一个过程. 语音识别是一门交叉学科,所涉及的领域有信号 ...

  • 【今日头条】“ZEN架构”助高性能嵌入式处理技术步入新时代

    编者按:在过去两年里,AMD公司频频发布处理器新品.继推出基于ZEN架构霄龙7000处理器后,AMD公司又隆重宣布了霄龙3000和锐龙1000两款高性能嵌入式处理器,将新架构从核心计算推向了边缘市场, ...