人工智能教程-语音识别技术
语音识别技术是人工智能技术中的主要方向之一,为了能够深入了解人工智能技术信息,那么必然需要对语音识别技术相关信息进行了解。
语音识别演示系统展示了计算机自动将人类的语音内容转换为相应文字的能力。语音识别基本过程为语音信号预处理与特征提取、声学模型与模式匹配、语言模型与语言处理。
语言识别技术有以下几个原理:
训练:预先分析出语音特征参数、制作语音模版并存放在语音参数库中。
识别:待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板——比较并采用判决的方法找出最接近语音特征的模板得出识别结果。识别有以下几种方法:基于模式匹配的动态时间规整法、基于统计模型的隐马尔柯夫模型法、基于统计模型的深度神经网络。
失真测度:在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。
从语音识别算法的发展来看,主要分为三大类:
第一类是模型匹配法,包括矢量量化(VQ)、动态时间规整(DTW)等;
第二类是概率统计方法,包括高斯混合模型 (GMM)、隐马尔科夫模型(HMM)等;
第三类是辨别器分类方法,如支持向量机(SVM)、人工神经网络(ANN)和深度神经网络(DNN)等以及混合方法 。
赞 (0)