语音信号处理(第2版) / 高等院校信息与通信工程系列教材
¥44.50定价
作者: 韩纪庆,张磊等
出版时间:2015-01
出版社:清华大学出版社
- 清华大学出版社
- 9787302302698
- 2-2
- 99841
- 16开
- 2015-01
- 工学
- 信息与通信工程
- TN912.3
- 机电类
内容简介
《语音信号处理(第2版)》系统地介绍语音信号处理的基础、概念、原理、方法与应用,以及该学科领域取得的新进展。全书共分9章,其中第1章绪论,介绍语音信号处理及其发展过程。第2章介绍语音产生与人类听觉的机理,传统的线性语音产生模型,以及近年来刚刚兴起的非线性语音产生模型。第3章从语音信号的时域特征入手,引入时频分析的思想,并进一步阐述时频分析中短时傅里叶变换和小波变换在语音信号特征分析中的应用,最后对广泛使用的倒谱特征以及同态解卷积进行介绍。第4章介绍语音信号的线性预测原理、解法、几种推演方法以及线谱对分析法。第5章介绍语音编码的相关知识,包括语音的波形编码、线性预测编码、极低速率语音编码技术,以及相关编码器的性能指标和评测方法。第6章介绍语音识别的基本内容,从基于矢量量化的识别技术到动态时间归正的识别技术,再到隐马尔可夫模型的识别技术,从孤立词识别到连接词识别及连续语音识别技术,再到关键词检出技术,最后还介绍近年来兴起的一些语音识别应用技术,包括语言学模型的自适应、htk应用以及lattice结构和混淆网络等。第7章介绍说话人识别的基本原理,主要包括说话人的特征选取、说话人识别的主要方法,以及近年来备受关注的gmm-ubm模型、开集说话人识别的规整技术等。第8章介绍近年来发展迅速的顽健语音识别技术,从影响语音识别性能的环境变化因素分析开始,介绍噪声环境下顽健语音识别技术,以及变异语音识别的技术。第9章介绍语音合成的基本原理、线性预测合成、共振峰合成以及汉语按规则合成,以及最近兴起的基于hmm合成技术等内容。 《语音信号处理(第2版)》可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。
目录
目录《语音信号处理(第2版)》第1章绪论1.1语音信号处理的发展1.2语音信号处理的应用1.3语音信号处理的总体结构参考文献第2章语音信号的声学基础及产生模型2.1语音信号的产生2.1.1语音的发音器官2.1.2语音的声学特征2.1.3语音信号在时域和频域的表示2.1.4汉语中语音的分类2.1.5汉语语音的韵律特性2.2语音信号的感知2.2.1听觉系统2.2.2听觉特性2.2.3掩蔽效应2.3语音信号的线性产生模型2.3.1激励模型2.3.2声道模型.2.3.3辐射模型2.4语音信号的非线性产生模型2.4.1调频-调幅模型的基本原理2.4.2 teager能量算子2.4.3能量分离算法2.4.4调频-调幅模型的应用参考文献第3章语音信号的特征分析3.1语音信号数字化3.1.1语音信号的采样和量化3.1.2短时加窗处理3.2语音信号的时域分析3.2.1短时能量分析3.2.2短时平均过零率3.2.3短时自相关函数和短时平均幅度差函数3.2.4端点检测和语音分割3.3语音信号的频域分析3.3.1滤波器组方法3.3.2傅里叶频谱分析3.4传统傅里叶变换缺点及时频分析的思想3.4.1信号的时频表示3.4.2不确定原理3.5 gabor变换3.6小波变换在语音信号分析中的应用3.6.1小波的数学表示及意义3.6.2小波分析特点3.6.3小波变换的多分辨分析3.6.4小波变换在语音处理中应用3.7语音信号的同态解卷积3.7.1同态信号处理的基本原理3.7.2语音信号的复倒谱3.7.3避免相位卷绕的算法3.7.4基于听觉特性的mel频率倒谱系数3.8语音信号特征应用3.8.1基音周期估计3.8.2共振峰的估计参考文献第4章语音信号的线性预测分析4.1线性预测的基本原理4.2线性预测方程组的解法4.2.1自相关法4.2.2协方差法4.2.3格型法4.2.4几种求解线性预测方法的比较4.3线性预测的几种推演参数4.3.1归一化自相关函数4.3.2反射系数4.3.3预测器多项式的根4.3.4 lpc倒谱4.3.5全极点系统的冲激响应及其自相关函数4.3.6预测误差滤波器的冲激响应及其自相关函数4.3.7对数面积比系数4.4线谱对分析法4.4.1线谱对分析的原理4.4.2线谱对参数的求解4.5感知线性预测plp系数参考文献第5章语音编码5.1波形编码5.1.1均匀量化pcm5.1.2非均匀量化pcm5.1.3自适应量化pcm5.1.4差分脉冲编码5.1.5自适应差分脉冲编码5.1.6增量调制和自适应增量调制5.1.7子带编码5.1.8自适应变换域编码5.2参数编码和混合编码5.2.1参数编码5.2.2基于全极点语音产生模型的混合编码5.2.3基于正弦模型的混合编码5.3极低速率语音编码技术5.3.1 400bps~1.2kbps的声码器5.3.2识别合成型声码器5.4语音编码器的性能指标和质量评测方法5.4.1编码速率5.4.2顽健性5.4.3时延5.4.4计算复杂度和算法的可扩展性5.4.5语音质量及其评价方法5.5语音编码国际标准5.6感知音频编码5.6.1感知编码的一般框架5.6.2心理声学模型5.6.3常用的感知编码标准参考文献第6章语音识别6.1概述6.2基于矢量量化的识别技术6.2.1 k-means矢量量化算法6.2.2 lbg算法6.3动态时间归正的识别技术6.3.1 dtw基本原理6.3.2模板训练算法6.4隐马尔可夫模型技术6.4.1 hmm基本思想6.4.2 hmm基本算法6.4.3 hmm算法实现中的问题6.4.4关于hmm训练的几点考虑6.5连接词语音识别技术6.5.1连接词识别问题的一般描述6.5.2二阶动态规划算法6.5.3分层构筑方法6.6大词表连续语音识别中的声学模型和语言学模型6.6.1声学模型6.6.2统计语言学模型6.6.3统计语言学模型平滑技术6.6.4语言学模型自适应技术6.7大词表连续语音识别中的解码技术6.7.1图的基本搜索算法6.7.2面向语音识别的搜索算法6.8大词表连续语音识别后处理技术6.8.1语音识别中间结果的表示形式6.8.2错误处理6.8.3最小字错误率解码方法6.9基于hmm的自适应技术6.9.1基于bayesian理论的自适应方法6.9.2基于变换的自适应方法6.10关键词检出技术6.10.1问题描述6.10.2关键词检出系统的组成6.10.3垃圾模型建模方法6.10.4语音解码器的设计6.10.5关键词确认过程6.10.6关键词检出系统性能优化6.11语音识别的应用技术6.11.1语音信息检索6.11.2发音学习技术6.11.3基于语音的情感处理6.11.4网络环境下的语音识别6.11.5嵌入式语音识别技术6.12htk工具介绍6.12.1数据准备阶段6.12.2模型训练阶段6.12.3识别阶段参考文献第7章说话人识别7.1概述7.2说话人识别的特征选取7.2.1特征参数的评价方法7.2.2说话人识别系统中常用的特征7.3说话人识别的主要方法7.3.1与文本有关的识别方法7.3.2与文本无关的识别方法7.3.3文本提示型的识别方法7.4阈值的选取7.5得分规整7.5.1零规整(zero normalization)7.5.2测试规整(test normalization)7.5.3说话人自适应的测试规整7.5.4 tz-norm7.5.5 h-norm7.5.6 c-norm7.6引入区分判别模型的说话人识别7.6.1 svm7.6.2基于svm的说话人识别7.6.3基于gmm得分的svm说话人识别7.6.4基于gmm均值超矢量的svm说话人识别7.7复杂信道下的说话人识别7.7.1特征映射7.7.2说话人模型合成7.7.3扰动属性投影7.7.4联合因子分析7.8说话人识别中有待解决的问题参考文献第8章顽健语音识别技术8.1概述8.2影响语音识别性能的环境变化因素8.3噪声环境下的顽健语音识别技术8.3.1基于语音增强的方法8.3.2通道畸变的抑制方法8.3.3基于模型的补偿方法8.4变异语音识别方法8.4.1变异语音的分析8.4.2变异语音的分类8.4.3变异语音的识别参考文献第9章语音合成9.1语音合成的基本原理9.2参数合成方法9.2.1线性预测合成方法9.2.2共振峰合成方法9.3波形拼接合成技术9.3.1 td-psola算法9.3.2 fd-psola算法9.4汉语按规则合成9.4.1韵律规则9.4.2多音节协同发音规则合成9.4.3轻声音节规则合成9.4.4儿化音节的规则合成9.5基于hmm的参数化语音合成技术9.5.1基于hmm参数语音合成系统的训练9.5.2基于hmm参数语音合成系统的合成阶段参考文献