自然语言及语音处理项目式教程 / 高等职业教育系列教材
¥65.00定价
作者: 关志广,王玲,区映映
出版时间:2025-06-11
出版社:机械工业出版社
- 机械工业出版社
- 9787111774389
- 1-1
- 548134
- 平装
- 2025-06-11
- 362
- 高职
内容简介
本书内容涵盖自然语言处理、语音信号处理这两项人机交互领域的重要技术,以项目式教学的方式,帮助读者快速掌握相关知识和提高项目开发的能力。本书共7个项目:项目1重点介绍自然语言处理和语音信号处理技术相关背景、开发环境和项目开发流程的基本知识,对搭建项目开发环境进行项目实战;项目2~4重点介绍自然语言处理技术中词法分析、句法分析、文本向量化、文本分类和聚类的基本知识,对中文命名实体识别、基于机器学习的文本分类、基于深度学习的文本情感分析进行项目实战;项目5~7重点介绍语音信号处理技术中数字音频预处理、特征提取、语音识别和语音合成的基本知识,对语音数据特征提取、语音和环境音识别、语音合成进行项目实战。在每个项目中,读者可以通过实例模块巩固理论知识,并在项目实战模块中提升综合应用能力。
本书可以作为高等职业院校人工智能相关专业课程的教材,也可作为职业技能等级证书的教学和培训用书,还可作为自然语言处理开发人员的参考用书。
本书可以作为高等职业院校人工智能相关专业课程的教材,也可作为职业技能等级证书的教学和培训用书,还可作为自然语言处理开发人员的参考用书。
目录
项目 1 搭建自然语言及语音信号处理开发环境
1.1 项目导入
1.2 知识链接
1.2.1 自然语言处理技术
1.2.2 语音信号处理技术
1.3 项目实战
1.3.1 部署 Python 开发环境
1.3.2 安装 PyTorch 框架
1.3.3 安装 PaddlePaddle 框架
1.3.4 验证开发环境
1.4 项目小结
1.5 知识拓展
1.6 习题
项目 2 进行中文命名实体识别
2.1 项目导入
2.2 知识链接
2.2.1 语料库
2.2.2 中文分词
2.2.3 词性标注
2.2.4 关键词提取
2.2.5 命名实体识别
2.3 项目实战
2.3.1 定义 CorpusProcess 类
2.3.2 定义 CRF_NER 类
2.3.3 模型训练与评估
2.3.4 模型预测
2.4 项目小结
2.5 知识拓展
2.6 习题
项目 3 实现机器学习的新闻内容分类
3.1 项目导入
3.2 知识链接
3.2.1 句法分析
3.2.2 文本向量化
3.2.3 文本分类与聚类
3.3 项目实战
3.3.1 准备数据集
3.3.2 模型训练
3.3.3 模型评估
3.3.4 模型预测
3.4 项目小结
3.5 知识拓展
3.6 习题
项目 4 实现深度学习的酒店评价情感分析
4.1 项目导入
4.2 知识链接
4.2.1 深度学习简介
4.2.2 卷积神经网络
4.2.3 循环神经网络
4.2.4Transformer 模型
4.2.5 深度学习框架
4.3 项目实战
4.3.1 读取语料数据集
4.3.2 语料预处理和特征提取
4.3.3 模型定义
4.3.4 模型训练
4.3.5 模型评估
4.3.6 模型测试
4.4 项目小结
4.5 知识拓展
4.6 习题
项目 5 提取语音数据的 MFCC 特征
5.1 项目导入
5.2 知识链接
5.2.1 语音的物理基础
5.2.2 语音信号的表征
5.2.3 语音信号的数字化
5.2.4 语音信号的预处理
5.2.5 语音信号的时域分析
5.2.6 语音信号的频域分析
5.2.7 语音信号的倒谱分析
5.3 项目实战
5.3.1 语音文件读取
5.3.2 语音信号预处理
5.3.3MFCC 特征提取
5.4 项目小结
5.5 知识拓展
5.6 习题
项目 6 实现单句语音和复杂环境音识别
6.1 项目导入
6.2 知识链接
6.2.1 语音识别简介
6.2.2 环境音识别简介
6.2.3 语音和环境音识别算法
6.3 项目实战
6.3.1 单句语音识别
6.3.2 复杂环境音识别
6.4 项目小结
6.5 知识拓展
6.6 习题
项目 7 实现新闻文本语音播报
7.1 项目导入
7.2 知识链接
7.2.1 语音合成简介
7.2.2 语音合成算法
7.3 项目实战
7.3.1 数据及模型准备
7.3.2 数据预处理
7.3.3 构建声学模型
7.3.4 声码器合成语音
7.3.5 结果评价
7.4 项目小结
7.5 知识拓展
7.6 习题
附录
附录 A APKU 词性标注集
附录 B CTB 词性标注集
附录 C SDC 依存关系标注集
参考文献
1.1 项目导入
1.2 知识链接
1.2.1 自然语言处理技术
1.2.2 语音信号处理技术
1.3 项目实战
1.3.1 部署 Python 开发环境
1.3.2 安装 PyTorch 框架
1.3.3 安装 PaddlePaddle 框架
1.3.4 验证开发环境
1.4 项目小结
1.5 知识拓展
1.6 习题
项目 2 进行中文命名实体识别
2.1 项目导入
2.2 知识链接
2.2.1 语料库
2.2.2 中文分词
2.2.3 词性标注
2.2.4 关键词提取
2.2.5 命名实体识别
2.3 项目实战
2.3.1 定义 CorpusProcess 类
2.3.2 定义 CRF_NER 类
2.3.3 模型训练与评估
2.3.4 模型预测
2.4 项目小结
2.5 知识拓展
2.6 习题
项目 3 实现机器学习的新闻内容分类
3.1 项目导入
3.2 知识链接
3.2.1 句法分析
3.2.2 文本向量化
3.2.3 文本分类与聚类
3.3 项目实战
3.3.1 准备数据集
3.3.2 模型训练
3.3.3 模型评估
3.3.4 模型预测
3.4 项目小结
3.5 知识拓展
3.6 习题
项目 4 实现深度学习的酒店评价情感分析
4.1 项目导入
4.2 知识链接
4.2.1 深度学习简介
4.2.2 卷积神经网络
4.2.3 循环神经网络
4.2.4Transformer 模型
4.2.5 深度学习框架
4.3 项目实战
4.3.1 读取语料数据集
4.3.2 语料预处理和特征提取
4.3.3 模型定义
4.3.4 模型训练
4.3.5 模型评估
4.3.6 模型测试
4.4 项目小结
4.5 知识拓展
4.6 习题
项目 5 提取语音数据的 MFCC 特征
5.1 项目导入
5.2 知识链接
5.2.1 语音的物理基础
5.2.2 语音信号的表征
5.2.3 语音信号的数字化
5.2.4 语音信号的预处理
5.2.5 语音信号的时域分析
5.2.6 语音信号的频域分析
5.2.7 语音信号的倒谱分析
5.3 项目实战
5.3.1 语音文件读取
5.3.2 语音信号预处理
5.3.3MFCC 特征提取
5.4 项目小结
5.5 知识拓展
5.6 习题
项目 6 实现单句语音和复杂环境音识别
6.1 项目导入
6.2 知识链接
6.2.1 语音识别简介
6.2.2 环境音识别简介
6.2.3 语音和环境音识别算法
6.3 项目实战
6.3.1 单句语音识别
6.3.2 复杂环境音识别
6.4 项目小结
6.5 知识拓展
6.6 习题
项目 7 实现新闻文本语音播报
7.1 项目导入
7.2 知识链接
7.2.1 语音合成简介
7.2.2 语音合成算法
7.3 项目实战
7.3.1 数据及模型准备
7.3.2 数据预处理
7.3.3 构建声学模型
7.3.4 声码器合成语音
7.3.5 结果评价
7.4 项目小结
7.5 知识拓展
7.6 习题
附录
附录 A APKU 词性标注集
附录 B CTB 词性标注集
附录 C SDC 依存关系标注集
参考文献