注册 登录 进入教材巡展
#

出版时间:2022-09

出版社:高等教育出版社

以下为《自然语言处理理论与实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 高等教育出版社
  • 9787040593969
  • 1版
  • 454328
  • 44259808-2
  • 16开
  • 2022-09
  • 350
  • 300
  • 计算机科学与技术、软件工程、人工智能、数据科学与大数据、智能科学与技术
  • 本科 研究生及以上
内容简介

本书系统介绍自然语言处理(NLP)的基础知识、核心技术和典型任务场景,同时具有配套的实验方案。教材依据“理论方法—关键技术—实战应用”的自主学习脉络,分为8章。其中:第1~3章概要介绍自然语言处理领域的若干基本概念与理论知识,同时包括了神经网络基础和语言模型与向量表示等进阶内容;第4章重点讲解了不同层次的语言要素分析和处理技术;第5~8章通过具体实例,围绕机器翻译、信息抽取、自动问答、机器阅读等典型任务场景,重点阐述了其各自的实现流程、前沿技术进展等关键内容。

全书通过原理解析、算法说明、代码实现等灵活手段,深入浅出地引导读者领略自然语言处理的独特魅力。本书配套的若干典型任务的程序代码,便于读者结合自身兴趣同步实践,浸入自然语言处理领域的热点问题求解,激发探索及创新精神。本书适合作为高校人工智能、计算机科学与技术、软件工程等相关专业自然语言处理课程教材。

目录

 前辅文
 第1章 绪论
  1.1 什么是自然语言
  1.2 什么是自然语言处理
  1.3 自然语言处理发展历程
  1.4 自然语言处理的难点与挑战
  1.5 基本概念与术语
  1.6 学习本书的预备知识基础
  本章习题
 第2章 人工神经网络
  2.1 人工神经网络基础
   2.1.1 神经元与感知机
   2.1.2 激活函数
  2.2 前馈神经网络
   2.2.1 前馈神经网络概念
   2.2.2 反向传播算法
   2.2.3 前馈神经网络实践
  2.3 循环神经网络
   2.3.1 简单循环神经网络
   2.3.2 循环神经网络的训练
   2.3.3 双向循环神经网络
   2.3.4 基于门控的循环神经网络
   2.3.5 循环神经网络实践
  2.4 卷神经网络
   2.4.1 卷积网络结构
   2.4.2 卷积神经网络实践
   2.4.3 基于MindSpore的卷积神经网络实践
  本章习题
  参考文献
 第3章 语言模型与向量表示
  3.1 语言模型
   3.1.1 语言模型概述
   3.1.2 统计语言模型
   3.1.3 神经网络语言模型
  3.2 向量表示
   3.2.1 离散向量表示
   3.2.2 稠密向量表示
   3.2.3 向量表示评价
   3.2.4 向量表示实践
  本章习题
  参考文献
 第4章 语言分析技术
  4.1 引言
  4.2 中文分词
   4.2.1 基本问题
   4.2.2 经典的分词算法
   4.2.3 中文分词实践
  4.3 依存句法分析
   4.3.1 概述
   4.3.2 常用的依存句法分析方法
   4.3.3 依存句法分析性能评价指标
   4.3.4 基于前馈神经网络的依存句法分析实验
   4.3.5 常用依存句法分析工具
   4.3.6 总结
  4.4 语义角色标注
   4.4.1 概述
   4.4.2 语义角色标注方法
   4.4.3 语义角色标注实践
  本章习题
  参考文献
 第5章 机器翻译
  5.1 机器翻译发展概况
  5.2 基于规则的机器翻译方法
  5.3 基于统计的机器翻译方法
   5.3.1 方法介绍
   5.3.2 基于统计的机器翻译实践
  5.4 基于神经网络的机器翻译方法
   5.4.1 编码器一解码器框架
   5.4.2 循环神经网络翻译框架
   5.4.3 基于注意力机制的翻译框架
   5.4.4 Transformer翻译框架
   5.4.5 翻译实践
  5.5 机器翻译质量评价
   5.5.1 人工评价
   5.5.2 自动评价
  5.6 翻译质量估计
  5.7 翻译开源工具与技术评测
   5.7.1 开源工具
   5.7.2 技术评测
  5.8 现状与挑战
  本章习题
  参考文献
 第6章 信息抽取
  6.1 发展概况
   6.1.1 命名实体识别方法
   6.1.2 关系抽取方法
  6.2 实体识别模型
   6.2.1 基于统计的实体识别模型
   6.2.2 基于双向LSTM和CRF的实体识别模型
   6.2.3 基于栅格LSTM的中文实体识别模型
   6.2.4 基于预训练语言模型的实体识别实践
  6.3 关系抽取
   6.3.1 基于分段卷积神经网络的关系抽取模型
   6.3.2 基于实例选择性注意力机制的关系抽取模型
   6.3.3 DocRED关系抽取实践
  6.4 信息抽取评价标准
   6.4.1 TIPSTER项目与MUC系列会议
   6.4.2 TIDES项目与ACE系列会议
   6.4.3 基于指称匹配的评价标准
   6.4.4 远程监督模式中的评价标准
  6.5 现状与挑战
  本章习题
  参考文献
 第7章 问答系统
  7.1 概述
  7.2 基于结构化数据的问答系统
   7.2.1 人工智能时期
   7.2.2 计算语言学时期
   7.2.3 总结
  7.3 基于自由文本的问答系统
   7.3.1 问题分析
   7.3.2 信息检索
   7.3.3 答案抽取
  7.4 基于问题对的问答系统
   7.4.1 常问问题和社区问答的对比
   7.4.2 问答系统的关键环节
  7.5 发展趋势
  7.6 项目实践:基于社区问答的对话式问答系统
   7.6.1 项目介绍
   7.6.2 系统整体架构
   7.6.3 爬虫模块
   7.6.4 相似问句计算
   7.6.5 系统效果
  本章习题
  参考文献
 第8章 机器阅读理解
  8.1 概述
  8.2 任务分类
   8.2.1 完形填空
   8.2.2 多项选择
   8.2.3 文本抽取
   8.2.4 自由回答
  8.3 评测指标
   8.3.1 准确性
   8.3.2 精确匹配
   8.3.3 F1值
   8.3.4 ROUGE-L
   8.3.5 BLEU值
  8.4 基于深度学习的阅读理解模型
   8.4.1 传统深度学习基本框架
   8.4.2 传统深度学习的阅读理解模型
   8.4.3 基于预训练语言模型的基本框架
   8.4.4 基于预训练语言模型的模型介绍
  8.5 项目实践:基于预训练语言模型的阅读理解系统
   8.5.1 项目介绍
   8.5.2 数据预处理
   8.5.3 下载并导入预训练语言模型
   8.5.4 基于预训练模型的阅读理解模型构建
   8.5.5 模型训练
   8.5.6 模型推理
   8.5.7 模型测试
  8.6 总结与展望
  本章习题
  参考文献