注册 登录 进入教材巡展
#

出版时间:2025-11

出版社:电子工业出版社

以下为《数据科学导引》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121517112
  • 1-1
  • 568555
  • 平塑
  • 16开
  • 2025-11
  • 468
  • 360
  • 工学
  • 计算机类
  • 计算机科学与技术
  • 本科 研究生及以上
内容简介
本书系统介绍数据科学核心理论与技术,融合了数学、统计学和计算机科学等多学科知识,旨在构建完整的数据科学知识体系。全书共 15 章,主要内容包括数据预处理、经典机器学习模型(回归、分类、聚类、集成)、关联规则挖掘、特征工程(降维与特征选择)、最大期望算法、概率图模型、深度学习、文本分析、图与网络分析以及分布式计算等核心模块。特别值得关注的是,本书对当前热点技术如Transformer、BERT、图神经网络等进行了讲解,并设有专门的文本分析和图与网络分析章节。此外,书中包含丰富的附录内容,涵盖了矩阵运算、概率论、优化算法等数学基础,为读者提供了必要的知识储备。本书主要面向高等院校数据科学与大数据技术专业的学生,可作为专业核心课程的教材,同时也适合相关领域的研究人员和工程技术人员参考。对于希望系统掌握数据科学技术、具备解决实际数据问题能力的读者来说,本书提供了从基础到前沿的完整学习路径。通过本书的学习,读者能够建立扎实的数据科学理论基础,并获得宝贵的实践经验。
目录
第 1 章 绪论........................................................ 1
1.1 数据科学的基本内容 ........................................ 2
1.1.1 数据分析的中心问题 ..................................... 4
1.1.2 数据的数学结构 ......................................... 5
1.1.3 数据分析的主要困难 ..................................... 6
1.1.4 算法的重要性 ........................................... 6
1.2 数据科学对学科发展的影响 ................................. 7
1.2.1 对传统学科的冲击 ....................................... 8
1.2.2 新学科的诞生:计算广告学 ............................... 9
1.3 数据科学对科学研究的影响 ................................ 10
1.4 数据科学的课程体系....................................... 10
1.5 本书结构 .................................................. 11
第 2 章 数据预处理................................................ 13
2.1 特征编码 .................................................. 14
2.1.1 数字编码.............................................. 14
2.1.2 One-Hot 编码 ......................................... 15
2.2 缺失值处理 ................................................ 16
2.3 数据标准化 ................................................ 19
2.3.1 Z-score 标准化......................................... 19
2.3.2 Min-Max 标准化 ....................................... 20
2.3.3 小数定标标准化 ........................................ 21
2.3.4 Logistic 标准化 ........................................ 21
2.3.5 不同标准化方法的对比 .................................. 22
2.4 特征离散化 ................................................ 23
2.4.1 等距离散化............................................ 24
2.4.2 等频离散化............................................ 25
2.4.3 聚类离散化............................................ 26
2.4.4 信息增益离散化 ........................................ 26
2.4.5 卡方离散化............................................ 27
2.4.6 类别属性相互依赖最大化 ................................ 28
2.4.7 小结..................................................29
2.5 离群值检测 ................................................ 29
2.5.1 基于统计的方法 ........................................ 30
2.5.2 基于近邻的方法 ........................................ 30
2.5.3 小结..................................................33
2.6 其他预处理方法 ........................................... 33
案例与实战 ..................................................... 33
第 3 章 回归模型 .................................................. 35
3.1 线性回归 .................................................. 36
3.1.1 一元线性回归 .......................................... 36
3.1.2 多元线性回归 .......................................... 37
3.1.3 小结..................................................38
3.2 线性回归正则化 ........................................... 39
3.2.1 岭回归和 LASSO.......................................39
3.2.2 其他正则化的线性回归模型 .............................. 43
3.3 非线性回归 ................................................ 44
3.3.1 样条回归.............................................. 44
3.3.2 径向基函数网络 ........................................ 46
案例与实战 ..................................................... 48
第 4 章 分类模型 .................................................. 50
4.1 逻辑回归 .................................................. 51
4.1.1 从线性回归到逻辑回归 .................................. 52
4.1.2 参数估计.............................................. 53
4.1.3 小结..................................................54
4.2 k-近邻..................................................... 55
4.2.1 k 值的选择 ............................................ 56
4.2.2 提高预测性能 .......................................... 57
4.2.3 小结..................................................58
4.3 决策树 .................................................... 59
4.3.1 决策树的生成 .......................................... 60
4.3.2 常见的决策树算法 ...................................... 6