注册 登录 进入教材巡展
#
  • #

出版时间:2018-05

出版社:机械工业出版社

以下为《机器学习算法》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111595137
  • 1版
  • 227184
  • 47229796-9
  • 平装
  • 16开
  • 2018-05
  • 343
  • 245
  • 工学
  • 计算机科学与技术
  • TP181
  • 计算机通信类
  • 本科
内容简介
与机器学习领域很多偏重于理论的书相比,本书在简明扼要地阐明基本原理的基础上,侧重于介绍如何在Python环境下使用机器学习方法库,并通过大量实例清晰形象地展示了不同场景下机器学习方法的应用。从这个角度来说,本书是一本使机器学习算法通过Python实现真正”落地”的书,而这无疑将给想要或致力于机器学习应用的读者带来方法理解和实现上的巨大裨益。本书中的例子采用Python编写,使用了scikit-learn机器学习框架、自然语言工具包(NLTK)、Crab、langdetect、Spark、gensim和TensorFlow(深度学习框架),环境为Linux、Mac OS X或Windows平台的Python 2.7或3.3 版本。本书主要面向希望进入数据科学领域但对机器学习非常陌生的IT专业人员(*好熟悉Python语言)。此外,需要基本的数学知识(线性代数、微积分和概率论),以充分理解大部分章节的内容。
目录
目 录

Machine Learning Algorithms



译者序

前言

作者简介

审校人员简介

第1章 机器学习简介1

 1.1 经典机器和自适应机器简介1

 1.2 机器学习的分类2

  1.2.1 监督学习3

  1.2.2 无监督学习5

  1.2.3 强化学习7

 1.3 超越机器学习——深度学习和仿生自适应系统8

 1.4 机器学习和大数据9

 延伸阅读10

 本章小结10

第2章 机器学习的重要元素11

 2.1 数据格式11

 2.2 可学习性13

  2.2.1 欠拟合和过拟合15

  2.2.2 误差度量16

  2.2.3 PAC学习18

 2.3 统计学习方法19

  2.3.1 最大后验概率学习20

  2.3.2 最大似然学习20

 2.4 信息论的要素24

 参考文献26

 本章小结26

第3章 特征选择与特征工程28

 3.1 scikit-learn练习数据集28

 3.2 创建训练集和测试集29

 3.3 管理分类数据30

 3.4 管理缺失特征33

 3.5 数据缩放和归一化33

 3.6 特征选择和过滤35

 3.7 主成分分析37

  3.7.1 非负矩阵分解42

  3.7.2 稀疏PCA42

  3.7.3 核PCA43

 3.8 原子提取和字典学习45

 参考文献47

 本章小结47

第4章 线性回归48

 4.1 线性模型48

 4.2 一个二维的例子48

 4.3 基于scikit-learn的线性回归和更高维50

 4.4 Ridge、Lasso和ElasticNet53

 4.5 随机采样一致的鲁棒回归57

 4.6 多项式回归58

 4.7 保序回归60

 参考文献62

 本章小结62

第5章 逻辑回归64

 5.1 线性分类64

 5.2 逻辑回归65

 5.3 实现和优化67

 5.4 随机梯度下降算法69

 5.5 通过网格搜索找到最优超参数71

 5.6 评估分类的指标73

 5.7 ROC曲线77

 本章小结79

第6章 朴素贝叶斯81

 6.1 贝叶斯定理81

 6.2 朴素贝叶斯分类器82

 6.3 scikit-learn中的朴素贝叶斯83

  6.3.1 伯努利朴素贝叶斯83

  6.3.2 多项式朴素贝叶斯85

  6.3.3 高斯朴素贝叶斯86

 参考文献89

 本章小结89

第7章 支持向量机90

 7.1 线性支持向量机90

 7.2 scikit-learn实现93

  7.2.1 线性分类94

  7.2.2 基于内核的分类95

  7.2.3 非线性例子97

 7.3 受控支持向量机101

 7.4 支持向量回归103

 参考文献104

 本章小结104

第8章 决策树和集成学习105

8.1 二元决策树105

  8.1.1 二元决策106

  8.1.2 不纯度的衡量107

  8.1.3 特征重要度109

 8.2 基于scikit-learn的决策树分类109

 8.3 集成学习113

  8.3.1 随机森林114

  8.3.2 AdaBoost116

  8.3.3 梯度树提升118

  8.3.4 投票分类器120

 参考文献122

 本章小结122

第9章 聚类基础124

 9.1 聚类简介124

  9.1.1 k均值聚类125

  9.1.2 DBSCAN136

  9.1.3 光谱聚类138

 9.2 基于实证的评价方法139

  9.2.1 同质性140

  9.2.2 完整性140

  9.2.3 修正兰德指数141

 参考文献142

 本章小结142

第10章 层次聚类143

 10.1 分层策略143

 10.2 凝聚聚类143

  10.2.1 树形图145

  10.2.2 scikit-learn中的凝聚聚类147

  10.2.3 连接限制149

 参考文献151

 本章小结152

第11章 推荐系统简介153

 11.1 朴素的基于用户的系统153

 11.2 基于内容的系统156

 11.3 无模式(或基于内存的)协同过滤158

 11.4 基于模型的协同过滤160

  11.4.1 奇异值分解策略161

  11.4.2 交替最小二乘法策略163

  11.4.3 用Apache Spark MLlib实现交替最小二乘法策略164

 参考文献167

 本章小结167

第12章 自然语言处理简介169

 12.1 NLTK和内置语料库169

 12.2 词袋策略171

  12.2.1 标记172

  12.2.2 停止词的删除174

  12.2.3 词干提取175

  12.2.4 向量化176

 12.3 基于路透社语料库的文本分类器例子180

 参考文献182

 本章小结182

第13章 自然语言处理中的主题建模与情感分析183

 13.1 主题建模183

  13.1.1 潜在语义分析183

  13.1.2 概率潜在语义分析188

  13.1.3 潜在狄利克雷分配193

 13.2 情感分析198

 参考文献202

 本章小结202

第14章 深度学习和TensorFlow简介203

 14.1 深度学习简介203

  14.1.1 人工神经网络203

  14.1.2 深层结构206

 14.2 TensorFlow简介208

  14.2.1 计算梯度210

  14.2.2 逻辑回归212

  14.2.3 用多层感知器进行分类215

  14.2.4 图像卷积218

 14.3 Keras内部速览220

 参考文献225

 本章小结225

第15章 构建机器学习框架226

 15.1 机器学习框架226

  15.1.1 数据收集227

  15.1.2 归一化227

  15.1.3 降维227

  15.1.4 数据扩充228

  15.1.5 数据转换228

  15.1.6 建模、网格搜索和交叉验证229

  15.1.7 可视化229

 15.2 用于机器学习框架的scikit-learn工具229

  15.2.1 管道229

  15.2.2 特征联合232

 参考文献233

 本章小结233