注册 登录 进入教材巡展
#
  • #

出版时间:2019-01

出版社:中国人民大学出版社

以下为《大数据挖掘与统计机器学习(第2版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国人民大学出版社
  • 9787300264066
  • 226917
  • 48213058-0
  • 16开
  • 2019-01
  • 350
  • 理学
  • 数学
  • TP274;TP181
  • 统计、经管
  • 本科
内容简介
本书介绍数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。最后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,我们给出了每种方法的R语言实现以及Python语言实现的上机实践。本书的一个亮点是最后一章给出的三个大数据案例,数据量均在10G左右。我们同时给出了单机版(Python、数据库、R)和分布式(Hadoop、Hive、Spark)两种实现方案。原始数据和程序代码均可在中国人民大学出版社网站上下载。 本书对第一版的改进是在读者反馈意见的基础上,增加了理论部分的Lasso模型求解、组合方法的Xgboost方法、支持向量机的SMO求解方法、深度学习的CNN方法等内容;同时所有方法给出了Python语言实现的上机实践;并且第十章增加了第三个大数据案例。以期跟进本领域最新前沿。 本书面向的主要读者是统计专业本科生以及其他各个领域有数据分析需求的学生和从业人员。
目录
第1章概述 1.1名词演化 1.2基本内容 1.3数据智慧 第2章线性回归方法 2.1多元线性回归 2.2压缩方法:岭回归与Lasso 2.3*Lasso 模型的求解与理论性质 2.4损失函数加罚的建模框架 2.5上机实践:R 2.6