注册 登录 进入教材巡展
#
  • #
  • #

出版时间:2020-12

出版社:高等教育出版社

以下为《数据科学与工程算法基础》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 高等教育出版社
  • 9787040553369
  • 1版
  • 368887
  • 44259700-1
  • 平装
  • 16开
  • 2020-12
  • 400
  • 300
  • 工学
  • 计算机科学与技术
  • 数据科学与大数据技术
  • 本科
内容简介

本书从概率统计、线性代数和组合优化角度出发, 介绍经典的数据科学与工程算法, 内容涉及数据分析处理全流程的算法及其数学基础, 主要包括抽样算法; 尾概率不等式及其应用; 典型的哈希技术, 如布隆过滤器和局部敏感哈希; 数据流模型以及典型 Misra Gries 算法、Count Sketch 算法; 随机游走及其应用; EM 算法; 特征值计算; 奇异值分解和主成分分析;矩阵分解; 整数规划; 子模函数及其应用; 模块度及社区发现等。全书配有大量翔实的应用实例可供参考, 有相当数量的习题可供读者练习。

本书可作为数据科学与大数据技术专业本科生、研究生相关课程的教材或参考书, 也可供相关领域技术人员参考。

目录

 前辅文
 第1 章绪论
  1.1 数据分析处理阶段
   1.1.1 数据采集
   1.1.2 数据预处理
   1.1.3 数据存储与管理
   1.1.4 数据分析与挖掘
   1.1.5 数据可视化
  1.2 算法设计原则
   1.2.1 数据特点
   1.2.2 算法评价
   1.2.3 算法设计原则
  本章小结
  习题
 第2 章抽样算法
  2.1 引入
  2.2 基本概念
   2.2.1 总体与样本
   2.2.2 抽样调查
  2.3 系统抽样
   2.3.1 直线等距抽样
   2.3.2 圆形等距抽样
   2.3.3 系统抽样特点
  2.4 分层抽样
  2.5 水库抽样
   2.5.1 水库抽样算法
   2.5.2 算法分析
   2.5.3 分布式水库抽样算法
  本章小结
  习题
 第3 章尾概率不等式及其应用
  3.1 引入
  3.2 Markov 不等式
  3.3 Chebyshev 不等式
  3.4 Chernoff 不等式
  3.5 尾概率不等式的应用—— Morris 算法
   3.5.1 Morris 算法
   3.5.2 Morris+ 算法
   3.5.3 Morris++ 算法
  本章小结
  习题
 第4 章哈希技术
  4.1 引入
  4.2 哈希
  4.3 布隆过滤器
   4.3.1 布隆过滤器的基本原理
   4.3.2 误判率
   4.3.3 降低误判率
   4.3.4 应用场景
  4.4 局部敏感哈希
   4.4.1 哈希函数的选择
   4.4.2 Shingling
   4.4.3 Min-Hashing
   4.4.4 基于Min-Hashing的局部敏感哈希过程
   4.4.5 应用场景
  本章小结
  习题
 第5 章数据流模型及频繁项挖掘
  5.1 引入
  5.2 数据流模型
   5.2.1 数据流和数据流模型
   5.2.2 数据流子模型
   5.2.3 概要数据结构
   5.2.4 近似算法
  5.3 频繁项挖掘
  5.4 确定性近似频数算法Misra Gries
   5.4.1 Misra Gries 算法
   5.4.2 Misra Gries 算法分析
  5.5 随机近似频数算法Count Sketch
   5.5.1 简单抽样算法
   5.5.2 Basic Count Sketch算法
   5.5.3 Count Sketch 算法
   5.5.4 Count-Min Sketch算法
  本章小结
  习题
 第6 章EM 算法
  6.1 引入
  6.2 最大似然估计方法
   6.2.1 似然函数
   6.2.2 最大似然估计
   6.2.3 混合模型
  6.3 EM 算法
   6.3.1 算法推导
   6.3.2 EM 算法
   6.3.3 EM 算法的收敛性
  本章小结
  习题
 第7 章随机游走及其应用
  7.1 引入
  7.2 随机过程
   7.2.1 马尔可夫过程
   7.2.2 随机游走
   7.2.3 转移概率矩阵
   7.2.4 平稳分布
  7.3 PageRank
   7.3.1 PageRank 问题定义与基本假设
   7.3.2 PageRank 值的计算方法
   7.3.3 PageRank 算法的改进
   7.3.4 算法收敛性分析
  本章小结
  习题
 第8 章特征值计算
  8.1 算法引入
  8.2 方阵的特征值与特征向量
  8.3 幂法
   8.3.1 幂法
   8.3.2 幂法改进
  8.4 反幂法
  8.5 瑞利商迭代法
   8.5.1 瑞利商定义
   8.5.2 瑞利商迭代法
   8.5.3 降阶技术
  本章小结
  习题
 第9 章奇异值分解与主成分分析
  9.1 引入
  9.2 对角化与特征值分解
  9.3 奇异值分解
   9.3.1 奇异值
   9.3.2 奇异值分解
   9.3.3 奇异值分解的应用
  9.4 主成分分析
   9.4.1 协方差
   9.4.2 协方差矩阵
   9.4.3 主成分分析
   9.4.4 PCA 的应用
  本章小结
  习题
 第10 章矩阵分解
  10.1 引入
  10.2 问题定义
   10.2.1 损失函数
   10.2.2 代价函数
  10.3 梯度下降算法
   10.3.1 凸函数及其极小值
   10.3.2 梯度下降算法
   10.3.3 随机梯度下降算法
   10.3.4 小批量梯度下降算法
  10.4 基于梯度下降的矩阵分解
   10.4.1 矩阵分解算法
   10.4.2 正则化
   10.4.3 矩阵分解算法变体
   10.4.4 矩阵分解的应用
  10.5 非负矩阵分解
   10.5.1 非负矩阵分解算法
   10.5.2 非负矩阵分解的应用
  本章小结
  习题10
 第11 章整数规划
  11.1 引入
  11.2 整数规划
   11.2.1 表示约束
   11.2.2 可行域
  11.3 分支定界法
   11.3.1 枚举树
   11.3.2 松弛和定界
   11.3.3 分支定界算法
   11.3.4 分支定界算法的例子
  11.4 割平面法
   11.4.1 有效不等式
   11.4.2 割平面法
  本章小结
  习题11
 第12 章子模函数及其应用
  12.1 引入
  12.2 子模函数及其性质
   12.2.1 子模函数
   12.2.2 子模函数的性质
  12.3 集合覆盖
   12.3.1 问题定义
   12.3.2 抽取式文本摘要
   12.3.3 集合覆盖问题满足子模条件
  12.4 爬山算法
  本章小结
  习题12
 第13 章模块度及社区发现
  13.1 引入
  13.2 图模型
   13.2.1 随机图
   13.2.2 NULL 模型
   13.2.3 无标度图
  13.3 模块度
   13.3.1 模块度的定义
   13.3.2 模块度的计算性质
   13.3.3 权重图的模块度定义
   13.3.4 有向图的模块度定义
   13.3.5 模块度的矩阵定义
  13.4 社区发现
   13.4.1 谱方法
   13.4.2 Louvain 算法
  本章小结
  习题13
 参考文献