注册 登录 进入教材巡展
#
  • #

出版时间:2017-09

出版社:清华大学出版社

以下为《Python数据分析基础》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 清华大学出版社
  • 9787302478904
  • 1-1
  • 118346
  • 48210578-0
  • 平装
  • 16开
  • 2017-09
  • 工学
  • 软件工程
  • TP311.561
  • 计算机
内容简介

Python是由Guido van Rossum于20世纪80年代末和90年代初,在荷兰国家数学和计算机科学研究所设计出来的。它是一种面向对象的、用途非常广泛的编程语言,具有非常清晰的语法特点,适用于多种操作系统。目前Python在国际上非常流行,正在得到越来越多的应用。

Python可以完成许多任务,功能非常强大,其利用Pandas处理大数据的过程,由于Pandas库的使用能够很好地展现数据结构,成为近来Python项目中经常使用的热门技术,并且R和Spark对Python都有很好的调用接口,甚至在内存使用方面都有优化。

本书根据作者多年教学经验编写,条理清楚,内容深浅适中,尽量让读者从实例出发,结合课后练习,少走弯路。本书涉及的内容主要包括Python数据类型与运算、流程控制及函数与类、Pandas库的数据处理与分析等。在本书的*后,还附带了一些文件读写、网络爬虫、矩阵计算等*基本的内容。

本书可以作为本科生、研究生以及科研人员学习Python的基础教材。

目录
  

1  Python简介 1

1.1  安装Python 2

1.2  Python 2Python 3的区别 5

本章小结 8

练习 8

2  Python数据类型与运算 9

2.1  数据类型 11

2.2  运算符与功能命令 12

2.2.1  算数运算符 12

2.2.2  比较运算符 12

2.2.3  赋值运算符 13

2.2.4  常量与变量 15

2.2.5  字符串 16

2.2.6  字符串索引与切片 18

2.2.7  输入和输出 20

2.2.8  原始字符串 21

2.2.9  range 22

2.2.10  元组、列表、字典、集合 22

2.2.11  格式化输出 37

2.2.12  stripsplit 40

2.2.13  divmod() 42

2.2.14  join() 42

本章小结 43

练习 47

3  流程控制及函数与类 49

3.1  流程控制 52

3.1.1  if-else 52

3.1.2  for循环 53

3.1.3  while循环 54

3.1.4  continuebreak 54

3.2  遍历 56

3.2.1  range()函数 56

3.2.2  列表与元组的遍历 59

3.3  函数 61

3.3.1  函数的定义 61

3.3.2  函数的使用 62

3.3.3  形参和实参 63

3.3.4  参数的传递和改变 63

3.3.5  变量的作用域 66

3.3.6  函数参数的类型 68

3.3.7  任意个数的参数 70

3.3.8  函数调用 71

3.4  函数式编程 74

3.4.1  lambda 74

3.4.2  reduce() 75

3.4.3  filter() 76

3.4.4  map() 77

3.4.5  行函数 77

3.5  常用的内置函数 78

3.5.1  sum 78

3.5.2  zip 79

3.5.3  enumerate 80

3.5.4  maxmin 81

3.5.5  eval 81

3.5.6  判断函数 83

3.6  常见的错误显示 86

3.6.1  常见的错误类型 87

3.6.2  初学者常犯的错误 89

3.6.3  try 93

3.6.4  assert 95

3.6.5  raise 95

3.7  模块和包 96

3.7.1  模块(module) 96

3.7.2  (package) 100

3.7.3  datetimecalendar模块 101

3.7.4  urllib模块 105

3.8   106

本章小结 109

练习 109

4  Python数据分析实战 113

4.1  关于Pandas 114

4.1.1  什么是Pandas 114

4.1.2  Pandas中的数据结构 114

4.1.3  Pandas的安装方法 114

4.1.4  Anaconda中安装
第三方库 118

4.2  数据准备 119

4.2.1  数据类型 119

4.2.2  数据结构 120

4.2.3  数据导入 128

4.2.4  数据导出 131

4.3  数据处理 133

4.3.1  数据清洗 133

4.3.2  数据抽取 138

4.3.3  排名索引 147

4.3.4  数据合并 151

4.3.5  数据计算 154

4.3.6  数据分组 156

4.3.7  日期处理 157

4.4  数据分析 162

4.4.1  基本统计 162

4.4.2  分组分析 163

4.4.3  分布分析 165

4.4.4  交叉分析 167

4.4.5  结构分析 169

4.4.6  相关分析 170

4.5  数据可视化 172

4.5.1  饼图 172

4.5.2  散点图 174

4.5.3  折线图 176

4.5.4  柱形图 180

4.5.5  直方图 183

本章小结 184

练习 184

5  其他 187

5.1  文件读写操作 188

5.1.1  文件的读写方法 189

5.1.2  文件的其他方法 190

5.1.3  文件的存储和读取 190

5.2  with语句 192

5.3  Anaconda下安装statsmodels 193

5.4  关于Spyder界面恢复默认状态的
处理 195

5.5  关于Python计算精度的问题 197

5.6  矩阵运算 200

5.6.1  创建矩阵 200

5.6.2  矩阵属性 200

5.6.3  解线性方程组 201

5.6.4  线性规划最优解 202

5.7  正则表达式 203

5.8  使用urllib打开网页 209

5.9  网页数据抓取 212

5.10  读取文档 217

本章小结 222

练习 222

参考文献 224