注册 登录 进入教材巡展
#

出版时间:2025-08

出版社:机械工业出版社

以下为《Python数据分析》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787893868382
  • 577235
  • 2025-08
  • 工学
  • 计算机类
  • 数据科学与大数据技术
  • 本科
内容简介
本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Python解决数据分析中的实际问题。
目录
第1章 绪论 1.1 背景介绍 1.2 数据分析简介 1.2.1 数据分析案例 1.2.2 数据分析的过程 1.3 如何学习本书 1.4 Python简介 1.4.1 什么是Python 1.4.2 Python的优点 1.4.3 用Python进行数据分析的过程 1.4.4 如何安装Python 1.4.5 如何使用Jupyter Notebook 第2章 Python基础 2.1 数据类型 2.1.1 数值(Number) 2.1.2 字符串(String) 2.1.3 列表 2.1.4 元组 2.1.5 集合 2.1.6 字典 2.2 运算法则 2.2.1 算术运算 2.2.2 逻辑运算 2.2.3 比较运算 2.3 条件语句 2.3.1 if条件判断语句 2.4 循环语句 2.4.1 while循环语句 2.4.2 for循环 2.5 终止语句 第3章 网络爬虫 3.1 encode & decode 3.1.1 ASCII码和Unicode 3.1.2 encoding和decoding 3.2 网页结构 3.2.1 服务器与本地交换机制 3.2.2 HTML 3.3 获取网页内容 3.3.1 requests包的安装 3.3.2 requests命令 3.3.3 在URL中传递参数 3.3.4 添加headers 第4章 正则表达式 4.1 函数构造和参数 4.1.1 函数 4.1.2 python内置函数的调用 4.1.3 自定义函数 4.1.4 自定义函数的参数 4.1.5 局部和全局变量 4.1.6 Lamda函数 4.2 正则表达式 4.2.1 简介 4.2.2 正则表达式中常用的字符集 4.2.3 RE库 4.2.4 r的含义与作用 4.2.5 匹配查询函数 4.2.6 匹配替换函数 4.2.7 匹配分割函数 4.3 爬虫案例 4.3.1 设置download_page函数获取网页内容: 第5章 词语切分 5.1 分词简介 5.1.1 最大匹配法分词 5.1.2 基于统计分词 5.2 jieba切词 5.2.1 jieba介绍 5.2.2 jieba切词实现 5.3 打开读取文件 5.3.1 打开文件 5.3.2 读取文件 5.4 jieba切词案例 第6章 BeautifulSoup 和 Json 6.1 正则表达式解析html网页 6.2 BeautifulSoup 6.2.1 BeautifulSoup 安装 6.2.2 创建BeautifulSoup对象 6.2.3 获取标签等信息 6.2.4 BeautifulSoup的解析器 6.3 BeautifulSoup解析html网页 6.4 Json 6.4.1 JSON的特点 6.4.2 JSON的结构 6.4.3 JSON获取并处理数据 第7章 信息检索和情感分析 7.1 信息检索 7.1.1 TF-IDF 7.1.2 案例学习介绍 7.2 词袋法 7.2.1 处理列表 7.2.2 处理文本文件 7.2.3 定义函数创建词袋 7.3 情感分析 第8章 Science Computing With Numpy 8.1 创建数组 8.1.1 安装Numpy库 8.1.2 列表和数组 8.1.3 创建Numpy数组 8.1.4 数组的形状 8.1.5 创建特殊Numpy数组 8.1.6 应用之titanic数据集 8.2 数组切片 8.2.1 索引和切片 8.2.2 数组切片和列表切片 8.2.3 维度变换和数组连接 8.3 数组计算 8.3.1 数组的一般操作 8.3.2 实例——比较titanic数据集男女平均存活率 8.4 手写识别体案例研究 8.4.1 初步探索数据集 8.4.2 数据标准化 8.4.3 可视化 8.5 金融案例分析 8.5.1 读取文件 8.5.2 计算成交量加权平均价格 8.5.3 计算最大值和最小值 8.5.4 计算极差 8.5.5 计算中位数 8.5.6 计算方差 第9章 用Pandas处理数据I 9.1 案例学习介绍 9.1.1 关于INVEST部门的投资任务 9.1.2 案例学习步骤 9.2 序列(Series)和 数据框(DataFrame) 9.2.2 创建DataFrame 9.2.3 使用Pandas读取和存储文件 9.3 用Pandas处理数据 9.3.1 查看数据 9.3.2 选择数据 9.3.3 数据类型转换 9.3.4 数据的增删改 9.4 用Pandas处理文本数据 9.4.1 在序列中(Series)处理文本数据 9.5 金融案例分析 9.5.1 基本信息探索 9.5.2 合并数据 9.5.3 索引问题 9.5.4 排序问题 9.5.5 重复数据处理 9.5.6 数据分组 9.5.7 缺失值处理 第10章 用Pandas处理数据II 10.1 进一步清洗文本数据 10.1.1 进一步清洗文本数据 10.1.2 更新评论日期 10.2 pandas可视化 10.2.1 参数详解 10.2.2 绘图 10.3 金融案例分析 10.3.1 基本信息探索 10.3.2 合并数据 10.3.3 索引问题 10.3.4 排序问题 10.3.5 重复数据处理 10.3.6 数据分组 10.3.7 缺失值处理 10.3.8 绘图 第11章 认识MySQL 11.1 数据库基础 11.1.1 表 11.1.2 列 11.1.3 数据类型 11.1.4 行 11.1.5 主键 11.1.6 SQL 11.1.7 什么是MySQL 11.1.8 MYSQL的优势 11.2 利用MySQL存储csv文件 11.2.1 使用图形化工具 11.2.2 使用Python连接数据库 11.3 数据库基本操作 11.3.1 检索数据:SELECT语句 11.3.2 过滤数据(WHERE) 11.3.3 插入数据(INSERT) 11.3.4 更新数据(UPDATE) 11.3.5 删除数据(DELETE) 第12章 机器学习介绍 12.1 机器学习概述 12.1.1 语音助手例子 12.1.2 什么是机器学习? 12.1.3 机器学习的分类 12.1.4 深入理解机器学习 12.2 模型评估与选择 12.2.1 模型选择的目的 12.2.2 评估指标 12.2.3 评估方法 12.2.4 最终模型 12.3 梯度下降 12.3.1 一维梯度下降 12.3.2 学习率 12.3.3 多维梯度下降 12.3.4 随机梯度下降 12.3.5 小批量梯度下降 12.4 建立并训练一个模型 12.4.1 推广费与销售额的关系 12.4.2 使用批量梯度下降求解 12.4.3 使用随机梯度下降求解 12.4.4 模型评估 第13章 情感分析-朴素贝叶斯模型 13.1 完整的机器学习项目 13.1.1 获取数据 13.1.2 发现并可视化数据 13.1.3 发现新的特征 13.1.4 为机器学习进行数据准备 13.1.5 训练模型 13.1.6 评估模型 13.2 python中文分词和数据预处理 28 13.2.1 下载数据 13.2.2 将函数应用到序列中 13.3 朴素贝叶斯模型 13.3.1 贝叶斯公式 13.3.2 模型介绍 13.4 使用朴素贝叶斯进行情感分析 13.4.1 文本的词袋表示 13.4.2 使用多项式朴素贝叶斯模型做文本分类 13.4.3 使用Pipeline(管道)对象组合机器学习模型的各个步骤 13.4.4 交叉验证法(cross validation)评估模型 13.4.5 保存并下载模型以进行预测 第14章 基于支持向量机的金融情感分析 14.1 SVM原理简介 14.1.1 SVM支持向量 14.1.2 对偶问题 14.1.3 松弛变量 14.1.4 非线性SVM分类任务(核函数) 14.1.5 支持向量回归任务 14.1.6 SVM 算法小结 14.2 支持向量机的Python代码实现 14.2.1 SVM的Python实现基本步骤 14.2.2 scikit-learn支持向量机算法库小结 14.2.3 SVM算法库其他调参要点 14.3 基于SVM的个人信贷违约预测 14.3.1 数据预览及预处理 14.3.2 特征工程 14.3.3 模型建立与参数调整 第15章 使用随机森林对市场活动进行预测 15.1 决策树与随机森林 15.1.1 决策树 15.1.2 随机森林 15.2 情感指标的获取与生成 15.2.1 获取每日情感分数 15.2.2 获取每日股评数量及意见分歧指数 15.2.3 填充缺失值 15.2.4 生成累积滞后分数 15.3 合并不同来源的数据 15.3.1 百度指数 15.3.2 获取股票市场数据 15.3.3 合并数据集 15.4 用随机森林进行市场预测 15.4.1 数据准备 15.4.2 可视化混淆矩阵 15.4.3 训练决策树模型 15.4.4 训练随机森林模型 15.4.5 对比不同训练集的模型度量指标AUC 15.5 案例分析 15.5.1 案例背景 15.5.2 案例目标 15.5.3 数据准备 15.5.4 训练决策树模型 15.5.5 训练随机森林模型 第16章 深度学习 16.1 神经网络 16.1.1 感知器 16.1.2 神经网络 16.1.3 BP神经网络 16.2 深度神经网络 16.2.1 卷积神经网络(CNN) 16.2.2 循环神经网络(RNN) 16.3 深度学习应用案例 16.4 发展方向 第17章 量化投资 17.1 什么是量化投资? 17.1.1 量化投资必备的基础金融理论 17.1.2 评价指标 17.1.3 量化投资的常见陷阱 17.2 股息率选股策略 17.2.1 “一鸟在手胜过双鸟在林” 17.3 股息率策略研究与实践 17.3.1 获取月度交易日 17.3.2 获取股息率 17.3.3 筛选前30%的股票作为组合 17.3.4 绩效可视化 17.4 PEG策略 17.4.1 PEG策略实现 17.4.2 策略可视化 17.5 同花顺量化实验室回测平台介绍 17.5.1 回测环境 17.5.2 编译运行 1.策略必须在init()和handle_bar()函数框架下实现: 17.5.3 策略回测 17.5.4 模拟交易 17.5.5 数据 17.5.6 运行频率 17.5.7 运行时间 17.5.8 佣金与印花税 17.5.9 滑点 17.5.10 拆分合并与分红 17.6 股息率选股策略回测平台实践 17.7 机器学习对指数涨跌预测