数据应用开发与服务(Python)(中、高级)(配套智慧职教慕课课程、微课、PPT课件) / “1+X”职业技能等级证书配套系列教材,新形态一体化教材
作者: 北京中软国际信息技术有限公司 吕志君,王正才,夏祥礼
出版时间:2023-06
出版社:高等教育出版社
- 高等教育出版社
- 9787040593495
- 1版
- 450448
- 64250063-1
- 平装
- 16开
- 2023-06
- 400
- 308
- 计算机等
- 高职
本书为1+X 职业技能等级证书配套系列教材之一,以《数据应用开发与服务(Python)职业技能等级标准(中、高级)》为依据,由北京中软国际信息技术有限公司组织编写。
本书采用项目化编写模式,共分为5 个项目:项目1 介绍多源数据采集与存储,主要利用Python 语言对不同数据源的数据进行采集;项目2 介绍数据处理,从数据探查、数据清洗和转换、数据取样以及数据检验4 个方面演练典型的数据处理方法;项目3 介绍数据建模与性能评估,在熟悉数据含义并对数据进行预处理的基础上,构建并训练如回归、分类和聚类等机器学习模型,并对未知数据进行预测;项目4 介绍特征选取与模型优化,使用Python语言调用sklearn 库函数实现特征提取与模型优化;项目5 介绍模型应用开发,实现端到端的数据应用开发与服务,并且侧重于将模型集成到一个完整的应用程序中。全书通过构建42 个学习任务,引导学生掌握Python 应用开发的综合应用知识与技能,并培养其应用所学完成实际任务的能力。
本书配套微课视频、电子课件(PPT)、任务源码、习题解答等数字化学习资源。与本书配套的数字课程“数据应用开发与服务(Python)”在“智慧职教”平台(www.icve.com.cn)上线,学习者可以登录平台进行在线学习,也可以通过扫描书中二维码观看教学视频,详见“智慧职教”服务指南。教师可发邮件至编辑邮箱1548103297@qq.com 获取相关教学资源。
本书可作为数据应用开发与服务(Python)1+X 职业技能等级证书(中、高级)认证的相关教学和培训教材,也可作为高等职业院校Python程序设计及大数据技术类课程的相关教学用书,还可供有一定Python 数据分析基础的开发人员自学参考,为将来从事与Python 应用相关的多源数据采集、数据预处理、数据建模、数据可视化、特征选取、模型优化、模型部署、模型应用开发等工作打下良好基础。
前辅文
项目1 多源数据采集与存储
学习目标
项目介绍
任务1.1 使用多线程实现多任务并发
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.2 基于网络应用协议获取数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.3 使用正则表达式匹配文本
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.4 使用爬虫框架爬取网站数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.5 读写MongoDB 非结构化数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.6 读写Redis 非结构化数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.7 快速搭建本地大数据环境
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.8 读写HDFS 数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.9 读写HBase 数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务1.10 从Hive 读取数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
项目小结
课后练习
项目2 数据处理
学习目标
项目介绍
任务2.1 获取数据的分布特点
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.2 以可视化方式查看数据特点
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.3 对数据进行归一化处理
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.4 对文本数据进行数值化处理
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.5 对数据进行离散化和分箱处理
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.6 生成K 折交叉验证数据
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.7 数据抽样
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.8 数据正态性验证
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务2.9 检测数据中的异常点或离群点
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
项目小结
课后练习
项目3 数据建模与性能评估
学习目标
项目介绍
任务3.1 训练线性回归模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.2 评价线性回归模型的性能
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.3 训练逻辑回归模型进行二分类
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.4 评价二分类模型的性能
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.5 使用朴素贝叶斯模型进行文本分类
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.6 使用K 近邻模型进行分类
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.7 使用决策树模型进行分类
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务3.8 使用K-Means 模型进行聚类
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
项目小结
课后练习
项目4 特征选取与模型优化
学习目标
项目介绍
任务4.1 合理使用逻辑回归的惩罚项
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.2 根据性能指标优选模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.3 使用Bagging 方法构建集成学习模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.4 使用Boosting 方法构建集成学习模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.5 使用Filter 方法进行特征筛选
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.6 使用Wrapper 方法进行特征筛选
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.7 使用Embedded 方法进行特征筛选
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.8 对数据进行特征降维
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.9 使用关联规则推荐模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.10 使用协同过滤模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务4.11 使用时间序列模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
项目小结
课后练习
项目5 模型应用开发
学习目标
项目介绍
任务5.1 训练、保存和测试模型
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务5.2 使用Django 构建模型服务
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务5.3 实现客户端程序
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
任务5.4 使用Flask 构建模型服务
【任务目标】
【任务描述】
【知识准备】
【任务实施】
【任务小结】
项目小结
课后练习
参考文献