Python数据预处理技术
¥49.00定价
作者: 蔡黎亚
出版时间:2024-05
出版社:清华大学出版社
- 清华大学出版社
- 9787302659631
- 1版
- 523965
- 66257091-0
- 16开
- 2024-05
- 计算机类
- 高职
作者简介
内容简介
本书基于人工智能领域所需的各类数据预处理技能为出发点,通过对相关数据预处理库的原理及应用方法的介绍让读者能够提升Python的数据预处理操作能力,以便于在人工智能的算法构造和调参等环节生成更适当的数据集合或提升算法模型的学习能力。本书共包含了六个章节:Python的标准库与扩展库、csv库与json库数据类型转换、jieba库中文切词统计、NumPy结合OpenCV-Python库进行数据处理、Pandas库统计分析、Pyecharts库在线数据可视化。
在第一个章节中介绍了Python相关数据处理的各类内置标准库与第三方扩展库。作为数据处理中的基础技能之一——数据类型的转换,在第二章中介绍了典型的表格数据格式CSV与网页数据格式JSON读取与写入的类型转换方法。在第三章介绍了自然语言处理中的中文切词Jieba库的使用技巧。而NumPy库作为重要的人工智能数组预处理库,介于其理解起来较为抽象,因此在第四章中配合了OpenCV-Python库通过对图片数据的处理进行讲解,以便于读者对二进制数组处理中的NumPy运算底层逻辑有更深的理解。而在第五章中则介绍了Pandas库在格式化文本数据处理中进行统计分析的方法。第六章作为最后一个章节,主要介绍了网页可视化Pyecharts库的应用。在人工智能领域常见的可视化库是Matplotlib库,但随着互联网应用技术的发展,越来越多的项目需要生成远程可见的在线网页数据格式,而Pyecharts库不仅可自动生成网页格式的图形,而且自带可与用户互动的交互性页面设置且生成图形的过程较为简单,日渐成为Python扩展库中不可或缺的可视化利器之一。
在第一个章节中介绍了Python相关数据处理的各类内置标准库与第三方扩展库。作为数据处理中的基础技能之一——数据类型的转换,在第二章中介绍了典型的表格数据格式CSV与网页数据格式JSON读取与写入的类型转换方法。在第三章介绍了自然语言处理中的中文切词Jieba库的使用技巧。而NumPy库作为重要的人工智能数组预处理库,介于其理解起来较为抽象,因此在第四章中配合了OpenCV-Python库通过对图片数据的处理进行讲解,以便于读者对二进制数组处理中的NumPy运算底层逻辑有更深的理解。而在第五章中则介绍了Pandas库在格式化文本数据处理中进行统计分析的方法。第六章作为最后一个章节,主要介绍了网页可视化Pyecharts库的应用。在人工智能领域常见的可视化库是Matplotlib库,但随着互联网应用技术的发展,越来越多的项目需要生成远程可见的在线网页数据格式,而Pyecharts库不仅可自动生成网页格式的图形,而且自带可与用户互动的交互性页面设置且生成图形的过程较为简单,日渐成为Python扩展库中不可或缺的可视化利器之一。