零基础学Python网络爬虫案例实战全流程详解(入门与提高篇)
¥99.00定价
作者: 王宇韬、吴子湛
出版时间:2021-07
出版社:机械工业出版社
- 机械工业出版社
- 9787111683681
- 372919
- 2021-07
作者简介
内容简介
网络爬虫是当今获取数据不可或缺的重要手段。本书讲解了Python 爬虫的基础知识和必备技能,帮助零基础的读者快速入门并熟练使用爬虫。
全书共8 章。第1 章讲解Python 开发环境的安装与配置以及Python 的基础语法知识。第2 章讲解如何运用Requests 库和Selenium 库获取网页源代码。第3 章讲解如何运用正则表达式和BeautifulSoup 库解析和提取数据。第4 章深入讲解Selenium 库在商业实战中的进阶应用。第5 章讲解爬虫数据的处理与可视化。第6 章讲解爬虫数据结构化神器pandas 库,以及如何通过Python 在MySQL 数据库中读写数据。第7 章讲解如何运用多线程和多进程技术提高爬虫效率。第8 章讲解如何运用IP 代理应对网站的反爬机制。
本书对于编程新手来说非常友好,从Python 基础到爬虫原理再到实战应用,循序渐进地帮助读者打好基础。对于有一定Python 爬虫基础的读者,本书也针对实战中常见的疑点和难点提供了解决技巧。
全书共8 章。第1 章讲解Python 开发环境的安装与配置以及Python 的基础语法知识。第2 章讲解如何运用Requests 库和Selenium 库获取网页源代码。第3 章讲解如何运用正则表达式和BeautifulSoup 库解析和提取数据。第4 章深入讲解Selenium 库在商业实战中的进阶应用。第5 章讲解爬虫数据的处理与可视化。第6 章讲解爬虫数据结构化神器pandas 库,以及如何通过Python 在MySQL 数据库中读写数据。第7 章讲解如何运用多线程和多进程技术提高爬虫效率。第8 章讲解如何运用IP 代理应对网站的反爬机制。
本书对于编程新手来说非常友好,从Python 基础到爬虫原理再到实战应用,循序渐进地帮助读者打好基础。对于有一定Python 爬虫基础的读者,本书也针对实战中常见的疑点和难点提供了解决技巧。