本书共分 3 篇,针对 Python 爬虫初学者,从零开始,系统地讲解了如何利用 Python 进行常见的网络爬虫的程序开发。 第 1 篇快速入门篇(第 1 章 ~ 第 9 章):本篇主要介绍了 Python 环境的搭建和一些 Python 的基础语法知识等、Python爬虫入门知识及基本的使用方法、Ajax 数据的分析和抓取、动态渲染页面数据的爬取、网站代理的设置与使用、验证码的识别与破解,以及 App 数据抓取、数据的存储方法等内容。 第 2 篇技能进阶篇(第 10 章 ~ 第 12 章):本篇主要介绍了 PySpider 和 Scrapy 两个常用爬虫框架的基本使用方法、分布式爬虫的实现思路,以及数据分析、数据清洗常用库的使用方法。 第 3 篇项目实战篇(第 13 章):本篇通过 6 个综合实战项目,详细地讲解了 Python 数据爬虫开始与实战应用。本篇对全书内容进行了总结回顾,强化读者的实操水平。 本书案例丰富,注重实战,既适合 Python 程序员和爬虫爱好者阅读学习,也适合作为广大职业院校相关专业的教学用书。
本书坚持以实例为主,理论为辅的路线,从 Python 基础、爬虫开发常用网络请求库,到爬虫框架使用和分布式爬虫设计,以及最后的数据存储、分析、实战训练等,覆盖了爬虫项目开发阶段的整个生命周期。 (1)没有高深的理论,每一章都是以实例为主,读者参考源码,修改实例,就能得到自己想要的结果。目的是让读者看得懂、学得会、做得出。 (2)实训与问答,10多章章节实训,目的是让读者看完之后,能做到举一反三,学以致用。 (3)内容系统,实战性强。本书从零开始讲解,然后逐步深入相关爬虫技能,从而达到从入门到精通的学习效果。 (4)配套资源丰富。案例源码,Python 常见面试题精选(50 道),“微信高手技巧随身查”“QQ 高手技巧随身查”“手机办公 10 招就够”3 本电子书,“5 分钟学会番茄工作法”视频教程““10 招精通超级时间整理术”视频教程。
- 版权: 北京大学出版社
- 出版: 2019-12-01
- 更新: 2023-03-22
- 书号:9787301309094
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程