-
收藏
-
加书架
-
引用
简介
本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫。
编辑推荐
JetBrains大中华区市场部经理赵磊作序!超过300个实战案例,10万行源代码,22个综合实战项目,海量学习资料,1000套中英文简历模板。全书内容涵盖: 李宁 “私房菜谱” Python爬虫基础知识 Python网络库 Python解析库 Python数据存储 Python异步数据抓取 Python移动App数据抓取 Python可见即可爬 Python Scrapy实战 Python项目实战 李宁“实战项目” 抓取小说目录与正文 抓取豆瓣网图书榜单 抓取房屋租赁信息 抓取豆瓣网音乐排行榜 抓取百度网站图片搜索中的图片 抓取QQ空间说说 可视化爬虫抓取和分析当当网图书评论
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2020-01-01
- 更新: 2023-06-07
- 书号:9787302535683
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程