-
收藏
-
加书架
-
引用
简介
本书介绍了Scrapy网络爬虫快速入门,Python开发快速入门,使用 BeautifulSoup实现定向采集,网络爬虫抓取原理与Python实现, URL地址查新所用到的数据结构,把抓取下来的文本存入数据库。还介绍了从互联网提取信息的方法,具体包括识别网页的编码,用正则表达式提取字符串,从文本中提取结构化信息,以及从文件提取信息。然后介绍使用Scrapy框架开发爬虫,如何实现分布式爬虫,如何开发网络爬虫图形用户界面。最后介绍影视采集器和暗网爬虫的案例。本书适合零基础开始学习开发网络爬虫的读者或者需要提高的专业技术人员参考。
编辑推荐
《Scrapy网络爬虫开发实战》由猎兔搜索技术团队核心成员编写,使用流行的Scrapy框架开发网络爬虫的应用,适合需要具体实现网络爬虫应用的开发人员或者对网络爬虫等相关领域感兴趣的人士参考。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2024-05-01
- 更新: 2024-10-24
- 书号:9787302658580
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程