简介
本书介绍基于Python语言的网络数据采集技术的相关知识,并为采集网络中的各种数据类型提供全面指导。第1章重点介绍Scrapy框架及配置方法;第2~6章重点介绍网络数据采集的基本原理,包括如何利用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何通过自动化的手段与网站进行交互;第7、8章介绍登录表单与验证码的数据采集和自动化处理,以及并行多线程网络数据的采集方法。本书还提供了多个实验,以帮助读者巩固所学内容。 本书适合作为普通高等院校计算机程序设计、大数据课程的教材,也可作为从事Web数据采集的软件开发人员和研究人员的参考书。
编辑推荐
本书可作为应用型本科高校的“数据科学与大数据技术”“大数据技术与应用”专业的教学用书,提供教学课件PPT、教学大纲、源代码、习题参考答案等配套资源。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2022-04-01
- 更新: 2023-06-19
- 书号:9787302600589
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术