简介
本书主要以纯案例驱动的形式,分别使用和结合使用requests库、selenium库,从互联网上收集数据。主要内容包括收集静态网页数据,网页解析,JSON数据,JSON解析,多级翻页,cookie和session,验证登录,多线程,数据的存储,收集到的数据包括静态网页数据、json、图片、音频、视频等数据,并对获取的数据进行清洗。适合Python初学者,也适合研究Python的广大科研人员、学者、工程技术人员。本教材采用纯的案例,和简单的注释,其他一些先修的知识是在其他课程有开设。
编辑推荐
从实战出发,适合初学者,紧跟 章节案例,理清代码实现,很快掌握编写Python爬虫程序。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2022-12-01
- 更新: 2023-11-24
- 书号:9787302619635
- 中图:TP312PY
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程