简介
本书共有八个项目,围绕网络爬虫三部曲“爬取—解析—存储”较为全面地介绍关于不同场景下利用Python爬取网络数据的基础知识和方法,让读者通过编写简单的静态爬虫和动态爬虫,使用Scrapy爬虫框架完成对爬虫理论和实践技能的学习。内容分为基础知识篇、中阶知识篇和实战篇。项目一至项目三介绍爬虫的基本概念、网页基础知识和Python基本语法等;项目四和项目五利用实例演示介绍有关爬取库、解析库等爬虫中阶知识;项目六至项目八则是实战篇,主要介绍数据存储的实例和利用动态网页爬取数据的综合案例,再次完整展现爬虫三部曲“爬取—解析—存储”,以及Scrapy爬虫框架的概念和实施。本书面向对网络爬虫技术感兴趣的读者,介绍了使用Python语言编写爬虫的各种技巧和方法,可供大数据技术等相关专业的学生参考使用,也可作为大数据技术爱好者的自学用书。
更多出版物信息
- 版权: 上海交通大学出版社
- 出版: 2023-11-01
- 更新: 2024-09-12
- 书号:9787313293268
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程