在大数据的时代背景下,使用网络爬虫是获取数据的一种重要手段,它可以减少我们生活中不必要的工作量。但是,千万不能乱用,因为涉及数据安全法,建议大家了解相关资料,合理规划爬虫。 《网络爬虫技术与应用(微课版)》介绍爬虫相关的常用工具及类库,基于Web、App的采集及项目的部署,不使用框架的普通爬虫脚本及使用两种爬虫框架的项目级爬虫。在实际工作中,feapder、scrapy这两个爬虫框架比较热门,企业使用得也比较多。掌握了爬虫框架,会让我们的开发工作事半功倍。《网络爬虫技术与应用(微课版)》主要包含requests、HTML、lxml、MySQL、JSON、JavaScript、Redis、jadx、pycharm、feappder、scrapy等内容,具体包含7个爬虫案例:基于requests+xpath采集网站文本数据、使用feapder爬虫框架爬取房屋租售数据、使用分布式爬虫采集金融数据、使用批次分布式爬虫采集天气数据、使用scrapy爬虫爬取电影数据、App爬虫的实践、企业项目部署与应用。 《网络爬虫技术与应用(微课版)》入门门槛低,为便于上手操作,从所需技术和基础理论出发,再到每个步骤都经过验证,帮助读者创建开发环境。《网络爬虫技术与应用(微课版)》既可以作为高等院校大数据及其相关专业学生的教材,又可以作为对数据类工作感兴趣、有一定Python基础的人员的参考书。
《网络爬虫技术与应用(微课版)》可作为大数据工程化处理与应用职业技能等级标准实训与高职大数据技术专业核心课程教学的选用教材。《网络爬虫技术与应用(微课版)》从原生爬虫的使用开始,以框架爬虫、分布式爬虫等不同类型爬虫工具的应用作为项目,带领学习者体验当前大数据行业企业的爬虫工程师常用工具与工作流程,以此掌握工程化的爬虫应用能力。
- 版权: 清华大学出版社
- 出版: 2023-08-01
- 更新: 2024-01-10
- 书号:9787302644422
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程