网络爬虫技术与应用(微课版)

作者: 郑淑晖、张正球

出版社: 清华大学出版社

出版日期: 2023-08-01

电子书 ¥27.95 定价:43.0
  • 收藏

  • 加书架

  • 引用

简介

在大数据的时代背景下,使用网络爬虫是获取数据的一种重要手段,它可以减少我们生活中不必要的工作量。但是,千万不能乱用,因为涉及数据安全法,建议大家了解相关资料,合理规划爬虫。 《网络爬虫技术与应用(微课版)》介绍爬虫相关的常用工具及类库,基于Web、App的采集及项目的部署,不使用框架的普通爬虫脚本及使用两种爬虫框架的项目级爬虫。在实际工作中,feapder、scrapy这两个爬虫框架比较热门,企业使用得也比较多。掌握了爬虫框架,会让我们的开发工作事半功倍。《网络爬虫技术与应用(微课版)》主要包含requests、HTML、lxml、MySQL、JSON、JavaScript、Redis、jadx、pycharm、feappder、scrapy等内容,具体包含7个爬虫案例:基于requests+xpath采集网站文本数据、使用feapder爬虫框架爬取房屋租售数据、使用分布式爬虫采集金融数据、使用批次分布式爬虫采集天气数据、使用scrapy爬虫爬取电影数据、App爬虫的实践、企业项目部署与应用。 《网络爬虫技术与应用(微课版)》入门门槛低,为便于上手操作,从所需技术和基础理论出发,再到每个步骤都经过验证,帮助读者创建开发环境。《网络爬虫技术与应用(微课版)》既可以作为高等院校大数据及其相关专业学生的教材,又可以作为对数据类工作感兴趣、有一定Python基础的人员的参考书。

编辑推荐

《网络爬虫技术与应用(微课版)》可作为大数据工程化处理与应用职业技能等级标准实训与高职大数据技术专业核心课程教学的选用教材。《网络爬虫技术与应用(微课版)》从原生爬虫的使用开始,以框架爬虫、分布式爬虫等不同类型爬虫工具的应用作为项目,带领学习者体验当前大数据行业企业的爬虫工程师常用工具与工作流程,以此掌握工程化的爬虫应用能力。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-08-01
  • 作者:郑淑晖、张正球
  • 更新: 2024-01-10
  • 书号:9787302644422
  • 中图:TP311.561
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    工学
    软件工程

作者信息

郑淑晖、张正球

郑淑晖,北京信息职业技术学院人工智能学院学院大数据专业负责人,副教授。承担专业多门核心课程的教学工作。参与2021年北京市职业教育教学成果奖项目“基于‘标准引领+智能测评’的教师职业能力提升模式研究与实践”(一等奖);主持校级课题“基于粒子群算法改进的数据优化策略及应用研究”(三等奖)。曾获北京市职业院校信息技术类专业《基于工作过程导向的课程》设计与实践竞赛专业组二等奖、校互动教学一等奖、青年教师课堂教学能力竞赛学院二等奖、信息化课程教学大赛二等奖。在国内外公开发行刊物、EI检索及核心刊物发表多篇论文,参与多本教材的编写,参加企业实践锻炼,有丰富的教学和项目开发经验。

相关图书