Python爬虫与反爬虫开发从入门到精通

作者: 刘延林

出版社: 北京大学出版社

出版日期: 2021-08-01

电子书 暂不销售 定价:99.0
  • 收藏

  • 加书架

  • 引用

简介

随着网络技术的迅速发展,如何有效地提取并利用信息,以及如何有效地防止信息被爬取,已成为一个巨大的挑战。本书从零开始系统地介绍了Python网络爬虫与反爬虫的开发与实战技能,全书共分为4篇,具体内容安排如下。 第1篇:基础篇(第1~3章)。系统地讲解了Python爬虫与反爬虫开发环境的搭建、爬虫与反爬虫通用基础知识、Python编程基础。 第2篇:爬虫篇(第4~8章)。这部分讲解了网络爬虫的相关知识与技能,主要包括网络爬虫快速入门、XPath匹配网页数据、re正则匹配数据、WebSocket数据抓取、Scrapy爬虫框架应用与开发等。 第3篇:反爬虫篇(第9~16章)。这部分讲解了网络反爬虫的相关知识与技能,主要包括爬虫与反爬虫的区别与认识、反爬—Header信息校验、反爬—IP限制、反爬—动态渲染页面、反爬—文本混淆、反爬—特征识别、反爬—验证码识别、反爬—APP数据抓取等。 第4篇:实战篇(第17章)。本篇主要列举了4个案例,综合讲解Python爬虫与反爬虫项目的实战应用。 本书从零基础开始讲解,系统全面,案例丰富,注重实战,既适合Python程序员和爬虫爱好者阅读学习,也可以作为广大职业院校相关专业的教材或参考用书。

更多出版物信息
  • 版权: 北京大学出版社
  • 出版: 2021-08-01
  • 作者:刘延林
  • 更新: 2023-03-22
  • 书号:9787301322697
  • 中图:TP311.561
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    工学
    软件工程