Python爬虫实战基础

作者: 李科均

出版社: 清华大学出版社

出版日期: 2023-06-01

电子书 ¥70.84 定价:109.0
  • 收藏

  • 加书架

  • 引用

简介

本书介绍Python网络爬虫开发从业者应掌握的基础技能。本书以网络爬虫为核心,涉及大大小小数十个能力体系。本书的前半部分介绍爬虫开发的基础知识,包括爬虫开发必备的环境搭建方法、开发中常用工具的使用方法和技巧、网页的构成原理和网页信息提取的方法、常用数据库的使用方法和应用场景,如通过Redis内置的布隆过滤器实现大规模URL地址的去重任务。本书的后半部分主要讲解网络爬虫开发所需的必要能力,包括网络通信的底层原理、背后涉及的互联网协议标准及如何对这些协议进行分析并加以利用,使用Docker部署网络爬虫所需的环境和爬虫项目的打包部署,使用网络爬虫的核心请求库实现与服务器端和客户端的通信和交互,使用自动化神器Selenium对复杂的爬虫需求进行快速实现,以及网络爬虫的多任务开发,重点是通过多线程和多进程来提高爬虫效率。 本书面向准备从事或正在从事网络爬虫开发的从业者以及对网络爬虫有浓厚兴趣的爱好者。

编辑推荐

本书全面介绍Python网络爬虫开发从业者的必备能力体系,注重实用性,面向初学者。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-06-01
  • 作者:李科均
  • 更新: 2023-12-15
  • 书号:9787302626565
  • 中图:TP312PY
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    工学
    软件工程

作者信息

李科均

李科均,世界五百强企业synnex高级软件工程师,从事RPA开发及网络爬虫开发,对技术有执着的研究;在Python领域拥有三年开发经验,在知乎、CSDN、简书、博客等平台发布原创技术文章超过200篇,累积20W字;在synnex沉淀了丰富的实战经验,也学习了世界一流企业的开发和管理流程。

相关图书