《玩转Python网络爬虫》黄永祥 9787302503286 【清华大学出版社官方正版电子书】- 文泉书局

玩转Python网络爬虫

作者：黄永祥

出版社：清华大学出版社

出版日期： 2018-08-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥45.54 （ 定价：69.0 ）

支持送礼物

送给好友

收藏
加书架
引用

简介

本书站在初学者的角度，从原理到实践，循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识，分别是网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网络做全面分析；数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识；数据清洗主要介绍字符串操作、正则和Beautiful Soup的使用；数据入库分别讲述了MySQL和MongoDB的操作，通过ORM框架SQLAlchemy实现数据持久化，实现企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件开发与应用、12306抢票程序和微博爬取，所举示例均来自于开发实践，可帮助读者快速提升技能，开发实际项目。框架篇主要讲述Scrapy的基础知识，并通过爬取QQ音乐为实例，让读者深层次了解Scrapy的使用。本书内容丰富，注重实战，适用于从零开始学习网络爬虫的初学者，或者是已经有一些网络爬虫编写经验，但希望更加全面、深入理解Python爬虫的开发人员。

编辑推荐

本书站在初学者的角度，从原理到实践，深入、系统地阐述了使用Python 3开发网络爬虫的核心技术，全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识，包括网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网站做全面分析。数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识。数据清洗主要介绍字符串操作、正则表达式和Beautiful Soup的使用。数据入库分别讲述了MySQL和MongoDB的操作，通过ORM框架SQLAlchemy实现数据持久化，实现企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件的开发与应用、12306抢票程序和微博爬取，所举实例均来自于编者的开发实践，可帮助读者快速提升技能，开发自己的实际项目。爬虫框架篇主要讲述Scrapy的原理和特性，通过爬取QQ音乐实例，介绍Scrapy在网络爬虫中的应用技巧。本部分内容可使读者深入地了解Scrapy的使用，并举一反三，编写出复杂的网络爬虫程序。本书既介绍编写网络爬虫的各种技术，又注重以网络爬虫和网站分析的思想为出发点，培养读者编写网络爬虫的逻辑思维，使读者能够针对不同的网站制定出不同的爬虫方案；此外，还介绍了反爬虫机制和相应的解决方案，是读者入职爬虫工程师的很好实践。本书所有程序代码均在Python 3.5环境下测试通过，读者可从网络上下载本书所有实例源代码。

更多出版物信息

版权：清华大学出版社
出版： 2018-08-01
作者：黄永祥
更新： 2023-07-18
书号：9787302503286
中图：TP311.561
学科：

工学

控制科学与工程
工学

计算机科学与技术
工学

软件工程

封面 1

扉页 2

内容简介 3

版权页 3

前言 4

目录 8

第1章　理解网络爬虫 14

第2章　爬虫开发基础 22

第3章　Chrome分析网站 34

第4章　Fiddler抓包工具 43

第5章　Urllib数据抓取 56

第6章　Requests数据抓取 67

第7章　验证码识别 77

第8章　数据清洗 87

第9章　文档数据存储 105

第10章　ORM框架 117

第11章　MongoDB数据库操作 131

第12章　项目实战：爬取淘宝商品信息 144

第13章　项目实战：分布式爬虫——QQ音乐 152

第14章　项目实战：爬虫软件——淘宝商品信息 174

第15章　项目实战：12306抢票 189

第16章　项目实战：玩转微博 232

第17章　Scrapy爬虫框架 278

第18章　项目实战：Scrapy爬取QQ音乐 311

正文结束 324

作者信息

黄永祥

黄永祥，信息管理与信息系统专业学士，曾从事过系统开发和自动化开发，精通B/S和C/S自动化测试技术，多年网络爬虫开发经验，对反爬虫机制有独到的见解，精通Flask、Django等Web框架并有丰富的网站开发经验。曾就职于广州易点科技有限公司，担任Python开发工程师，目前就职于广东数据集成有限公司。热爱分享和新技术的探索，在CSDN上发表多篇Python技术文章。

玩转Python网络爬虫

作者信息

黄永祥

相关专题

Python 由浅入深

Python系列丛书

相关图书

Python 网络爬虫实战

Python 网络爬虫实战

实战Python网络爬虫

实战Python网络爬虫

Python网络爬虫实战

Python网络爬虫实战

Python快乐编程——网络爬虫

Python快乐编程——网络爬虫

Python网络爬虫案例实战

Python网络爬虫案例实战

Python网络爬虫技术与应用

Python网络爬虫技术与应用

Python网络爬虫从入门到精通

Python网络爬虫从入门到精通

Python网络爬虫开发从入门到精通

Python网络爬虫开发从入门到精通

Python 3网络爬虫实战

Python 3网络爬虫实战

相关课程

非遗传承人教你玩转彩泥塑

21天玩转新零售（喻旭）

极客Python应用（小甲鱼）

Python快乐编程基础入门-9787302530145

零起步玩转Mind+创客教程——基于micro:bit开发板（9787302579960/088605-01）

Python深度学习（9787302555223/085788-01）

Python概率统计（9787302616573/094807-01）

计算机网络（吴功宜）

Python人工智能（9787302571889/090377-01）

Python面试通关宝典（9787302565017/089964-01）