简介
基础篇:HTTP协议、WEB服务器原理、网络协议、HTML规范、编码 技术原理篇:普通爬虫、主题爬虫、微博、礼貌型爬虫、分布式爬虫、协议数据还原、ETL、大数据交易技术:平台、技术支持、难点 工具与应用篇:从零开始、开源系统/Java、Python 工具应用:爬虫用于抓取论坛、用于舆情监测
编辑推荐
本书围绕大数据采集,对采集技术的相关基础、技术原理、Python实现技术、大数据挖掘与应用方法进行了系统介绍。书中全面完整地覆盖了各种类型的网络爬虫及相关的信息处理挖掘技术,并提供了27个与爬虫相关技术和应用相关的Python程序。本书可以作为高等院校大数据、计算机、信息以及经管、金融等人文社科相关专业研究生和高年级本科生的教材,也可以作为大数据、计算机、信息以及经管、金融等人文社科领域研究人员和专业技术人员的参考书。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2020-03-01
- 更新: 2023-06-07
- 书号:9787302540540
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程