Python网络爬虫与数据分析从入门到实践

作者: 马国俊

出版社: 清华大学出版社

出版日期: 2023-04-01

电子书 ¥31.92 定价:79.8
  • 收藏

  • 加书架

  • 引用

简介

《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理、文本向量化技术,以及机器学习算法在数据分析中的应用。书中还给出了大量案例和项目,可以帮助读者快速上手,提高实用技能。 《Python网络爬虫与数据分析从入门到实践》内容丰富,注重实操,适用于网络爬虫岗位、数据分析岗位的初级工程师和各类工程技术人员,还可作为高校经济、管理、人文社科、大数据等专业的教学用书。

编辑推荐

突出特色是实战,所有知识点都配合案例并给出详细操作,所有代码都有注释,可以说学习无障碍、无痛苦。 涉及多种流行的热门框架,包括爬虫框架如Urllib、BeautifulSoup、Scrapy,常用的数据分析库如Numpy、Pandas、Matplotlib等都进行了详细介绍。 全流程讲解,从获取数据、数据预处理到数据分析和数据可视化,面面俱到。 技术先进,除常用数据处理方法,还介绍了当前热门的中文文本处理,以及热门的机器学习算法在数据分析中的应用。 本书给出了大量示例和项目,可以帮助读者掌握一线技能,真正解决工作中遇到的问题。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-04-01
  • 作者:马国俊
  • 更新: 2023-11-24
  • 书号:9787302627814
  • 中图:TP312PY
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    工学
    软件工程

作者信息

马国俊

马国俊,男,1978年生人,西北师范大学,硕士,教授,现为兰州文理学院数字媒体学院教授。先后在国内外刊物发表各类学术论文40余篇,其中三大检索收录5篇;出版教材3部;发明国家实用新型专利5项、软件著作权3项;主持、参与各类项目5项。目前主要从事Python数据分析的教学与研究工作。

相关图书