简介
本书采用“理论+实战”的形式,结合作者多年在大数据领域的开发实践经验,通过大量实例全面介绍Hadoop和Spark的基础知识及其高级应用。作者拥有丰富的教学经验,为读者精心录制了配套教学视频,并提供了书中所有实例的源码,方便读者学习和实践。全书分为4篇,共12章。第1篇(第1、2章)准备篇,主要介绍Hadoop和Spark的基本概念,以及如何快速搭建Hadoop和Spark的学习环境。第2篇(第3~6章)入门篇,涵盖Hadoop的高级特性、Spark的基础知识与高级特性,以及大数据安全。第3篇(第7~10章)进阶篇,深入讲解数据采集与清洗、数据存储与管理、数据分析与挖掘以及实时数据处理。第4篇(第11、12章)项目实战篇,通过Hadoop和Spark实现一站式数据分析系统设计,以及ChatGPT赋能Hadoop与Spark大数据分析的项目实战。本书内容全面、结构清晰、案例丰富,既适合初学者自学,也适合开发者阅读,还可作为培训机构和高校相关课程的教学参考书。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-04-01
- 更新: 2025-07-16
- 书号:9787302684800
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术