简介
本书以Spark3.x和Python3.x为主线,全面介绍了Spark及其生态体系中常用大数据项目的安装和使用。全书共8章,分别讲解了Spark基础知识、Spark部署、SparkRDD、SparkSQL、SparkStreaming、Kafka、StructuredStreaming和SparkMLlib,并在最后完整开发了一个在线教育学生学习情况分析系统,帮助大家巩固前面所学的内容。本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书可以作为高等教育本、专科院校数据科学与大数据技术及相关专业的教材,并适合大数据开发初学者、大数据分析与挖掘的从业者阅读。
编辑推荐
内容结构清晰,由浅入深地讲解Spark技术要点 提供从基础理论到实际操作的系统化学习路径 结合案例系统讲解Spark核心组件的原理与应用 通过综合案例完整呈现项目开发流程 提供教学视频、PPT、教学设计、测试题等丰富的教学资源
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-03-01
- 更新: 2025-05-19
- 书号:9787302681052
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术