简介
本书以Spark3.x和Scala2.x为主线,全面介绍了Spark及其生态体系中常用大数据项目的安装和使用。全书共10章,分别讲解了Scala语言基础、Spark基础知识、Spark部署、SparkRDD、SparkSQL、HBase、Kafka、SparkStreaming、StructuredStreaming和SparkMLlib,并在最后完整开发了一个在线教育学生学习情况分析系统,帮助大家巩固前面所学的内容。本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书可以作为高等教育本、专科院校数据科学与大数据技术及相关专业的教材,并适合大数据开发初学者、大数据分析与挖掘的从业者阅读。
编辑推荐
加入综合项目案例,帮助读者了解Spark在实际应用场景中的使用。 详细解释代码内容,以便读者更容易理解。 知识点结构清晰,由浅入深地讲解Spark的原理、架构和应用。 整合教材、资源和服务,提供一体化的学习平台。 强调实战导向,注重应用型人才培养。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-02-01
- 更新: 2025-05-19
- 书号:9787302683131
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术