亮点
代码、教学大纲
简介
主要内容包括,大数据技术概述(或背景知识),Scala基础知识,Spark基础,RDD编程,Spark SQL开发,Spark Streaming / Structured Streaming编程,MLLib 机器学习编程等基础内容。 主要作为本科生数据科学与大数据技术、计算机科学与技术等相关专业必修或选修课程教科书,或作为相关工程技术人员的参考书。 本教材基于Spark 3.3.x等新版本所带来的开发方式、方法的变化,从工业、服务业等行业实际应用开发的角度,介绍Spark开发的基础知识,开发过程中的注意事项,并提供合理建议,从而引导学习过程更贴近大数据开发实际。 除了不同于其他教材所讲解的内容基础未基于新的软件产品或平台外,本教程更是从工业、服务行业大数据开发实际需求出发,引导学习者养成良好的开发习惯,为高效率地解决实际问题打开坚实基础。
编辑推荐
(1)作为Spark开发提供编程指导书,介绍Spark开发基础知识、RDD编程、SQL编程、Streaming开发以及机器学习开发等内容。 (2)全书内容讲解循序渐进,深入浅出,符合初学者学习的认识规律,易于读者学习和掌握。 (3)从工程实践的角度深入分析,引导读者结合实际,从解决大数据应用场景实际需求的角度出发,用简单、直接、高效的方法或工具解决具体问题。 (4)本书所介绍的Spark API,基于Spark 3.3.x,涉及的其他软件,基本都选择了较新的稳定版本。 (5)全书提供配套的数据、示例代码、阅读材料及练习题。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2024-02-01
- 更新: 2024-10-24
- 书号:9787302644668
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术
相关图书
-
Scala和Spark大数据分析 函数式编程、数据流和机器学习
(德) 雷扎尔·卡里姆 (Md. Rezaul Karim) , (美) 斯里达尔·阿拉 (Sridhar Alla) , 著
¥158.00