-
收藏
-
加书架
-
引用
简介
本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、Spark RDD编程、Spark SQL结构化数据处理、HBase分布式数据库、Spark Streaming流计算、Spark MLlib机器学习、数据可视化。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程、数据科学与大数据技术、人工智能等专业的大数据课程教材,也可供从事大数据开发和研究工作的工程师和科技工作者参考。
编辑推荐
内容系统全面:全面介绍Spark3.2.0的生态组件。 原理浅显易懂:理论实践结合案例丰富注释详尽。 大数据可视化:WordCloud、PyeCharts、Plotly。 算法代码实现:使用Python实现书中所有算法。 配套资源丰富:配有教学课件、数据集和源代码。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2023-03-01
- 更新: 2023-11-24
- 书号:9787302625520
- 中图:TP274;TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术