简介
本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序,最后介绍监控、配置、调试、测试和开发等高级主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈数据分析,最终成为数据科学家。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2020-05-01
- 更新: 2023-06-21
- 书号:9787302551966
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术
相关图书
-
机器学习和深度学习:原理、算法、实战(使用Python 和 TensorFlow)
[印] 文卡塔·雷迪·科纳萨尼(Venkata Reddy Konasani)、沙伦德拉·卡德雷(Shailendra Kadre)著 秦婧 韩雨童 译
¥128.00