-
收藏
-
加书架
-
引用
《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》全面、系统、深入地介绍Apache Spark性能优化的相关技术和策略,涵盖从Spark性能优化的基础知识到核心技术,再到应用实践的方方面面。本书不但系统地介绍各种监控工具的使用,而且还结合实战案例,详细介绍Spark性能优化的各种经验和技巧,提升读者的实际应用技能。 《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》共8章。第1章从性能优化的基本概念出发,介绍Spark的基础知识,并介绍如何进行性能优化;第2章介绍Spark性能优化的几个方面,包括程序设计优化、资源优化、网络通信优化和数据读写优化等;第3章深入介绍Spark任务执行过程优化;第4章介绍Spark SQL性能优化;第5章结合实战案例全面解析Spark性能优化的核心技术与应用;第6章详细介绍不同应用场景的性能优化策略;第7章介绍Spark集成Hadoop、Kafka和Elasticsearch使用时的性能优化,从而提供更实用的Spark性能提升方案;第8章介绍Spark应用程序开发与优化,以及集群管理实践。 《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》内容丰富,讲解深入浅出,适合Apache Spark开发人员、数据工程师和数据科学家阅读,也适合需要处理大规模数据集和对Spark性能优化感兴趣的技术人员阅读,还可作为高等院校大数据专业的教材和相关培训机构的教学用书。
全面、深入地总结资深工程师多年大数据项目实战经验理论结合实践,由浅入深地展现Spark性能优化的核心技术 内容全面:涵盖Spark性能优化的基础知识、核心技术和应用实践,对Spark性能优化进行全面、系统的探讨。 实用性强:不但介绍理论知识,而且结合350多个示例和多个实战案例解析Spark性能优化的核心技术与应用,帮助读者更好地实施优化策略。 适用面广:无论是Spark性能优化初学者,还是开发人员、数据工程师和数据科学家等从业人员,都可以从本书中获得需要的知识和技能。 前瞻性强:基于Spark的新版本写作,不但介绍其新特性,而且介绍其集成Hadoop、Kafka和Elasticsearch使用时的性能优化方法。 讲解深入:对Spark性能优化的核心技术与工作原理进行深入讲解,以便让读者能够理解Spark的内部结构和运行机制,从而更有效地对其性能进行优化。
- 版权: 清华大学出版社
- 出版: 2023-11-01
- 更新: 2024-03-06
- 书号:9787302647706
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术