简介
《精通Hadoop3》详细阐述了与Hadoop 3相关的基础知识,主要包括Hadoop 3简介、深入理解Hadoop分布式文件系统、YARN资源管理器、MapReduce内部机制、Hadoop中的SQL、实时处理引擎、Hadoop生态圈组件、定义Hadoop中的应用程序、Hadoop中的实时流处理、Hadoop中的机器学习、云端中的Hadoop、Hadoop集群分析、Hadoop中的角色及其执行内容、网络和数据安全、监测Hadoop等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
编辑推荐
《精通Hadoop3》阐述了Hadoop生态圈中的高级概念,并通过安全机制、监测机制和数据管理机制构建高性能的Hadoop数据管线。 除此之外,本书还利用Apache Spark 和Flink改进企业级应用程序,并考查Hadoop的内部工作机制,包括一些真实案例的构建方案。同时,我们还将通过Hadoop 3数据平台探讨企业级应用程序的最佳实践方案,其中涉及授权和身份验证机制。随后,我们将学习如何在Hadoop中对数据进行建模、深入了解基于Hadoop 3的分布式计算机制,并查看不同的数据批处理模式。 最后,本书讨论如何高效地继承Hadoop生态圈中的组件,以实现高速、可靠的大数据管线。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2022-02-20
- 更新: 2023-06-07
- 书号:9787302596875
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术