Hadoop大数据技术原理与应用(第2版)

作者: 黑马程序员

出版社: 清华大学出版社

出版日期: 2023-07-01

电子书 ¥38.86 定价:59.8
  • 收藏

  • 加书架

  • 引用

简介

本书以Hadoop 3.x及其生态体系中常用的大数据开源项目为主线,从大数据的概念入手,进而讲解Hadoop及其生态体系中常用大数据开源项目的架构和原理,并且在本书的最后一章通过一个项目案例对Hadoop的综合运用进行讲解。本书共分为11章,第1章主要讲解了大数据和Hadoop基础知识,包括大数据概述、大数据的应用场景、Hadoop的优缺点和Hadoop的生态体系等内容。第2章主要讲解了Hadoop集群的部署和简单使用,包括虚拟机的创建、Centos Stream 9的安装与配置、JDK的安装、基于伪分布式部署Hadoop、基于完全分布式部署Hadoop,以及通过一个案例-词频统计演示Hadoop集群的简单使用。第3~4章主要讲解了Hadoop核心组件HDFS、MapReduce和YARN的概念及使用,包括HDFS架构、HDFS文件读写流程、HDFS的Shell和Java API操作、MapReduce编程模型、MapReduce工作原理、YARN基本架构等内容,并且通过3个MapReduce的经典案例讲解MapReduce和YARN的使用。第5~10章主要讲解了Hadoop生态体系中常用大数据开源项目的概念和使用,包括Hive、ZooKeeper、Flume、Azkaban和Sqoop,其中第6章基于ZooKeeper对Hadoop高可用集群的概念和实现进行了讲解。第11章通过综合项目-网站流量日志数据分析系统对Hadoop及其生态系统的综合运用进行操作和讲解,包括系统概述、需求分析、数据采集的实现、数据预处理的实现、数据分析的实现等。 本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。

编辑推荐

本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-07-01
  • 作者:黑马程序员
  • 更新: 2023-12-15
  • 书号:9787302633969
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

黑马程序员

张明强,担任江苏传智播客教育科技股份有限公司教材研发中心教材编辑一职,负责编写大数据技术相关教材和制作教材的配套资源,有多年教育领域相关工作经验,曾编写《大数据项目实战》《Spark项目实战》《Hive数据仓库》《NoSQL数据库技术与应用》等大数据技术教材。

相关图书