Hadoop + Spark生态系统操作与实战指南

作者: 余辉

出版社: 清华大学出版社

出版日期: 2017-09-01

电子书 ¥20.7 定价:69.0
  • 收藏

  • 加书架

  • 引用

简介

本书用于Hadoop+Spark快速上手,全面解析Hadoop和Spark生态系统,通过原理解说和实例操作每一个组件,让读者能够轻松跨入大数据分析与开发的大门。全书共12章,大致分为3个部分,第1部分(第1~7章)讲解Hadoop的原生态组件,包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装,以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介绍Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本环境下实战操作,其中Flume和Kafka属于Apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目,包络网页日志离线项目和实时项目,在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合,一步步带领读者学习和实战操作。本书适合想要快速掌握大数据技术的初学者,也适合作为高等院校和培训机构相关专业师生的教学参考书和实验用书。

编辑推荐

通过实际操作,快速学习Hadoop+Spark大数据技术。 解析Hadoop + Spark常用组件原理和实战操作,让读者快速了解组件原理和应用。 结合Hadoop + Spark原生态组件操作,使得读者了解当今互联网应用极为广泛的集群技术。 帮助读者构建Hadoop + Spark两大生态系统全局观。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2017-09-01
  • 作者:余辉
  • 更新: 2023-06-07
  • 书号:9787302479673
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

余辉

余辉,中国科学院大学硕士研究生毕业,研究方向为云计算和大数据。现供职于某上市公司担任技术经理,并在 Oracle OAEC人才产业集团大数据学院担任大数据讲师。曾在清华大学电子工程系NGNLab研究室担任软件工程师。

相关图书