本书特色
获奖作品
亮点
教学大纲
课件
视频资源
其他素材
试题库
简介
本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1、2章主要带领大家认识Hadoop以及学会搭建Hadoop集群;第3~5章讲解分布式文件系统(HDFS)、分布式计算框架MapReduce以及分布式协调服务;第6章讲解Hadoop 2.0新特性,包含YARN和高可用特性;第7~10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop;第11章是一个综合项目——网站流量日志数据分析系统,目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深对Hadoop技术的理解。 本书附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。 本书可作为高等院校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2019-05-01
- 更新: 2023-07-07
- 书号:9787302524403
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术
获奖信息
国家软件与集成电路公共服务平台信息技术紧缺人才培养工程指定教材