简介
本书共分12章,分为基础篇、核心篇和应用篇。基础篇包括大数据概论、大数据集群系统基础、Hadoop分布式系统、HDFS分布式文件系统、MapReduce分布式计算、HBase分布式数据库应用; 核心篇包括YARN资源分配、Spark集群计算、Spark机器学习、Hive数据仓库应用、ZooKeeper协调服务; 应用篇包括医药大数据案例分析。 本书可以作为高等院校大数据技术相关课程本科生教材,也可以作为大数据技术基础相关课程研究生教材,还可以作为从事大数据相关工作的工程技术人员的参考用书。
编辑推荐
本教材的实质上是项目教学法或者案列教学法,目的是让同学们通过操作实践来实现一个大数据系统,全书围绕hadoop大数据的生态系统,从原理上、技术上进行深入的理论分析,通过操作、大数据系统、大数据编程来学习,真正实现“教、学、做”的一体化教学方法。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2020-06-01
- 更新: 2023-06-07
- 书号:9787302538431
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术