简介
本书系统介绍了大数据基础知识和相关技术,全书分为大数据基础篇、大数据存储与管理篇、大数据采集与预处理篇、大数据分析与挖掘篇、大数据平台Hadoop实践与应用案例篇。全书共17章,主要内容包括大数据基本概念、大数据存储与管理概念及技术、大数据采集及预处理技术、大数据计算模式、大数据分布式并行处理框架Hadoop、大数据分布式文件系统HDFS、大数据分布式数据库系统HBase、大数据分布式数据仓库系统Hive、大数据MapReduce分布式并行计算模型、大数据Spark内存计算模型、大数据Flink流式计算模型、大数据处理基础算法、大数据关联分析、分类、聚类、回归典型数据挖掘算法、大数据Hadoop平台操作实践、大数据预测应用案例分析以及中科曙光XData大数据平台架构、关键技术及其应用案例。全书提供了大量应用实例,每章后附有习题。本书特色在于融会贯通大数据基本概念与大数据技术及应用,很好将大数据概念、技术及应用融合在一起,便于读者能够更好理解大数据基本概念、更快掌握大数据前沿技术及其应用。本书适合作为高等院校计算机、软件工程、信息管理等相关专业的本科生及研究生学习大数据技术教学用书,也可作为相关IT工程技术人员的参考用书。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2024-08-01
- 更新: 2024-11-18
- 书号:9787302667308
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术