简介
本书以某招聘网站中的大数据职位招聘信息为数据源,系统地介绍了如何使用Hadoop生态系统进行大数据离线分析的方法和步骤。全书共6章,分别讲解了项目需求、项目架构、项目实现流程、Hadoop集群环境搭建、使用Flume实现数据采集、使用MapReduce实现数据预处理、使用Hive实现数据分析和使用FineBI实现数据可视化。本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书适用于高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适用于数据分析、数据可视化、数据仓库等领域的从业者阅读。
编辑推荐
本书在第1版成功的基础上,按照最新的教改要求,采用最新的软件版本精心修订, 本书以某招聘网站中的大数据职位招聘信息为数据源,系统地介绍了如何使用 Hadoop 生态系统进行大数据离线分析的方法和步骤。全书共6章,分别讲解了项目需求、项目架构、项目实现流程、Hadoop集群环境搭建、使用Flume实现数据采集、使用MapReduce实现数据预处理、使用Hive实现数据分析和使用FineBI实现数据可视化。 本书配套资源丰富,提供配套视频、教学PPT、教学设计等。 本书适合作为高校数据科学与大数据技术及相关专业的教材,也适合数据分析、数据可视化、数据仓库等领域的从业者阅读。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-03-01
- 更新: 2025-05-29
- 书号:9787302685371
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术