简介
本书以电商网站中的用户行为数据作为数据源,系统介绍了如何使用Spark生态系统进行离线分析和实时分析的方法。全书共6章,分别讲解了项目述、搭建集群环境,使用Flume实现数据采集,使用Hive构建数据仓库,使用Spark进行数据分析以及使用FineBl实现数据可视化。本书附有教学PPT,教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书适合作为高等学校数据科学与大数据技术及相关专业的教材,也适合数据分析,数据可视化等领域的从业者阅读。
编辑推荐
本书为传智播客公司大数据系列中的一本,全书内容完整,结构清晰,条理分明,术语规范,描述流畅,质量较好。本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用 Spark生态系统进行离线分析和实时分析的方法。全书共6章,分别讲解了项目概述、集群环境搭建、使用Flume实现数据采集、使用Hive构建数据仓库、使用Spark进行数据分析以及使用FineBI实现数据可视化。本书有较高的知识性、科学性和实用性,出版价值较高。本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-03-01
- 更新: 2025-05-28
- 书号:9787302685302
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术