简介
本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用Spark生态系统进行大数据离线分析和实时分析的方法。全书共7章,分别讲解了项目需求、项目架构、项目实现流程、大数据集群环境搭建、热门品类Top10分析、各区域热门商品Top3分析、网站转化率统计、广告点击流实时统计和使用FineBI实现数据可视化。本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书适用于高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适用于数据分析、数据可视化等领域的从业者阅读。
编辑推荐
本书以电商网站中的用户行为数据为数据源,系统地介绍了如何使用Spark生态系统进行离线分析和实时分析的方法和步骤。全书共7章,分别讲解了项目需求、项目架构、项目实现流程、搭建大数据集群环境、使用Spark Core和Spark SQL编写离线分析的Spark程序、使用Structured Streaming编写实时分析的Spark程序、使用HBase实现数据存储和使用FineBI实现数据可视化。 本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。 本书以项目驱动方式引导读者学习并动手操作以提升大数据技能;从零到一,逐步引导读者完成项目的开发;通俗易懂,让读者能够清楚地理解每个步骤的原理;融合了教材、资源、服务,方便教与学。 本书适用于高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适用于数据分析、数据可视化领域的从业者阅读。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-03-01
- 更新: 2025-05-29
- 书号:9787302684947
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术