简介
本书定位于大数据专业核心技术——实时计算,重点讨论大数据应用场景中的数据特点和应用需求的实时流计算技术。本书通过对分布式实时计算系统的分析,将学习部分按功能性质划分成四个模块,分别为Kafka数据流处理模块、Strom实时计算模块、HBase数据存储模块和Zookeeper分布式协调模块。对此四个工作模块进行教学化处理,形成HBase基础操作、Zookeeper集群管理、配置Storm集群等核心课程体系,并配以实例使学习者便于理解,易于上手,掌握实时计算Storm相关的基础知识和实际业务系统的开发能力。本书主要针对具有软件编程基础(特别是数据技术)的学生和专业工程师,特别是数据科学、数据分析专业的高年级本科学生以及从事与数据相关的高级技术人员的读者人群。
编辑推荐
本书综合了大数据离线分析所需的主流技术Storm+Apache HBase+Zookeeper+Kafka,并配以案例和丰富的辅助学习资源,足以满足广大学习者入门的需要。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2007-01-18
- 更新: 2023-12-17
- 书号:9787302503217
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术