简介
本书由资深大数据专家精心编写,循序渐进地介绍了Flink生态系统主流的大数据开发技术。全书共7章,第1章讲解Flink的基础知识,包括Flink应用场景、主要组件、编程模型等,最后通过一个单词计数示例带领读者快速体验Flink应用程序的编写;第2、3章讲解Flink的多种运行时架构、任务调度原理、数据分区以及Flink集群的安装部署,同时包括Flink命令行操作、应用程序提交、常用Shell命令等;第4~7章讲解了Flink流式计算DataStream API、关系型计算Table&SQL API以及图计算框架Gelly等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、Kafka的整合操作。 本书内容翔实,实例丰富,适合Flink新手、大数据开发人员阅读,也可作为培训机构和大专院校相关专业的教学用书。
编辑推荐
Flink的基础知识,包括Flink应用场景、主要组件、编程模型等,通过单词计数示例带领读者快速体验Flink应用程序的编写。 Flink的多种运行时架构、任务调度原理、数据分区、Flink集群的安装部署,以及Flink命令行操作、应用程序提交、常用Shell命令等。 Flink流式计算DataStream API、关系型计算Table&SQL API、图计算框架Gelly等的基础知识和架构原理,以及API操作、内核源码剖析。 通过丰富的实际案例讲解了各个框架的具体应用以及与Hadoop生态系统框架Hive、Kafka的整合操作。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2021-12-13
- 更新: 2023-06-19
- 书号:9787302598183
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术