本书以Flink 1.16.0为主线,全面介绍了Flink的核心概念和常用功能。全书共9章,分别讲解了Flink概述,Flink部署与应用,DataStream API,DataSet API,时间与窗口,状态和容错机制,Table API&SQL和Flink CEP。 本书附有配套视频、教学课件、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书内容,还提供了在线答疑,欢迎读者关注。 本书可作为高等教育本、专科院校数据科学与大数据技术及相关专业的教材,还适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读。
本书从Flink的概念入手,进而讲解Flink相关架构和原理,帮助读者从搭建Flink集群到使用DataStream API、DataSet API和Table API&SQL实现Flink应用程序的过程进行详细讲解,并在本书的最后一章通过一个项目案例对Flink的综合运用进行讲解。本书共分为9个章节。第1章主要介绍了Flink的理论性知识,包括数据处理架构的演变、Flink关键特性、Flink应用场景、Flink批流模型、Flink集群运行架构等。第2章主要讲解了Flink的部署,包括虚拟机的安装、Linux操作系统的配置、JDK部署、集群部署之Flink on YARN、集群部署之Standalone、本地模式部署,以及介绍了如何了Flink命令行界面和SQL Client的使用。第3章主要讲解了如何使用DataStream API实现Flink应用程序,包括DataStream程序结构、DataStream数据类型、创建执行环境、创建数据源、创建接收器、转换操作以及涵盖本章整体知识体系的案例。第4章主要讲解了如何使用DataSet API实现Flink应用程序,包括DataSet程序结构、创建执行环境、创建数据源、创建接收器、转换操作以及涵盖本章整体知识体系的案例。第5章主要讲解了Flink的时间和窗口,包括时间概念、窗口分配器、Watermark、窗口函数、窗口触发器等。第6章主要讲解了Flink的状态和容错机制,包括状态概述、Checkpoint、State Backend、状态编程等。第7章主要讲解了如何使用Table API&SQL实现Flink应用程序,包括Table程序结构、数据类型、Catalog操作、数据库管理、表操作以及查询操作等。第8章内容对使用Table API&SQL实现Flink应用程序的内容进行深入讲解,包括内置函数和自定义函数的使用、DataStream与表的转换、时间属性以及窗口操作等。第9章通过综合项目-电商用户行为分析对Flink的综合运用进行操作和讲解,包括项目概述、需求分析、项目架构、以及实时统计不同需求等。 本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
- 版权: 清华大学出版社
- 出版: 2024-05-01
- 更新: 2024-11-07
- 书号:9787302661733
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术