Apache Airflow 数据编排实战

作者: [荷] 巴斯·哈伦斯拉克(Bas Harenslak),朱利安·德·瑞特(Julian de Ruiter)著 殷海英 译

出版社: 清华大学出版社

出版日期: 2022-11-01

电子书 暂不销售 定价:128.0
  • 收藏

  • 加书架

  • 引用

简介

数据管道通过整合、清理、分析、可视化等方式来管理初始收集的数据流。Apache Airflow提供了一个统一的平台,可以使用它设计、实施、监控和维护数据的流动。Airflow具有易于使用的UI、即插即用的选项以及灵活的Python脚本,这些都使Airflow能够非常轻松地完成任何数据管理任务。   在《Apache Airflow 数据编排实战》中,介绍了如何构建和维护有效的数据管道。与你一同探索最常见的使用模式,包括聚合多个数据源、连接到数据湖以及云端部署。可以将本书作为Airflow的实用指南,本书涵盖了为Airflow提供动力的有向无环图(DAG)的各方面知识,以及如何根据工作需求对其进行自定义的技术。 主要内容 ● 构建、测试及部署Airflow管道作为DAG ● 自动对数据进行移动和转换 ● 使用回填技术分析历史数据集 ● 开发自定义组件 ● 在生产环境中搭建Airflow

编辑推荐

《Apache Airflow 数据编排实战》通过4部分深入浅出地介绍了什么是Airflow,如 何部署和使用Airflow, 并涉及许多深入的主题,让你对Airflow 能够有全面的了解,并 且在本书的第I部分,为大家提供了许多实用的案例,让你能够快速使用Airflow解决 工作中遇到的各种数据流处理问题。现在是云的时代,在本书的第IV部分介绍了大量的 上云示例,让你能够轻松地使用Airflow管理各种本地、云端或者二者混合在- -起的数 据流。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2022-11-01
  • 作者:[荷] 巴斯·哈伦斯拉克(Bas Harenslak),朱利安·德·瑞特(Julian de Ruiter)著 殷海英 译
  • 更新: 2023-11-16
  • 书号:9787302618157
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

[荷] 巴斯·哈伦斯拉克(Bas Harenslak),朱利安·德·瑞特(Julian de Ruiter)著 殷海英 译

Bas Harenslak和Julian de Ruiter是数据工程师,他们在为大公司开发数据管道方面拥有丰富的经验。同时,Bas也是一位Airflow的提交者。

相关图书