简介
Kettle是一款国外开源的ETL工具,纯Java编写,无须安装,功能完备,数据抽取高效稳定。 本书介绍并演示如何用Kettle完成Hadoop数据仓库上的ETL过程,所有的描绘场景与实验环境都是基于Linux操作系统的虚拟机。全书共分10章,主要内容包括ETL与Kettle的基本概念、Kettle安装与配置、Kettle对Hadoop的支持、建立ETL示例模型、数据转换与装载、定期自动执行ETL作业、维度表技术、事实表技术,以及Kettle并行、集群与分区技术。 本书既适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校和培训机构人工智能与大数据相关专业的师生参考。
编辑推荐
Kettle易用性好,编码工作量小,功能完备,基于Java,允许多线程与并发执行以提高效率。本书以CDH作为Hadoop平台,结合销售订单示例,详细介绍并演示如何使用Kettle完成Hadoop数据仓库的ETL过程。本书适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2021-08-01
- 更新: 2023-06-22
- 书号:9787302582618
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术
相关图书
-
Hadoop高级编程——构建与实现大数据解决方案
(美) 卢博林斯凯 (Lublinsky,B.) , (美) 史密斯 (Smith,K.T.) , (美) 雅库伯维奇 (Yakubovich,A.) , 著
¥59.80