简介
在数据湖仓的所有新增要素中,排名第一的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规划。
编辑推荐
超越数据库与数据湖,新一代数据管理的新模式——数据湖仓为数据分析带来新变革,为更有效、更便捷、更科学、更可靠、更灵活的数据分析提供基础。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2023-03-01
- 更新: 2023-10-18
- 书号:9787302624479
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术