首页>软件资讯>常见问题

常见问题

Data Vault 2.0 erwin与数据治理

发布时间:2023-04-10 15:35:16人气:396

Erwin
唯一同时具有Data Catalog和DW-Automation能力的厂商.png

Data Vault 2.0


Data Vault 是一种向企业提供数据分析服务的方法和架构,支持数据仓库、商业智能、分析和数据科学需求。它的核心是一种先进、敏捷的方法,能够快速、有效地设计和构建数据仓库,实现数据价值的最大化。


Data Vault 专为那些追求敏捷数据仓库项目的组织而量身定制,在这些项目中,可扩展性、集成、开发速度和业务导向至关重要。它继承并超越了传统数据仓库设计的优势,适应了企业规模和业务高速增长的挑战。


Data Vault 是一种比传统的数据仓库技术路线(例如 Kimball 模型和 Inmon模型)更先进、更实用的方法。由于它在解决当今许多数据仓库问题方面的卓越表现,以及众多热情的数据专业人士的推广和支持,它正在得到越来越多的企业和组织的认可和采用。随着它的普及,相关的书籍、博客、用户组和其他资源也不断涌现,为用户提供更多的学习和交流机会。

2.png

Data Vault 2.0生态系统技术堆栈

Data Vault 2.0方法论成为数据仓库中项目管理的最佳标准。它采用了Scrum作为团队协作的工具,并将其应用于项目的日常任务。在每个两到三周的Scrum迭代(sprint冲刺)中,团队按照软件开发生命周期(SDLC)的流程执行一个小型瀑布模型。目标是在每个迭代结束时完成可交付并可投入生产的内容,保证项目的质量和进度。


Erwin


erwin元数据管理、数据目录、数据仓库ETL / ELT代码自动化与Data Vault 2.0生态完美集成。见局部放大的Data Vault 2.0生态系统技术堆栈图。Erwin是同时具有Data Catalog和DW Automation能力的厂商。

3.png

这里的Data Warehouse Automation又分为正向工程和逆向工程:

4.png


正向工程自动化:从数据处理流程和/或元数据的角度集成生态系统应用程序,为ETL / ELT工具生成自动化代码。

5.png


逆向工程自动化:收集静态数据和动态数据的元数据,进行数据血缘分析、影响分析等。


数据治理

6.png


元数据驱动的数据治理架构—满足企业数据治理需求


收集数据——从各种数据管理孤岛中自动收集元数据,获取数据结构和业务术语,并将其整合到集中存储库中。


分析数据——从元数据的技术属性、业务属性、管理属性,理解数据与业务的关系,管理数据映射,进行数据血缘分析、影响分析等。


数据架构——理清元数据的技术、业务、管理属性,形成基于元数据的数据标准管理,并以此构建元数据驱动的数据治理架构。


数据治理——开发治理模型来管理标准、策略和最佳实践,并将它们与数据实物资产相关联。


数据可视化——让所有用户都能够在他们的角色背景下查看相关数据。


数据治理平台要想在技术上展现出色的实力,不仅要能够实现数据模型管理、元数据管理、业务术语管理、数据血缘分析、数据标准落地等常规的功能,还要能够适应现代大数据处理流程和技术堆栈的变化,支持:


{主流商用关系型数据库、云端RDS、ETL / ELT工具、云上数据湖与数据工厂、开源大数据平台、数据科学与工程、下一代数据湖仓一体等等等等}的正向工程和逆向工程的双向操作。这是数据治理平台的硬核(黑科技)技术指标。


除了完善支持Data Vault生态系统之外,erwin还拥有业界最广泛的数据连接器,支持任何异构数据源和目标之间的正向、逆向工程。

7.png



上一条:Fiddler Everywhere v4.2.1

下一条:SnapGene_日常分子生物学工具