数据管理-元数据管理&建设&案例&标准.pdf

数据管理-元数据管理&建设&案例&标准.pdf
这份文档主要介绍了元数据管理的概念、重要性、方法、应用和标准,核心内容如下: **1. 元数据概述** 元数据是“关于数据的数据”,描述了数据本身(如数据库、数据元素、数据模型),数据表示的概念(如业务流程、应用系统、软件代码、技术基础设施)及联系。其作用是帮助组织理解自身数据、评估数据质量、管理数据库,并确保数据质量与安全。 **2. 元数据管理目标与原则** * **目标:**确保数据内容一致性、理解数据间的相似与差异、保证质量、提供访问途径、实现数据交换。 * **原则:**组织承诺、制定战略、企业视角、潜移默化、开放访问、重视质量、规范审计和持续改进。 **3. 元数据类型** 包括业务元数据、技术元数据和操作元数据。业务元数据侧重业务内容,技术元数据涉及技术细节,操作元数据描述处理和访问细节。 **4. 元数据注册标准** ISO/IEC 11179标准提供了用于定义元数据注册的框架,以实现元数据驱动的数据交换。 **5. 元数据基本概念** 包括元数据与数据、元数据类型、非结构化数据的元数据、元数据来源、元数据架构类型。 **6. 非结构化数据的元数据管理** 对非结构化数据(文档或其他介质)的元数据管理是重要的,涉及描述性元数据、结构性元数据、管理元数据、书目元数据和保存元数据,在大数据背景下,收集元数据作为数据采集流程的一部分,生成数据湖内容的目录。 **7. 元数据来源** 元数据来源广泛,包括应用程序、业务术语表、商务智能工具、配置管理工具、数据字典、数据集成工具、数据库管理、数据映射管理工具、数据质量工具等,需根据实际应用场景选择。 **8. 元数据架构类型** 包括集中式、分布式和混合式架构。其中,集中式架构适用于 IT 资源有限或追求一致性的组织;分布式架构检索通过实时从源系统检索数据,分布式元数据架构没有持久的存储库;混合式架构则结合了集中式和分布式架构的特性。 **9. 元数据管理活动** 包括定义战略、理解需求、定义架构、创建维护、查询报告和分析。 **10. 元数据管理方法** * **数据血缘分析:** 跟踪数据来源、加工处理过程、最终销毁过程,从而快速定位问题。 * **影响分析:**描述数据间的依赖性细节,分析一个数据源发生变化的影响。 * **大数据采集的元数据:** 在大数据场景下,需要结合新技术和流程,以实现元数据的管理。 * **实施指南:**包括渐进的步骤建设受控的元数据管理环境,并学习管理元数据环境的试点项目。 **11. 元数据应用** 元数据可应用于企业数据资产管理、数据血缘分析、冷热度分析和运营驾驶舱,帮助企业实现数据资产的全面、高效利用。 **12. 元数据管理工具** 元数据管理的主要工具是元数据存储库。 **13. 企业级元数据管理能力** 强调在数据被加载时补充元数据;通过各行业专家定义众包元数据;提供端到端的数据血缘分析能力;将语义建模与非模型化的灵活性相结合;使用图形化的表示方法。 **14. CWM标准** CWM是数据仓库和商业智能(BI)工具之间共享元数据,制定了一整套关于语法和语义的规范。 **15. 元数据管理流程** 元数据管理流程包含数据开发、采集、存储、编辑、发布、应用、检索、维护等环节。
在线阅读 下载完整报告 | 6.16 MB | 71页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告