Microsoft Purview 统一目录中的数据质量报告

数据质量 (DQ) 报表是一份综合文档,用于评估和总结组织或系统中的数据质量。 它通常包括对各种数据质量维度和指标的评估,以帮助利益干系人了解其数据的准确性、完整性、一致性、可靠性和及时性。 此数据质量报告使团队能够一目了然地跟踪运行状况管理进度,并确定需要执行更多工作才能提高数据资产中的数据质量的领域。

本文介绍如何访问此报表,以及提供的数据质量度量对运行状况管理意味着什么。

报告目的

  • 监视和治理:持续监视和管理数据的质量,确保数据符合组织的标准和法规要求。

  • 决策支持:为利益干系人提供可靠的数据,以便做出明智的业务决策。

  • 识别问题:检测和记录数据质量问题,实现及时修正。

  • 改进数据管理:通过确定数据质量问题的根本原因并实施纠正措施来增强数据管理实践。

  • 性能度量:衡量数据质量计划的有效性,并跟踪随时间推移的改进。

  • 利益干系人沟通:向利益干系人(包括管理层、数据产品所有者、数据专员和 IT 团队)传达数据质量状态和进度。 通过提供数据质量状况的清晰而全面的视图,这些报表在维护组织内数据的完整性和有用性方面起着关键作用。

先决条件

需要 数据运行状况读取者 权限才能查看数据资产运行状况信息。

查看数据治理运行状况报告

  1. 打开 Microsoft Purview 门户,然后选择“统一目录”。
  2. 选择“ 运行状况管理 ”下拉列表。
  3. 选择 “报表”
  4. 选择 “数据运行状况 ”报告。

数据质量维度报告

报表的概述页涵盖数据质量维度分数、数据质量规则层次结构、数据质量状态(按维度)和数据质量维度 & 用于不同数据资产的规则类型。 顶部控件可帮助你一目了然地了解整体运行状况管理。

数据质量报告概述页的屏幕截图。

使用筛选器查看特定治理域、数据产品或处于特定状态的数据产品的信息, (例如:草稿) 。

数据质量维度 说明
Accuracy 数据应准确表示真实实体。 上下文很重要! 例如,如果要存储客户地址,请确保它们与实际位置匹配。
完整性 此规则的目的是标识空、null 或缺失的数据。 此规则验证所有值都存在 (但不一定正确) 。
整合 此规则确保数据遵循数据格式设置标准,例如日期、地址和允许值的表示形式。
一致性 此规则检查同一记录的不同值是否与给定规则一致,并且没有矛盾。 数据一致性可确保在不同记录中统一表示相同的信息。 例如,如果你有产品目录,则一致的产品名称和说明至关重要。
及时 此规则旨在确保在尽可能短的时间内访问数据。 它可确保数据是最新的。
唯一性 此规则检查值是否没有重复,例如,如果每个客户应该只有一条记录,则同一客户没有多个记录。 每个客户、产品或交易都应具有唯一标识符。

数据质量总体分数和维度分数可帮助数据从业者和数据资产所有者了解其数据的完整性、准确性、一致性和可信度。 它还指示需要采取哪些改进操作来提高其数据资产的质量。

数据质量维度分数的屏幕截图。

提示

如果使用筛选器,这些 KPI 将反映所选治理域或数据产品的分数。

按维度显示的数据质量状态

针对每个治理域计算数据质量维度分数。 使用规则映射的维度,分数从数据资产列到数据资产,从数据资产到数据产品以及每个行业标准维度的治理域级别一直汇总起来。 可以筛选出每个治理域的维度级别分数,以调查更多详细信息。

按治理域表显示的数据运行状况的屏幕截图。

数据质量规则通过和失败比率

数据产品的每个 DQ 维度都测量了数据质量规则的通过率和失败率。 此度量值可帮助数据所有者和数据从业者了解数据产品中哪些数据不精确、不一致、不完整、重复或不够新鲜。 此度量值还有助于调查和了解应用的规则是不正确的还是数据不正确。

每个维度的数据质量规则通过和失败配给的屏幕截图。

数据质量详细信息报表

此报表有助于了解应用于数据产品、数据资产和关键数据元素的规则数量,以度量和监视组织整个数据资产的质量。 可以向下钻取,了解某个规则类型的数据资产失败记录数、哪些规则类型性能更好,以及哪些治理域和数据产品正在发布和维护可信数据。 可以按治理域和数据产品筛选度量值,以了解当前状态并计划改进操作。

数据质量详细信息报表的屏幕截图。

注意

  1. 数据质量运行状况报告依赖于数据运行状况控件和 Purview 元数据自助服务分析模型。 如果客户不使用数据运行状况控件,并且不订阅 Purview 统一目录元数据,则不会刷新数据质量运行状况报告。 客户要么需要使用数据运行状况控件,要么需要订阅 purview 元数据进行自助分析,以刷新数据质量运行状况报告。
  2. 如果客户不使用数据质量功能,则数据质量运行状况报告将显示为空白,因为数据质量运行状况报告是使用数据质量扫描功能生成的数据创建的。

后续步骤