并非所有数据质量问题都是主观的

Discuss hot database and enhance operational efficiency together.
Post Reply
asimd23
Posts: 606
Joined: Mon Dec 23, 2024 3:25 am

并非所有数据质量问题都是主观的

Post by asimd23 »

如今,在扩展的现代数据堆栈中,数据质量的范围要广泛得多。特别是,大规模数据操作产生的问题与主观的业务线数据质量问题截然不同。因此,虽然主观检查很难扩展,但也许真正需要解决的大规模问题并不是那么主观。

在现代数据堆栈中,数据质量问题的 爱沙尼亚手机号码数据 范围从语义和主观(难以定义)到操作和客观(易于定义)。例如,客观和较容易定义的问题是数据显示为空字段、记录重复交易甚至丢失交易。更具体地说,操作问题可能是关键报告的数据上传未按时进行,或者数据架构更改导致重要字段丢失。

数据质量问题是高度主观还是绝对客观取决于它源自数据堆栈的哪一层。现代数据堆栈及其支持团队通常分为两大层: 数据平台或基础设施层; 分析和报告层。平台团队由以下人员组成: 数据工程师,维护数据基础设施并充当数据生产者。该团队为分析层的消费者提供服务,包括分析工程师、数据分析师和业务利益相关者。

在堆栈的最高层,问题往往是特定领域的、主观的,并且很难自动检测。在平台层,数据质量问题源于数据操作失败。虽然这些平台层问题经常被认为是主观的、难以监控的,但它们通常是显而易见的问题。
Post Reply