假设您负责维护来自云存储的大量数据管道或将数据流式传输到数据仓库。如何确保每次转换后数据都符合预期?这就是数据质量测试的作用所在。数据测试使用一组规则来检查数据是否符合某些要求。
数据测试可以在整个 数据管道,从摄取点到目的地,但其中涉及一些权衡。
另一方面,还有数据监控,这是 数据可观 墨西哥手机号码数据 测性 数据监控解决方案无需编写特定规则来评估数据是否满足您的要求,而是不断检查整个管道中数据的预定义指标是否符合可接受的阈值,以提醒您出现问题。这些指标可用于尽早发现问题,无论是手动还是算法,而无需明确测试这些问题。
虽然数据测试和数据监控都是数据可靠性工程子领域的一个组成部分,但它们显然不同。
本文详细阐述了它们之间的区别,并深入探讨了如何以及在何处实施测试和监控。在本文的第一部分,我们将详细讨论数据测试,在本文的第二部分,我们将重点介绍数据监控的最佳实践。
测试与监控数据管道
数据测试是通过将单个对象(例如值、列或表)与一组业务规则进行比较来评估该对象的做法。由于这种做法会根据数据质量要求验证数据,因此也称为数据质量测试或功能数据测试。数据质量有很多维度,但例如,不言自明的数据测试会评估日期字段的格式是否正确。