“脏数据”就像一种看不见的病毒,困扰着当今的商业世界。也就是说,在当今以“大数据”为中心的世界里,不准确、不完整、不一致的数据正在激增。
处理脏数据每年给公司带来数百万美元的损失。它降低了整个企业各部门的效率和效力,并削弱了发展和扩大规模的努力。它削弱了竞争力,增加了安全风险,并带来了合规性问题。
负责 数据管理 多年来,企业一直在努力应对这一挑战。目前许多可用的工具可以解决部门内孤立团队的数据管理问题,但无法解决整个公司或更广泛的数据生态系统的数据管理问题。更糟糕 阿富汗手机号码数据 的是,这些工具最终往往会产生更多需要管理的数据——而且这些数据也会变得肮脏,造成更多麻烦和收入损失。
理解脏数据
脏数据 指任何数据 具有误导性、重复性、不正确或不准确的、尚未集成的、违反业务规则的、缺乏统一格式的、或包含标点符号或拼写错误的。
为了了解近几十年来脏数据是如何变得无处不在的,想象一下以下场景:
一家大型银行的贷款人发现几乎所有银行的客户都是宇航员,这让他们感到困惑。考虑到 只有 数十名宇航员,这没有意义。