有哪些典型的“脏数据”?
0 1478
0
该提问暂无详细描述
收藏
2021-03-15 17:12 更新 小眼的铁板烧 •  3524
共 1 个回答
高赞 时间
0

当你听到污染一词时,你可能会想到垃圾填埋场中的塑料袋和柴油机的排放物。但是对于数据驱动的组织来说,环境污染并不是唯一需要担心的污染类型。对于所有行业的各种规模的组织来说,Salesforce和Marketo内部的脏数据都是一个巨大的问题。

不幸的是,保持数据库的清洁并不像在高速公路一侧捡垃圾那样简单。要解决脏数据问题,必须首先定义确切构成脏数据的内容。

重复资料

重复是数据污染最严重的问题之一。副本可以通过多种方式形成,包括数据迁移,通过集成进行的数据交换,第三方连接器,手动输入以及从批处理导入。最常见的重复对象是潜在客户,联系人和客户。

使用重复数据污染的Salesforce或Marketo可能导致:

  • 虚增的存储数量

  • 低效的工作流程和数据恢复

  • 偏斜的指标和分析

  • 由于无法访问数据,导致软件使用不佳

  • CRM和营销自动化系统的ROI降低

    重复数据在任何数据驱动型组织的系统中均不存在。消除重复数据的Salesforce或Marketo数据库应该是任何数据处理的重中之重。

如何清理并防止重复:

在海量数据积累时代之前,仅人力就足以合并重复项并将潜在客户链接到帐户。如今,有用于检测和合并重复项的自动化解决方案。用于复制数据的外部解决方案,例如Deepchecks 允许用户根据可自定义的条件匹配潜在客户,联系人和客户,并防止在进入Salesforce和Marketo的所有入口点重复。

过时的数据

你是否曾经找到一份看起来很有希望的报告或研究,却发现该信息已经存在了多年并且不再相关了?

数据过时的常见原因:

  • 个人改变角色或公司
  • 组织更名或被收购
  • 软件和系统的发展超越了先前的迭代

这就是现代数字生态系统的本质,对于普通数据库而言,变化太快了。在将数据用于见解,决策和分析之前,组织需要能够相信其数据是最新的。

不安全的数据

各国都制定了数据安全和隐私法,这给企业带来了额外的经济激励,使其可以遵循这些新制定的法律。由于对违规行为处以高额罚款,不安全的数据迅速成为脏数据最危险的类型之一。

在越来越以消费者为中心的商业环境中,数字许可、选择加入和隐私通知正成为新的规范。

主要的数据隐私法包括:

  • 欧盟的GDPR
  • 加利福尼亚的《消费者隐私法》(CCPA)
  • 缅因州保护在线消费者信息隐私的法案

资料不完整

如果记录缺少在销售和市场营销采取行动之前需要处理传入信息的关键字段,则可以将其定义为不完整。

例如,假设组织正在针对非营利机构开展竞选活动。如果新的或现有的记录缺少“行业”或“行业”字段,则不会将其包含在广告系列的智能列表中,并且可能会错过宝贵的收入机会。

知道记录上的更多数据点即更多洞察力并不是科学的。诸如潜在客户路由,评分和分段之类的数据过程依赖于关键字段的聚集来进行操作。

转载自:https://www.quora.com/What-is-considered-dirty-data

收藏
2021-03-15 17:25 更新 空心人 •  3374