公司存储的所有数据中,80%都是无用的,这种浪费也阻碍了创新。我们详细介绍了什么是暗数据以及一些避免暗数据的良好做法。
什么是暗数据?
“数据就是新的石油。”如果你没有听过这句话(几乎到了精疲力尽的地步),请举手。
我们不会讨论为什么数据变得如此重要,但我们会谈论一些并不总是被考虑到的事情:闪光的东西不一定都是金子,在每个数据库、每个信息存储库中,都存储着不再有趣的材料。
这就是所谓的暗数据。根据 Gartner 的说法,暗数据被定义 玻利维亚电报号码数据库 为组织在业务活动中收集、处理和存储的信息资产,但通常不会用于其他目的(例如分析、业务关系和直接货币化)。
几乎任何类型的文档、应用程序、交易和/或操作都会生成暗数据。典型示例包括客户或前雇员信息、日志文件、调查数据、财务报表、笔记、演示文稿、电子邮件、电子邮件附件、非活动数据库、旧版本文档、呼叫中心记录、客户评论等。
确实,组织通常仅出于履行法律义务(例如保留发票)的目的而保留所有这些暗数据,但这种存储和数据保护通常需要花费更多费用(有时还需要承担更大的风险),而这比在我们的存储库中维护这些信息所能带来的价值更高。
据估计,到 2025 年,全球每天将产生 463 EB 的数据。许多公司努力存储和收集有关其用户的大量信息,有时甚至不考虑他们真正需要这些数据的原因。是的,目标是正确分析它们以制定业务战略并更好地调整您的产品和营销以满足客户的需求。但完成了吗?
此外,这种存储大量信息的急切心态也导致存储了一些没意思或没价值的数据。事实上,根据大数据分析公司 Splunk 的报告,组织收集的数据中有 55% 属于这种脏数据现象。
暗数据的缺点
这些暗数据的最大问题不在于我们无用地存储它们,而在于它们可能导致其他并发症。
例如,必须分配更多资源才能存储所有这些信息。此外,根据我们存储数据的方式和位置,这个容量可能会影响其他设备的性能,因此需要我们的计算设备提供更多的电力。
此外,如果我们保留的这些不再有用的数据包括个人信息,我们必须记住我们应该对其进行监控和控制,因为个人保护权利也适用于这些文件。值得记住的是,信息越敏感,我们需要考虑的安全策略就越多。