数据目录:现代数据管理中的重要资产
已发表: 2022-02-10您可以花更多的时间寻找数据而不是分析数据。 为了将您的业务数据转化为竞争优势,您的所有用户都需要能够快速查找、理解和利用这些数据。 如果跨部门的决策者找不到他们需要或无法理解的数据,那么他们就无法利用它来优化业务运营和改进关键增长战略。 建立数据目录的企业可以轻松发现、整理、分类和共享数据资产、数据集和分析模型,以发现新的机会。 数据目录正在成为现代数据管理的核心组件,允许所有业务用户轻松查找和访问数据,以加快获得洞察的时间。
什么是数据目录?
数据目录是一个库,您的所有业务数据都被整齐地组织、索引并随时可用。 它将围绕数据资产或元数据的技术细节组织成已定义、有意义且可搜索的业务资产,以实现所有业务用户和数据消费者之间一致的数据理解。
数据目录有什么作用?
数据目录的作用是数据目录的一部分——通过将来自多个来源的数据组织到一个可搜索的集中式图书馆中,数据目录工具使任何寻找问题答案的人都能更快、更有效地定位、理解和利用数据。 但是数据目录是如何做到这一点的呢?
数据集搜索
数据目录提供强大的搜索功能,包括按方面、关键字和/或过滤器、对象名称和业务术语进行搜索,从而更快、更轻松地找到正确的数据。 许多数据目录会根据相关性和查看频率自动对搜索结果进行排名,因此最好的数据很容易获得。
数据集评估
预览数据集、查看所有相关元数据、验证数据的用户和描述以及查看数据质量信息的能力简化了选择正确数据集进行分析的过程。
数据访问和保护
数据访问功能确保用户可以根据自己的需要,合规、安全地访问数据。 它们包括对安全、隐私和合规敏感数据的保护,因此尽管每个人都可以访问相同的数据目录,但只有具有正确权限的用户才能访问某些数据集。
分析
与商业智能解决方案集成的数据目录显着提高了数据分析的速度和质量。 它还提供数据集目录和可视化功能。 使用正确的工具,还可以使用高级数据操作。
统一管理
数据目录永远消除了孤岛。 通过为您的整个业务数据收集提供一个集中位置,数据目录可实现自助式用户体验,并消除 IT 和数据专家在需要数据时授予每个人访问权限的负担。
为什么您的企业需要数据目录
根据 IBM 的研究,企业领导者将 70% 的时间用于查找数据,而利用数据的时间仅为 30%。 如果没有充分发挥数据的潜力,您的数据有什么用? 只有当业务用户能够将数据转化为有意义和有用的洞察力以推动他们的决策制定、获得价值并获得竞争优势时,数据才是有价值的资产。
数据目录使整个组织中的数据更易于访问。 您的团队不必依赖 IT 和数据分析师,他们可以使用目录的工具在几分钟内找到他们需要的东西。 这为公司中的每个人节省了时间,加快了决策过程,并提高了整体生产力和效率。
数据目录促进了数据驱动的文化。 当每个人都可以访问数据时,跨部门和不同职责级别的每个人都会变得更加自信并开始说同一种语言。 协作变得更加容易和透明。 数据驱动文化的目标是为整个组织带来透明度并提供易于使用的洞察力。 它将数据置于所有决策的中心,因此您不依赖直觉,而是依赖事实。 这样一来,错误就会被减少到最低限度,并且几乎总能保证成功。
例如,如果您的企业属于零售行业,并且结合了店内购物者数据、购买历史记录和手机数据,您可以使用这些数据在潜在客户购买时创建和启动地理定位广告活动. 数据目录工具可以帮助您的团队获得这些见解,从而推动和支持广告活动决策。 最后,数据目录可以实现更有效的广告活动,从而获得更高的投资回报率。
当然,收集和存储数据并非没有对消费者隐私的担忧和责任。 有关消费者数据隐私的法规正在推动公司可以收集哪些数据以及如何存储和交换这些数据。 数据目录工具可帮助组织遵守 GDPR、HIPAA、CCPA 等法规。

数据目录:构建还是购买?
完全可以建立自己的数据目录。 问题是是否值得投入时间、金钱和精力,还是投资于已经建立的数据目录工具是否更好。 以下是构建与购买数据目录工具的优缺点:
- 构建您自己的数据目录需要一个专门的数据工程师团队——您需要至少 5 名永久分配到该项目的工程师,在构建和实施阶段甚至更多。
- 建立自己的数据目录需要时间——对于拥有足够资源的大型组织来说,建立自己的数据目录的过程可能需要大约 3-4 周的时间。 然而,一些人报告说,他们经过多次尝试和几年的时间,才最终成功地建立了数据目录。
- 数据目录标准变化很快; 您需要一个维护和支持团队来保持您的数据目录是最新的——这在最初的项目之上。 您应该只雇用人员从事这项工作,或者为您现有的团队增加额外的责任(我们猜他们确实有更重要的任务需要关注)。
- 要构建自己的数据目录,您需要机器学习专业知识,以便能够捕获技术、运营、业务和社交元数据——数据智能对于数据目录的开发至关重要,而机器学习等创新是其核心。 机器学习数据目录 (MLDC) 为管理、监控和改进业务数据资产的使用提供了最佳方式,并支持实时数据发现、自动编目、元数据爬行和 PII 数据分类。
- 构建您自己的数据目录需要 UX/UI 资源——构建数据目录的目标是您的所有用户都可以轻松查找和访问数据。 这意味着数据目录的设计方式应使所有用户,无论角色和专业知识如何,都可以无缝地使用它。 为了保证这一点,您需要一名 UX/UI 专家与数据工程师团队一起工作。
- 建立自己的数据目录是一项昂贵的项目——建立自己的数据目录的成本可能会更低,但从长远来看,这项投资会产生许多额外的成本。 与购买具有持续更新和内置支持成本的数据目录相比,您维护自己的工具可能需要多支付 2 到 3 倍的费用。
相反,选择购买现有的数据目录工具是更快、更灵活的选择。 您可以立即开始利用它,而不必担心雇用新人、给您的数据团队带来负担或任何维护和支持。 投资数据目录解决方案并让您的工程师将宝贵的时间用于改进您自己的产品/服务的软件是有意义的。
如何找到合适的数据目录工具
最好的数据目录可以简化您的数据管理流程并帮助您的组织变得更加数据驱动。 不同的数据目录解决方案适用于不同的用例,因此将搜索范围缩小到最适合您要求的范围很重要。 有些处理数据湖中的数据,更适合数据科学,而另一些则更面向业务,因此您可能正在寻找什么。
但当然,选择正确的数据目录还有更多工作要做。 数据目录仅与其搜索和过滤数据的能力一样有用。 如果将其集成到 Slingshot 等数据分析解决方案中,它可以让用户充分利用他们的数据并做出更明智的业务决策,同时提供广泛的数据源和数据集、可视化和仪表板目录。 它将聊天和基于目标的策略基准测试、数据分析、项目和内容管理合二为一,是一款多功能且直观的应用程序。
数据目录工具需要具有强大的数据搜索和发现功能,以便所有用户都能从他们使用的数据中获得有价值的见解。 它应该能够利用 ML/AI 来提高数据素养,加快获得准确洞察的时间,并增强数据准备。 它需要能够将预构建的连接器用于各种来源,包括一个开放的连接器 SDK 以连接到任何其他来源,并整合协作。 确保还寻找元数据管理,以及供应商的治理、合规性、部署和集成选项是什么。
结论
数据目录应该是您的数据策略的基础。 如果您真的想控制您的数据并构建一个易于查找、下载、使用和共享的可信数据的单一来源,那么数据目录就是合适的工具。 获得整个组织中所有数据的统一视图可以让您轻松找到所需的正确数据,并花费更少的时间来搜索它并花费更多的时间来分析它。
