데이터 카탈로그: 현대 데이터 관리의 핵심 자산

게시 됨: 2022-02-10

데이터를 분석하는 것보다 데이터를 찾는 데 더 많은 시간을 할애할 수 있습니다. 비즈니스 데이터를 경쟁 우위로 전환하려면 모든 사용자가 해당 데이터를 빠르게 찾고, 이해하고, 활용할 수 있어야 합니다. 여러 부서의 의사 결정자가 필요한 데이터를 찾을 수 없거나 이해할 수 없다면 비즈니스 운영을 최적화하고 주요 성장 전략을 개선하는 데 활용할 수 없습니다. 데이터 카탈로그를 구축한 기업은 데이터 자산, 데이터 세트 및 분석 모델을 쉽게 발견, 선별, 분류 및 공유하여 새로운 기회를 발견할 수 있습니다. 데이터 카탈로그는 최신 데이터 관리의 핵심 구성 요소가 되어 모든 비즈니스 사용자가 데이터를 쉽게 찾고 액세스하여 통찰력을 얻는 시간을 단축할 수 있습니다.

데이터 카탈로그란 무엇입니까?

데이터 카탈로그는 모든 비즈니스 데이터가 깔끔하게 정리되고 인덱싱되어 사용할 수 있도록 준비된 라이브러리입니다. 데이터 자산 또는 메타데이터에 대한 기술 세부 정보를 정의되고 의미 있고 검색 가능한 비즈니스 자산으로 구성하여 모든 비즈니스 사용자와 데이터 소비자 간에 일관된 데이터 이해를 가능하게 합니다.

데이터 카탈로그는 무엇을 합니까?

데이터 카탈로그가 하는 일은 데이터 카탈로그의 일부입니다. 여러 소스의 데이터를 검색 가능한 중앙 집중식 라이브러리로 구성함으로써 데이터 카탈로그 도구를 사용하면 질문에 대한 답변을 찾는 모든 사람이 데이터를 보다 빠르고 효율적으로 찾고, 이해하고, 활용할 수 있습니다. 그러나 데이터 카탈로그는 이를 어떻게 수행합니까?

데이터세트 검색

데이터 카탈로그는 패싯, 키워드 및/또는 필터, 개체 이름 및 비즈니스 용어로 검색을 포함하는 강력한 검색 기능을 제공하여 올바른 데이터를 더 빠르고 쉽게 찾을 수 있도록 합니다. 많은 데이터 카탈로그는 관련성과 보기 빈도에 따라 검색 결과의 순위를 자동으로 지정하므로 최상의 데이터를 쉽게 사용할 수 있습니다.

데이터세트 평가

데이터 세트를 미리 보고, 연결된 모든 메타데이터, 데이터를 인증한 사용자, 설명을 보고 데이터 품질 정보를 볼 수 있는 기능은 분석에 적합한 데이터 세트를 선택하는 프로세스를 단순화합니다.

데이터 액세스 및 보호

데이터 액세스 기능은 사용자가 필요에 따라 규정을 준수하고 안전하게 데이터에 액세스할 수 있도록 합니다. 여기에는 보안, 개인 정보 보호 및 규정 준수 민감한 데이터에 대한 보호가 포함되므로 모든 사람이 동일한 데이터 카탈로그에 액세스할 수 있지만 올바른 권한이 있는 사용자만 특정 데이터 세트에 액세스할 수 있습니다.

해석학

비즈니스 인텔리전스 솔루션과 통합된 데이터 카탈로그는 데이터 분석의 속도와 품질을 크게 향상시킵니다. 또한 데이터 세트 및 시각화 기능의 카탈로그를 제공합니다. 올바른 도구를 사용하면 고급 데이터 작업도 사용할 수 있습니다.

통합 관리

데이터 카탈로그는 사일로를 영원히 제거합니다. 전체 비즈니스 데이터 수집을 위한 중앙 집중식 위치를 제공함으로써 데이터 카탈로그는 셀프 서비스 사용자 경험을 가능하게 하고 IT 및 데이터 전문가가 데이터를 필요로 하는 모든 사람이 필요할 때 액세스 권한을 부여해야 하는 부담을 제거합니다.

비즈니스에 데이터 카탈로그가 필요한 이유

IBM의 연구에 따르면 비즈니스 리더는 데이터를 찾는 데 70%의 시간을 소비하고 30%만 활용합니다. 데이터가 최대한 활용되지 않으면 무슨 소용이 있습니까? 데이터는 비즈니스 사용자가 데이터를 의미 있고 유용한 통찰력으로 변환하여 의사 결정을 주도하고 가치를 창출하며 경쟁 우위를 확보할 수 있는 경우에만 가치 있는 자산입니다.

데이터 카탈로그를 사용하면 조직 전체에서 데이터에 더 쉽게 액세스할 수 있습니다. 팀이 IT 및 데이터 분석가에게 의존하는 대신 카탈로그의 도구를 사용하여 몇 분 만에 필요한 것을 찾을 수 있습니다. 이는 회사의 모든 사람의 시간을 절약하고 의사 결정 프로세스를 가속화하며 전반적인 생산성과 효율성을 높입니다.

데이터 카탈로그는 데이터 중심 문화를 조성합니다. 모든 사람이 데이터에 액세스할 수 있게 되면 부서와 책임 수준에 관계없이 모든 사람이 자신감을 갖게 되고 동일한 언어로 말하기 시작합니다. 협업이 더 쉽고 투명해집니다. 데이터 중심 문화의 목표는 조직 전체에 투명성을 제공하고 쉽게 사용할 수 있는 통찰력을 제공하는 것입니다. 데이터를 모든 결정의 중심에 두므로 직감에 의존하지 않고 사실에 의존합니다. 그렇게 하면 오류가 최소화되고 성공이 거의 항상 보장됩니다.

예를 들어 귀하의 비즈니스가 소매업이고 매장 내 쇼핑객 데이터, 구매 내역 및 휴대전화 데이터를 결합하는 경우 해당 데이터를 사용하여 구매 시점에 잠재 고객을 대상으로 지역 타겟팅 광고 캠페인을 만들고 시작할 수 있습니다. . 데이터 카탈로그 도구는 팀에서 광고 캠페인 결정을 주도하고 지원할 수 있는 이러한 통찰력을 얻는 데 도움이 될 수 있습니다. 결국 데이터 카탈로그는 더 높은 ROI를 가져오는 보다 효과적인 광고 캠페인을 가능하게 합니다.

물론 데이터를 수집하고 저장하는 것은 소비자의 개인 정보에 대한 우려와 책임 없이 오지 않습니다. 소비자의 데이터 개인 정보 보호에 대한 규정은 데이터 회사가 수집할 수 있는 데이터와 데이터를 저장 및 교환하는 방법을 주도하고 있습니다. 데이터 카탈로그 도구는 조직이 GDPR, HIPAA, CCPA 등의 규정을 준수하는 데 도움이 됩니다.

데이터 카탈로그: 구축 또는 구매?

자신의 데이터 카탈로그를 구축하는 것은 절대적으로 가능합니다. 문제는 시간, 돈, 노력을 투자할 가치가 있는지, 아니면 이미 구축된 데이터 카탈로그 도구에 투자하는 것이 더 나은지 여부입니다. 데이터 카탈로그 도구 구축과 구매의 장단점은 다음과 같습니다.

  • 자신의 데이터 카탈로그를 구축하려면 전담 데이터 엔지니어 팀 이 필요합니다. 프로젝트에 영구적으로 할당되는 최소 5명의 엔지니어가 필요하며 구축 및 구현 단계에서는 더 많은 엔지니어가 필요합니다.
  • 자체 데이터 카탈로그를 구축하는 데는 시간이 걸립니다 . 리소스가 충분한 대규모 조직의 경우 자체 데이터 카탈로그를 구축하는 프로세스가 약 3-4주가 소요될 수 있습니다. 그러나 일부에서는 데이터 카탈로그를 성공적으로 설정하기까지 여러 번 시도하고 몇 년이 걸렸다고 보고합니다.
  • 데이터 카탈로그 표준은 빠르게 변경됩니다. 데이터 카탈로그를 최신 상태로 유지하려면 유지 관리 및 지원 팀이 필요하며 이는 초기 프로젝트의 최우선 과제입니다. 사람을 고용하여 해당 작업만 수행하거나 기존 팀에 추가 책임을 추가해야 합니다.
  • 자체 데이터 카탈로그를 구축하려면 기술, 운영, 비즈니스 및 소셜 메타데이터를 캡처할 수 있는 기계 학습 전문 지식이 필요합니다. 데이터 인텔리전스는 데이터 카탈로그 개발에 중요하며 기계 학습과 같은 혁신이 핵심입니다. 머신 러닝 데이터 카탈로그(MLDC)는 비즈니스 데이터 자산의 사용을 관리, 모니터링 및 개선하기 위한 최상의 방법을 제공하고 실시간 데이터 검색, 자동화된 카탈로그 작성, 메타데이터 크롤링 및 PII 데이터 분류를 가능하게 합니다.
  • 자체 데이터 카탈로그를 구축하려면 UX/UI 리소스가 필요합니다 . 데이터 카탈로그 구축의 목표는 모든 사용자가 데이터를 쉽게 찾고 액세스할 수 있도록 하는 것입니다. 즉, 데이터 카탈로그는 역할과 전문 지식에 관계없이 모든 사용자가 원활하게 작업할 수 있는 방식으로 설계되어야 합니다. 이를 보장하려면 데이터 엔지니어 팀과 함께 작업하는 UX/UI 전문가가 필요합니다.
  • 자체 데이터 카탈로그를 구축하는 것은 비용이 많이 드는 프로젝트입니다. 자체 데이터 카탈로그 를 구축하는 데 비용이 덜 들 수 있지만 장기적으로 이 투자와 관련된 많은 추가 비용이 있습니다. 지속적인 업데이트와 지원 비용이 내장된 데이터 카탈로그를 구입하는 것보다 자체 도구를 유지 관리하는 데 2배에서 3배 더 많은 비용을 지불하게 될 것입니다.

반대로 기존 데이터 카탈로그 도구를 구입하는 것이 더 빠르고 민첩한 옵션입니다. 새로운 사람을 고용하거나 데이터 팀에 부담을 주거나 유지 관리 및 지원에 부담을 주지 않고 즉시 활용을 시작할 수 있습니다. 데이터 카탈로그 솔루션에 투자하고 엔지니어가 자신의 제품/서비스를 개선하는 소프트웨어 작업에 귀중한 시간을 할애하도록 하는 것이 좋습니다.

올바른 데이터 카탈로그 도구를 찾는 방법

최고의 데이터 카탈로그는 데이터 관리 프로세스를 단순화하고 조직이 보다 데이터 중심적이 되도록 도와주는 카탈로그입니다. 다양한 데이터 카탈로그 솔루션은 다양한 사용 사례에 적합하므로 요구 사항에 가장 적합한 솔루션으로 검색 범위를 좁히는 것이 중요합니다. 일부는 데이터 레이크에서 데이터를 처리하고 데이터 과학에 더 적합하지만 다른 일부는 비즈니스 지향적이므로 아마도 찾고 있는 것입니다.

그러나 물론 올바른 데이터 카탈로그를 선택하는 것보다 더 많은 것이 있습니다. 데이터 카탈로그는 데이터를 검색하고 필터링하는 기능만큼만 유용합니다. Slingshot과 같은 데이터 분석 솔루션에 통합되면 사용자가 데이터를 최대한 활용하고 보다 현명한 비즈니스 결정을 내리는 동시에 광범위한 데이터 소스 및 세트, 시각화 및 대시보드 카탈로그를 제공할 수 있습니다. 채팅, 목표 기반 전략 벤치마킹, 데이터 분석, 프로젝트 및 콘텐츠 관리를 하나로 통합한 다용도 직관적인 앱입니다.

데이터 카탈로그 도구에는 모든 사용자가 작업하는 데이터에서 귀중한 통찰력을 얻을 수 있도록 강력한 데이터 검색 및 검색 기능이 있어야 합니다. ML/AI를 활용하여 데이터 리터러시를 개선하고 정확한 통찰력을 얻는 시간을 단축하며 데이터 준비를 강화할 수 있어야 합니다. 다른 소스에 연결하고 협업을 통합하기 위한 개방형 커넥터 SDK를 포함하여 다양한 소스에 대한 사전 구축된 커넥터를 활용할 수 있어야 합니다. 메타데이터 큐레이션과 공급업체의 거버넌스, 규정 준수, 배포 및 통합 옵션이 무엇인지도 확인하십시오.

결론

데이터 카탈로그는 데이터 전략의 기초가 되어야 합니다. 진정으로 데이터를 제어하고 쉽게 찾고, 다운로드하고, 사용하고, 공유할 수 있는 신뢰할 수 있는 데이터의 단일 소스를 구축하려면 데이터 카탈로그가 적합한 도구입니다. 조직 전체의 모든 데이터에 대한 통합 보기를 확보하면 필요한 올바른 데이터를 쉽게 찾고 검색 시간을 줄이고 분석하는 데 더 많은 시간을 할애할 수 있습니다.