如何理解高級外部和替代數據
已發表: 2021-11-30
外部數據可用於業務改進。 然而,重要的是首先檢查外部數據的來源和實施到管理流程中。
每年,外部數據都變得更加有用。 隨著小型企業更容易獲取數據,外部數據應用程序的數量也在增加。 然而,正確的數據管理仍然是一個問題。 對過去幾年的分析表明,即使是知名企業也可能難以管理數據。
在繼續之前,我建議閱讀有關此主題的上一篇文章。 如果您已經完成了必要的基礎工作,那麼跳入外部數據採集和管理會容易得多。
了解外部數據
乍一看,這似乎很簡單。 外部數據可以定義為在組織外部獲取的任何數據。 它通常被稱為營銷中的第三方或第二方數據。
外部數據可以有多種形式
傳統和高級外部數據之間存在三個關鍵區別。 首先是大多數人都熟悉傳統的外部數據來源——政府記錄和統計部門、新聞稿等。
雖然它不經常被企業使用,但它仍然在金融部門和許多其他行業中佔有一席之地。 高級外部數據旨在覆蓋更廣泛的受眾。
另請閱讀: 2021 年 9 大 WordPress 潛在客戶生成插件
互聯網監控和自動數據收集可以產生先進的外部數據。
許多公司使用高級外部數據,例如客戶評論跟踪或社交媒體情緒分析。
替代數據不是新類型,而是質量。 雖然有很多種定義方式,但最常見的定義是與傳統數據相反。 這是獲取不經常使用的數據並生成可操作見解的過程。
衛星圖像是替代數據的一個很好的例子。 衛星圖像是替代數據的一個很好的例子。
研究表明,投資者可以先於其他人從衛星圖像中推斷出市場參與者和零售商的價值波動。
在這種情況下,替代數據可能有助於您做出更好的投資決策。
另請閱讀:改善個人發展和自我成長的 11 種最佳方法及其對我們生活的益處
將高級外部數據集成到現有管道中
收集外部數據需要付出努力。 這與內部數據形成對比,內部數據主要是業務流程的結果。 這些數據只能通過創建內部團隊來收集或通過第三方供應商採購來獲得。
在開始任何 Web 抓取、自動數據收集或 Web 抓取之前,您需要決定三件事:什麼類型的數據、它將如何工作以及它將去往何處。
在數據倉庫中,應存儲所有業務數據。 這僅適用於非日常使用的數據。 外部數據可用於支持日常運營以及實現長期目標。
如果將數據用於動態定價等日常操作,則數據可能不會最終存儲在倉庫中。 在這些情況下,長期存儲不太可能成為一種選擇,因為動態定價涉及復雜的 API 網絡、數學比較和計算。

可以從外部來源和其他來源獲得哪些高級數據?
但是,除非使用附加信息進行存儲和分析,否則無法理解高級外部或替代數據。 這些情況需要更多的計劃並且更複雜。
首先,應為特定目的收集所有數據。 這個目的通常是為了支持或揭穿一個假設。 與衛星圖像類似,此類圖像的數據應長期保存並手動分析。 它應該被分配一個主題和一個期望。
其次,重要的是要了解替代數據在某些情況下可能沒有用。 替代數據在某些情況下可能沒有用,例如,因為它通常是被假設為提供對特定現象的洞察力但尚未經過徹底測試的數據。
第三,數據採集流程比傳統流程需要更多的支持和維護。 如果公司沒有分析師或提取團隊,則無法進行高級外部和替代數據收集。
另請閱讀: 10 種開發人員工作類型:IT 工作
建築支撐結構
需要支持結構來使高級外部或替代數據可用。 如果數據是從第三方供應商處獲取的,則在某些情況下它們可能非常簡單。 只需要一個數據分析師團隊和一些治理實踐。 然而,數據質量審查和其他過程仍然是必要的。
如果沒有數據供應商可以提供所需的信息,或者出於任何其他原因必須組建內部團隊,那就更加困難了。
因為我在技術開發方面信任我的同事,所以我不會詳細介紹。 對於大多數企業來說,更容易找到提供抓取解決方案的供應商。
將需要一個專門的數據團隊來管理信息流,特別是如果它來自多個來源。 在將數據傳輸到倉庫之前,需要經過三個關鍵步驟:規範化、清理和保證。
數據自動不會統一。 可能存在腐敗或根本不准確。
因此,數據清洗是必要的。 在移動數據之前,必須對其進行清理。 這涉及修復格式和命名約定以及其他結構方面。
在移動數據之前,質量保證是必不可少的。 在從供應商處購買數據的情況下,質量保證更加重要。
另請閱讀:團隊的 5 個最佳資源容量規劃工具
結論
當管道中涉及外部數據時,事情會變得更加複雜。
自動化數據收集可能會增加成本,因為它需要技術專長、分析能力或兩者兼而有之。 計劃將外部數據集成到業務流程中非常重要。
外部數據可以帶來巨大的收益並創造全新的增長機會。
