Databricks - 協作資料、分析與人工智慧的統一平台

已發表: 2023-10-26

公司簡介是StartupTalky的一項舉措,旨在發布有關不同新創公司和組織的經過驗證的資訊。

我們今天所處的現代世界很大程度上依賴數據和資訊。 我們周圍的一切,例如我們使用的、看到的和周圍的事物,都以一種或另一種方式受到科技的影響。

隨著對技術需求的成長,數據的重要性開始凸顯。 隨著資料的堆積,出現了對倉庫來儲存、分析和處理這些資料以用於多種目的的需求。

這就是Databricks推出其平台的地方。 Databricks 作為一個雲端平台來儲存大量可以處理和平穩運行的資料。 這是一個基於流行的開源產品Apache Spark所建構的分析平台。 他們佔據了10.19% 的市場份額,並有望成為數位分析市場的第三大佔有者。

Databricks - 公司亮點

新創公司名稱資料區塊
總部舊金山, 加州, 美國
產業電腦軟體、資料、人工智慧
創辦人Ali Ghodsi、Andy Konwinski、lon Stoica、Patrick Wendell、Reynold Xin、Matei Zaharia 與 Arsalan Tavakoli
成立2013年
網站databricks.com

Databricks - 關於
Databricks - 產業
Databricks - 創辦人
Databricks - 創業故事
Databricks - 使命
Databricks - 標誌
Databricks - 業務與收入模型
Databricks - 員工
Databricks - 資金與投資者
Databricks - 收購
Databricks - 社群媒體存在
Databricks - 成長與收入
Databricks - 產品與功能
Databricks - 投資
Databricks - 合作夥伴
Databricks - 競爭對手
Databricks - 未來計劃

Databricks - 關於

Databricks 由Apache Spark的創建者創立,是一家資料和人工智慧 (AI) 公司。 它充當雲端上任何結構化或非結構化資料的倉庫。 Databricks 還可以作為所有資料、人工智慧和分析功能的組合平台,幫助資料工程師、分析師和資料科學家無縫地執行巨大的工作負載。 這是透過由 Apache Spark 提供支援的Lakehouse 平台來完成的,該平台是資料湖(低成本和靈活性)和資料倉儲(效能效率)功能的最佳組合。

除了 Apache Spark 之外, Delta Lake 和 MLflow是另外兩個開源項目,它們是 Lakehouse 平台有效功能的背後。 Databricks 透過多個雲端(即 Google Cloud、AWS、Microsoft Azure 和阿里雲端)提供統一資料服務。

關於Databricks

Databricks - 產業

數據產業已成為影響生活和商業各個層面的龐大且重要的產業。 據 Statista 稱,到 2027 年,數據市場預計將成長至 1,030 億美元,是 2018 年規模的兩倍。人工智慧是另一個快速成長的市場,已成為現代工業的重要組成部分。


數位轉型重塑業務的關鍵驅動力
數位轉型正在重塑企業和工作文化。 閱讀本文,了解數位轉型的關鍵驅動因素。

Databricks - 創辦人

Databricks創辦人
Databricks創辦人

Databricks 由加州大學的幾位教授和五位前柏克萊分校博士共同創立。 學生。

  • Databricks 聯合創辦人兼執行長Ali Ghodsi是 Apache Spark 的創建者之一。 他是加州大學 (UC) 的教授,也是加州大學 Rising 實驗室的董事會成員。 他主要負責 Databricks 在全球的發展和擴張。
  • Ion Stoica是 Databricks 的共同創辦人兼董事長,也是加州大學柏克萊分校的教授。 他也是 AMPLab 的共同主任。 除此之外,他還與他人共同創立了一家名為Conviva的新創公司,致力於大規模視訊分發。
  • Matei Zaharia是 Databricks 的共同創辦人兼技術專家,曾參與 Spark 項目,現在是 Apache 基金會的副總裁。 2014 年,他因其在大規模電腦系統方面的研究而獲得了 ACM 博士論文獎。
  • Databricks 聯合創辦人兼工程副總裁Patrick Wendell在 Spark 的營運中發揮了重要作用。
  • Reynold Xin ,共同創辦人兼首席架構師,負責 Apache Spark 的技術營運。 他於 2011 年在 VLDB 獲得最佳演示獎。
  • Andy Konwinski是共同創辦人兼管理副總裁,負責 Databricks 的人工智慧營運。 早些時候,他負責公司在 Spark Summit 創建中的市場工作。
  • Arsalan Tavakoli-Shiraji是 Databricks 聯合創始人兼現場工程高級副總裁,此前曾在麥肯錫擔任副總裁。 他曾是一名博士。 加州大學柏克萊分校的學生。

Databricks - 創業故事

Databricks 執行長 Ali Ghodsi 從 8 歲起就熱衷於編碼,當時他的父母為他買了一台二手 Commodore 64。他繼續接受電腦工程的高等教育,並獲得了博士學位。 在分散式計算中。 後來,在2009年,他與Ion Stoica聯手,共同創作了“Spark”,這也是由Matei Zaharia發起的。

他們進一步與另一個致力於機器學習的團隊協調,共同在市場上推出了「Apache Spark」。 起初,沒有公司給予任何關注,因為這項技術看起來很陌生。 2013 年,Ben Horowitz(Andreessen Horowitz VC 聯合創辦人)投資 1,400 萬美元,為他們帶來了希望,並鼓勵他們創建一家公司,作為運行 Apache Spark 的平台。 因此,Databricks於2013年成立。

Databricks - 使命

Databricks 的使命是透過創新新技術來統一資料、人工智慧和分析,從而提高資料統一的效率。 他們努力讓客戶體驗更具吸引力。

Databricks - 標誌

資料塊標誌
資料塊標誌

Databricks 標誌類似於兩塊磚塊,完美對齊,就像架子上組織的資料資料夾一樣。 Databricks 似乎打算讓標誌保持起點和終點,中間沒有任何中斷。 這樣做可能意味著它們將資料收集、儲存和分析功能統一在一個通用平台下,無需退出,因為這裡涵蓋了所有內容。

Databricks - 業務與收入模型

他們的商業模式定位於基於 Web 的軟體,該軟體提供了與 Apache Spark 配合使用的平台。 它為資料工程師和科學家提供了自動群組管理和 Python 風格的筆記本。

Databricks 以軟體即服務 (SaaS) 的形式提供資源,並透過訂閱產生收入。 他們的主要服務透過三個雲端平台,即:

  • 微軟Azure
  • Google雲
  • 亞馬遜網路服務

儘管每種雲的價格各不相同,但有一個需要注意的共同因素: “只需為您使用的內容付費” 。 費用的計算與所選服務無關,無需預付款。 客戶只需為使用的資源數量付費。

Databricks - 員工

截至 2023 年,Databricks 在全球擁有超過 5,001 至 10,000名員工。2019 年 11 月,Databricks 慶祝了為其僱用第 1000 名全職員工這一里程碑。 招收第一批 1000 名員工花了 6 年時間,剩下的員工只花了不到 2 年的時間。

Databricks - 資金與投資者

Databricks 最近融資 5.037 億美元,自成立以來已透過 12 輪融資籌集了 40 億美元。 迄今為止,共有 49 名投資者投資了 Databricks。

日期階段數量投資者
2023 年 9 月 14 日系列一5.037 億美元T·羅維·普萊斯
2023 年 7 月 31 日二級市場- -
2023 年 3 月 3 日H系列- -
2021 年 9 月 4 日天使輪20萬美元-
2021 年 8 月 31 日H系列16 億美元Counterpoint Global(摩根士丹利)、Baillie Gifford、ClearBridge Investments、UC Investments、Andreessen Horowitz、亞馬遜網路服務(AWS)、微軟、CapitalG、CPP Investment Board、Coatue Management、Fidelity Management & Research、富蘭克林鄧普頓、GIC 、Greenoaks、Octahedron Capital、T. Rowe Price Associates、Tiger Global Management、Whale Rock Capital Management、Insight Partners、Gaingels、New Enterprise Association、Alta Park Capital、一系列紐約梅隆銀行基金、Discovery Capital、Dragoneer Investment Group、Flucasagoneer Investment Group Ventures、House Fund測地線和綠灣創投公司。
2021 年 2 月 1 日G系列10億美元富蘭克林鄧普頓、CPP 投資委員會、富達管理與研究有限責任公司、Whale Rock、亞馬遜網路服務(AWS)、CapitalG、Salesforce Ventures、微軟、Andreessen Horowitz、Alkeon Capital Management、BlackRock, Inc.、Coatue Management、 T. Rowe Price Associates 、Tiger Global Management、New Enterprise Association、Discovery Capital、Dragoneer Investment Group、Founders Circle Capital、Geodesic、GIC、Green Bay Ventures、Greenoaks Capital 和 Octahedron Capital。
2019 年 10 月 22 日F系列4億美元Andreessen Horowitz、BlackRock, Inc.、T. Rowe Price Associates、Tiger Global Management、Coatue、New Enterprise Association、微軟、Alkeon Capital Management、Dragoneer Investment Group、Geodesic 和 Green Bay Ventures。
2019 年 2 月 5 日E系列2.5億美元Andreessen Horowitz、微軟、Coatue、Battery Ventures、New Enterprise Association、Green Bay Ventures 和 Geodesic Capital。
2017 年 8 月 22 日D系列1.4億美元新企業協會、Andreessen Horowitz、Battery Ventures、Geodesic Capital 和 Green Bay Ventures。
2016 年 12 月 15 日C系列6000萬美元新企業協會、Andreessen Horowitz 和 SineWave Ventures。
2014 年 6 月 30 日B系列3300萬美元新企業協會、Andreessen Horowitz 和 DCVC。
2013 年 9 月 25 日A系列1400萬美元安德森‧霍洛維茲 (Andreessen Horowitz)、SV Angel 和阿爾弗雷德‧莊 (Alfred Chang)。

Databricks - 收購

Databricks 迄今已收購了七家公司。 以下是詳細資訊:

帳戶名稱日期數量
阿爾西翁2023 年 10 月 23 日1億美元
馬賽克ML 2023 年 6 月 26 日$1.3B
奧克拉2023 年 5 月 3 日-
數據歡樂公司2022 年 10 月 13 日-
皮質實驗室2022 年 4 月 15 日-
8080實驗室2021 年 10 月 6 日-
雷達什2020 年 6 月 24 日-

印度頂級雲端運算新創公司名單及其成長
雲端運算已成為新常態,這一趨勢催生了大量依賴雲端的新創公司。 這些公司效率更高。

Databricks - 社群媒體存在

Databricks 在 Twitter 和 LinkedIn 上擁有良好的影響力,他們利用這些平台來推廣其產品和服務,以獲得市場優勢。 他們還發布了有關他們的世界巡迴和發布活動以及最新發明的資訊。 還可以在他們的社交平台上找到以 Databricks 或其產品以及與職缺相關的資訊為特色的部落格和文章的連結。

Databricks - 成長與收入

Databricks成立於2013年,以Spark技術為核心。 它的成立立即被一個謠言所繼承:「如果你的數據不適合他們的內存,Spark 技術將無法運作」。 這阻礙了企業使用 Spark。

最後,在 2015 年,創始人決定透過參加一場比賽來結束這些謠言,他們打破了在最短時間內處理 1 PB 數據的世界紀錄,並因此獲得了媒體的關注和知名度。

到 2017 年,他們的估值達到 5 億美元,但年收入卻低得多,只有 100 萬美元。 後來,參加“排序競賽”,在員工招聘方面做出一些改變,並決定開發具有大型企業所需功能的軟體,結果證明是卓有成效的。

從那時起,Databricks 的成長就一路走上坡路。 他們的收入在 2018 年首次突破 1 億美元大關,僅用了一年時間就在 2019 年達到了 2 億美元。Lakehouse 功能的推出是其成功的主要因素。 該公司的估值從2019 年第三季的 62 億美元成長到 2021 年第三季的約 380 億美元。

Databricks 報告2020 年年度經常性收入為 4.25 億美元。

Databricks 揭露,在截至 2023 年 1 月 31 日結束的財年中,其收入超過 10 億美元。 該公司報告稱,2022 年的業績成長超過 60%。


全球價值最高的 15 家新創公司
以下是全球價值最高的 15 家新創公司的名單。 TikTok 的母公司位元組跳動是全球最有價值的新創公司,估值達 2800 億美元。

Databricks - 產品與功能

最新發布的一些重要產品包括:

新 Delta Lake 版本的數據統一

Databricks 於 2023 年 6 月 28 日宣布推出新版本的 Delta Lake 資料儲存格式。據該公司稱,該版本消除了資料孤島。 資料湖系統中分析資料表的競爭對手開源標準的最新成員是 Delta Lake 3.0,其中包括來自 Apache 基金會的 Iceberg 和 Hudi。

多莉

Databricks 於 2023 年 3 月 24 日推出了一個開源語言模型,讓程式設計師可以創建自己的由 AI 驅動的聊天機器人應用程式。

萊克豪斯聯盟

在其資料+ AI 高峰會上,Databricks 於2023 年6 月28 日推出了其所謂的Lakehouse Federation 功能。借助這項新功能,企業可以透過結合不同的平台,在各種平台上發現、查詢和管理其數據。圍牆資料系統。

Databricks - 合作夥伴

Databricks 與許多公司合作。 最近一些著名的合作夥伴包括:

微軟

2023 年 8 月,微軟與 Databricks 建立了新的合作夥伴關係,以行銷人工智慧應用程式開發工具,擴大了其人工智慧目標的範圍。 企業將能夠使用 Databricks 軟體從頭開始創建自己的人工智慧模型。

小拜

2023 年 9 月 11 日,Databricks 與 Kobai 合作。 客戶可以利用 Databricks Lakehouse 平台的強大功能和可擴展性,以及知識圖的簡單性和洞察力。

3i資訊科技

為了透過在單一平台上結合資料和人工智慧來產生商業價值,3i Infotech Ltd 和 Databricks 於 2023 年 10 月 18 日建立合作夥伴關係。

Databricks - 投資

Databricks 已投資 24 家公司。 部分投資如下:

帳戶名稱日期數量
困惑人工智慧2022年-
阿爾西翁2018年-
預言.io 2017年1月-
催化劑2017年9月-
清潔實驗室- -

Databricks - 競爭對手

Databricks 的一些主要競爭對手是:

  • 雪花
  • 雲端時代
  • 數據統計
  • 庫博萊
  • MATLAB
  • 阿爾泰克斯
  • 德雷米奧
  • 智慧體

以下是與一些競爭對手的一些比較:

Snowflake - Snowflake 比 Databricks 大很多。 它們都以靈活的價格提供類似的服務,幾乎沒有什麼區別(Databricks 處理大數據,而 Snowflake 提供雲端資料的彈性以進行集中存取)。 Databricks 正在與競爭對手進行一場持久戰。

Cloudera - Cloudera 提供了一個通用的雲端儲存和管理平台,可以為組織儲存、處理和分析資料。 它與Databricks的資料倉儲、處理和分發形式類似。


面向 SaaS 的嵌入式 BI 工具 | SaaS 商業智慧軟體
什麼是嵌入式 BI? 嵌入式商業智慧是將 BI 功能整合到業務流程應用程式或入口網站中。 在這裡閱讀更多內容!

Databricks - 未來計劃

顯然,Databricks 正在研究 2021 年成長最快的兩個大數據領域:串流媒體和深度學習。他們正在建立多方面的應用程式介面 (API) 來處理這兩個領域。 Databricks 也熱衷於加速 Data Lakehouse 的創新,透過征服資料驅動型組織來獲得更大的優勢。

據他們的網站稱,Databricks 計劃啟用工作區的收藏夾功能。 註釋、儀表板、實驗和搜尋都可以儲存到收藏清單中,然後您可以從主頁存取這些清單。

Databricks - 常見問題解答

什麼是資料塊?

Databricks 是一種基於雲端的工具,用於使用機器學習模型儲存和處理大量資料。 這是透過他們的 Apache Spark 工具完成的。

誰創立了 Databricks?

Databricks 由七個人共同創立,分別是 Ali Ghodsi、Ion Stoica、Matei Zaharia、Patrick Wendell、Reynold Xin、Andy Konwinski 和 Arsalan Tavakoli-Shiraji。

Databricks 透過融資獲得了多少資金?

Databricks 透過 12 輪融資籌集了約 40 億美元。

Databricks 的年收入是多少?

Databricks 報告稱,截至 2022 年的年度經常性收入 (ARR) 為 12.75 億美元。

Databricks 的客戶是誰?

Databricks 在全球擁有約 6000 多家客戶。 他們的一些受歡迎的客戶是:

  • CVS健康
  • 再生元
  • T移動
  • 匯豐銀行
  • 康卡斯特