Databricks – Eine einheitliche Plattform für die Zusammenarbeit von Daten, Analysen und KI

Veröffentlicht: 2023-10-26

Company Profile ist eine Initiative von StartupTalky zur Veröffentlichung verifizierter Informationen über verschiedene Startups und Organisationen.

Die moderne Welt, in der wir heute leben, hängt massiv von Daten und Informationen ab. Alles um uns herum, die Dinge, die wir nutzen, sehen und von denen wir umgeben sind, wird auf die eine oder andere Weise von der Technologie beeinflusst.

Mit dem wachsenden Bedarf an Technologie begann die Bedeutung von Daten zu florieren. Mit der Anhäufung von Daten entstand der Bedarf an einem Lager, um diese Daten für verschiedene Zwecke zu speichern, zu analysieren und zu verarbeiten .

Hier stellte Databricks seine Plattform vor. Databricks dient als Cloud-Plattform zur Speicherung enormer Datenmengen, die verarbeitet und reibungslos ausgeführt werden können. Dabei handelt es sich um eine Analyseplattform, die auf dem beliebten Open-Source-Produkt Apache Spark aufbaut. Sie haben einen Marktanteil von 10,19 % und sind voraussichtlich der drittgrößte Anbieter auf dem Markt für digitale Analysen.

Databricks – Unternehmenshighlights

Startname Datenbausteine
Hauptquartier San Francisco, Kalifornien, Vereinigte Staaten
Industrie Computersoftware, Daten, KI
Gründer Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia und Arsalan Tavakoli
Gegründet 2013
Webseite databricks.com

Databricks – Über
Databricks – Industrie
Databricks – Gründer
Databricks – Startup-Story
Databricks – Mission
Databricks – Logo
Databricks – Geschäfts- und Umsatzmodell
Databricks – Mitarbeiter
Databricks – Finanzierung und Investoren
Databricks – Akquisitionen
Databricks – Präsenz in sozialen Medien
Databricks – Wachstum und Umsatz
Databricks – Produkte und Funktionen
Databricks – Investition
Databricks – Partnerschaften
Databricks – Konkurrenten
Databricks – Zukunftspläne

Databricks – Über

Databricks wurde von den Entwicklern von Apache Spark als Unternehmen für Daten und künstliche Intelligenz (KI) gegründet. Es fungiert als Lager für alle strukturierten und unstrukturierten Daten in der Cloud. Databricks dient auch als kombinierte Plattform für alle Ihre Daten-, KI- und Analysefunktionen, die Dateningenieuren, Analysten und Datenwissenschaftlern hilft, große Arbeitslasten nahtlos auszuführen. Dies geschieht durch die Lakehouse-Plattform mit Apache Spark, die die beste Kombination aus Funktionen von Data Lakes (günstige Kosten und Flexibilität) und Data Warehouses (Leistungseffizienz) darstellt.

Neben Apache Spark sind Delta Lake und MLflow die beiden anderen Open-Source-Projekte, die hinter den effektiven Funktionen der Lakehouse-Plattform stehen. Databricks stellt seine Unified Data-Dienste über mehrere Clouds bereit, nämlich Google Cloud, AWS, Microsoft Azure und Alibaba Cloud.

Über Databricks

Databricks – Industrie

Die Datenindustrie hat sich zu einer großen und bedeutenden Branche in allen Lebens- und Geschäftsbereichen entwickelt. Laut Statista wird erwartet, dass der Datenmarkt bis 2027 auf satte 103 Milliarden US-Dollar anwächst. Das ist doppelt so groß wie im Jahr 2018. Künstliche Intelligenz ist ein weiterer schnell wachsender Markt, der zu einem wesentlichen Element moderner Industrien geworden ist.


Haupttreiber der digitalen Transformation, um das Geschäft neu zu erfinden
Die digitale Transformation erfindet Unternehmen und Arbeitskultur neu. Lesen Sie diesen Artikel, um mehr über die wichtigsten Treiber der digitalen Transformation zu erfahren.

Databricks – Gründer

Databricks-Gründer
Databricks-Gründer

Databricks wurde von einigen Professoren der University of California und fünf ehemaligen Berkeley-Doktoranden mitbegründet. Studenten.

  • Ali Ghodsi , Mitbegründer und CEO von Databricks, war einer der Schöpfer von Apache Spark. Er war Professor an der University of California (UC) sowie Vorstandsmitglied im Rising Lab der UC. Er trug die Hauptverantwortung für das Wachstum und die Expansion von Databricks weltweit.
  • Ion Stoica , Mitbegründer und Vorsitzender von Databricks, ist außerdem Professor an der UC Berkeley. Er ist außerdem Co-Direktor bei AMPLab. Darüber hinaus war er Mitbegründer eines Start-ups namens Conviva für die Videoverbreitung im großen Stil.
  • Matei Zaharia , Mitbegründer und Cheftechnologe bei Databricks, war früher Teil des Spark-Projekts und ist jetzt Vizepräsident der Apache Foundation. Für seine Forschungen zu großen Computersystemen wurde ihm 2014 der ACM Doctoral Dissertation Award verliehen.
  • Patrick Wendell , Mitbegründer und Vice President of Engineering bei Databricks, hatte eine wichtige Rolle im Betrieb von Spark gespielt.
  • Reynold Xin , Mitbegründer und Chefarchitekt, kümmert sich um den technischen Betrieb in Apache Spark. Er gewann 2011 den Best Demo Award bei VLDB.
  • Andy Konwinski , Mitbegründer und Vizepräsident des Managements, kümmert sich um die KI-Operationen in Databricks. Zuvor kümmerte er sich um die Marktbemühungen des Unternehmens bei der Gründung des Spark Summit.
  • Arsalan Tavakoli-Shiraji , Mitbegründer und Senior Vice President of Field Engineering bei Databricks, arbeitete zuvor als Associate Principal bei McKinsey. Er war ein ehemaliger Ph.D. Student an der UC Berkeley.

Databricks – Startup-Story

Ali Ghodsi, der CEO von Databricks, war seit seinem achten Lebensjahr begeistert vom Programmieren, als seine Eltern ihm einen gebrauchten Commodore 64 kauften. Er absolvierte eine höhere Ausbildung in Computertechnik und promovierte zum Dr. im verteilten Rechnen. Später, im Jahr 2009, tat er sich mit Ion Stoica zusammen und sie schufen gemeinsam „Spark“, das bereits von Matei Zaharia initiiert wurde.

Sie stimmten sich außerdem mit einem anderen Team ab, das an maschinellem Lernen arbeitete, und führten gemeinsam „Apache Spark“ auf dem Markt ein. Zunächst achtete kein Unternehmen darauf, da die Technologie fremdartig schien. Im Jahr 2013 weckte Ben Horowitz (Mitbegründer von Andreessen Horowitz VC) mit einer Investition von 14 Millionen US-Dollar Hoffnung in ihnen und ermutigte sie, ein Unternehmen zu gründen, das als Plattform für den Betrieb von Apache Spark dient. So wurde Databricks im Jahr 2013 gegründet.

Databricks – Mission

Databricks hat sich zum Ziel gesetzt, die Datenvereinheitlichung effizienter zu gestalten, indem es neue Techniken zur Vereinheitlichung von Daten, KI und Analysen entwickelt. Sie streben danach, das Kundenerlebnis ansprechender zu gestalten.

Databricks – Logo

Databricks-Logo
Databricks-Logo

Das Databricks-Logo ähnelt zwei Steinen, die perfekt ausgerichtet sind, wie Datenordner, die in einem Regal angeordnet sind. Es scheint, dass Databricks beabsichtigte, das Logo mit einem Start- und Endpunkt ohne Pausen dazwischen beizubehalten. Dies kann so erfolgen, dass sie Datenerfassungs-, Speicher- und Analysefunktionen auf einer gemeinsamen Plattform vereinen, ohne dass ein Exit erforderlich ist, da hier alles abgedeckt wird.

Databricks – Geschäfts- und Umsatzmodell

Ihr Geschäftsmodell basiert auf der webbasierten Software, die eine Plattform für die Arbeit mit Apache Spark bietet. Es erleichtert Dateningenieuren und Wissenschaftlern die automatische Gruppenverwaltung und Notizbücher im Python-Stil.

Databricks stellt seine Ressourcen in Form von Software as a Service (SaaS) zur Verfügung und generiert Einnahmen durch seine Abonnements. Ihre Hauptdienste erfolgen über drei Cloud-Plattformen, nämlich:

  • Microsoft Azure
  • Google Cloud
  • Amazon Web Services

Obwohl die Preise für jede Cloud unterschiedlich sind, gibt es einen gemeinsamen Faktor: „Zahlen Sie nur für das, was Sie nutzen.“ Die Kosten werden unabhängig von den gewählten Leistungen berechnet und erfordern keine Vorauszahlung. Die Kunden müssen nur für die Anzahl der verbrauchten Ressourcen bezahlen.

Databricks – Mitarbeiter

Databricks beschäftigt im Jahr 2023 weltweit über 5.001 bis 10.000 Mitarbeiter . Im November 2019 feierte Databricks den Meilenstein, den 1000. Vollzeitmitarbeiter eingestellt zu haben. Es dauerte 6 Jahre, bis die ersten 1000 Mitarbeiter eingestellt waren, und weniger als 2 Jahre, um den Rest einzustellen.

Databricks – Finanzierung und Investoren

Mit seiner jüngsten Finanzierung in Höhe von 503,7 Millionen US-Dollar hat Databricks seit seiner Gründung in 12 Finanzierungsrunden 4 Milliarden US-Dollar eingesammelt. Insgesamt haben bisher 49 Investoren in Databricks investiert.

Datum Bühne Menge Investoren
14. September 2023 Serie I 503,7 Millionen US-Dollar T. Rowe Price
31. Juli 2023 Zweiter Markt - -
3. März 2023 Serie H - -
4. September 2021 Engel rund 200.000 $ -
31. August 2021 Serie H 1,6 Milliarden US-Dollar Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, eine Reihe von BNY Mellon-Fonds, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, The House Fund Geodesic und Green Bay Ventures.
1. Februar 2021 Serie G 1 Milliarde Dollar Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital und Octahedron Capital.
22. Oktober 2019 Serie F 400 Millionen Dollar Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic und Green Bay Ventures.
5. Februar 2019 Serie E 250 Millionen Dollar Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures und Geodesic Capital.
22. August 2017 Serie D 140 Millionen Dollar New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital und Green Bay Ventures.
15. Dezember 2016 Serie C 60 Millionen Dollar New Enterprise Association, Andreessen Horowitz und SineWave Ventures.
30. Juni 2014 Serie B 33 Millionen Dollar New Enterprise Association, Andreessen Horowitz und DCVC.
25. September 2013 Serie A 14 Millionen Dollar Andreessen Horowitz, SV Angel und Alfred Chuang.

Databricks – Akquisitionen

Databricks hat bisher sieben Unternehmen übernommen. Nachfolgend finden Sie die Details:

Kontoname Datum Menge
Arcion 23. Okt. 2023 100 Mio. $
MosaikML 26. Juni 2023 1,3 Milliarden US-Dollar
Okera 3. Mai 2023 -
DataJoy Inc. 13. Okt. 2022 -
Cortex Labs 15. April 2022 -
8080 Labore 6. Oktober 2021 -
Redash 24. Juni 2020 -

Liste der Top-Cloud-Computing-Startups in Indien und ihr Wachstum
Cloud Computing ist zur neuen Norm geworden, der Trend hat eine große Anzahl von Startups hervorgebracht, die auf die Cloud setzen. Diese Unternehmen sind effizienter.

Databricks – Präsenz in sozialen Medien

Databricks verfügt über eine gute Präsenz auf Twitter und LinkedIn und nutzt diese Plattformen, um seine Produkte und Dienstleistungen zu bewerben und sich so einen Marktvorteil zu verschaffen. Sie posten auch über ihre Welttourneen und Launch-Events mit ihren neuesten Erfindungen. Links zu Blogs und Artikeln über Databricks oder ihre Produkte sowie Informationen zu Stellenangeboten finden Sie auch auf ihren sozialen Plattformen.

Databricks – Wachstum und Umsatz

Databricks wurde 2013 gegründet und behält die Spark-Technologie als Kernstück bei. Seiner Gründung folgte sofort das Gerücht, dass „Spark Technology nicht funktioniert, wenn Ihre Daten nicht in ihren Speicher passen“. Dies hielt Unternehmen davon ab, Spark zu nutzen.

Im Jahr 2015 beschlossen die Gründer schließlich, diesen Gerüchten ein Ende zu setzen, indem sie an einem Wettbewerb teilnahmen, bei dem sie den Weltrekord für die Verarbeitung eines Petabytes an Daten in kürzester Zeit brachen und dadurch mediale Aufmerksamkeit und Popularität erlangten.

Im Jahr 2017 wurde ihr Wert auf 500 Millionen US-Dollar geschätzt, ihr Jahresumsatz lag jedoch mit 1 Million US-Dollar deutlich niedriger. Später erwies sich die Teilnahme am „Sortierwettbewerb“, einige Änderungen bei der Einstellung von Mitarbeitern und die Entscheidung, Software mit Funktionen zu entwickeln, die von großen Unternehmen gefordert werden, als fruchtbar.

Seitdem geht das Wachstum von Databricks nur noch bergauf. Ihr Umsatz erreichte 2018 erstmals die 100-Millionen-Dollar-Marke und es dauerte nur ein weiteres Jahr, bis er 2019 die 200-Millionen-Dollar-Marke erreichte. Die Einführung der Lakehouse-Funktion war ein Hauptfaktor für den Erfolg. Die Bewertung des Unternehmens stieg von 6,2 Milliarden US-Dollar im dritten Quartal 2019 auf rund 38 Milliarden US-Dollar im dritten Quartal 2021.

Databricks meldete im Jahr 2020 einen wiederkehrenden Jahresumsatz von 425 Millionen US-Dollar.

Databricks gab bekannt, dass das Unternehmen im Geschäftsjahr, das am 31. Januar 2023 endete, einen Umsatz von über 1 Milliarde US-Dollar erwirtschaftete. Das Unternehmen berichtete, dass es im Vorjahr 2022 um mehr als 60 % gewachsen sei.


Top 15 der am höchsten bewerteten Startups der Welt
Hier ist eine Liste der 15 am höchsten bewerteten Startups der Welt. Bytedance, die Muttergesellschaft von TikTok, ist mit einer Bewertung von 280 Milliarden US-Dollar das wertvollste Startup der Welt.

Databricks – Produkte und Funktionen

Einige der jüngsten prominenten Markteinführungen sind:

Data Unity mit der neuen Delta Lake-Version

Databricks hat am 28. Juni 2023 eine neue Version seines Datenspeicherformats Delta Lake angekündigt. Nach Angaben des Unternehmens beseitigt diese Version Datensilos. Die neueste Ergänzung zu den konkurrierenden Open-Source-Standards für die analytischen Datentabellen in Data-Lake-Systemen ist Delta Lake 3.0, zu dem Iceberg und Hudi von der Apache Foundation gehören.

Dolly

Databricks stellte am 24. März 2023 ein Open-Source-Sprachmodell vor, das es Programmierern ermöglicht, ihre eigenen, KI-gesteuerten Chatbot-Anwendungen zu erstellen.

Lakehouse Federation

Auf seinem Data + AI Summit stellte Databricks am 28. Juni 2023 seine sogenannte Lakehouse Federation-Funktion vor. Mit dieser neuen Funktion können Unternehmen ihre Daten auf einer Vielzahl von Plattformen entdecken, abfragen und verwalten, indem sie ihre unterschiedlichen Daten kombinieren ummauerte Datensysteme.

Databricks – Partnerschaften

Databricks hat mit vielen Unternehmen zusammengearbeitet. Einige der jüngsten prominenten Partnerschaften sind:

Microsoft

Mit einer neuen Partnerschaft mit Databricks im August 2023 zur Vermarktung von KI-App-Entwicklungstools hat Microsoft den Umfang seiner KI-Ziele erweitert. Mit der Databricks-Software können Unternehmen ihre eigenen KI-Modelle von Grund auf erstellen.

Kobai

Am 11. September 2023 gingen Databricks und Kobai eine Partnerschaft ein. Kunden können die Leistungsfähigkeit und Skalierbarkeit der Databricks Lakehouse-Plattform sowie die Einfachheit und Erkenntnisse von Wissensgraphen nutzen.

3i Infotech

Um durch die Kombination von Daten und KI auf einer einzigen Plattform Geschäftswert zu generieren, haben 3i Infotech Ltd und Databricks am 18. Oktober 2023 eine Partnerschaft geschlossen.

Databricks – Investition

Databricks hat in 24 Unternehmen investiert. Nachfolgend sind einige der Investitionen aufgeführt:

Kontoname Datum Menge
Ratlosigkeit KI 2022 -
Arcion 2018 -
Prophezeiung.io Januar 2017 -
Katalysator September 2017 -
Cleanlab - -

Databricks – Konkurrenten

Einige der Top-Konkurrenten von Databricks sind:

  • Schneeflocke
  • Cloudera
  • Datentax
  • Qubole
  • MATLAB
  • Alteryx
  • Dremio
  • Intellicus

Hier ein paar Vergleiche mit einigen Mitbewerbern:

Schneeflocke – Schneeflocke ist viel größer als Databricks. Beide bieten ähnliche Dienste mit wenigen Unterschieden (Databricks verarbeitet große Datenmengen, während Snowflake die Elastizität von Cloud-Daten für den zentralen Zugriff bietet) zu einem flexiblen Preis. Databricks führt einen langen Kampf, um seinen Konkurrenten zu besiegen.

Cloudera – Cloudera bietet eine gemeinsame Cloud-Speicher- und Verwaltungsplattform, die Daten für ein Unternehmen speichert, verarbeitet und analysiert. Es ähnelt dem von Databricks in Form von Data Warehouse, Processing und Distribution.


Eingebettete BI-Tools für SaaS | SaaS-Business-Intelligence-Software
Was ist eingebettete BI? Unter Embedded Business Intelligence versteht man die Integration von BI-Funktionen in Geschäftsprozessanwendungen oder -portale. Lesen Sie hier mehr!

Databricks – Zukunftspläne

Es ist offensichtlich, dass Databricks im Jahr 2021 an zwei der am schnellsten wachsenden Big-Data-Domänen arbeitete, Streaming und Deep-Learning. Sie bauten eine vielschichtige Anwendungsprogrammierschnittstelle (API) auf, um diese beiden Domänen zu verarbeiten. Databricks ist außerdem daran interessiert, die Innovation von Data Lakehouse zu beschleunigen, um durch die Eroberung datengesteuerter Organisationen einen größeren Vorteil zu erzielen.

Laut ihrer Website plant Databricks, die Favoritenfunktion des Arbeitsbereichs zu aktivieren. Notizen, Dashboards, Experimente und Suchen können alle in einer Favoritenliste gespeichert werden, auf die Sie dann über die Startseite zugreifen können.

Databricks – FAQs

Was sind Databricks?

Databricks ist ein cloudbasiertes Tool zum Speichern und Verarbeiten großer Datenmengen mithilfe von Modellen des maschinellen Lernens. Dies geschieht über ihr Apache Spark-Tool.

Wer hat Databricks gegründet?

Databricks wurde von sieben Personen mitbegründet, nämlich Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski und Arsalan Tavakoli-Shiraji.

Wie viel hat sich Databricks durch die Finanzierung gesichert?

Databricks sicherte sich in 12 Finanzierungsrunden rund 4 Milliarden US-Dollar.

Wie hoch ist der Jahresumsatz von Databricks?

Databricks hat für das Jahr bis 2022 einen jährlichen wiederkehrenden Umsatz (ARR) von 1,275 Milliarden US-Dollar gemeldet.

Wer sind die Kunden von Databricks?

Databricks hat weltweit über 6000 Kunden. Einige ihrer beliebtesten Kunden sind:

  • Hülse
  • CVS Gesundheit
  • Regeneron
  • T-Mobile
  • HSBC
  • Comcast