Databricks - Une plateforme unifiée pour collaborer en matière de données, d'analyses et d'IA

Publié: 2023-10-26

Company Profile est une initiative de StartupTalky visant à publier des informations vérifiées sur différentes startups et organisations.

Le monde moderne dans lequel nous vivons aujourd’hui dépend massivement des données et des informations. Tout ce qui nous entoure, les choses que nous utilisons, voyons et qui nous entourent, sont influencés d'une manière ou d'une autre par la technologie.

À mesure que le besoin de technologie augmente, l’importance des données a commencé à prendre de l’ampleur. Avec l’accumulation de données, le besoin d’un entrepôt pour stocker, analyser et traiter ces données à des fins multiples est apparu.

C'est là que Databricks a fait apparaître sa plateforme. Databricks sert de plate-forme cloud pour stocker d'énormes données qui peuvent être traitées et exécutées en douceur. Il s'agit d'une plate-forme analytique construite sur leur produit open source populaire appelé Apache Spark . Ils occupent une part de marché de 10,19 % et sont le troisième acteur en importance sur le marché de l'analyse numérique.

Databricks - Points forts de l'entreprise

Nom de démarrage Briques de données
Quartier général San Francisco, Californie, États-Unis
Industrie Logiciels informatiques, données, IA
Fondateurs Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia et Arsalan Tavakoli
Fondé 2013
Site web databricks.com

Databricks - À propos
Databricks - Industrie
Databricks - Fondateurs
Databricks - Histoire de startup
Databricks-Mission
Databricks-Logo
Databricks - Modèle commercial et de revenus
Databricks - Employés
Databricks - Financement et investisseurs
Databricks - Acquisitions
Databricks - Présence sur les réseaux sociaux
Databricks - Croissance et revenus
Databricks - Produits et fonctionnalités
Databricks - Investissement
Databricks - Partenariats
Databricks - Concurrents
Databricks - Projets futurs

Databricks - À propos

Databricks a été créée par les créateurs d' Apache Spark , en tant que société de données et d'intelligence artificielle (IA). Il agit comme un entrepôt pour toutes les données structurées ou non structurées, sur le cloud. Databricks sert également de plate-forme combinée pour toutes vos fonctions de données, d'IA et d'analyse qui aide les ingénieurs de données, les analystes et les scientifiques des données à effectuer d'énormes charges de travail de manière transparente. Cela est réalisé par leur plate-forme Lakehouse optimisée par Apache Spark, qui constitue la meilleure combinaison de fonctionnalités des Data Lakes (faible coût et flexibilité) et des Data Warehouses (efficacité des performances).

Outre Apache Spark, Delta Lake et MLflow sont les deux autres projets open source qui sont à l'origine des fonctions efficaces de la plateforme Lakehouse. Databricks fournit ses services de données unifiées via plusieurs cloud, à savoir Google Cloud, AWS, Microsoft Azure et Alibaba Cloud.

À propos des Databricks

Databricks - Industrie

L’industrie des données est devenue une industrie vaste et importante dans tous les aspects de la vie et des affaires. Selon Statista, le marché des données devrait atteindre 103 milliards de dollars d’ici 2027. Il représente le double de sa présence en 2018. L’intelligence artificielle est un autre marché en croissance rapide qui est devenu un élément essentiel des industries modernes.


Principaux moteurs de la transformation numérique pour réinventer l'entreprise
La transformation numérique réinvente les entreprises et la culture du travail. Lisez cet article pour connaître les principaux moteurs de la transformation numérique.

Databricks - Fondateurs

Fondateurs de Databricks
Fondateurs de Databricks

Databricks a été cofondée par quelques professeurs de l'Université de Californie et cinq anciens doctorants de Berkeley. étudiants.

  • Ali Ghodsi , co-fondateur et PDG de Databricks, était l'un des créateurs d'Apache Spark. Il a été professeur à l'Université de Californie (UC) ainsi que membre du conseil d'administration du Rising Lab de l'UC. Il a assumé la responsabilité principale de la croissance et de l’expansion de Databricks dans le monde.
  • Ion Stoica , co-fondateur et président de Databricks, est également professeur à l'UC Berkeley. Il est également codirecteur d'AMPLab. Parallèlement, il a cofondé une start-up appelée Conviva , pour la distribution de vidéos à grande échelle.
  • Matei Zaharia , co-fondateur et technologue en chef chez Databricks, faisait auparavant partie du projet Spark et est désormais vice-président de la Fondation Apache. Le prix de thèse de doctorat ACM lui a été décerné en 2014 pour ses recherches sur les systèmes informatiques à grande échelle.
  • Patrick Wendell , co-fondateur et vice-président de l'ingénierie chez Databricks, a joué un rôle majeur dans les opérations de Spark.
  • Reynold Xin , co-fondateur et architecte en chef et s'occupe des opérations techniques dans Apache Spark. Il a remporté le prix de la meilleure démo en 2011 au VLDB.
  • Andy Konwinski , co-fondateur et vice-président de la direction, s'occupe des opérations d'IA chez Databricks. Auparavant, il s'est occupé des efforts de marché de l'entreprise lors de la création du Spark Summit.
  • Arsalan Tavakoli-Shiraji , co-fondateur et vice-président principal de l'ingénierie de terrain chez Databricks, a auparavant travaillé chez McKinsey en tant que directeur associé. Il était un ancien doctorant. étudiant à l'UC Berkeley.

Databricks - Histoire de startup

Ali Ghodsi, PDG de Databricks, était passionné de codage depuis l'âge de 8 ans lorsque ses parents lui ont acheté un Commodore 64 d'occasion. Il a poursuivi ses études supérieures en ingénierie informatique et a obtenu un doctorat. en informatique distribuée. Plus tard, en 2009, il s'associe à Ion Stoica et ils créent ensemble « Spark », déjà à l'instigation de Matei Zaharia.

Ils se sont ensuite coordonnés avec une autre équipe travaillant sur l'apprentissage automatique et ont introduit ensemble « Apache Spark » sur le marché. Au début, aucune entreprise n’y prêtait attention, car la technologie semblait étrangère. En 2013, Ben Horowitz (co-fondateur d'Andreessen Horowitz VC) leur a donné un peu d'espoir en investissant 14 millions de dollars et les a encouragés à créer une entreprise qui sert de plate-forme pour gérer Apache Spark. Ainsi, Databricks a été créée en 2013.

Databricks-Mission

Databricks a pour mission de rendre l'unification des données plus efficace, en innovant de nouvelles techniques pour unifier les données, l'IA et l'analyse. Ils s'efforcent de rendre l'expérience client plus attrayante.

Databricks-Logo

Logo Databricks
Logo Databricks

Le logo Databricks ressemble à deux briques parfaitement alignées comme des dossiers de données organisés sur une étagère. Il semble que Databricks ait eu l'intention de conserver le logo avec un point de départ et un point d'arrivée sans aucune interruption entre les deux. Cela peut impliquer qu'ils unifient les fonctions de collecte, de stockage et d'analyse de données sous une plate-forme commune sans avoir besoin de sortie, car tout est couvert ici.

Databricks - Modèle commercial et de revenus

Leur modèle économique est positionné sur le logiciel Web qui fournit une plate-forme pour travailler avec Apache Spark. Il facilite la gestion automatique des groupes et les blocs-notes de style Python pour les ingénieurs de données et les scientifiques.

Databricks fournit ses ressources sous forme de Software as a Service (SaaS) et génère des revenus grâce à ses abonnements. Leurs principaux services s'effectuent à travers trois plateformes cloud à savoir :

  • Microsoft Azure
  • Google Cloud
  • Services Web Amazon

Bien que les prix varient pour chaque cloud, il existe un facteur commun à noter : « Ne payez que ce que vous utilisez » . Les coûts sont calculés indépendamment des services choisis et ne nécessitent aucun paiement initial. Les clients sont tenus de payer uniquement pour le nombre de ressources utilisées au fur et à mesure.

Databricks - Employés

Databricks compte plus de 5 001 à 10 000 employés dans le monde en 2023. En novembre 2019, Databricks a célébré le jalon de l'embauche du 1 000e employé à temps plein pour eux. Il a fallu 6 ans pour atteindre les 1 000 premiers salariés et moins de 2 ans pour embaucher le reste.

Databricks - Financement et investisseurs

Avec son récent financement de 503,7 millions de dollars, Databricks a levé 4 milliards de dollars au cours de 12 cycles de financement depuis sa création. Jusqu'à présent, 49 investisseurs au total ont investi dans Databricks.

Date Scène Montant Investisseurs
14 septembre 2023 Série I 503,7 millions de dollars Prix ​​​​T. Rowe
31 juillet 2023 Marché secondaire - -
3 mars 2023 Série H - -
4 septembre 2021 Ange rond 200 000 $ -
31 août 2021 Série H 1,6 milliard de dollars Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, une suite de fonds BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, the House Fund Géodésique et Green Bay Ventures.
1 février 2021 Série G 1 milliard de dollars Franklin Templeton, Conseil d'investissement du RPC, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital et Octahedron Capital.
22 octobre 2019 Série F 400 millions de dollars Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic et Green Bay Ventures.
5 février 2019 Série E 250 millions de dollars Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures et Geodesic Capital.
22 août 2017 Série D 140 millions de dollars New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital et Green Bay Ventures.
15 décembre 2016 Série C 60 millions de dollars Association des nouvelles entreprises, Andreessen Horowitz et SineWave Ventures.
30 juin 2014 Série B 33 millions de dollars Association des nouvelles entreprises, Andreessen Horowitz et DCVC.
25 septembre 2013 Série A 14 millions de dollars Andreessen Horowitz, SV Angel et Alfred Chuang.

Databricks - Acquisitions

Databricks a jusqu'à présent acquis sept sociétés. Ci-dessous les détails :

Nom du compte Date Montant
Arcion 23 octobre 2023 100 millions de dollars
MosaïqueML 26 juin 2023 1,3 milliard de dollars
Okéra 3 mai 2023 -
DataJoy Inc. 13 octobre 2022 -
Laboratoires Cortex 15 avril 2022 -
8080 Laboratoires 6 octobre 2021 -
Redash 24 juin 2020 -

Liste des meilleures startups de cloud computing en Inde et leur croissance
Le Cloud Computing est devenu la nouvelle norme, la tendance a donné naissance à un grand nombre de startups qui s'appuient sur le cloud. Ces entreprises sont plus efficaces.

Databricks - Présence sur les réseaux sociaux

Databricks est bien présent sur Twitter et LinkedIn et utilise ces plateformes pour promouvoir ses produits et services afin d'obtenir un avantage sur le marché. Ils publient également des informations sur leurs tournées mondiales et lancent des événements avec leurs dernières inventions. Des liens vers des blogs et des articles présentant Databricks ou leurs produits et des informations relatives aux offres d'emploi peuvent également être trouvés sur leurs plateformes sociales.

Databricks - Croissance et revenus

Databricks a été créé en 2013, gardant la technologie Spark comme noyau. Sa création a été immédiatement suivie par une rumeur selon laquelle « la technologie Spark ne fonctionnera pas si vos données ne rentrent pas dans leur mémoire ». Cela a découragé les entreprises d'utiliser Spark.

Finalement, en 2015, les fondateurs ont décidé de mettre fin à ces rumeurs en participant à un concours au cours duquel ils ont battu le record du monde de traitement d'un pétaoctet de données dans le temps le plus court et ont ainsi gagné en popularité et en attention médiatique.

En 2017, ils étaient évalués à 500 millions de dollars, mais leur revenu annuel était bien inférieur à 1 million de dollars. Plus tard, participer au « concours de tri », apporter quelques changements dans le recrutement des employés et décider de créer des logiciels dotés des fonctionnalités demandées par les grandes entreprises, s'est avéré fructueux.

Depuis lors, la croissance de Databricks ne fait que s’accentuer. Leurs revenus ont atteint la barre des 100 millions de dollars pour la première fois en 2018 et n'ont mis qu'un an de plus pour atteindre 200 millions de dollars en 2019. L'introduction de la fonctionnalité Lakehouse a été l'un des principaux facteurs de son succès. La valorisation de la société est passée de 6,2 milliards de dollars au troisième trimestre 2019 à environ 38 milliards de dollars au troisième trimestre 2021.

Databricks a déclaré un chiffre d'affaires récurrent annuel de 425 millions de dollars en 2020.

Databricks a révélé qu'au cours de l'exercice clos le 31 janvier 2023, il avait généré plus d'un milliard de dollars de revenus. L’entreprise a déclaré avoir connu une croissance de plus de 60 % au cours de l’année précédente, 2022.


Top 15 des startups les plus valorisées au monde
Voici une liste des 15 startups les plus valorisées au monde. Société mère de TikTok, Bytedance est la startup la plus valorisée au monde avec une valorisation de 280 milliards de dollars.

Databricks - Produits et fonctionnalités

Certains des derniers lancements importants sont :

Unité des données avec la nouvelle version de Delta Lake

Databricks a annoncé une nouvelle version de son format de stockage de données Delta Lake le 28 juin 2023. Selon l'entreprise, cette version élimine les silos de données. Le dernier ajout aux normes open source rivales pour les tables de données analytiques dans les systèmes de lacs de données est Delta Lake 3.0, qui inclut Iceberg et Hudi de la Fondation Apache.

Chariot

Databricks a dévoilé un modèle de langage open source qui permet aux programmeurs de créer leurs propres applications de chatbot pilotées par l'IA le 24 mars 2023.

Fédération Lakehouse

Lors de son Data + AI Summit, Databricks a lancé ce qu'elle appelle sa fonction Lakehouse Federation le 28 juin 2023. Avec cette nouvelle fonctionnalité, les entreprises peuvent découvrir, interroger et administrer leurs données sur un large éventail de plateformes en combinant leurs données disparates. systèmes de données cloisonnés.

Databricks - Partenariats

Databricks s'est associé à de nombreuses entreprises. Certains des derniers partenariats importants sont :

Microsoft

Avec un nouveau partenariat avec Databricks en août 2023 pour commercialiser des outils de développement d'applications d'IA, Microsoft a élargi la portée de ses objectifs en matière d'IA. Les entreprises pourront créer leurs propres modèles d'IA à partir de zéro à l'aide du logiciel Databricks.

Kobaï

Le 11 septembre 2023, Databricks et Kobai se sont associés. Les clients peuvent profiter de la puissance et de l'évolutivité de la plateforme Databricks Lakehouse, ainsi que de la simplicité et des informations des graphiques de connaissances.

3i Infotech

Afin de générer de la valeur commerciale en combinant données et IA sur une seule plateforme, 3i Infotech Ltd et Databricks se sont associés le 18 octobre 2023.

Databricks - Investissement

Databricks a investi dans 24 entreprises. Certains des investissements sont répertoriés ci-dessous :

Nom du compte Date Montant
IA de perplexité 2022 -
Arcion 2018 -
Prophétie.io janvier 2017 -
Catalyseur septembre 2017 -
Laboratoire propre - -

Databricks - Concurrents

Certains des principaux concurrents de Databricks sont :

  • Flocon de neige
  • Cloudera
  • Datastax
  • Qubole
  • MATLAB
  • Altéryx
  • Drémio
  • Intellicus

Voici quelques comparaisons avec certains concurrents :

Flocon de neige – Snowflake est beaucoup plus grand que Databricks. Ils offrent tous deux des services similaires avec quelques différences (Databricks traite des données volumineuses tandis que Snowflake offre l'élasticité des données cloud pour un accès centralisé) à un prix flexible. Databricks mène une longue bataille pour vaincre son concurrent.

Cloudera - Cloudera fournit une plate-forme commune de stockage et de gestion cloud qui stocke, traite et analyse les données d'une organisation. Il est similaire à celui des Databricks sous la forme d'entrepôt de données, de traitement et de distribution.


Outils BI intégrés pour SaaS | Logiciel de veille économique SaaS
Qu’est-ce que la BI embarquée ? La business intelligence intégrée est l'intégration de fonctionnalités de BI dans des applications ou des portails de processus métier. En savoir plus ici !

Databricks - Projets futurs

Il est évident que Databricks travaillait sur deux des domaines Big Data à la croissance la plus rapide, le streaming et le Deep-Learning en 2021. Ils construisaient une interface de programmation d'application (API) à multiples facettes pour traiter ces deux domaines. Databricks souhaite également accélérer l'innovation de Data Lakehouse pour obtenir un plus grand avantage en conquérant les organisations basées sur les données.

Selon leur site Web, Databricks prévoit d'activer la fonctionnalité Favoris de l'espace de travail. Les notes, tableaux de bord, expériences et recherches peuvent tous être enregistrés dans une liste de favoris, à laquelle vous pouvez ensuite accéder depuis la page d'accueil.

Databricks - FAQ

Qu’est-ce que Databricks ?

Databricks est un outil basé sur le cloud permettant de stocker et de traiter d'énormes quantités de données à l'aide de modèles de Machine Learning. Cela se fait via leur outil Apache Spark.

Qui a fondé Databricks ?

Databricks a été cofondé par sept personnes, à savoir Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski et Arsalan Tavakoli-Shiraji.

Quel montant Databricks a-t-il obtenu grâce au financement ?

Databricks a obtenu environ 4 milliards de dollars grâce à 12 cycles de financement.

Quel est le chiffre d’affaires annuel de Databricks ?

Databricks a déclaré un revenu annuel récurrent (ARR) de 1,275 milliard de dollars pour l'année se terminant en 2022.

Qui sont les clients de Databricks ?

Databricks compte plus de 6 000 clients dans le monde. Certains de leurs clients populaires sont :

  • Coquille
  • CVS Santé
  • Régénéron
  • T Mobile
  • HSBC
  • Comcast