Databricks: una plataforma unificada para colaborar con datos, análisis e inteligencia artificial

Publicado: 2023-10-26

Company Profile es una iniciativa de StartupTalky para publicar información verificada sobre diferentes startups y organizaciones.

El mundo moderno en el que vivimos hoy depende enormemente de los datos y la información. Todo lo que nos gusta a nuestro alrededor, las cosas que usamos, vemos y nos rodean, están influenciados de una u otra manera por la tecnología.

A medida que crece la necesidad de tecnología, la importancia de los datos comenzó a florecer. Con la acumulación de datos, surgió la necesidad de un almacén para almacenar, analizar y procesar estos datos para múltiples propósitos.

Aquí es donde Databricks presentó su plataforma. Databricks sirve como una plataforma en la nube para almacenar enormes datos que pueden procesarse y ejecutarse sin problemas. Esta es una plataforma analítica basada en su popular producto de código abierto llamado Apache Spark . Han ocupado una cuota de mercado del 10,19% y se posicionan como el tercer ocupante más grande en el mercado de análisis digital.

Databricks: aspectos destacados de la empresa

Nombre de inicio Ladrillos de datos
Sede San Francisco, California, Estados Unidos
Industria Software informático, datos, IA
Fundadores Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia y Arsalan Tavakoli
Fundado 2013
Sitio web databricks.com

Ladrillos de datos: Acerca de
Ladrillos de datos - Industria
Ladrillos de datos: fundadores
Databricks: historia de inicio
Ladrillos de datos: misión
Ladrillos de datos - Logotipo
Databricks: modelo de negocio e ingresos
Ladrillos de datos: empleados
Databricks: financiación e inversores
Databricks - Adquisiciones
Databricks: presencia en redes sociales
Databricks: crecimiento e ingresos
Ladrillos de datos: productos y características
Ladrillos de datos - Inversión
Ladrillos de datos: asociaciones
Ladrillos de datos: competidores
Ladrillos de datos: planes futuros

Ladrillos de datos: Acerca de

Databricks fue fundada por los creadores de Apache Spark , como una empresa de Datos e Inteligencia Artificial (IA). Actúa como almacén de datos estructurados o no estructurados, en la nube. Databricks también sirve como una plataforma combinada para todas sus funciones de datos, inteligencia artificial y análisis que ayuda a los ingenieros, analistas y científicos de datos a realizar enormes cargas de trabajo sin problemas. Esto lo hace su plataforma Lakehouse impulsada por Apache Spark, que es la mejor combinación de características de Data Lakes (bajo costo y flexibilidad) y Data Warehouses (eficiencia de rendimiento).

Además de Apache Spark, Delta Lake y MLflow son los otros dos proyectos de código abierto que están detrás de las funciones efectivas de Lakehouse Platform. Databricks proporciona sus servicios de datos unificados a través de múltiples nubes, a saber, Google Cloud, AWS, Microsoft Azure y Alibaba Cloud.

Acerca de los ladrillos de datos

Ladrillos de datos - Industria

La industria de datos se ha convertido en una industria grande e importante en todos los aspectos de la vida y los negocios. Según Statista, se espera que el mercado de datos crezca hasta la friolera de 103 mil millones de dólares para 2027. Es el doble de su presencia en 2018. La inteligencia artificial es otro mercado de rápido crecimiento que se ha convertido en un elemento esencial en las industrias modernas.


Impulsores clave de la transformación digital para reinventar los negocios
La transformación digital está reinventando las empresas y la cultura laboral. Lea este artículo para conocer los impulsores clave de la transformación digital.

Ladrillos de datos: fundadores

Fundadores de ladrillos de datos
Fundadores de ladrillos de datos

Databricks fue cofundada por un par de profesores de la Universidad de California y cinco ex doctores de Berkeley. estudiantes.

  • Ali Ghodsi , cofundador y director ejecutivo de Databricks, fue uno de los creadores de Apache Spark. Fue profesor en la Universidad de California (UC) y miembro de la junta directiva del Rising Lab de la UC. Ha tenido la responsabilidad principal del crecimiento y expansión de Databricks en todo el mundo.
  • Ion Stoica , cofundador y presidente de Databricks, también es profesor en UC Berkeley. También es codirector de AMPLab. Además de esto, cofundó una start-up llamada Conviva , para la distribución de vídeos a gran escala.
  • Matei Zaharia , cofundador y tecnólogo jefe de Databricks, anteriormente formó parte del proyecto Spark y ahora es el vicepresidente de la Fundación Apache. El Premio de Tesis Doctoral ACM le fue otorgado en 2014 por su investigación en sistemas informáticos a gran escala.
  • Patrick Wendell , cofundador y vicepresidente de ingeniería de Databricks, desempeñó un papel importante en las operaciones de Spark.
  • Reynold Xin , cofundador y arquitecto jefe, se encarga de las operaciones técnicas en Apache Spark. Ganó el premio a la mejor demostración en 2011 en VLDB.
  • Andy Konwinski , cofundador y vicepresidente de gestión, se encarga de las operaciones de IA en Databricks. Anteriormente se encargó de los esfuerzos de mercado de la empresa en la creación de Spark Summit.
  • Arsalan Tavakoli-Shiraji , cofundador y vicepresidente senior de ingeniería de campo en Databricks, trabajó anteriormente en McKinsey como director asociado. Era un ex doctor. estudiante de la Universidad de Berkeley.

Databricks: historia de inicio

Ali Ghodsi, director ejecutivo de Databricks, estaba interesado en la codificación desde los 8 años, cuando sus padres le compraron un Commodore 64 usado. Continuó sus estudios superiores en ingeniería informática y obtuvo un doctorado. en computación distribuida. Posteriormente, en 2009, se unió a Ion Stoica y juntos crearon 'Spark', que ya fue instigado por Matei Zaharia.

Además, se coordinaron con otro equipo que trabajaba en aprendizaje automático y juntos introdujeron 'Apache Spark' en el mercado. Al principio, ninguna empresa prestó atención porque la tecnología parecía extraña. En 2013, Ben Horowitz (cofundador de Andreessen Horowitz VC), les plantó algo de esperanza al invertir 14 millones de dólares y los animó a crear una empresa que sirviera como plataforma para ejecutar Apache Spark. Así, Databricks se estableció en 2013.

Ladrillos de datos: misión

Databricks funciona con la misión de hacer que la unificación de datos sea más eficiente mediante la innovación de nuevas técnicas para unificar datos, inteligencia artificial y análisis. Se esfuerzan por hacer que la experiencia del cliente sea más atractiva.

Ladrillos de datos - Logotipo

Logotipo de ladrillos de datos
Logotipo de ladrillos de datos

El logotipo de Databricks se asemeja a dos ladrillos perfectamente alineados, como carpetas de datos organizadas en un estante. Parece que Databricks tenía la intención de mantener el logotipo con un punto inicial y final sin interrupciones en el medio. Esto se puede hacer para implicar que unifican las funciones de recopilación, almacenamiento y análisis de datos en una plataforma común sin necesidad de una salida, ya que todo se trata aquí.

Databricks: modelo de negocio e ingresos

Su modelo de negocio se basa en el software basado en web que proporciona una plataforma para trabajar con Apache Spark. Facilita la gestión automática de grupos y cuadernos estilo Python para ingenieros y científicos de datos.

Databricks proporciona sus recursos en forma de software como servicio (SaaS) y genera ingresos a través de sus suscripciones. Sus principales servicios se realizan a través de tres plataformas en la nube, a saber:

  • MicrosoftAzure
  • Nube de Google
  • Servicios web de Amazon

Aunque los precios varían para cada nube, hay un factor común a destacar: “Paga solo por lo que usas” . Los costos se calculan independientemente de los servicios elegidos y no requieren pago por adelantado. Los clientes deben pagar solo por la cantidad de recursos utilizados sobre la marcha.

Ladrillos de datos: empleados

Databricks tiene entre 5001 y 10 000 empleados en todo el mundo en 2023. En noviembre de 2019, Databricks celebró el hito de haber contratado al empleado número 1000 a tiempo completo para ellos. Se necesitaron 6 años para llegar a los primeros 1000 empleados y menos de 2 años para contratar al resto.

Databricks: financiación e inversores

Con su reciente financiación de 503,7 millones de dólares, Databricks ha recaudado 4 mil millones de dólares a través de 12 rondas de financiación desde su formación. Hasta ahora, un total de 49 inversores han invertido en Databricks.

Fecha Escenario Cantidad Inversores
14 de septiembre de 2023 Serie I 503,7 millones de dólares Precio de T. Rowe
31 de julio de 2023 Mercado secundario - -
3 de marzo de 2023 Serie H - -
4 de septiembre de 2021 Ángel redondo $200K -
31 de agosto de 2021 Serie H $1.6 mil millones Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, un conjunto de fondos BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, House Fund Geodésico y Green Bay Ventures.
1 de febrero de 2021 Serie G mil millones de dólares Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital y Octahedron Capital.
22 de octubre de 2019 Serie F $400 millones Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic y Green Bay Ventures.
5 de febrero de 2019 Serie E $250 millones Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures y Geodesic Capital.
22 de agosto de 2017 Serie D $140 millones Asociación de Nuevas Empresas, Andreessen Horowitz, Battery Ventures, Geodesic Capital y Green Bay Ventures.
15 de diciembre de 2016 Serie C $60 millones Asociación de Nuevas Empresas, Andreessen Horowitz y SineWave Ventures.
30 de junio de 2014 Serie B $33 millones Asociación de Nuevas Empresas, Andreessen Horowitz y DCVC.
25 de septiembre de 2013 Serie A $14 millones Andreessen Horowitz, SV Angel y Alfred Chuang.

Databricks - Adquisiciones

Hasta ahora, Databricks ha adquirido siete empresas. A continuación se detallan los detalles:

Nombre de la cuenta Fecha Cantidad
Arción 23 de octubre de 2023 100 millones de dólares
mosaicoml 26 de junio de 2023 1.300 millones de dólares
okera 3 de mayo de 2023 -
DataJoy Inc. 13 de octubre de 2022 -
Laboratorios de corteza 15 de abril de 2022 -
8080 laboratorios 6 de octubre de 2021 -
Redash 24 de junio de 2020 -

Lista de las principales empresas emergentes de computación en la nube en la India y su crecimiento
La computación en la nube se ha convertido en la nueva norma, la tendencia ha dado origen a una gran cantidad de nuevas empresas que dependen de la nube. Estas empresas son más eficientes.

Databricks: presencia en redes sociales

Databricks tiene buena presencia en Twitter y LinkedIn y utiliza estas plataformas para promocionar sus productos y servicios y obtener una ventaja en el mercado. También publican sobre sus giras mundiales y eventos de lanzamiento de sus últimos inventos. En sus plataformas sociales también se pueden encontrar enlaces a blogs y artículos sobre Databricks o sus productos e información relacionada con ofertas de trabajo.

Databricks: crecimiento e ingresos

Databricks se estableció en 2013, manteniendo Spark Technology como su núcleo. A su formación le siguió inmediatamente el rumor de que "Spark Technology no funcionará si sus datos no caben en su memoria". Esto disuadió a las empresas de utilizar Spark.

Finalmente, en 2015, los fundadores decidieron acabar con estos rumores participando en un concurso en el que batieron el récord mundial de procesar un petabyte de datos en el menor tiempo y, como resultado, ganaron atención mediática y popularidad.

En 2017, estaban valorados en 500 millones de dólares, pero sus ingresos anuales eran mucho menores: 1 millón de dólares. Más tarde, resultó fructífero participar en el "concurso de clasificación", hacer algunos cambios en la contratación de empleados y decidir crear software con las características demandadas por las grandes empresas.

Desde entonces, el crecimiento de Databricks sólo ha ido cuesta arriba. Sus ingresos alcanzaron la marca de los 100 millones de dólares por primera vez en 2018 y tardó solo un año más en alcanzar los 200 millones de dólares en 2019. La introducción de la función Lakehouse fue un factor principal de su éxito. La valoración de la empresa creció de 6.200 millones de dólares en el tercer trimestre de 2019 a alrededor de 38.000 millones de dólares en el tercer trimestre de 2021.

Databricks reportó ingresos anuales recurrentes de 425 millones de dólares en 2020.

Databricks reveló que durante el año fiscal que concluyó el 31 de enero de 2023, generó más de mil millones de dólares en ingresos. La empresa informó que se expandió más del 60% en el año anterior 2022.


Las 15 startups mejor valoradas del mundo
Aquí hay una lista de las 15 startups mejor valoradas del mundo. Bytedance, la empresa matriz de TikTok, es la startup más valiosa del mundo con una valoración de 280 mil millones de dólares.

Ladrillos de datos: productos y características

Algunos de los últimos lanzamientos destacados son:

Data Unity con la nueva versión de Delta Lake

Databricks anunció una nueva versión de su formato de almacenamiento de datos Delta Lake el 28 de junio de 2023. Según la empresa, esta versión elimina los silos de datos. La última incorporación a los estándares rivales de código abierto para las tablas de datos analíticos en sistemas de lagos de datos es Delta Lake 3.0, que incluye Iceberg y Hudi de la Fundación Apache.

Muñequita

Databricks presentó un modelo de lenguaje de código abierto que permite a los programadores crear sus propias aplicaciones de chatbot impulsadas por IA el 24 de marzo de 2023.

Federación de la casa del lago

En su Cumbre Data + AI, Databricks lanzó lo que denomina su función Lakehouse Federation el 28 de junio de 2023. Con esta nueva característica, las empresas pueden descubrir, consultar y administrar sus datos en una amplia gama de plataformas combinando sus dispares sistemas de datos amurallados.

Ladrillos de datos: asociaciones

Databricks se ha asociado con muchas empresas. Algunas de las últimas asociaciones destacadas son:

microsoft

Con una nueva asociación con Databricks en agosto de 2023 para comercializar herramientas de desarrollo de aplicaciones de IA, Microsoft ha aumentado el alcance de sus objetivos de IA. Las empresas podrán crear sus propios modelos de IA desde cero utilizando el software Databricks.

kobai

El 11 de septiembre de 2023, Databricks y Kobai se asociaron. Los clientes pueden aprovechar el poder y la escalabilidad de la plataforma Databricks Lakehouse, junto con la simplicidad y la información de los gráficos de conocimiento.

3i Informática

Para generar valor comercial combinando datos e inteligencia artificial en una sola plataforma, 3i Infotech Ltd y Databricks se asociaron el 18 de octubre de 2023.

Ladrillos de datos - Inversión

Databricks ha invertido en 24 empresas. Algunas de las inversiones se enumeran a continuación:

Nombre de la cuenta Fecha Cantidad
Perplejidad IA 2022 -
Arción 2018 -
Profecía.io enero de 2017 -
Catalizador septiembre de 2017 -
laboratorio limpio - -

Ladrillos de datos: competidores

Algunos de los principales competidores de Databricks son:

  • Copo de nieve
  • nubeera
  • Registro de datos
  • Qubolé
  • MATLAB
  • Altérix
  • Dremio
  • Intellicus

Aquí hay algunas comparaciones con algunos competidores:

Copo de nieve: Snowflake es mucho más grande que Databricks. Ambos ofrecen servicios similares con pocas diferencias (Databricks procesa grandes cantidades de datos mientras que Snowflake ofrece elasticidad de datos en la nube para acceso centralizado) a un precio flexible. Databricks está librando una larga batalla para superar a su competidor.

Cloudera: Cloudera proporciona una plataforma común de gestión y almacenamiento en la nube que almacena, procesa y analiza datos para una organización. Es similar al de Databricks en forma de almacén, procesamiento y distribución de datos.


Herramientas de BI integradas para SaaS | Software de inteligencia empresarial SaaS
¿Qué es el BI integrado? La inteligencia empresarial integrada es la integración de capacidades de BI dentro de aplicaciones o portales de procesos empresariales. ¡Leer más aquí!

Ladrillos de datos: planes futuros

Es evidente que Databricks estaba trabajando en dos de los dominios de big data de más rápido crecimiento, Streaming y Deep-Learning en 2021. Estaban construyendo una interfaz de programación de aplicaciones (API) multifacética para procesar estos dos dominios. Databricks también está interesado en acelerar la innovación de Data Lakehouse para obtener una mayor ventaja al conquistar organizaciones basadas en datos.

Según su sitio web, Databricks planea habilitar la función de favoritos del espacio de trabajo. Las notas, los paneles, los experimentos y las búsquedas se pueden guardar en una lista de favoritos, a la que luego podrá acceder desde la página de inicio.

Ladrillos de datos: preguntas frecuentes

¿Qué son los ladrillos de datos?

Databricks es una herramienta basada en la nube para almacenar y procesar grandes cantidades de datos utilizando modelos de aprendizaje automático. Esto se hace a través de su herramienta Apache Spark.

¿Quién fundó Databricks?

Databricks fue cofundado por siete personas, a saber, Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski y Arsalan Tavakoli-Shiraji.

¿Cuánto ha obtenido Databricks mediante financiación?

Databricks obtuvo alrededor de 4 mil millones de dólares a través de 12 rondas de financiación.

¿Cuáles son los ingresos anuales de Databricks?

Databricks ha informado unos ingresos recurrentes anuales (ARR) de 1275 millones de dólares para el año que finaliza en 2022.

¿Quiénes son los clientes de Databricks?

Databricks tiene alrededor de 6000+ clientes en todo el mundo. Algunos de sus clientes populares son:

  • Caparazón
  • Salud CVS
  • Regenerón
  • T-Mobile
  • HSBC
  • Comcast