Databricks – Uma plataforma unificada para colaborar dados, análises e IA

Publicados: 2023-10-26

Company Profile é uma iniciativa da StartupTalky para publicar informações verificadas sobre diferentes startups e organizações.

O mundo moderno em que vivemos depende enormemente de dados e informações. Tudo ao nosso redor, como as coisas que usamos, vemos e pelas quais estamos cercados, são de uma ou outra forma influenciadas pela tecnologia.

À medida que a necessidade de tecnologia cresce, a importância dos dados começou a florescer. Com o acúmulo de dados, surgiu a necessidade de um armazém para armazenar, analisar e processar esses dados para diversas finalidades.

Foi aqui que a Databricks apresentou sua plataforma. Databricks serve como uma plataforma em nuvem para armazenar dados enormes que podem ser processados ​​e executados sem problemas. Esta é uma plataforma analítica construída em seu popular produto de código aberto chamado Apache Spark . Eles ocuparam uma participação de mercado de 10,19% e são o terceiro maior ocupante no mercado de análise digital.

Databricks - Destaques da empresa

Nome de inicialização Blocos de dados
Quartel general São Francisco, Califórnia, Estados Unidos
Indústria Software de computador, dados, IA
Fundadores Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia e Arsalan Tavakoli
Fundado 2013
Local na rede Internet databricks. com

Blocos de dados – Sobre
Blocos de dados - Indústria
Databricks - Fundadores
Databricks – História de inicialização
Blocos de dados - Missão
Blocos de dados - Logotipo
Databricks – Modelo de Negócios e Receita
Blocos de dados - Funcionários
Databricks - Financiamento e Investidores
Databricks - Aquisições
Databricks - Presença nas Redes Sociais
Databricks – Crescimento e receita
Databricks – Produtos e Recursos
Blocos de dados – Investimento
Databricks - Parcerias
Blocos de dados – Concorrentes
Databricks – Planos Futuros

Blocos de dados – Sobre

A Databricks foi criada pelos criadores do Apache Spark , como uma empresa de Dados e Inteligência Artificial (IA). Atua como um armazém para quaisquer dados estruturados ou não estruturados, na nuvem. Databricks também serve como uma plataforma combinada para todas as suas funções de dados, IA e análise que ajuda engenheiros de dados, analistas e cientistas de dados a executar grandes cargas de trabalho de maneira integrada. Isso é feito por sua plataforma Lakehouse alimentada por Apache Spark, que é a melhor combinação de recursos de Data Lakes (baixo custo e flexibilidade) e Data Warehouses (eficiência de desempenho).

Além do Apache Spark, Delta Lake e MLflow são os outros dois projetos de código aberto, que estão por trás das funções efetivas da Plataforma Lakehouse. Databricks fornece seus serviços de dados unificados por meio de várias nuvens, nomeadamente Google Cloud, AWS, Microsoft Azure e Alibaba Cloud.

Sobre blocos de dados

Blocos de dados - Indústria

A indústria de dados tornou-se uma indústria grande e significativa em todos os aspectos da vida e dos negócios. De acordo com Statista, espera-se que o mercado de dados cresça para impressionantes 103 mil milhões de dólares até 2027. É o dobro da sua presença em 2018. A Inteligência Artificial é outro mercado em rápido crescimento que se tornou um elemento essencial nas indústrias modernas.


Principais impulsionadores da transformação digital para reinventar os negócios
A transformação digital está reinventando os negócios e a cultura de trabalho. Leia este artigo para saber mais sobre os principais impulsionadores da transformação digital.

Databricks - Fundadores

Fundadores de databricks
Fundadores de databricks

A Databricks foi cofundada por alguns professores da Universidade da Califórnia e cinco ex-Ph.D. de Berkeley. estudantes.

  • Ali Ghodsi , cofundador e CEO da Databricks, foi um dos criadores do Apache Spark. Ele foi professor da Universidade da Califórnia (UC) e membro do conselho do Rising Lab da UC. Ele foi o principal responsável pelo crescimento e expansão da Databricks em todo o mundo.
  • Ion Stoica , cofundador e presidente da Databricks, também é professor na UC Berkeley. Ele também é codiretor do AMPLab. Além disso, foi cofundador de uma start-up chamada Conviva , para distribuição de vídeos em larga escala.
  • Matei Zaharia , cofundador e tecnólogo-chefe da Databricks, fez parte do projeto Spark e agora é vice-presidente da Apache Foundation. O Prêmio ACM de Dissertação de Doutorado foi concedido a ele em 2014 por sua pesquisa em sistemas computacionais de grande escala.
  • Patrick Wendell , cofundador e vice-presidente de engenharia da Databricks, desempenhou um papel importante nas operações do Spark.
  • Reynold Xin , cofundador e arquiteto-chefe e cuida das operações técnicas no Apache Spark. Ele ganhou o prêmio de Melhor Demo em 2011 no VLDB.
  • Andy Konwinski , cofundador e vice-presidente de gestão, cuida das operações de IA no Databricks. Anteriormente ele cuidou dos esforços de mercado da empresa na criação do Spark Summit.
  • Arsalan Tavakoli-Shiraji , cofundador e vice-presidente sênior de engenharia de campo da Databricks, trabalhou anteriormente na McKinsey como diretor associado. Ele era um ex-Ph.D. estudante da UC Berkeley.

Databricks – História de inicialização

Ali Ghodsi, o CEO da Databricks, gostava de programar desde os 8 anos de idade, quando seus pais compraram para ele um Commodore 64 usado. em computação distribuída. Mais tarde, em 2009, juntou-se a Ion Stoica e juntos criaram 'Spark', que já era instigado por Matei Zaharia.

Eles ainda coordenaram com outra equipe que trabalhava em aprendizado de máquina e, juntos, introduziram o 'Apache Spark' no mercado. No início, nenhuma empresa prestou atenção, pois a tecnologia parecia estranha. Em 2013, Ben Horowitz (cofundador da Andreessen Horowitz VC), plantou alguma esperança neles ao investir US$ 14 milhões e os encorajou a criar uma empresa que serve como plataforma para administrar o Apache Spark. Assim, o Databricks foi criado em 2013.

Blocos de dados - Missão

Databricks funciona com a missão de tornar a Unificação de Dados mais eficiente, inovando novas técnicas para unificar Dados, IA e Análise. Eles se esforçam para tornar a experiência do cliente mais envolvente.

Blocos de dados - Logotipo

Logotipo do Databricks
Logotipo do Databricks

O logotipo do Databricks se assemelha a dois blocos alinhados perfeitamente como pastas de dados organizadas em uma prateleira. Parece que o Databricks pretendia manter o logotipo com um ponto inicial e final, sem interrupções entre eles. Isso pode significar que eles unificam as funções de coleta, armazenamento e análise de dados em uma plataforma comum, sem necessidade de saída, já que tudo é abordado aqui.

Databricks – Modelo de Negócios e Receita

Seu modelo de negócios está posicionado no software baseado na web que fornece uma plataforma para trabalhar com Apache Spark. Facilita o gerenciamento automático de grupos e notebooks estilo Python para engenheiros e cientistas de dados.

A Databricks fornece seus recursos na forma de Software como Serviço (SaaS) e gera receita por meio de suas assinaturas. Seus principais serviços são através de três plataformas em nuvem, a saber:

  • Microsoft Azure
  • Google Nuvem
  • Amazon Web Services

Embora os preços variem para cada nuvem, há um fator comum a ser observado: “Pague apenas pelo que usar” . Os custos são calculados independentemente dos serviços escolhidos e não requerem pagamento antecipado. Os clientes são obrigados a pagar apenas pela quantidade de recursos usados ​​à medida que utilizam.

Blocos de dados - Funcionários

A Databricks tinha mais de 5.001 a 10.000 funcionários em todo o mundo em 2023. Em novembro de 2019, a Databricks comemorou o marco de ter contratado o 1.000º funcionário em tempo integral para eles. Foram necessários 6 anos para atingir os primeiros 1.000 funcionários e menos de 2 anos para contratar os demais.

Databricks - Financiamento e Investidores

Com o seu recente financiamento de 503,7 milhões de dólares, a Databricks arrecadou 4 mil milhões de dólares através de 12 rondas de financiamento desde a sua formação. Um total de 49 investidores investiram até agora em Databricks.

Data Estágio Quantia Investidores
14 de setembro de 2023 Série I US$ 503,7 milhões Preço de T. Rowe
31 de julho de 2023 Mercado secundário - -
3 de março de 2023 Série H - -
4 de setembro de 2021 Anjo redondo US$ 200 mil -
31 de agosto de 2021 Série H US$ 1,6 bilhão Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, um conjunto de fundos BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, the House Fund Geodésica e Green Bay Ventures.
1º de fevereiro de 2021 Série G US$ 1 bilhão Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital e Octahedron Capital.
22 de outubro de 2019 Série F US$ 400 milhões Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic e Green Bay Ventures.
5 de fevereiro de 2019 Série E US$ 250 milhões Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures e Geodesic Capital.
22 de agosto de 2017 Série D US$ 140 milhões Nova Associação Empresarial, Andreessen Horowitz, Battery Ventures, Geodesic Capital e Green Bay Ventures.
15 de dezembro de 2016 Série C US$ 60 milhões Nova Associação Empresarial, Andreessen Horowitz e SineWave Ventures.
30 de junho de 2014 Série B US$ 33 milhões Nova Associação Empresarial, Andreessen Horowitz e DCVC.
25 de setembro de 2013 Série A US$ 14 milhões Andreessen Horowitz, SV Angel e Alfred Chuang.

Databricks - Aquisições

Até agora, a Databricks adquiriu sete empresas. Abaixo estão os detalhes:

Nome da conta Data Quantia
Arcion 23 de outubro de 2023 US$ 100 milhões
MosaicML 26 de junho de 2023 US$ 1,3 bilhão
Okera 3 de maio de 2023 -
DataJoy Inc. 13 de outubro de 2022 -
Laboratórios Cortex 15 de abril de 2022 -
Laboratórios 8080 6 de outubro de 2021 -
Redash 24 de junho de 2020 -

Lista das principais startups de computação em nuvem na Índia e seu crescimento
A computação em nuvem se tornou a nova norma, a tendência deu origem a um grande número de startups que dependem da nuvem. Essas empresas são mais eficientes.

Databricks - Presença nas Redes Sociais

A Databricks tem boa presença no Twitter e LinkedIn e utiliza essas plataformas para promover seus produtos e serviços para obter vantagem de mercado. Eles também postam sobre suas turnês mundiais e eventos de lançamento com suas últimas invenções. Links para blogs e artigos sobre Databricks ou seus produtos e informações relacionadas a vagas de emprego também podem ser encontrados em suas plataformas sociais.

Databricks – Crescimento e receita

A Databricks foi criada em 2013, mantendo a Spark Technology como seu núcleo. Sua formação foi imediatamente seguida por um boato de que “a tecnologia Spark não funcionará se seus dados não couberem na memória”. Isso desencorajou as empresas a usar o Spark.

Finalmente, em 2015, os fundadores decidiram acabar com esses rumores participando de um concurso onde bateram o recorde mundial de processamento de um petabyte de dados no menor tempo e, como resultado, ganharam atenção e popularidade da mídia.

Em 2017, eles foram avaliados em US$ 500 milhões, mas sua receita anual foi bem menor, em US$ 1 milhão. Mais tarde, participar no 'concurso de triagem', fazer algumas alterações na contratação de funcionários e decidir construir software com funcionalidades exigidas pelas grandes empresas, revelou-se frutífero.

Desde então, o crescimento da Databricks só aumentou. Sua receita atingiu a marca de US$ 100 milhões pela primeira vez em 2018 e levou apenas mais um ano para atingir US$ 200 milhões em 2019. A introdução do recurso Lakehouse foi um fator primordial para seu sucesso. A avaliação da empresa cresceu de US$ 6,2 bilhões no terceiro trimestre de 2019 para cerca de US$ 38 bilhões no terceiro trimestre de 2021.

Databricks relatou receita recorrente anual de US$ 425 milhões em 2020.

A Databricks divulgou que durante o ano fiscal concluído em 31 de janeiro de 2023, arrecadou mais de US$ 1 bilhão em receitas. A empresa informou que expandiu mais de 60% no ano anterior de 2022.


As 15 startups mais valorizadas do mundo
Aqui está uma lista das 15 startups mais valorizadas do mundo. Controladora da TikTok, a Bytedance é a startup mais valiosa do mundo, com uma avaliação de US$ 280 bilhões.

Databricks – Produtos e Recursos

Alguns dos últimos lançamentos importantes são:

Unidade de dados com novo lançamento do Delta Lake

Databricks anunciou uma nova versão de seu formato de armazenamento de dados Delta Lake em 28 de junho de 2023. Segundo a empresa, esta versão elimina silos de dados. A mais recente adição aos padrões rivais de código aberto para tabelas de dados analíticos em sistemas de data lake é o Delta Lake 3.0, que inclui Iceberg e Hudi da Apache Foundation.

Boneca

Databricks revelou um modelo de linguagem de código aberto que permite aos programadores criar seus próprios aplicativos de chatbot impulsionados por IA em 24 de março de 2023.

Federação de Lakehouse

Em seu Data + AI Summit, a Databricks lançou o que chama de função Lakehouse Federation em 28 de junho de 2023. Com esse novo recurso, as empresas podem descobrir, consultar e administrar seus dados em uma ampla gama de plataformas, combinando seus diferentes sistemas de dados murados.

Databricks - Parcerias

Databricks fez parceria com muitas empresas. Algumas das últimas parcerias proeminentes são:

Microsoft

Com uma nova parceria com a Databricks em agosto de 2023 para comercializar ferramentas de desenvolvimento de aplicativos de IA, a Microsoft aumentou o escopo de seus objetivos de IA. As empresas poderão criar seus próprios modelos de IA do zero usando o software Databricks.

Kobai

Em 11 de setembro de 2023, Databricks e Kobai formaram uma parceria. Os clientes podem aproveitar o poder e a escalabilidade da plataforma Databricks Lakehouse, juntamente com a simplicidade e os insights dos gráficos de conhecimento.

3i Tecnologia da Informação

A fim de gerar valor comercial combinando dados e IA em uma única plataforma, a 3i Infotech Ltd e a Databricks firmaram uma parceria em 18 de outubro de 2023.

Blocos de dados – Investimento

A Databricks investiu em 24 empresas. Alguns dos investimentos estão listados abaixo:

Nome da conta Data Quantia
Perplexidade AI 2022 -
Arcion 2018 -
Profecia.io Janeiro de 2017 -
Catalisador Setembro de 2017 -
Laboratório limpo - -

Blocos de dados – Concorrentes

Alguns dos principais concorrentes do Databricks são:

  • Floco de neve
  • Cloudera
  • Imposto de dados
  • Qubole
  • MATLAB
  • Alterix
  • Drêmio
  • Intellicus

Aqui estão algumas comparações com alguns concorrentes:

Snowflake - Snowflake é muito maior que Databricks. Ambos oferecem serviços semelhantes com poucas diferenças (Databricks processa grandes dados, enquanto Snowflake oferece elasticidade de dados em nuvem para acesso centralizado) a um preço flexível. A Databricks está travando uma longa batalha para superar seu concorrente.

Cloudera - Cloudera fornece uma plataforma comum de armazenamento e gerenciamento em nuvem que armazena, processa e analisa dados para uma organização. É semelhante ao Databricks na forma de Data Warehouse, Processamento e Distribuição.


Ferramentas de BI incorporadas para SaaS | Software de inteligência de negócios SaaS
O que é BI incorporado? A inteligência de negócios incorporada é a integração de recursos de BI em aplicativos ou portais de processos de negócios. Leia mais aqui!

Databricks – Planos Futuros

É evidente que a Databricks estava trabalhando em dois dos domínios de big data de crescimento mais rápido, Streaming e Deep-Learning em 2021. Eles estavam construindo uma interface de programação de aplicativos (API) multifacetada para processar esses dois domínios. A Databricks também está interessada em acelerar a inovação do Data Lakehouse para obter uma vantagem maior ao conquistar organizações orientadas por dados.

De acordo com seu site, a Databricks planeja habilitar o recurso de favoritos do espaço de trabalho. Notas, painéis, experimentos e pesquisas podem ser salvos em uma lista de favoritos, que você pode acessar na página inicial.

Blocos de dados - Perguntas frequentes

O que são blocos de dados?

Databricks é uma ferramenta baseada em nuvem para armazenar e processar grandes quantidades de dados usando modelos de aprendizado de máquina. Isso é feito por meio da ferramenta Apache Spark.

Quem fundou o Databricks?

Databricks foi co-fundado por sete pessoas, nomeadamente Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski e Arsalan Tavakoli-Shiraji.

Quanto a Databricks garantiu através de financiamento?

Databricks garantiu cerca de US$ 4 bilhões por meio de 12 rodadas de financiamento.

Qual é a receita anual do Databricks?

Databricks relatou uma receita recorrente anual (ARR) de US$ 1,275 bilhão para o ano encerrado em 2022.

Quem são os clientes do Databricks?

Databricks tem cerca de 6.000 clientes em todo o mundo. Alguns de seus clientes populares são:

  • Concha
  • Saúde CVS
  • Regeneron
  • T móvel
  • HSBC
  • Comcast