Databricks — унифицированная платформа для совместной работы с данными, аналитикой и искусственным интеллектом.

Опубликовано: 2023-10-26

Профиль компании — это инициатива StartupTalky по публикации проверенной информации о различных стартапах и организациях.

Современный мир, в котором мы живем сегодня, во многом зависит от данных и информации. Все вокруг нас, вещи, которые мы используем, видим и окружаем, так или иначе находятся под влиянием технологий.

По мере роста потребности в технологиях значимость данных начала процветать. По мере накопления данных возникла необходимость в хранилище для хранения, анализа и обработки этих данных для различных целей.

Именно здесь Databricks представила свою платформу. Databricks служит облачной платформой для хранения огромных данных, которые можно обрабатывать и бесперебойно использовать. Это аналитическая платформа, построенная на их популярном продукте с открытым исходным кодом под названием Apache Spark . Они заняли 10,19% рынка и станут третьим по величине игроком на рынке цифровой аналитики.

Databricks — основные сведения о компании

Название запуска Блоки данных
Главное управление Сан-Франциско, Калифорния, США
Промышленность Компьютерное программное обеспечение, данные, искусственный интеллект
Основатели Али Годси, Энди Конвински, Лон Стойка, Патрик Венделл, Рейнольд Синь, Матей Захария и Арсалан Таваколи
Основан 2013
Веб-сайт databricks.com

Блоки данных — О проекте
Блоки данных — промышленность
Databricks — Основатели
Databricks — история стартапа
Блоки данных — Миссия
Блоки данных — логотип
Databricks — модель бизнеса и доходов
Блоки данных — сотрудники
Databricks — Финансирование и инвесторы
Блоки данных — Приобретения
Databricks — присутствие в социальных сетях
Databricks – рост и доходы
Блоки данных — продукты и функции
Блоки данных — инвестиции
Блоки данных — партнерство
Блоки данных — конкуренты
Блоки данных — планы на будущее

Блоки данных — О проекте

Databricks была основана создателями Apache Spark как компания, занимающаяся данными и искусственным интеллектом (ИИ). Он действует как хранилище любых структурированных и неструктурированных данных в облаке. Databricks также служит комбинированной платформой для всех ваших функций обработки данных, искусственного интеллекта и аналитики, которая помогает инженерам данных, аналитикам и специалистам по данным беспрепятственно выполнять огромные рабочие нагрузки. Это достигается с помощью их платформы Lakehouse на базе Apache Spark, которая представляет собой лучшее сочетание функций озер данных (дешевизна и гибкость) и хранилищ данных (эффективность производительности).

Помимо Apache Spark, Delta Lake и MLflow — это еще два проекта с открытым исходным кодом, которые обеспечивают эффективные функции платформы Lakehouse. Databricks предоставляют свои услуги унифицированных данных через несколько облаков, а именно: Google Cloud, AWS, Microsoft Azure и Alibaba Cloud.

О блоках данных

Блоки данных — промышленность

Индустрия данных превратилась в крупную и значимую отрасль во всех аспектах жизни и бизнеса. По данным Statista, ожидается, что к 2027 году рынок данных вырастет до колоссальных 103 миллиардов долларов. Это вдвое больше, чем в 2018 году. Искусственный интеллект — еще один быстро растущий рынок, который стал важным элементом в современных отраслях.


Ключевые драйверы цифровой трансформации для переосмысления бизнеса
Цифровая трансформация меняет бизнес и культуру труда. Прочтите эту статью, чтобы узнать о ключевых факторах цифровой трансформации.

Databricks — Основатели

Основатели Databricks
Основатели Databricks

Компания Databricks была основана парой профессоров Калифорнийского университета и пятью бывшими докторами философии из Беркли. студенты.

  • Али Годси , соучредитель и генеральный директор Databricks, был одним из создателей Apache Spark. Он был профессором Калифорнийского университета (UC), а также членом правления Rising Lab Калифорнийского университета. Он нес основную ответственность за рост и расширение Databricks по всему миру.
  • Ион Стойка , сооснователь и председатель Databricks, также является профессором Калифорнийского университета в Беркли. Он также является содиректором AMPLab. В дополнение к этому он стал соучредителем стартапа Conviva , занимающегося распространением видео в больших масштабах.
  • Матей Захария , соучредитель и главный технолог Databricks, ранее участвовал в проекте Spark, а сейчас является вице-президентом Apache Foundation. Премия ACM за докторскую диссертацию была вручена ему в 2014 году за исследования в области крупномасштабных компьютерных систем.
  • Патрик Венделл , соучредитель и вице-президент по разработке Databricks, сыграл важную роль в деятельности Spark.
  • Рейнольд Синь , соучредитель и главный архитектор, отвечает за технические операции в Apache Spark. Он выиграл награду за лучшее демо в 2011 году на VLDB.
  • Энди Конвински , соучредитель и вице-президент по управлению, отвечает за операции искусственного интеллекта в Databricks. Ранее он курировал рыночные усилия компании по созданию Spark Summit.
  • Арсалан Таваколи-Шираджи , соучредитель и старший вице-президент по проектированию в Databricks, ранее работал в McKinsey заместителем директора. Он был бывшим доктором философии. студент Калифорнийского университета в Беркли.

Databricks — история стартапа

Али Годси, генеральный директор Databricks, увлекался программированием с 8 лет, когда родители купили ему подержанный Commodore 64. Он получил высшее образование в области компьютерной инженерии и степень доктора философии. в распределенных вычислениях. Позже, в 2009 году, он объединился с Ионом Стойкой, и они вместе создали «Искру», инициатором которой уже был Матей Захария.

Далее они координировали свои действия с другой командой, работающей над машинным обучением, и вместе представили на рынке Apache Spark. Поначалу ни одна компания не обратила на это внимания, так как технология казалась чужой. В 2013 году Бен Горовиц (соучредитель Andreessen Horowitz VC) вселил в них некоторую надежду, инвестировав 14 миллионов долларов, и призвал их создать компанию, которая будет служить платформой для запуска Apache Spark. Таким образом, Databricks была создана в 2013 году.

Блоки данных — Миссия

Целью Databricks является повышение эффективности унификации данных за счет внедрения новых методов объединения данных, искусственного интеллекта и аналитики. Они стремятся сделать клиентский опыт более привлекательным.

Блоки данных — логотип

Логотип блоков данных
Логотип блоков данных

Логотип Databricks напоминает два кирпича, идеально выровненных, как папки с данными, расположенные на полке. Похоже, что Databricks намеревались сохранить в логотипе начальную и конечную точку без каких-либо перерывов между ними. Это может быть сделано для того, чтобы подразумевать, что они объединяют функции сбора, хранения и анализа данных на одной общей платформе без необходимости выхода, поскольку все описано здесь.

Databricks — модель бизнеса и доходов

Их бизнес-модель основана на веб-программном обеспечении, которое обеспечивает платформу для работы с Apache Spark. Он упрощает автоматическое управление группами и создание блокнотов в стиле Python для инженеров и ученых, работающих с данными.

Databricks предоставляет свои ресурсы в форме программного обеспечения как услуги (SaaS) и получает доход за счет своих подписок. Их основные услуги предоставляются через три облачные платформы, а именно:

  • Microsoft Azure
  • Google Облако
  • Веб-сервисы Amazon

Хотя цены для каждого облака различаются, следует отметить общий фактор: «Платите только за то, что используете» . Стоимость рассчитывается независимо от выбранных услуг и не требует предоплаты. Клиенты обязаны платить только за количество используемых ресурсов.

Блоки данных — сотрудники

По состоянию на 2023 год в Databricks работает более 5001–10 000 сотрудников по всему миру. В ноябре 2019 года Databricks отпраздновала юбилей, наняв для себя 1000-го штатного сотрудника. На то, чтобы набрать первую 1000 сотрудников, ушло 6 лет, а на найм остальных — менее 2 лет.

Databricks — Финансирование и инвесторы

Благодаря недавнему финансированию в размере 503,7 миллиона долларов США, Databricks привлекла 4 миллиарда долларов США в ходе 12 раундов финансирования с момента своего создания. На данный момент в Databricks вложили в общей сложности 49 инвесторов .

Дата Этап Количество Инвесторы
14 сентября 2023 г. Серия I 503,7 миллиона долларов Т. Роу Прайс
31 июля 2023 г. Вторичный рынок - -
3 марта 2023 г. Серия Н - -
4 сентября 2021 г. Ангел круглый 200 тысяч долларов -
31 августа 2021 г. Серия Н 1,6 миллиарда долларов Counterpoint Global (Morgan Stanley), Бэйли Гиффорд, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Франклин Темплтон, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, набор фондов BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, The House Fund Geodesic и Green Bay Ventures.
1 февраля 2021 г. Серия G 1 миллиард долларов Франклин Темплтон, Инвестиционный совет CPP, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital и Octahedron Capital.
22 октября 2019 г. Серия F 400 миллионов долларов Андреессен Горовиц, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic и Green Bay Ventures.
5 февраля 2019 г. Серия Е 250 миллионов долларов Андриссен Горовиц, Microsoft, Coatue, Battery Ventures, Ассоциация новых предприятий, Green Bay Ventures и Geodesic Capital.
22 августа 2017 г. Серия Д 140 миллионов долларов Ассоциация новых предприятий, Andreessen Horowitz, Battery Ventures, Geodesic Capital и Green Bay Ventures.
15 декабря 2016 г. Серия С 60 миллионов долларов Ассоциация новых предприятий, Andreessen Horowitz и SineWave Ventures.
30 июня 2014 г. Серия Б 33 миллиона долларов Ассоциация новых предприятий, Andreessen Horowitz и DCVC.
25 сентября 2013 г. Серия А 14 миллионов долларов Андриссен Горовиц, С.В. Анхель и Альфред Чуанг.

Блоки данных — Приобретения

Databricks на данный момент приобрела семь компаний. Ниже приведены подробности:

Имя учетной записи Дата Количество
Арцион 23 октября 2023 г. 100 миллионов долларов
МозаикаML 26 июня 2023 г. 1,3 миллиарда долларов
Окера 3 мая 2023 г. -
ДатаДжой Инк. 13 октября 2022 г. -
Кортекс Лабс 15 апреля 2022 г. -
8080 Лабораторий 6 октября 2021 г. -
Редаш 24 июня 2020 г. -

Список лучших стартапов в области облачных вычислений в Индии и их рост
Облачные вычисления стали новой нормой, эта тенденция породила огромное количество стартапов, которые полагаются на облако. Эти компании более эффективны.

Databricks — присутствие в социальных сетях

Databricks имеет хорошее присутствие в Twitter, а LinkedIn использует эти платформы для продвижения своих продуктов и услуг, чтобы получить преимущество на рынке. Они также публикуют информацию о своих мировых турах и мероприятиях, посвященных своим последним изобретениям. Ссылки на блоги и статьи, посвященные Databricks или их продуктам, а также информацию, связанную с вакансиями, также можно найти на их социальных платформах.

Databricks – рост и доходы

Компания Databricks была основана в 2013 году, в основе которой лежит технология Spark. За его созданием сразу же последовал слух о том, что «Spark Technology не будет работать, если ваши данные не поместятся в их память». Это отпугивало предприятия от использования Spark.

Наконец, в 2015 году основатели решили положить конец этим слухам, приняв участие в конкурсе, в котором они побили мировой рекорд по обработке одного петабайта данных за наименьшее время и в результате завоевали внимание СМИ и популярность.

К 2017 году их стоимость оценивалась в 500 миллионов долларов, но их годовой доход был намного ниже — 1 миллион долларов. Позже участие в «конкурсе по сортировке», внесение некоторых изменений в набор сотрудников и решение о создании программного обеспечения с функциями, востребованными крупными предприятиями, оказалось плодотворным.

С тех пор рост Databricks только растет. Их доход впервые достиг отметки в 100 миллионов долларов в 2018 году, а в 2019 году потребовался всего год, чтобы достичь 200 миллионов долларов. Внедрение функции Lakehouse стало основным фактором успеха. Оценка компании выросла с $6,2 млрд в третьем квартале 2019 года до примерно $38 млрд в третьем квартале 2021 года.

Databricks сообщила, что годовой регулярный доход в 2020 году составил 425 миллионов долларов.

Databricks сообщила, что за финансовый год, завершившийся 31 января 2023 года, она принесла доход более 1 миллиарда долларов. Компания сообщила, что в предыдущем 2022 году она выросла более чем на 60%.


Топ-15 самых дорогих стартапов в мире
Вот список 15 самых дорогих стартапов в мире. Материнская компания TikTok, Bytedance, является самым ценным стартапом в мире с оценкой в ​​280 миллиардов долларов.

Блоки данных — продукты и функции

Некоторые из последних заметных запусков:

Единство данных с новым выпуском Delta Lake

Databricks анонсировала новую версию своего формата хранения данных Delta Lake 28 июня 2023 года. По заявлению компании, эта версия устраняет разрозненность данных. Последним дополнением к конкурирующим стандартам с открытым исходным кодом для таблиц аналитических данных в системах озер данных является Delta Lake 3.0, который включает Iceberg и Hudi от Apache Foundation.

Долли

24 марта 2023 года компания Databricks представила языковую модель с открытым исходным кодом, которая позволяет программистам создавать свои собственные приложения-чат-боты, управляемые искусственным интеллектом.

Федерация Лейкхауса

28 июня 2023 года на саммите Data + AI компания Databricks запустила так называемую функцию Lakehouse Federation. Благодаря этой новой функции компании могут обнаруживать, запрашивать и администрировать свои данные на широком спектре платформ, объединяя их разрозненные данные. закрытые системы данных.

Блоки данных — партнерство

Databricks сотрудничает со многими компаниями. Некоторые из последних выдающихся партнерств:

Майкрософт

Благодаря новому партнерству с Databricks в августе 2023 года по продвижению инструментов разработки приложений на основе искусственного интеллекта Microsoft расширила масштабы своих целей в области искусственного интеллекта. Компании смогут создавать свои собственные модели искусственного интеллекта с нуля с помощью программного обеспечения Databricks.

Кобай

11 сентября 2023 года Databricks и Kobai заключили партнерство. Клиенты могут воспользоваться мощью и масштабируемостью платформы Databricks Lakehouse, а также простотой и информативностью графиков знаний.

3i Инфотек

Чтобы создать ценность для бизнеса за счет объединения данных и искусственного интеллекта на единой платформе, 3i Infotech Ltd и Databricks заключили партнерское соглашение 18 октября 2023 года.

Блоки данных — инвестиции

Databricks инвестировала в 24 компании. Некоторые из инвестиций перечислены ниже:

Имя учетной записи Дата Количество
Недоумение ИИ 2022 год -
Арцион 2018 год -
Пророчество.io Январь 2017 г. -
Катализатор Сентябрь 2017 г. -
Чистая лаборатория - -

Блоки данных — конкуренты

Некоторые из главных конкурентов Databricks:

  • Снежинка
  • Клаудера
  • Датастакс
  • Куболе
  • МАТЛАБ
  • Альтерикс
  • Дремио
  • Интелликус

Вот несколько сравнений с некоторыми конкурентами:

Снежинка. Снежинка намного больше, чем Databricks. Оба они предлагают схожие услуги с небольшими различиями (Databricks обрабатывает большие данные, а Snowflake предлагает гибкость облачных данных для централизованного доступа) по гибкой цене. Databricks ведет долгую борьбу за победу над своим конкурентом.

Cloudera — Cloudera предоставляет общую облачную платформу хранения и управления, которая хранит, обрабатывает и анализирует данные для организации. Он аналогичен Databricks в форме хранилища, обработки и распространения данных.


Встроенные инструменты BI для SaaS | SaaS-программное обеспечение для бизнес-аналитики
Что такое встроенный BI? Встроенная бизнес-аналитика — это интеграция возможностей бизнес-аналитики в приложения или порталы бизнес-процессов. Подробнее читайте здесь!

Блоки данных — планы на будущее

Очевидно, что в 2021 году Databricks работала над двумя наиболее быстрорастущими областями больших данных: потоковой передачей и глубоким обучением. Они создавали многогранный интерфейс прикладного программирования (API) для обработки этих двух областей. Databricks также стремится ускорить внедрение инноваций Data Lakehouse, чтобы получить большее преимущество за счет завоевания организаций, ориентированных на данные.

Согласно их веб-сайту, Databricks планирует включить функцию избранного в рабочей области. Заметки, информационные панели, эксперименты и результаты поиска можно сохранить в списке избранного, к которому затем можно получить доступ с главной страницы.

Блоки данных: часто задаваемые вопросы

Что такое блоки данных?

Databricks — это облачный инструмент для хранения и обработки огромных объемов данных с использованием моделей машинного обучения. Это делается с помощью инструмента Apache Spark.

Кто основал Databricks?

Соучредителями Databricks выступили семь человек, а именно: Али Годси, Ион Стойка, Матей Захария, Патрик Венделл, Рейнольд Синь, Энди Конвински и Арсалан Таваколи-Шираджи.

Какую сумму Databricks получила за счет финансирования?

Databricks получила около 4 миллиардов долларов в ходе 12 раундов финансирования.

Каков годовой доход Databricks?

Databricks сообщила о годовом периодическом доходе (ARR) в размере 1,275 миллиарда долларов за год, заканчивающийся 2022 году.

Кто являются клиентами Databricks?

У Databricks более 6000 клиентов по всему миру. Некоторые из их популярных клиентов:

  • Оболочка
  • Здоровье CVS
  • Регенерон
  • T-Mobile
  • HSBC
  • Комкаст