Google Colab: все, что вам нужно знать

Опубликовано: 2022-08-16

Google Colab делает науку о данных, глубокое обучение, нейронные сети и машинное обучение доступными для отдельных исследователей, которые не могут позволить себе дорогостоящую вычислительную инфраструктуру.

Машинное обучение и наука о данных — это две новые технологии, в которых все новое поколение ученых-компьютерщиков хотят преуспеть. Существует множество обучающих онлайн-курсов, бесплатных лекций и онлайн-руководств по машинному обучению и науке о данных.

Но практика в проектах становится ограничением, поскольку для таких рабочих нагрузок вам нужны высокопроизводительные ПК. Ответом на этот вопрос является Google Colaboratory или, короче говоря, Colab. Продолжайте читать, чтобы получить полный обзор Google Colab.

Что такое Google Colab?

YouTube видео

Colab — это похожий на Jupyter Notebook продукт от Google Research. Разработчик программ на Python может использовать этот блокнот для написания и выполнения произвольных программных кодов на Python, просто используя веб-браузер.

Вкратце, Colab — это облачная версия Jupyter Notebook. Чтобы использовать Colab, вам не нужно устанавливать и запускать или обновлять аппаратное обеспечение вашего компьютера, чтобы соответствовать требованиям Python к интенсивной рабочей нагрузке ЦП / ГП. Кроме того, Colab предоставляет вам бесплатный доступ к вычислительной инфраструктуре, такой как хранилище, память, вычислительная мощность, графические процессоры (GPU) и тензорные процессоры (TPU).

Google специально запрограммировал этот облачный инструмент кодирования Python с учетом потребностей программистов машинного обучения, аналитиков больших данных, специалистов по данным, исследователей искусственного интеллекта и изучающих Python.

Лучшая часть — это один блокнот с кодом для всех компонентов, необходимых для представления полного проекта по машинному обучению или науке о данных руководителям программ или спонсорам. Например, ваш блокнот Colab может содержать исполняемые коды, живые коды Python, форматированный текст, HTML, LaTeX, изображения, визуализации данных, диаграммы, графики, таблицы и многое другое.

Что делает Google Colab?

Что делает Google Colab

Google Colab — это просто онлайн-представление Jupyter Notebook. В то время как Jupyter Notebook требует установки на компьютер и может использовать только ресурсы локального компьютера, Colab — это полноценное облачное приложение для кодирования Python.

Вы можете писать коды Python с помощью Colab в веб-браузерах Google Chrome или Mozilla Firefox. Вы также можете выполнять эти коды в браузере без использования какой-либо среды выполнения или интерфейса командной строки.

Кроме того, вы можете придать своему блокноту проекта Python профессиональный вид, добавив математические уравнения, графики, таблицы, изображения и другую графику. Кроме того, вы можете кодировать визуализацию данных в Python, и Colab отобразит код в визуальном активе.

Кроме того, Colab позволяет повторно использовать файлы Jupyter Notebook из GitHub. Кроме того, вы также можете импортировать совместимые проекты машинного обучения и науки о данных из других источников. Colab эффективно обрабатывает импортированные ресурсы для отображения чистого и безошибочного кода Python.

Лучшие функции Google Colab

YouTube видео

GPU и TPU

Бесплатные пользователи Colab получают бесплатный доступ к средам выполнения GPU и TPU на срок до 12 часов. Его среда выполнения GPU поставляется с процессором Intel Xeon @ 2,20 ГГц, 13 ГБ ОЗУ, ускорителем Tesla K80 и 12 ГБ видеопамяти GDDR5.

Среда выполнения TPU состоит из процессора Intel Xeon с частотой 2,30 ГГц, 13 ГБ ОЗУ и облачного TPU с вычислительной мощностью 180 терафлопс.

С Colab Pro или Pro+ вы можете задействовать больше процессоров, TPU и GPU на срок более 12 часов.

Совместное использование ноутбука

Блокнот кода Python никогда не был доступен до Colab. Теперь вы можете создавать общие ссылки для файлов Colab, сохраненных на вашем Google Диске. Теперь поделитесь ссылкой с соавтором, который хочет работать с вами. Кроме того, вы также можете пригласить программистов для работы с вами, используя электронную почту Google.

Установка специальной библиотеки

Colab позволяет устанавливать сторонние библиотеки (AWS S3, GCP, SQL, MySQL и т. д.), которые недоступны во фрагментах кода. Все, что вам нужно сделать, это добавить однострочный код со следующими префиксами кода:

 !pip install (example: !pip install matplotlib-venn)
 !apt-get install (example: !apt-get -qq install -y libfluidsynth1)

Предустановленные библиотеки

Google Colab предлагает несколько предустановленных библиотек, чтобы вы могли импортировать необходимую библиотеку из фрагментов кода. К таким библиотекам относятся NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras и другие библиотеки машинного обучения.

Совместное кодирование

Совместное кодирование

Совместное кодирование незаменимо для групповых проектов. Это помогает вашей команде выполнять вехи раньше ожидаемого срока. Если вашей команде требуется совместная работа в режиме реального времени над проектами по машинному обучению и науке о данных, Google Collaborative — это как раз то, что вам нужно.

Просто отправьте редактируемую ссылку с соавторами или пригласите соавторов для группового кодирования. Вся записная книжка Python обновляется автоматически по мере написания кода команды, и вы почувствуете, что работаете с общими Google Sheets или Docs.

Облачное хранилище

Google Colab использует вашу квоту хранилища Google Диска для сохранения файлов. Следовательно, вы можете возобновить работу с любого компьютера, на котором у вас есть доступ к вашей учетной записи Google Диска.

Облачное хранилище также функционирует как резервная копия ваших данных от любых бедствий.

Интеграция с GitHub

Вы можете связать свою учетную запись GitHub с Google Colab, чтобы легко импортировать и экспортировать файлы кода. Для импорта вы можете нажать Ctrl+O и щелкнуть вкладку GitHub, чтобы получить файлы кода. Напротив, просто нажмите «Сохранить копию на GitHub» в меню «Файл», чтобы отправить файлы на GitHub.

Несколько источников данных

Google Colaboratory поддерживает различные источники данных для ваших учебных проектов по машинному обучению и искусственному интеллекту. Например, вы можете импортировать данные с локального компьютера, подключить Google Диск к экземпляру Colab, получить удаленные данные и клонировать репозиторий GitHub в Colab.

Автоматический контроль версий

Как и Google Sheets и Docs, Google Colab также имеет исчерпывающий трекер истории. Модуль отслеживает все изменения, внесенные с момента создания файла. Вы можете получить доступ к журналам из меню «Файл» и выбрать параметр «История изменений».

Почему вы должны выбрать Google Colab?

Почему вы должны выбрать Google Colab
  • Google Colaboratory — это облачный инструмент. Вы можете начать кодировать фантастические модели машинного обучения и обработки данных с помощью браузера Chrome.
  • Colab бесплатен с ограниченными ресурсами. Однако не стоит ожидать, что вы сможете бесконечно хранить свои модели искусственного интеллекта или машинного обучения в бесплатной инфраструктуре Colab.
  • Если вы знаете, как работать с Jupyter, вам не нужно проходить обучение в Google Colaboratory.
  • Бесплатный доступ к GPU и TPU для обширных моделей обработки данных и машинного обучения.
  • Он поставляется с предустановленными и популярными библиотеками данных.
  • Кодировщики могут легко поделиться блокнотом кода с коллегами для кодирования в реальном времени.
  • Поскольку Google размещает записную книжку в Google Cloud, вам не нужно беспокоиться о контроле версий и хранении документов кода.
  • Легко интегрируется с GitHub.
  • Вы можете обучать ИИ с помощью изображений.
  • Вы также можете обучать модели аудио и тексту.
  • Исследователи также могут запускать программы TensorFlow в Colab.

Как использовать Google Colab

Как использовать Google Colab

Вы можете использовать Google Colaboratory, если соответствуете следующим минимальным требованиям:

  • Учетная запись Google, чтобы испытать все удобства Colab.
  • Компьютер с последней версией браузера Google Chrome или Mozilla Firefox.
  • Google рекомендует Chrome для Colab.
  • Примите условия использования данных Google.

Вы можете получить доступ к Google Colaboratory с официального сайта. Colab бесплатен; однако ограниченное выделение ресурсов не всегда гарантировано. Если вам нужно больше скорости и возможностей обработки с гарантированными ресурсами, вы можете получить Colab Pro или Pro+.

Колаб Про

Некоторые модели обработки данных и машинного обучения, подходящие для Colab, можно найти в Google Seedbank.

Различия между Google Colab и Jupyter Notebook

Возможности кодового документа Совместная работа Google Блокнот Юпитера
Мгновенный просмотр файла кода Да Нет
Совместное использование документа с кодом Да Нет
Установленные библиотеки Да Нет
Облачный хостинг Да Нет
Синхронизация файлов Да Нет

# 1 . Colab не требует установки программного обеспечения на локальный компьютер. Напротив, Jupyter Notebook требует установки программного обеспечения и ресурсов локального компьютера для вычислений.

# 2 . Поскольку Colab основан на облаке, вы получаете автоматический контроль версий. Кроме того, Google Диск автоматически сохраняет записную книжку Python. Напротив, в Jupyter Notebook вам необходимо периодически сохранять блокнот и управлять контролем версий.

# 3 . Файлы Colab доступны на Google Диске для резервного копирования. С другой стороны, файлы Jupyter Notebook не резервируются автоматически.

# 4 . Вы можете отправлять свои файлы Colab кому угодно, даже клиенту, который не является специалистом по данным. Они могут легко открыть документ в Google Colab и просмотреть его содержимое. Со стороны получателя не требуется установка программного обеспечения.

Напротив, получатель должен установить и запустить Jupyter Notebook, чтобы прочитать ваш проект. Следовательно, обмен этим файлом с клиентами, не занимающимися наукой о данных, становится проблемой.

# 5 . Google Colaboratory поставляется с необходимыми библиотеками для проектов по науке о данных и машинному обучению. Это также дает вам определенное количество процессора, оперативной памяти, графического процессора и TPU в облаке. Таким образом, вы экономите время и деньги.

Напротив, вам необходимо найти и установить все библиотеки, необходимые для вашего проекта, если вы работаете с приложением Jupyter Notebook. Установка такого количества библиотек также потребляет ресурсы ЦП, ОЗУ и графического процессора локальной машины.

Выполнение общих задач в Google Colab

Создать блокнот

Создайте блокнот в Google Colab
  • Перейдите на портал Google Colab и увидите «Добро пожаловать в Colab!»
  • В верхнем меню нажмите « Файл» .
  • В контекстном меню «Файл» выберите « Новый блокнот ».
  • Ваш новый блокнот Python готов. Вы можете переименовать файл блокнота.

Загружать и скачивать файлы

Вы можете загрузить локальные коды Python в Colab, выполнив следующие действия:

Загрузить блокнот в Google Colab
  • В верхнем меню нажмите « Файл» .
  • Откроется контекстное меню с множеством опций.
  • Найдите Загрузить блокнот и нажмите на него.
  • Теперь вы увидите наложенную консоль с такими параметрами, как «Примеры», «Google Диск», «GitHub» и «Загрузить».
  • Нажмите на любую вкладку и выберите содержимое кода, которое вы хотите загрузить.

Загрузка вашего незавершенного или готового проекта также очень проста. Вот шаги:

Скачать блокнот из Google Colab
  • Щелкните меню « Файл» , расположенное в верхней строке меню.
  • Наведите курсор на Скачать .
  • Откроется контекстное меню с двумя вариантами формата загружаемого файла: .ipynb и .py.
  • Вы можете выбрать предпочтительный формат и скачать файл.

Доступ к GitHub

Доступ к GitHub в Colab очень прост. Вот что вы можете сделать:

Доступ к репозиторию GitHub из Colaboratory
  • Нажмите « Файл » в верхней строке меню.
  • Выберите Загрузить блокнот в контекстном меню.
  • Откроется консоль с вкладкой GitHub .
  • Кроме того, вы можете нажать Ctrl + O , чтобы получить доступ к той же консоли.
  • Параметры поиска GitHub — URL-адрес GitHub, имя пользователя и название организации.

Доступ к локальным файлам

  • Нажмите Ctrl+O на своем новом блокноте Colab.
  • Выберите вкладку « Загрузить » на появившейся консоли.
  • Нажмите « Выбрать файл» , чтобы найти локальный файл, который вы хотите открыть в Colab.

Доступ к Google Диску

Доступ к Google Диску
  • Нажмите « Файл » в верхнем меню.
  • Вы можете выбрать Открыть блокнот или Загрузить блокнот .
  • Появится консоль с вкладкой для Google Диска .
  • Нажмите на нее, чтобы получить доступ к файлам с Google Диска.

Если вы хотите подключить Google Диск к своему экземпляру Colab, выполните следующие действия:

Подключите Google Диск к вашему экземпляру Colab
  • Нажмите « Файл» , расположенный на левой панели навигации.
  • Выберите команду « Подключить диск ».
  • В появившемся уведомлении выберите Подключиться к Google Диску .
  • Google попросит вас выбрать аккаунт для авторизации.

Сохранить и импортировать из Google Sheets

Вы можете легко сохранить данные записной книжки в файл Google Sheets для дальнейшей обработки. Для этого попробуйте выполнить следующие действия:

Доступ к Google Таблицам
  • Нажмите кнопку « Фрагменты кода» в левом нижнем углу.
  • Панель навигации откроется с правой стороны.
  • Введите « Листы » в фильтре, и вы найдете фрагменты кода « Сохранение данных » и « Импорт данных ».
  • Дважды щелкните заголовок, чтобы включить код в записную книжку.

Доступ к AWS S3

Вы можете получить доступ к файлам и ресурсам кода из облачных платформ хранения, таких как AWS S3 и Azure Blob, с помощью сегментов облачного хранилища.

Доступ к AWS S3

Для этого вы должны установить ByteHub, который имеет функции для загрузки и сохранения данных в облачное хранилище. Вы можете запустить следующий код:

 !pip install -q bytehub[aws]

Доступ к наборам данных Kaggle

Доступ к наборам данных Kaggle
  • Перейдите в учетную запись Kaggle и нажмите Expire API Token в разделе API, чтобы удалить старые токены.
  • Создайте новый токен API , чтобы получить kaggle.json на локальном компьютере.
  • Теперь используйте следующий код для установки Kaggle:
 !pip install -q kaggle
  • Теперь загрузите файл Kaggle.json в базу кода Python, следуя стандартной практике кодирования.

Заключительные слова

Теперь, когда вы подробно изучили приложение Google Collaboratory, вы сможете приступить к обучению, обучению или практике проектов машинного обучения. Google Colab — действительно удобное облачное приложение для тех, кто любит Jupyter Notebooks.

Вас также могут заинтересовать некоторые популярные открытые наборы данных для проектов по науке о данных.