Google Colab: Alles, was Sie wissen müssen
Veröffentlicht: 2022-08-16Google Colab macht Data Science, Deep Learning, neuronale Netzwerke und maschinelles Lernen für einzelne Forscher zugänglich, die sich keine kostspielige Recheninfrastruktur leisten können.
Maschinelles Lernen und Data Science sind die beiden neuen Technologien, in denen sich alle Informatiker der neuen Generation auszeichnen wollen. Es gibt viele Online-Lernkurse, kostenlose Vorträge und Online-Anleitungen zu ML und Data Science.
Das Üben an Projekten wird jedoch zu einer Einschränkung, da Sie für solche Workloads High-End-PCs benötigen. Die Antwort auf dieses Problem ist Google Colaboratory oder kurz Colab. Lesen Sie weiter, um die ultimative Bewertung von Google Colab zu erhalten.
Was ist Google Colab?
Colab ist ein Jupyter Notebook-ähnliches Produkt von Google Research. Ein Python-Programmentwickler kann dieses Notebook verwenden, um zufällige Python-Programmcodes zu schreiben und auszuführen, indem er einfach einen Webbrowser verwendet.
Kurz gesagt, Colab ist eine in der Cloud gehostete Version von Jupyter Notebook. Um Colab zu verwenden, müssen Sie Ihre Computerhardware nicht installieren und ausführen oder aktualisieren, um die CPU-/GPU-intensiven Workload-Anforderungen von Python zu erfüllen. Darüber hinaus bietet Ihnen Colab freien Zugriff auf Computerinfrastruktur wie Speicher, Arbeitsspeicher, Verarbeitungskapazität, Grafikprozessoren (GPUs) und Tensor-Verarbeitungseinheiten (TPUs).
Google hat dieses Cloud-basierte Python-Codierungstool speziell unter Berücksichtigung der Bedürfnisse von Programmierern für maschinelles Lernen, Big-Data-Analysten, Datenwissenschaftlern, KI-Forschern und Python-Lernern programmiert.
Das Beste daran ist ein Code-Notizbuch für alle Komponenten, die erforderlich sind, um ein vollständiges Machine-Learning- oder Data-Science-Projekt den Programmverantwortlichen oder Sponsoren vorzustellen. Ihr Colab-Notebook kann beispielsweise ausführbare Codes, Live-Python-Codes, Rich-Text, HTML, LaTeX, Bilder, Datenvisualisierungen, Diagramme, Grafiken, Tabellen und mehr enthalten.
Was macht Google Colab?

Google Colab ist einfach eine Online-Darstellung von Jupyter Notebook. Während Jupyter Notebook auf einem Computer installiert werden muss und nur lokale Maschinenressourcen nutzen kann, ist Colab eine vollwertige Cloud-App für die Python-Codierung.
Sie können Python-Codes mit Colab in Ihren Webbrowsern Google Chrome oder Mozilla Firefox schreiben. Sie können diese Codes auch im Browser ausführen, ohne dass eine Laufzeitumgebung oder eine Befehlszeilenschnittstelle erforderlich ist.
Darüber hinaus können Sie Ihrem Python-Projektnotizbuch ein professionelles Aussehen verleihen, indem Sie mathematische Gleichungen, Grafiken, Tabellen, Bilder und andere Grafiken hinzufügen. Darüber hinaus können Sie Datenvisualisierungen in Python codieren, und Colab rendert den Code in einem visuellen Asset.
Darüber hinaus können Sie mit Colab Jupyter Notebook-Dateien von GitHub wiederverwenden. Abgesehen davon können Sie auch kompatible Machine-Learning- und Data-Science-Projekte aus anderen Quellen importieren. Colab verarbeitet die importierten Assets effizient, um saubere und fehlerfreie Python-Codes anzuzeigen.
Beste Funktionen von Google Colab
GPUs und TPUs
Kostenlose Colab-Benutzer erhalten gebührenfreien Zugriff auf GPU- und TPU-Laufzeiten für bis zu 12 Stunden. Seine GPU-Laufzeit kommt mit Intel Xeon CPU @2.20 GHz, 13 GB RAM, Tesla K80 Beschleuniger und 12 GB GDDR5 VRAM.
Die TPU-Laufzeit besteht aus einer Intel Xeon CPU @2,30 GHz, 13 GB RAM und einer Cloud-TPU mit 180 Teraflops Rechenleistung.
Mit Colab Pro oder Pro+ können Sie mehr CPUs, TPUs und GPUs für mehr als 12 Stunden in Betrieb nehmen.
Notebook-Freigabe
Python-Code-Notebook war vor Colab noch nie zugänglich. Jetzt können Sie gemeinsam nutzbare Links für Colab-Dateien erstellen, die auf Ihrem Google Drive gespeichert sind. Teilen Sie jetzt den Link mit dem Mitarbeiter, der mit Ihnen zusammenarbeiten möchte. Darüber hinaus können Sie auch Programmierer einladen, mit Google-E-Mails mit Ihnen zusammenzuarbeiten.
Spezielle Bibliotheksinstallation
Mit Colab können Sie Nicht-Colaboratory-Bibliotheken (AWS S3, GCP, SQL, MySQL usw.) installieren, die in den Code-Snippets nicht verfügbar sind. Sie müssen lediglich einen Einzeiler-Code mit den folgenden Code-Präfixen hinzufügen:
!pip install (example: !pip install matplotlib-venn) !apt-get install (example: !apt-get -qq install -y libfluidsynth1)Vorinstallierte Bibliotheken
Google Colab bietet mehrere vorinstallierte Bibliotheken, sodass Sie die erforderliche Bibliothek aus Code-Snippets importieren können. Zu diesen Bibliotheken gehören NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras und weitere ML-Bibliotheken.
Kollaborative Codierung

Co-Coding ist für Gruppenprojekte unverzichtbar. Es hilft Ihrem Team, Meilensteine früher als im erwarteten Zeitrahmen abzuschließen. Wenn Ihr Team Echtzeit-Zusammenarbeit bei ML- und Data-Science-Projekten benötigt, ist Google Collaborative genau das richtige Tool.
Senden Sie einfach einen bearbeitbaren Link mit den Mitarbeitern oder laden Sie Mitarbeiter zur Gruppenkodierung ein. Das gesamte Python-Notizbuch wird automatisch aktualisiert, wenn das Team codiert, und Sie haben das Gefühl, an gemeinsam genutzten Google-Tabellen oder -Dokumenten zu arbeiten.
Cloud-Speicher
Google Colab verwendet Ihr Google Drive-Speicherkontingent zum Speichern von Dateien. Daher können Sie die Arbeit von jedem Computer aus fortsetzen, auf dem Sie auf Ihr Google Drive-Konto zugreifen können.
Cloud-Speicher fungiert auch als Backup Ihrer Daten vor Katastrophen.
GitHub-Integration
Sie können Ihr GitHub-Konto mit Google Colab verknüpfen, um Codedateien nahtlos zu importieren und zu exportieren. Für den Import können Sie Strg+O drücken und auf die Registerkarte GitHub klicken, um Codedateien abzurufen. Klicken Sie im Gegenteil einfach im Menü Datei auf Kopie auf GitHub speichern, um Dateien an GitHub zu senden.
Mehrere Datenquellen
Google Colaboratory unterstützt verschiedene Datenquellen für Ihre ML- und KI-Schulungsprojekte. Sie können beispielsweise Daten von einem lokalen Computer importieren, Google Drive in einer Colab-Instanz mounten, Remote-Daten abrufen und ein GitHub-Repository in Colab klonen.
Automatische Versionskontrolle
Wie Google Sheets und Docs verfügt auch Google Colab über einen umfassenden Verlaufstracker. Das Modul verfolgt alle Änderungen, die seit der Dateierstellung vorgenommen wurden. Sie können auf die Protokolle über das Menü Datei zugreifen und auf die Option Revisionsverlauf klicken.
Warum sollten Sie sich für Google Colab entscheiden?

- Google Colaboratory ist ein Cloud-basiertes Tool. Sie können mit dem Codieren fantastischer ML- und Data-Science-Modelle mit einem Chrome-Browser beginnen.
- Colab ist kostenlos mit begrenzten Ressourcen. Sie sollten jedoch nicht erwarten, dass Sie Ihre Modelle für künstliche Intelligenz oder maschinelles Lernen unbegrenzt auf der kostenlosen Infrastruktur von Colab speichern können.
- Wenn Sie wissen, wie Sie mit Jupyter arbeiten, müssen Sie bei Google Colaboratory keine Lernkurve durchlaufen.
- Freier Zugriff auf GPUs und TPUs für umfangreiche Data-Science- und Machine-Learning-Modelle.
- Es wird mit vorinstallierten und beliebten Data-Science-Bibliotheken geliefert.
- Programmierer können das Code-Notizbuch ganz einfach mit Mitarbeitern teilen, um in Echtzeit zu programmieren.
- Da Google das Notebook in Google Cloud hostet, müssen Sie sich keine Gedanken über die Versionskontrolle und Speicherung von Codedokumenten machen.
- Einfache Integration mit GitHub.
- Sie können KI mit Bildern trainieren.
- Sie können Modelle auch mit Audio und Text trainieren.
- Forscher können auch TensorFlow-Programme auf Colab ausführen.
So verwenden Sie Google Colab

Sie können Google Colaboratory verwenden, wenn Sie die folgenden Mindestanforderungen erfüllen:
- Ein Google-Konto, um alle Vorteile von Colab zu erleben.
- Ein Computer, auf dem der neueste Google Chrome- oder Mozilla Firefox-Browser ausgeführt werden kann
- Google empfiehlt Chrome für Colab.
- Akzeptieren Sie die Datennutzungsbedingungen von Google.
Sie können über die offizielle Website von Google Colaboratory darauf zugreifen. Colab ist kostenlos; begrenzte Ressourcenzuteilungen sind jedoch nicht immer garantiert. Wenn Sie mehr Geschwindigkeit und Verarbeitungskapazitäten mit garantierten Ressourcen benötigen, können Sie Colab Pro oder Pro+ erwerben.


Einige für Colab geeignete Modelle für Data Science und maschinelles Lernen finden Sie in der Google Seedbank.
Die Unterschiede zwischen Google Colab und Jupyter Notebook
| Code-Doc-Funktionen | Google-Kooperation | Jupyter-Notizbuch |
| Sofortiges Anzeigen von Codedateien | Ja | Nein |
| Teilen von Codedokumenten | Ja | Nein |
| Installierte Bibliotheken | Ja | Nein |
| Cloud-Hosting | Ja | Nein |
| Synchronisieren von Dateien | Ja | Nein |
#1 . Colab benötigt keine Softwareinstallationen auf dem lokalen Rechner. Im Gegensatz dazu erfordert Jupyter Notebook Softwareinstallationen und lokale Maschinenressourcen für die Berechnung.
#2 . Da Colab cloudbasiert ist, erhalten Sie eine automatische Versionskontrolle. Außerdem speichert Google Drive das Python-Notizbuch automatisch. Im Gegensatz dazu müssen Sie bei Jupyter Notebook das Notebook regelmäßig speichern und die Versionskontrolle verwalten.
#3 . Colab-Dateien sind zu Sicherungszwecken auf Google Drive verfügbar. Andererseits werden Jupyter Notebook-Dateien nicht automatisch gesichert.
#4 . Sie können Ihre Colab-Dateien an jeden senden, sogar an einen Kunden, der kein Datenwissenschaftler ist. Sie können das Dokument ganz einfach in Google Colab öffnen und den Inhalt überprüfen. Seitens des Empfängers ist keine Softwareinstallation erforderlich.
Im Gegenteil, der Empfänger muss Jupyter Notebook installieren und ausführen, um Ihr Projekt zu lesen. Daher wird die gemeinsame Nutzung dieser Datei mit Nicht-Data-Science-Clients zu einer Herausforderung.

#5 . Google Colaboratory enthält die erforderlichen Bibliotheken für Data-Science- und Machine-Learning-Projekte. Es gibt Ihnen auch eine bestimmte Menge an CPU, RAM, GPU und TPU in der Cloud. So sparen Sie Zeit und Geld.
Im Gegensatz dazu müssen Sie alle für Ihr Projekt erforderlichen Bibliotheken beziehen und installieren, wenn Sie an der Jupyter Notebook-App arbeiten. Die Installation so vieler Bibliotheken verbraucht auch die CPU-, RAM- und GPU-Ressourcen des lokalen Computers.
Ausführen häufiger Aufgaben auf Google Colab
Erstellen Sie ein Notizbuch

- Gehen Sie zum Google Colab-Portal und sehen Sie "Willkommen bei Colab!"
- Klicken Sie im oberen Menü auf Datei .
- Wählen Sie im Kontextmenü Datei die Option Neues Notizbuch .
- Ihr neues Python-Notebook ist fertig. Sie können die Notebook-Datei umbenennen.
Dateien hochladen und herunterladen
Sie können lokale Python-Codes in Colab hochladen, indem Sie diesen Schritten folgen:

- Klicken Sie im oberen Menü auf Datei .
- Es öffnet sich ein Kontextmenü mit vielen Optionen.
- Finden Sie Notizbuch hochladen und klicken Sie darauf.
- Sie sehen nun eine überlagerte Konsole mit Optionen wie Beispiele, Google Drive, GitHub und Hochladen.
- Klicken Sie auf eine beliebige Registerkarte und wählen Sie den Codeinhalt aus, den Sie hochladen möchten.
Das Herunterladen Ihres laufenden oder abgeschlossenen Projekts ist ebenfalls super einfach. Hier sind die Schritte:

- Klicken Sie auf das Menü Datei in der oberen Menüleiste.
- Bewegen Sie den Mauszeiger über Herunterladen .
- Es öffnet sich ein Kontextmenü mit zwei Download-Dateiformatoptionen: .ipynb und .py.
- Sie können ein bevorzugtes Format auswählen und die Datei herunterladen.
Greifen Sie auf GitHub zu
Der Zugriff auf GitHub ist in Colab ein Kinderspiel. Folgendes können Sie tun:

- Klicken Sie in der oberen Menüleiste auf Datei .
- Wählen Sie im Kontextmenü Notizbuch hochladen.
- Eine Konsole mit einem GitHub -Tab wird geöffnet.
- Alternativ können Sie Strg+O drücken, um auf dieselbe Konsole zuzugreifen.
- GitHub-Suchoptionen sind GitHub-URL, Benutzername und Name der Organisation.
Greifen Sie auf lokale Dateien zu
- Drücken Sie Strg+O auf Ihrem neuen Colab-Notebook.
- Wählen Sie in der angezeigten Konsole die Registerkarte Hochladen aus.
- Klicken Sie auf Datei auswählen , um die lokale Datei zu suchen, die Sie in Colab öffnen möchten.
Greifen Sie auf Google Drive zu

- Klicken Sie im oberen Menü auf Datei .
- Sie können Notizbuch öffnen oder Notizbuch hochladen auswählen.
- Es erscheint eine Konsole mit einer Registerkarte für Google Drive .
- Klicken Sie darauf, um auf Dateien von Google Drive zuzugreifen.
Wenn Sie Google Drive in Ihrer Colab-Instanz bereitstellen möchten, gehen Sie folgendermaßen vor:

- Klicken Sie im linken Navigationsbereich auf Datei .
- Wählen Sie den Befehl Mount Drive aus.
- Wählen Sie in der angezeigten Benachrichtigung Mit Google Drive verbinden aus .
- Google fordert Sie auf, ein Konto für die Autorisierung auszuwählen.
In Google Sheets speichern und daraus importieren
Sie können Ihre Notizbuchdaten zur weiteren Verarbeitung mühelos in einer Google Sheets-Datei speichern. Versuchen Sie dazu die folgenden Schritte:

- Klicken Sie unten links auf die Schaltfläche Code-Snippets .
- Auf der rechten Seite öffnet sich ein Navigationsbereich.
- Geben Sie Sheets in den Filter ein, und Sie werden Save data und Importing data code snippets finden.
- Doppelklicken Sie auf den Titel, um den Code in das Notizbuch aufzunehmen.
Greifen Sie auf AWS S3 zu
Sie können auf Dateien und Codierungsressourcen von Cloud-Speicherplattformen wie AWS S3 und Azure Blob zugreifen, indem Sie Cloud-Speicher-Buckets verwenden.

Dazu müssen Sie ByteHub installieren, das über die Funktionen zum Laden und Speichern von Daten auf Cloud-Speicher verfügt. Sie können den folgenden Code ausführen:
!pip install -q bytehub[aws]Greifen Sie auf Kaggle-Datensätze zu

- Gehen Sie zum Kaggle-Konto und klicken Sie im API-Bereich auf API-Token ablaufen lassen, um alte Token zu entfernen.
- Erstellen Sie ein neues API-Token , um kaggle.json auf dem lokalen Computer abzurufen.
- Verwenden Sie nun den folgenden Code, um Kaggle zu installieren:
!pip install -q kaggle- Laden Sie nun die Kaggle.json-Datei gemäß einer standardmäßigen Codierungspraxis in die Python-Codebasis hoch.
Letzte Worte
Nachdem Sie sich nun ausführlich mit der Google Collaboratory App auseinandergesetzt haben, sollten Sie in der Lage sein, Ihre Lern-, Schulungs- oder Übungsprojekte für maschinelles Lernen zu starten. Google Colab ist eine wirklich praktische Cloud-App für diejenigen, die Jupyter Notebooks mögen.
Möglicherweise interessieren Sie sich auch für einige beliebte offene Datensätze für Data-Science-Projekte.


