Google Colab: tutto ciò che devi sapere
Pubblicato: 2022-08-16Google Colab rende la scienza dei dati, il deep learning, la rete neurale e l'apprendimento automatico accessibili ai singoli ricercatori che non possono permettersi costose infrastrutture di calcolo.
Machine learning e data science sono le due nuove tecnologie in cui tutti gli informatici di nuova generazione vogliono eccellere. Sono disponibili molti corsi di apprendimento online, lezioni gratuite e guide pratiche online su ML e scienza dei dati.
Tuttavia, esercitarsi sui progetti diventa un vincolo poiché sono necessari PC di fascia alta per tali carichi di lavoro. La risposta a questo problema è Google Colaboratory o Colab, in breve. Continua a leggere per ottenere la recensione definitiva di Google Colab.
Cos'è Google Colab?
Colab è un prodotto simile a un taccuino Jupyter di Google Research. Uno sviluppatore di programmi Python può utilizzare questo notebook per scrivere ed eseguire codici di programma Python casuali semplicemente utilizzando un browser web.
In poche parole, Colab è una versione ospitata su cloud di Jupyter Notebook. Per utilizzare Colab, non è necessario installare, eseguire il runtime o aggiornare l'hardware del computer per soddisfare i requisiti di carico di lavoro intensivo di CPU/GPU di Python. Inoltre, Colab ti offre libero accesso all'infrastruttura informatica come storage, memoria, capacità di elaborazione, unità di elaborazione grafica (GPU) e unità di elaborazione tensoriale (TPU).
Google ha appositamente programmato questo strumento di codifica Python basato su cloud tenendo presente le esigenze di programmatori di machine learning, analisti di big data, data scientist, ricercatori di intelligenza artificiale e studenti di Python.
La parte migliore è un blocco appunti di codice per tutti i componenti necessari per presentare un progetto completo di machine learning o scienza dei dati ai supervisori o agli sponsor del programma. Ad esempio, il tuo notebook Colab può contenere codici eseguibili, codici Python attivi, rich text, HTML, LaTeX, immagini, visualizzazioni di dati, grafici, tabelle e altro ancora.
Cosa fa Google Colab?

Google Colab è semplicemente una rappresentazione online di Jupyter Notebook. Mentre Jupyter Notebook deve essere installato su un computer e può utilizzare solo le risorse della macchina locale, Colab è un'app cloud a tutti gli effetti per la codifica Python.
Puoi scrivere codici Python utilizzando Colab sui browser Web Google Chrome o Mozilla Firefox. Puoi anche eseguire quei codici sul browser senza bisogno di alcun ambiente di runtime o interfaccia della riga di comando.
Inoltre, puoi dare al tuo taccuino del progetto Python un aspetto professionale aggiungendo equazioni matematiche, grafici, tabelle, immagini e altri elementi grafici. Inoltre, puoi codificare le visualizzazioni dei dati in Python e Colab eseguirà il rendering del codice in una risorsa visiva.
Inoltre, Colab ti consente di riutilizzare i file Jupyter Notebook da GitHub. Oltre a ciò, puoi anche importare progetti di apprendimento automatico e scienza dei dati compatibili da altre fonti. Colab elabora in modo efficiente le risorse importate per visualizzare codici Python puliti e privi di errori.
Le migliori funzionalità di Google Colab
GPU e TPU
Gli utenti Colab gratuiti ottengono l'accesso gratuito ai tempi di esecuzione di GPU e TPU per un massimo di 12 ore. Il runtime della GPU viene fornito con CPU Intel Xeon a 2,20 GHz, 13 GB di RAM, acceleratore Tesla K80 e 12 GB GDDR5 VRAM.
Il runtime della TPU è costituito da una CPU Intel Xeon a 2,30 GHz, 13 GB di RAM e un TPU cloud con 180 teraflop di potenza di calcolo.
Con Colab Pro o Pro+ puoi commissionare più CPU, TPU e GPU per più di 12 ore.
Condivisione del taccuino
Il blocco appunti del codice Python non è mai stato accessibile prima di Colab. Ora puoi creare collegamenti condivisibili per i file Colab che vengono salvati su Google Drive. Ora condividi il link con il collaboratore che vuole lavorare con te. Inoltre, puoi anche invitare i programmatori a lavorare con te utilizzando le e-mail di Google.
Installazione di librerie speciali
Colab consente di installare librerie non collaborative (AWS S3, GCP, SQL, MySQL, ecc.) che non sono disponibili nei frammenti di codice. Tutto quello che devi fare è aggiungere un codice one-liner con i seguenti prefissi di codice:
!pip install (example: !pip install matplotlib-venn) !apt-get install (example: !apt-get -qq install -y libfluidsynth1)Librerie preinstallate
Google Colab offre più librerie preinstallate in modo da poter importare la libreria richiesta dai frammenti di codice. Tali librerie includono NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras e altre librerie ML.
Codifica collaborativa

Il co-coding è indispensabile per i progetti di gruppo. Aiuta il tuo team a completare le pietre miliari prima del lasso di tempo previsto. Se il tuo team ha bisogno di una collaborazione in tempo reale su progetti di machine learning e data science, Google Collaborative è lo strumento giusto.
Invia semplicemente un link modificabile con i collaboratori o invita i collaboratori per la codifica di gruppo. L'intero taccuino Python si aggiorna automaticamente come i codici del team e hai la sensazione di lavorare su fogli o documenti Google condivisi.
Archiviazione su cloud
Google Colab utilizza la tua quota di archiviazione di Google Drive per salvare i file. Quindi, puoi riprendere il lavoro da qualsiasi computer su cui puoi accedere al tuo account Google Drive.
Il cloud storage funziona anche come backup dei tuoi dati da eventuali disastri.
Integrazione con GitHub
Puoi collegare il tuo account GitHub con Google Colab per importare ed esportare file di codice senza problemi. Per l'importazione, puoi premere Ctrl+O e fare clic sulla scheda GitHub per ottenere i file di codice. Al contrario, è sufficiente fare clic su Salva una copia su GitHub dal menu File per inviare file a GitHub.
Più origini dati
Google Colaboratory supporta varie origini dati per i tuoi progetti di formazione ML e AI. Ad esempio, puoi importare dati da una macchina locale, montare Google Drive su un'istanza Colab, recuperare dati remoti e clonare repository GitHub in Colab.
Controllo automatico della versione
Come Fogli e Documenti Google, anche Google Colab ha un tracker cronologia completo. Il modulo tiene traccia di tutte le modifiche apportate dalla creazione del file. È possibile accedere ai registri dal menu File e fare clic sull'opzione Cronologia revisioni.
Perché dovresti scegliere Google Colab?

- Google Colaboratory è uno strumento basato su cloud. Puoi iniziare a codificare fantastici modelli di ML e scienza dei dati utilizzando un browser Chrome.
- Colab è gratuito con risorse limitate. Tuttavia, non dovresti aspettarti di poter archiviare i tuoi modelli di intelligenza artificiale o machine learning indefinitamente sull'infrastruttura gratuita di Colab.
- Se sai lavorare su Jupyter, non devi seguire alcuna curva di apprendimento su Google Colaboratory.
- Accesso gratuito a GPU e TPU per modelli di data science e machine learning estesi.
- Viene fornito con librerie di data science preinstallate e popolari.
- I programmatori possono condividere facilmente il codice notebook con i collaboratori per la codifica in tempo reale.
- Poiché Google ospita il notebook su Google Cloud, non devi preoccuparti del controllo della versione del documento di codice e dell'archiviazione.
- Si integra facilmente con GitHub.
- Puoi addestrare l'IA usando le immagini.
- Puoi anche addestrare modelli su audio e testo.
- I ricercatori possono anche eseguire programmi TensorFlow su Colab.
Come utilizzare Google Colab

Puoi utilizzare Google Colaboratory se soddisfi i seguenti requisiti minimi:

- Un account Google per provare tutta la comodità di Colab.
- Un computer in grado di eseguire l'ultimo browser Google Chrome o Mozilla Firefox
- Google consiglia Chrome per Colab.
- Accetta i termini e le condizioni sull'utilizzo dei dati di Google.
Puoi accedere a Google Colaboratory dal suo sito web ufficiale. Colab è gratuito; tuttavia, le allocazioni di risorse limitate non sono sempre garantite. Se hai bisogno di maggiore velocità e capacità di elaborazione con risorse garantite, puoi ottenere Colab Pro o Pro+.

Per alcuni modelli di data science e machine learning adatti a Colab, puoi consultare Google Seedbank.
Le differenze tra Google Colab e Jupyter Notebook
| Caratteristiche del documento di codice | Google Colaboratorio | Taccuino di Giove |
| Visualizzazione istantanea del file di codice | sì | No |
| Condivisione di documenti di codice | sì | No |
| Librerie installate | sì | No |
| Hosting cloud | sì | No |
| Sincronizzazione di file | sì | No |
#1 . Colab non necessita di installazioni software sulla macchina locale. Al contrario, Jupyter Notebook richiede installazioni di software e risorse della macchina locale per il calcolo.
#2 . Poiché Colab è basato su cloud, ottieni il controllo automatico della versione. Inoltre, Google Drive continua a salvare automaticamente il notebook Python. Al contrario, su Jupyter Notebook, è necessario salvare periodicamente il notebook e gestire il controllo della versione.
#3 . I file Colab sono disponibili su Google Drive a scopo di backup. D'altra parte, i file di Jupyter Notebook non vengono sottoposti a backup automaticamente.
#4 . Puoi inviare i tuoi file Colab a chiunque, anche a un cliente che non sia un data scientist. Possono facilmente aprire il documento su Google Colab e rivedere il contenuto. Non è richiesta alcuna installazione di software dalla parte del destinatario.
Al contrario, il destinatario deve installare ed eseguire Jupyter Notebook per leggere il tuo progetto. Pertanto, la condivisione di questo file con client non di data science diventa una sfida.

#5 . Google Colaboratory include le librerie necessarie per i progetti di data science e machine learning. Ti dà anche una certa quantità di CPU, RAM, GPU e TPU sul cloud. Così risparmi tempo e denaro.
Al contrario, è necessario reperire e installare tutte le librerie necessarie per il progetto se si lavora sull'app Jupyter Notebook. L'installazione di così tante librerie consuma anche le risorse CPU, RAM e GPU della macchina locale.
Esecuzione di attività comuni su Google Colab
Crea un taccuino

- Vai al portale di Google Colab e vedi "Benvenuto in Colab!"
- Nel menu in alto, fai clic su File .
- Dal menu contestuale File, scegli Nuovo taccuino .
- Il tuo nuovo notebook Python è pronto. Puoi rinominare il file del taccuino.
Carica e scarica file
Puoi caricare codici Python locali su Colab seguendo questi passaggi:

- Nel menu in alto, fai clic su File .
- Si aprirà un menu contestuale con molte opzioni.
- Trova Carica taccuino e fai clic su di esso.
- Ora vedrai una console sovrapposta con opzioni come Esempi, Google Drive, GitHub e Carica.
- Fare clic su qualsiasi scheda e selezionare il contenuto del codice che si desidera caricare.
Anche scaricare il tuo progetto in corso o finito è semplicissimo. Ecco i passaggi:

- Fare clic sul menu File situato nella barra dei menu in alto.
- Passa il cursore su Download .
- Si aprirà un menu contestuale con due opzioni per il formato del file di download: .ipynb e .py.
- Puoi scegliere un formato preferito e scaricare il file.
Accedi a GitHub
L'accesso a GitHub è un gioco da ragazzi in Colab. Ecco cosa puoi fare:

- Fare clic su File nella barra dei menu in alto.
- Seleziona Carica taccuino dal menu contestuale.
- Si aprirà una console con una scheda GitHub .
- In alternativa, puoi premere Ctrl+O per accedere alla stessa console.
- Le opzioni di ricerca di GitHub sono l'URL di GitHub, il nome utente e il nome dell'organizzazione.
Accedi ai file locali
- Premi Ctrl+O sul tuo nuovo notebook Colab.
- Seleziona la scheda Carica sulla console visualizzata.
- Fare clic su Scegli file per individuare il file locale che si desidera aprire su Colab.
Accedi a Google Drive

- Fare clic su File nel menu in alto.
- È possibile selezionare Apri taccuino o Carica taccuino .
- Apparirà una console con una scheda per Google Drive .
- Fare clic su quello per accedere ai file da Google Drive.
Se desideri montare Google Drive sulla tua istanza Colab, procedi nel seguente modo:

- Fare clic su File che si trova nel riquadro di navigazione a sinistra.
- Selezionare il comando Monta unità .
- Nella notifica visualizzata, seleziona Connetti a Google Drive .
- Google ti chiederà di scegliere un account per l'autorizzazione.
Salva e importa da Fogli Google
Puoi salvare facilmente i dati del tuo taccuino in un file di Fogli Google per un'ulteriore elaborazione. Per farlo, prova questi passaggi:

- Fare clic sul pulsante Frammenti di codice nell'angolo in basso a sinistra.
- Si aprirà un riquadro di navigazione sul lato destro.
- Digita Fogli nel filtro e troverai Salvataggio dati e Importazione frammenti di codice dati .
- Fare doppio clic sul titolo per includere il codice nel taccuino.
Accedi ad AWS S3
Puoi accedere a file e asset di codifica da piattaforme di archiviazione cloud come AWS S3 e Azure Blob utilizzando i bucket di archiviazione cloud.

Per fare ciò, è necessario installare ByteHub, che ha le funzionalità per il caricamento e il salvataggio dei dati sul cloud storage. Puoi eseguire il seguente codice:
!pip install -q bytehub[aws]Accedi ai set di dati Kaggle

- Vai all'account Kaggle e fai clic su Expire API Token dalla sezione API per rimuovere i vecchi token.
- Crea un nuovo token API per ottenere kaggle.json sul computer locale.
- Ora usa il seguente codice per installare Kaggle:
!pip install -q kaggle- Ora carica il file Kaggle.json nella codebase Python seguendo una pratica di codifica standard.
Parole finali
Ora che hai affrontato una discussione approfondita sull'app Google Collaboratory, dovresti essere in grado di avviare rapidamente i tuoi progetti di apprendimento, formazione o pratica di machine learning. Google Colab è un'app cloud davvero conveniente per chi ama Jupyter Notebooks.
Potresti anche essere interessato ad alcuni popolari set di dati aperti per progetti di scienza dei dati.


