Google Colab: todo lo que necesitas saber
Publicado: 2022-08-16Google Colab hace que la ciencia de datos, el aprendizaje profundo, las redes neuronales y el aprendizaje automático sean accesibles para investigadores individuales que no pueden pagar una infraestructura computacional costosa.
El aprendizaje automático y la ciencia de datos son las dos nuevas tecnologías en las que todos los científicos informáticos de nueva generación quieren sobresalir. Hay muchos cursos de aprendizaje en línea, conferencias gratuitas y guías prácticas en línea sobre ML y ciencia de datos.
Pero practicar en proyectos se convierte en una limitación, ya que necesita PC de alta gama para tales cargas de trabajo. La respuesta a este problema es Google Colaboratory o Colab, en resumen. Continúe leyendo para obtener la revisión definitiva de Google Colab.
¿Qué es Google Colaboration?
Colab es un producto similar a Jupyter Notebook de Google Research. Un desarrollador de programas de Python puede usar este cuaderno para escribir y ejecutar códigos aleatorios de programas de Python simplemente usando un navegador web.
En pocas palabras, Colab es una versión alojada en la nube de Jupyter Notebook. Para usar Colab, no necesita instalar y ejecutar ni actualizar el hardware de su computadora para cumplir con los requisitos intensivos de carga de trabajo de CPU/GPU de Python. Además, Colab le brinda acceso gratuito a la infraestructura informática como almacenamiento, memoria, capacidad de procesamiento, unidades de procesamiento de gráficos (GPU) y unidades de procesamiento de tensor (TPU).
Google ha programado especialmente esta herramienta de codificación de Python basada en la nube teniendo en cuenta las necesidades de los programadores de aprendizaje automático, los analistas de big data, los científicos de datos, los investigadores de IA y los estudiantes de Python.
La mejor parte es un cuaderno de códigos para todos los componentes necesarios para presentar un proyecto completo de aprendizaje automático o ciencia de datos a los supervisores o patrocinadores del programa. Por ejemplo, su cuaderno de Colab puede contener códigos ejecutables, códigos de Python en vivo, texto enriquecido, HTML, LaTeX, imágenes, visualizaciones de datos, cuadros, gráficos, tablas y más.
¿Qué hace Google Colab?

Google Colab es simplemente una representación en línea de Jupyter Notebook. Si bien Jupyter Notebook necesita instalación en una computadora y solo puede usar los recursos de la máquina local, Colab es una aplicación en la nube completa para la codificación de Python.
Puede escribir códigos Python usando Colab en sus navegadores web Google Chrome o Mozilla Firefox. También puede ejecutar esos códigos en el navegador sin necesidad de ningún entorno de tiempo de ejecución o interfaz de línea de comandos.
Además, puede darle a su cuaderno de proyectos de Python un aspecto profesional agregando ecuaciones matemáticas, gráficos, tablas, imágenes y otros gráficos. Además, puede codificar visualizaciones de datos en Python y Colab representará el código en un recurso visual.
Además, Colab le permite reutilizar archivos de Jupyter Notebook desde GitHub. Aparte de eso, también puede importar proyectos compatibles de aprendizaje automático y ciencia de datos de otras fuentes. Colab procesa eficientemente los activos importados para mostrar códigos de Python limpios y sin errores.
Las mejores características de Google Colab
GPU y TPU
Los usuarios gratuitos de Colab obtienen acceso gratuito a tiempos de ejecución de GPU y TPU por hasta 12 horas. Su tiempo de ejecución de GPU viene con CPU Intel Xeon a 2,20 GHz, 13 GB de RAM, acelerador Tesla K80 y 12 GB de VRAM GDDR5.
El tiempo de ejecución de TPU consta de una CPU Intel Xeon a 2,30 GHz, 13 GB de RAM y una TPU en la nube con 180 teraflops de potencia computacional.
Con Colab Pro o Pro+, puede encargar más CPU, TPU y GPU durante más de 12 horas.
Uso compartido de cuadernos
El cuaderno de código de Python nunca ha sido accesible antes de Colab. Ahora, puede crear enlaces para compartir para archivos de Colab que se guardan en su Google Drive. Ahora, comparte el enlace con el colaborador que quiere trabajar contigo. Además, también puede invitar a programadores a trabajar con usted utilizando los correos electrónicos de Google.
Instalación especial de biblioteca
Colab le permite instalar bibliotecas que no son de colaboración (AWS S3, GCP, SQL, MySQL, etc.) que no están disponibles en los fragmentos de código. Todo lo que necesita hacer es agregar un código de una sola línea con los siguientes prefijos de código:
!pip install (example: !pip install matplotlib-venn) !apt-get install (example: !apt-get -qq install -y libfluidsynth1)Bibliotecas preinstaladas
Google Colab ofrece varias bibliotecas preinstaladas para que pueda importar la biblioteca requerida desde fragmentos de código. Dichas bibliotecas incluyen NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras y más bibliotecas ML.
Codificación colaborativa

La cocodificación es indispensable para proyectos grupales. Ayuda a su equipo a completar hitos antes del plazo previsto. Si su equipo necesita colaboración en tiempo real en proyectos de ciencia de datos y aprendizaje automático, Google Collaborative es la herramienta ideal.
Simplemente envíe un enlace editable con los colaboradores o invite a colaboradores para la codificación grupal. Todo el cuaderno de Python se actualiza automáticamente a medida que el equipo codifica, y tiene la sensación de trabajar en Hojas de cálculo o Documentos de Google compartidos.
Almacenamiento en la nube
Google Colab utiliza su cuota de almacenamiento de Google Drive para guardar archivos. Por lo tanto, puede reanudar el trabajo desde cualquier computadora en la que pueda acceder a su cuenta de Google Drive.
El almacenamiento en la nube también funciona como una copia de seguridad de sus datos de cualquier desastre.
Integración GitHub
Puede vincular su cuenta de GitHub con Google Colab para importar y exportar archivos de código sin problemas. Para importar, puede presionar Ctrl+O y hacer clic en la pestaña GitHub para obtener archivos de código. Por el contrario, simplemente haga clic en Guardar una copia en GitHub desde el menú Archivo para enviar archivos a GitHub.
Múltiples fuentes de datos
Google Colaboratory es compatible con varias fuentes de datos para sus proyectos de capacitación en aprendizaje automático e inteligencia artificial. Por ejemplo, puede importar datos desde una máquina local, montar Google Drive en una instancia de Colab, obtener datos remotos y clonar el repositorio de GitHub en Colab.
Control automático de versiones
Al igual que Google Sheets and Docs, Google Colab también tiene un rastreador de historial exhaustivo. El módulo rastrea todos los cambios realizados desde la creación del archivo. Puede acceder a los registros desde el menú Archivo y hacer clic en la opción Historial de revisión.
¿Por qué debería elegir Google Colab?

- Google Colaboratory es una herramienta basada en la nube. Puede comenzar a codificar fantásticos modelos de ciencia de datos y ML con un navegador Chrome.
- Colab es gratuito con recursos limitados. Sin embargo, no debe esperar que pueda almacenar sus modelos de inteligencia artificial o aprendizaje automático indefinidamente en la infraestructura gratuita de Colab.
- Si sabe trabajar en Jupyter, no necesita pasar por ninguna curva de aprendizaje en Google Colaboratory.
- Acceso gratuito a GPU y TPU para modelos completos de ciencia de datos y aprendizaje automático.
- Viene con bibliotecas de ciencia de datos populares y preinstaladas.
- Los codificadores pueden compartir fácilmente el cuaderno de códigos con colaboradores para la codificación en tiempo real.
- Dado que Google aloja el cuaderno en Google Cloud, no necesita preocuparse por el control y el almacenamiento de la versión del documento de código.
- Se integra fácilmente con GitHub.
- Puedes entrenar la IA usando imágenes.
- También puede entrenar modelos en audio y texto.
- Los investigadores también pueden ejecutar programas TensorFlow en Colab.
Cómo usar Google Colab

Puede usar Google Colaboratory si cumple con los siguientes requisitos mínimos:

- Una cuenta de Google para experimentar toda la comodidad de Colab.
- Una computadora que pueda ejecutar el último navegador Google Chrome o Mozilla Firefox
- Google recomienda Chrome para Colab.
- Acepta los términos y condiciones de uso de datos de Google.
Puedes acceder a Google Colaboratory desde su sitio web oficial. Colab es gratis; sin embargo, las asignaciones limitadas de recursos no siempre están garantizadas. Si necesita más velocidad y capacidades de procesamiento con recursos garantizados, puede obtener Colab Pro o Pro+.

Para conocer algunos modelos de ciencia de datos y aprendizaje automático adecuados para Colab, puede consultar Google Seedbank.
Las diferencias entre Google Colab y Jupyter Notebook
| Características del documento de código | Colaborador de Google | Cuaderno Jupyter |
| Visualización instantánea de archivos de código | Sí | No |
| Uso compartido de documentos de código | Sí | No |
| bibliotecas instaladas | Sí | No |
| alojamiento en la nube | Sí | No |
| Sincronizando archivos | Sí | No |
#1 Colab no necesita instalaciones de software en la máquina local. Por el contrario, Jupyter Notebook requiere instalaciones de software y recursos de máquinas locales para el cálculo.
#2 Dado que Colab está basado en la nube, obtienes un control de versión automático. Además, Google Drive sigue guardando el cuaderno de Python automáticamente. Por el contrario, en Jupyter Notebook, debe guardar el cuaderno periódicamente y administrar el control de versiones.
#3 Los archivos de Colab están disponibles en Google Drive para realizar copias de seguridad. Por otro lado, los archivos de Jupyter Notebook no se respaldan automáticamente.
#4 Puede enviar sus archivos de Colab a cualquier persona, incluso a un cliente que no sea un científico de datos. Pueden abrir fácilmente el documento en Google Colab y revisar el contenido. No se requiere instalación de software por parte del destinatario.
Por el contrario, el destinatario debe instalar y ejecutar Jupyter Notebook para leer su proyecto. Por lo tanto, compartir este archivo con clientes que no son de ciencia de datos se convierte en un desafío.

#5 Google Colaboratory viene con las bibliotecas necesarias para proyectos de ciencia de datos y aprendizaje automático. También le brinda una cierta cantidad de CPU, RAM, GPU y TPU en la nube. Así, ahorras tiempo y dinero.
Por el contrario, debe obtener e instalar todas las bibliotecas necesarias para su proyecto si trabaja en la aplicación Jupyter Notebook. La instalación de tantas bibliotecas también consume los recursos de CPU, RAM y GPU de la máquina local.
Ejecución de tareas comunes en Google Colab
Crear un cuaderno

- Vaya al portal de Google Colab y vea "¡Bienvenido a Colab!"
- En el menú superior, haz clic en Archivo .
- En el menú contextual Archivo, elija Nuevo cuaderno .
- Su nuevo cuaderno de Python está listo. Puede cambiar el nombre del archivo del cuaderno.
Subir y descargar archivos
Puede cargar códigos locales de Python en Colab siguiendo estos pasos:

- En el menú superior, haga clic en Archivo .
- Se abrirá un menú contextual con muchas opciones.
- Busque Cargar cuaderno y haga clic en él.
- Ahora verá una consola superpuesta con opciones como Ejemplos, Google Drive, GitHub y Cargar.
- Haga clic en cualquier pestaña y seleccione el contenido del código que desea cargar.
Descargar su proyecto en progreso o terminado también es muy fácil. Aquí están los pasos:

- Haga clic en el menú Archivo ubicado en la barra de menú superior.
- Pase el cursor sobre Descargar .
- Se abrirá un menú contextual con dos opciones de formato de archivo de descarga: .ipynb y .py.
- Puede elegir un formato preferido y descargar el archivo.
Acceder a GitHub
Acceder a GitHub es muy sencillo en Colab. Esto es lo que puede hacer:

- Haga clic en Archivo en la barra de menú superior.
- Seleccione Cargar cuaderno en el menú contextual.
- Se abrirá una consola con una pestaña de GitHub .
- Alternativamente, puede presionar Ctrl+O para acceder a la misma consola.
- Las opciones de búsqueda de GitHub son URL de GitHub, nombre de usuario y nombre de la organización.
Acceder a archivos locales
- Presiona Ctrl+O en tu nuevo cuaderno de Colab.
- Seleccione la pestaña Cargar en la consola que aparece.
- Haga clic en Elegir archivo para ubicar el archivo local que desea abrir en Colab.
Acceder a Google Drive

- Haga clic en Archivo en el menú superior.
- Puede seleccionar Abrir libreta o Cargar libreta .
- Aparecerá una consola con una pestaña para Google Drive .
- Haga clic en eso para acceder a los archivos de Google Drive.
Si desea montar Google Drive en su instancia de Colab, siga estos pasos:

- Haga clic en Archivo ubicado en el panel de navegación izquierdo.
- Seleccione el comando Montar unidad .
- En la notificación que aparece, selecciona Conectar a Google Drive .
- Google le pedirá que elija una cuenta para la autorización.
Guardar e importar desde Hojas de cálculo de Google
Puede guardar los datos de su cuaderno sin esfuerzo en un archivo de Hojas de cálculo de Google para su posterior procesamiento. Para hacerlo, prueba estos pasos:

- Haga clic en el botón Fragmentos de código en la esquina inferior izquierda.
- Se abrirá un panel de navegación en el lado derecho.
- Escriba Hojas en el filtro y encontrará los fragmentos de código Guardando datos e Importando datos .
- Haga doble clic en el título para incluir el código en el cuaderno.
Acceda a AWS S3
Puede acceder a archivos y activos de codificación desde plataformas de almacenamiento en la nube como AWS S3 y Azure Blob mediante el uso de depósitos de almacenamiento en la nube.

Para hacer esto, debe instalar ByteHub, que tiene las funcionalidades para cargar y guardar datos en el almacenamiento en la nube. Puede ejecutar el siguiente código:
!pip install -q bytehub[aws]Acceder a los conjuntos de datos de Kaggle

- Vaya a la cuenta de Kaggle y haga clic en Expire API Token en la sección API para eliminar tokens antiguos.
- Cree un nuevo token de API para obtener kaggle.json en la computadora local.
- Ahora usa el siguiente código para instalar Kaggle:
!pip install -q kaggle- Ahora, suba el archivo Kaggle.json a la base de código de Python siguiendo una práctica de codificación estándar.
Ultimas palabras
Ahora que ha pasado por una discusión en profundidad sobre la aplicación Google Collaboratory, debería poder comenzar su aprendizaje, capacitación o práctica de proyectos de aprendizaje automático. Google Colab es una aplicación en la nube genuinamente conveniente para aquellos a quienes les gustan los Jupyter Notebooks.
También puede estar interesado en algunos conjuntos de datos abiertos populares para proyectos de ciencia de datos.


