Google Colab: ทุกสิ่งที่คุณจำเป็นต้องรู้

เผยแพร่แล้ว: 2022-08-16

Google Colab ทำให้นักวิจัยแต่ละรายซึ่งไม่สามารถซื้อโครงสร้างพื้นฐานด้านการคำนวณที่มีราคาแพง สามารถเข้าถึงวิทยาศาสตร์ข้อมูล การเรียนรู้เชิงลึก เครือข่ายประสาท และการเรียนรู้ของเครื่อง

แมชชีนเลิร์นนิงและวิทยาศาสตร์ข้อมูลเป็นเทคโนโลยีใหม่สองอย่างที่นักวิทยาศาสตร์คอมพิวเตอร์ยุคใหม่ทุกคนต้องการทำให้เป็นเลิศ มีหลักสูตรการเรียนรู้ออนไลน์มากมาย การบรรยายฟรี และคำแนะนำวิธีใช้ออนไลน์เกี่ยวกับ ML และวิทยาศาสตร์ข้อมูล

แต่การฝึกฝนในโครงการจะกลายเป็นข้อจำกัด เนื่องจากคุณต้องการพีซีระดับไฮเอนด์สำหรับปริมาณงานดังกล่าว คำตอบสำหรับปัญหานี้คือ Google Colaboratory หรือ Colab อย่างย่อ อ่านต่อเพื่อรับรีวิวขั้นสุดยอดของ Google Colab

Google Colab คืออะไร?

วิดีโอ YouTube

Colab เป็นผลิตภัณฑ์คล้าย Jupyter Notebook จาก Google Research นักพัฒนาโปรแกรม Python สามารถใช้สมุดบันทึกนี้เพื่อเขียนและรันโค้ดโปรแกรม Python แบบสุ่มโดยใช้เว็บเบราว์เซอร์

โดยสรุป Colab เป็น Jupyter Notebook เวอร์ชันที่โฮสต์บนคลาวด์ ในการใช้ Colab คุณไม่จำเป็นต้องติดตั้งและรันไทม์หรืออัปเกรดฮาร์ดแวร์คอมพิวเตอร์ของคุณเพื่อให้เป็นไปตามข้อกำหนดปริมาณงานที่ใช้ CPU/GPU ที่เข้มข้นของ Python นอกจากนี้ Colab ยังให้คุณเข้าถึงโครงสร้างพื้นฐานการประมวลผลได้ฟรี เช่น พื้นที่เก็บข้อมูล หน่วยความจำ ความสามารถในการประมวลผล หน่วยประมวลผลกราฟิก (GPU) และหน่วยประมวลผลเทนเซอร์ (TPU)

Google ได้ตั้งโปรแกรมเครื่องมือเข้ารหัส Python บนคลาวด์นี้โดยเฉพาะ โดยคำนึงถึงความต้องการของโปรแกรมเมอร์การเรียนรู้ของเครื่อง นักวิเคราะห์ข้อมูลขนาดใหญ่ นักวิทยาศาสตร์ข้อมูล นักวิจัย AI และผู้เรียน Python

ส่วนที่ดีที่สุดคือโน้ตบุ๊กหนึ่งรหัสสำหรับส่วนประกอบทั้งหมดที่จำเป็นในการนำเสนอแมชชีนเลิร์นนิงหรือโปรเจ็กต์วิทยาศาสตร์ข้อมูลแก่ผู้ดูแลโปรแกรมหรือผู้สนับสนุน ตัวอย่างเช่น สมุดบันทึก Colab ของคุณสามารถประกอบด้วยโค้ดสั่งการ, รหัส Python แบบสด, Rich Text, HTML, LaTeX, รูปภาพ, การแสดงข้อมูลเป็นภาพ, แผนภูมิ, กราฟ, ตาราง และอื่นๆ

Google Colab ทำอะไรได้บ้าง

Google Colab ทำอะไรได้บ้าง

Google Colab เป็นเพียงตัวแทนออนไลน์ของ Jupyter Notebook แม้ว่า Jupyter Notebook จะต้องติดตั้งบนคอมพิวเตอร์และใช้ได้เฉพาะทรัพยากรเครื่องในเครื่อง แต่ Colab เป็นแอประบบคลาวด์เต็มรูปแบบสำหรับการเข้ารหัส Python

คุณเขียนโค้ด Python โดยใช้ Colab บนเว็บเบราว์เซอร์ Google Chrome หรือ Mozilla Firefox ได้ คุณยังสามารถรันโค้ดเหล่านั้นบนเบราว์เซอร์ได้โดยไม่ต้องใช้สภาพแวดล้อมรันไทม์หรืออินเทอร์เฟซบรรทัดคำสั่ง

นอกจากนี้ คุณยังสามารถทำให้สมุดบันทึกโปรเจ็กต์ Python ของคุณดูเป็นมืออาชีพได้ด้วยการเพิ่มสมการทางคณิตศาสตร์ กราฟ ตาราง รูปภาพ และกราฟิกอื่นๆ นอกจากนี้ คุณสามารถเขียนโค้ดการแสดงข้อมูลเป็นภาพใน Python และ Colab จะแสดงโค้ดในเนื้อหาแบบภาพ

นอกจากนี้ Colab ยังให้คุณนำไฟล์ Jupyter Notebook กลับมาใช้ใหม่จาก GitHub นอกจากนั้น คุณยังสามารถนำเข้าแมชชีนเลิร์นนิงและโปรเจ็กต์วิทยาศาสตร์ข้อมูลที่ใช้ร่วมกันได้จากแหล่งอื่น Colab ประมวลผลทรัพยากรที่นำเข้าอย่างมีประสิทธิภาพเพื่อแสดงรหัส Python ที่สะอาดและปราศจากข้อผิดพลาด

คุณลักษณะที่ดีที่สุดของ Google Colab

วิดีโอ YouTube

GPU และ TPU

ผู้ใช้ Colab ฟรีจะได้รับสิทธิ์เข้าถึงรันไทม์ GPU และ TPU โดยไม่เสียค่าใช้จ่ายสูงสุด 12 ชั่วโมง รันไทม์ของ GPU มาพร้อมกับ Intel Xeon CPU ที่ 2.20 GHz, RAM 13 GB, ตัวเร่งความเร็ว Tesla K80 และ GDDR5 VRAM ขนาด 12 GB

รันไทม์ TPU ประกอบด้วย Intel Xeon CPU @2.30 GHz, RAM 13 GB และ Cloud TPU ที่มีพลังประมวลผล 180 เทราฟลอป

ด้วย Colab Pro หรือ Pro+ คุณสามารถใช้งาน CPU, TPU และ GPU ได้มากกว่า 12 ชั่วโมง

การแชร์โน้ตบุ๊ก

Colab ไม่เคยเข้าถึงสมุดบันทึกโค้ด Python มาก่อน ตอนนี้ คุณสามารถสร้างลิงก์ที่แชร์ได้สำหรับไฟล์ Colab ที่บันทึกไว้ใน Google ไดรฟ์ของคุณ ตอนนี้ แชร์ลิงก์กับผู้ทำงานร่วมกันที่ต้องการร่วมงานกับคุณ นอกจากนี้ คุณยังสามารถเชิญโปรแกรมเมอร์ให้ทำงานร่วมกับคุณโดยใช้อีเมลของ Google

การติดตั้งห้องสมุดพิเศษ

Colab ให้คุณติดตั้งไลบรารีที่ไม่ใช่ Colaboratory (AWS S3, GCP, SQL, MySQL ฯลฯ) ที่ไม่มีอยู่ในข้อมูลโค้ด สิ่งที่คุณต้องทำคือเพิ่มโค้ดหนึ่งซับพร้อมคำนำหน้าโค้ดต่อไปนี้:

 !pip install (example: !pip install matplotlib-venn)
 !apt-get install (example: !apt-get -qq install -y libfluidsynth1)

ห้องสมุดที่ติดตั้งล่วงหน้า

Google Colab มีไลบรารี่ที่ติดตั้งไว้ล่วงหน้าหลายไลบรารี คุณจึงสามารถนำเข้าไลบรารีที่จำเป็นจากข้อมูลโค้ดได้ ไลบรารีดังกล่าวรวมถึง NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras และไลบรารี ML อื่นๆ

การเข้ารหัสร่วมกัน

การเข้ารหัสร่วมกัน

Co-coding จำเป็นสำหรับโครงการกลุ่ม ช่วยให้ทีมของคุณบรรลุเป้าหมายได้เร็วกว่ากรอบเวลาที่คาดไว้ หากทีมของคุณต้องการการทำงานร่วมกันแบบเรียลไทม์ในโครงการ ML และวิทยาศาสตร์ข้อมูล Google Collaborative ก็เป็นเครื่องมือ

เพียงส่งลิงก์ที่แก้ไขได้กับผู้ทำงานร่วมกันหรือเชิญผู้ทำงานร่วมกันมาเขียนโค้ดกลุ่ม สมุดบันทึก Python ทั้งหมดจะอัปเดตโดยอัตโนมัติตามรหัสของทีม และคุณจะรู้สึกเหมือนกำลังทำงานบน Google ชีตหรือเอกสารที่แชร์

การจัดเก็บเมฆ

Google Colab ใช้โควต้าพื้นที่เก็บข้อมูล Google ไดรฟ์ของคุณเพื่อวัตถุประสงค์ในการบันทึกไฟล์ ดังนั้น คุณสามารถทำงานต่อจากคอมพิวเตอร์เครื่องใดก็ได้ที่คุณสามารถเข้าถึงบัญชี Google ไดรฟ์ของคุณได้

ที่เก็บข้อมูลบนคลาวด์ยังทำหน้าที่เป็นการสำรองข้อมูลของคุณจากภัยพิบัติต่างๆ

การรวม GitHub

คุณสามารถเชื่อมโยงบัญชี GitHub กับ Google Colab เพื่อนำเข้าและส่งออกไฟล์โค้ดได้อย่างราบรื่น สำหรับการนำเข้า คุณสามารถกด Ctrl+O และคลิกที่แท็บ GitHub เพื่อรับไฟล์โค้ด ในทางตรงกันข้าม เพียงคลิกที่บันทึกสำเนาไปยัง GitHub จากเมนูไฟล์เพื่อส่งไฟล์ไปยัง GitHub

แหล่งข้อมูลหลายแหล่ง

Google Colaboratory รองรับแหล่งข้อมูลที่หลากหลายสำหรับโครงการฝึกอบรม ML และ AI ของคุณ ตัวอย่างเช่น คุณสามารถนำเข้าข้อมูลจากเครื่องในเครื่อง ต่อเชื่อม Google ไดรฟ์กับอินสแตนซ์ Colab ดึงข้อมูลระยะไกล และโคลน GitHub repo ลงใน Colab

การควบคุมเวอร์ชันอัตโนมัติ

เช่นเดียวกับ Google ชีตและเอกสาร Google Colab ยังมีตัวติดตามประวัติโดยละเอียดอีกด้วย โมดูลติดตามการเปลี่ยนแปลงทั้งหมดที่เกิดขึ้นตั้งแต่สร้างไฟล์ คุณสามารถเข้าถึงบันทึกจากเมนูไฟล์และคลิกตัวเลือกประวัติการแก้ไข

ทำไมคุณควรเลือก Google Colab

ทำไมคุณควรเลือก Google Colab
  • Google Colaboratory เป็นเครื่องมือที่ทำงานบนคลาวด์ คุณสามารถเริ่มเขียนโค้ด ML และโมเดลวิทยาศาสตร์ข้อมูลที่ยอดเยี่ยมได้โดยใช้เบราว์เซอร์ Chrome
  • Colab ไม่มีค่าใช้จ่ายด้วยทรัพยากรที่จำกัด อย่างไรก็ตาม คุณไม่ควรคาดหวังว่าคุณจะสามารถจัดเก็บโมเดลปัญญาประดิษฐ์หรือแมชชีนเลิร์นนิงได้อย่างไม่มีกำหนดบนโครงสร้างพื้นฐานฟรีของ Colab
  • หากคุณรู้จักการทำงานกับ Jupyter คุณไม่จำเป็นต้องผ่านช่วงการเรียนรู้ใดๆ บน Google Colaboratory
  • เข้าถึง GPU และ TPU ฟรีสำหรับวิทยาศาสตร์ข้อมูลที่ครอบคลุมและโมเดลการเรียนรู้ของเครื่อง
  • มันมาพร้อมกับไลบรารีวิทยาศาสตร์ข้อมูลที่ติดตั้งไว้ล่วงหน้าและเป็นที่นิยม
  • ผู้เขียนโค้ดสามารถแชร์สมุดบันทึกโค้ดกับผู้ทำงานร่วมกันเพื่อการเข้ารหัสแบบเรียลไทม์ได้อย่างง่ายดาย
  • เนื่องจาก Google โฮสต์โน้ตบุ๊กบน Google Cloud คุณจึงไม่ต้องกังวลเกี่ยวกับการควบคุมเวอร์ชันของเอกสารและการจัดเก็บ
  • รวมเข้ากับ GitHub ได้อย่างง่ายดาย
  • คุณสามารถฝึก AI โดยใช้รูปภาพ
  • คุณยังสามารถฝึกโมเดลเกี่ยวกับเสียงและข้อความได้อีกด้วย
  • นักวิจัยยังสามารถเรียกใช้โปรแกรม TensorFlow บน Colab ได้อีกด้วย

วิธีใช้ Google Colab

วิธีใช้ Google Colab

คุณสามารถใช้ Google Colaboratory ได้หากคุณมีคุณสมบัติตรงตามข้อกำหนดขั้นต่ำดังต่อไปนี้:

  • บัญชี Google เพื่อสัมผัสความสะดวกสบายของ Colab
  • คอมพิวเตอร์ที่เรียกใช้เบราว์เซอร์ Google Chrome หรือ Mozilla Firefox เวอร์ชันล่าสุดได้
  • Google ขอแนะนำ Chrome สำหรับ Colab
  • ยอมรับข้อกำหนดและเงื่อนไขการใช้ข้อมูลของ Google

คุณสามารถเข้าถึง Google Colaboratory ได้จากเว็บไซต์ทางการ Colab ฟรี; อย่างไรก็ตาม การจัดสรรทรัพยากรอย่างจำกัดไม่รับประกันเสมอไป หากคุณต้องการความเร็วและความสามารถในการประมวลผลที่มากขึ้นพร้อมการรับประกันทรัพยากร คุณสามารถรับ Colab Pro หรือ Pro+

Colab Pro

สำหรับโมเดลวิทยาศาสตร์ข้อมูลและแมชชีนเลิร์นนิงบางประเภทที่เหมาะกับ Colab คุณสามารถดู Google Seedbank ได้

ความแตกต่างระหว่าง Google Colab และ Jupyter Notebook

คุณสมบัติ Code Doc Google Colaboratory Jupyter Notebook
ดูไฟล์โค้ดทันที ใช่ ไม่
การแชร์เอกสารรหัส ใช่ ไม่
ห้องสมุดที่ติดตั้ง ใช่ ไม่
คลาวด์โฮสติ้ง ใช่ ไม่
กำลังซิงค์ไฟล์ ใช่ ไม่

#1 . Colab ไม่จำเป็นต้องติดตั้งซอฟต์แวร์บนเครื่องในเครื่อง ในทางตรงกันข้าม Jupyter Notebook ต้องการการติดตั้งซอฟต์แวร์และทรัพยากรเครื่องในเครื่องสำหรับการคำนวณ

#2 . เนื่องจาก Colab ทำงานบนระบบคลาวด์ คุณจะได้รับการควบคุมเวอร์ชันอัตโนมัติ นอกจากนี้ Google ไดรฟ์ยังบันทึกสมุดบันทึก Python โดยอัตโนมัติอีกด้วย ในทางตรงกันข้าม บน Jupyter Notebook คุณต้องบันทึกโน้ตบุ๊กเป็นระยะและจัดการการควบคุมเวอร์ชัน

#3 . ไฟล์ Colab มีอยู่ใน Google ไดรฟ์เพื่อการสำรองข้อมูล ในทางกลับกัน ไฟล์ Jupyter Notebook จะไม่ถูกสำรองโดยอัตโนมัติ

#4 . คุณส่งไฟล์ Colab ไปให้ใครก็ได้ แม้แต่ลูกค้าที่ไม่ใช่นักวิทยาศาสตร์ข้อมูล พวกเขาสามารถเปิดเอกสารบน Google Colab และตรวจสอบเนื้อหาได้อย่างง่ายดาย ไม่จำเป็นต้องติดตั้งซอฟต์แวร์จากปลายทางของผู้รับ

ในทางกลับกัน ผู้รับจำเป็นต้องติดตั้งและรัน Jupyter Notebook เพื่ออ่านโปรเจ็กต์ของคุณ ดังนั้น การแชร์ไฟล์นี้กับลูกค้าที่ไม่ใช่วิทยาศาสตร์ข้อมูลจึงกลายเป็นเรื่องท้าทาย

#5 . Google Colaboratory มาพร้อมกับไลบรารีที่จำเป็นสำหรับโครงการวิทยาศาสตร์ข้อมูลและแมชชีนเลิร์นนิง นอกจากนี้ยังให้ CPU, RAM, GPU และ TPU จำนวนหนึ่งแก่คุณบนคลาวด์ ดังนั้นคุณประหยัดเวลาและเงิน

ในทางตรงกันข้าม คุณต้องจัดหาและติดตั้งไลบรารีทั้งหมดที่จำเป็นสำหรับโครงการของคุณ หากทำงานบนแอป Jupyter Notebook การติดตั้งไลบรารีจำนวนมากยังใช้ทรัพยากร CPU, RAM และ GPU ของเครื่องท้องถิ่นอีกด้วย

ดำเนินการงานทั่วไปบน Google Colab

สร้างสมุดบันทึก

สร้างสมุดบันทึกบน Google Colab
  • ไปที่พอร์ทัล Google Colab แล้วดู "ยินดีต้อนรับสู่ Colab!"
  • ที่เมนูด้านบน ให้คลิกที่ ไฟล์
  • จากเมนูบริบทไฟล์ เลือก สมุดบันทึกใหม่
  • สมุดบันทึก Python ใหม่ของคุณพร้อมแล้ว คุณสามารถเปลี่ยนชื่อไฟล์สมุดบันทึกได้

อัพโหลดและดาวน์โหลดไฟล์

คุณสามารถอัปโหลดโค้ด Python ในเครื่องไปยัง Colab โดยทำตามขั้นตอนเหล่านี้:

อัปโหลดสมุดบันทึกไปยัง Google Colab
  • ที่เมนูด้านบน ให้คลิก ไฟล์
  • เมนูบริบทจะเปิดขึ้นพร้อมตัวเลือกมากมาย
  • ค้นหา อัปโหลดสมุดบันทึก และคลิกที่มัน
  • ตอนนี้คุณจะเห็นคอนโซลที่ซ้อนทับพร้อมตัวเลือกต่างๆ เช่น Examples, Google Drive, GitHub และ Upload
  • คลิกที่แท็บใดก็ได้และเลือกเนื้อหาโค้ดที่คุณต้องการอัปโหลด

การดาวน์โหลดโปรเจ็กต์ที่อยู่ระหว่างดำเนินการหรือที่เสร็จแล้วนั้นง่ายมากเช่นกัน นี่คือขั้นตอน:

ดาวน์โหลดสมุดบันทึกจาก Google Colab
  • คลิกที่เมนู ไฟล์ ที่อยู่บนแถบเมนูด้านบน
  • วางเคอร์เซอร์เหนือ ดาวน์โหลด
  • เมนูบริบทจะเปิดขึ้นพร้อมตัวเลือกรูปแบบไฟล์ดาวน์โหลดสองแบบ: .ipynb และ .py
  • คุณสามารถเลือกรูปแบบที่ต้องการและดาวน์โหลดไฟล์ได้

เข้าถึง GitHub

การเข้าถึง GitHub นั้นง่ายมากใน Colab นี่คือสิ่งที่คุณสามารถทำได้:

การเข้าถึง GitHub repo จาก Colaboratory
  • คลิก ไฟล์ ที่แถบเมนูด้านบน
  • เลือก อัปโหลดสมุดบันทึก จากเมนูบริบท
  • คอนโซลที่มีแท็บ GitHub จะเปิดขึ้น
  • หรือคุณสามารถกด Ctrl+O เพื่อเข้าถึงคอนโซลเดียวกันได้
  • ตัวเลือกการค้นหา GitHub ได้แก่ GitHub URL ชื่อผู้ใช้ และชื่อองค์กร

เข้าถึงไฟล์ในเครื่อง

  • กด Ctrl+O บนสมุดบันทึก Colab ใหม่ของคุณ
  • เลือกแท็บ อัปโหลด บนคอนโซลที่ปรากฏขึ้น
  • คลิก เลือกไฟล์ เพื่อค้นหาไฟล์ในเครื่องที่คุณต้องการเปิดบน Colab

เข้าถึง Google ไดรฟ์

เข้าถึง Google ไดรฟ์
  • คลิก ไฟล์ ที่เมนูด้านบน
  • คุณสามารถเลือก เปิดสมุดบันทึก หรือ อัปโหลดสมุดบันทึก
  • คอนโซลจะปรากฏขึ้นพร้อมกับแท็บสำหรับ Google ไดรฟ์
  • คลิกเพื่อเข้าถึงไฟล์จาก Google Drive

หากคุณต้องการเมานต์ Google ไดรฟ์กับอินสแตนซ์ Colab ของคุณ ให้ทำตามขั้นตอนเหล่านี้:

ต่อเชื่อม Google ไดรฟ์กับอินสแตนซ์ Colab ของคุณ
  • คลิกที่ ไฟล์ ที่อยู่ในบานหน้าต่างนำทางด้านซ้าย
  • เลือกคำสั่ง Mount Drive
  • ในการแจ้งเตือนที่ปรากฏขึ้น ให้เลือก เชื่อมต่อกับ Google ไดรฟ์
  • Google จะขอให้คุณเลือกบัญชีสำหรับการอนุญาต

บันทึกและนำเข้าจาก Google ชีต

คุณสามารถบันทึกข้อมูลสมุดบันทึกของคุณลงในไฟล์ Google ชีตได้อย่างง่ายดายเพื่อการประมวลผลต่อไป โดยให้ลองทำตามขั้นตอนเหล่านี้:

การเข้าถึง Google ชีต
  • คลิกปุ่ม Code Snippets ที่มุมล่างซ้าย
  • บานหน้าต่างนำทางจะเปิดขึ้นทางด้านขวา
  • พิมพ์ ชีต ในตัวกรอง แล้วคุณจะพบข้อมูลโค้ด การบันทึกข้อมูล และ การนำเข้าข้อมูล
  • ดับเบิลคลิกที่ชื่อเพื่อรวมรหัสในสมุดบันทึก

เข้าถึง AWS S3

คุณสามารถเข้าถึงไฟล์และสินทรัพย์การเข้ารหัสจากแพลตฟอร์มพื้นที่จัดเก็บบนคลาวด์ เช่น AWS S3 และ Azure Blob ได้โดยใช้บัคเก็ตที่เก็บข้อมูลบนคลาวด์

เข้าถึง AWS S3

ในการดำเนินการนี้ คุณต้องติดตั้ง ByteHub ซึ่งมีฟังก์ชันสำหรับการโหลดและบันทึกข้อมูลลงในที่เก็บข้อมูลบนคลาวด์ คุณสามารถเรียกใช้รหัสต่อไปนี้:

 !pip install -q bytehub[aws]

เข้าถึงชุดข้อมูล Kaggle

เข้าถึงชุดข้อมูล Kaggle
  • ไปที่บัญชี Kaggle และคลิกที่ หมดอายุ API Token จาก ส่วน API เพื่อลบโทเค็นเก่า
  • สร้าง โทเค็น API ใหม่ เพื่อรับ kaggle.json บนเครื่องคอมพิวเตอร์
  • ตอนนี้ใช้รหัสต่อไปนี้เพื่อติดตั้ง Kaggle:
 !pip install -q kaggle
  • ตอนนี้ อัปโหลดไฟล์ Kaggle.json ไปยังฐานโค้ด Python โดยปฏิบัติตามหลักการเขียนโค้ดมาตรฐาน

คำพูดสุดท้าย

เมื่อคุณได้ผ่านการอภิปรายเชิงลึกเกี่ยวกับแอป Google Collaboratory แล้ว คุณควรจะสามารถเริ่มต้นการเรียนรู้ ฝึกอบรม หรือฝึกฝนโครงการแมชชีนเลิร์นนิงได้ Google Colab เป็นแอประบบคลาวด์ที่สะดวกอย่างแท้จริงสำหรับผู้ที่ชอบ Jupyter Notebooks

คุณอาจสนใจชุดข้อมูลเปิดที่เป็นที่นิยมสำหรับโครงการวิทยาศาสตร์ข้อมูล