Generative Adversarial Networks (GAN): บทนำ

เผยแพร่แล้ว: 2022-08-16

Generative Adversarial Network (GANs) เป็นหนึ่งในเทคโนโลยีสมัยใหม่ที่มีศักยภาพมากมายในหลายกรณีการใช้งาน ตั้งแต่การสร้างภาพอายุของคุณและการเสริมเสียงของคุณไปจนถึงการใช้งานที่หลากหลายในทางการแพทย์และอุตสาหกรรมอื่นๆ

เทคโนโลยีขั้นสูงนี้สามารถช่วยคุณกำหนดรูปแบบผลิตภัณฑ์และบริการของคุณได้ นอกจากนี้ยังสามารถใช้เพื่อปรับปรุงคุณภาพของภาพเพื่อรักษาความทรงจำ

แม้ว่า GAN จะเป็นประโยชน์สำหรับหลาย ๆ คน แต่บางคนก็พบว่าเป็นเรื่องที่เกี่ยวข้อง

แต่เทคโนโลยีนี้คืออะไรกันแน่?

ในบทความนี้ ผมจะพูดถึงว่า GAN คืออะไร มันทำงานอย่างไร และการใช้งานของ GAN

มาดำดิ่งกันเลย!

เครือข่ายปฏิปักษ์กำเนิดคืออะไร?

Generative Adversarial Network (GAN) คือเฟรมเวิร์กแมชชีนเลิร์นนิงที่ประกอบด้วยโครงข่ายประสาทเทียมสองเครือข่ายที่แข่งขันกันเพื่อสร้างการคาดการณ์ที่แม่นยำยิ่งขึ้น เช่น รูปภาพ เพลงที่ไม่เหมือนใคร ภาพวาด และอื่นๆ

GANs ได้รับการออกแบบในปี 2014 โดย Ian Goodfellow นักวิทยาศาสตร์และวิศวกรคอมพิวเตอร์ และเพื่อนร่วมงานของเขาบางคน พวกมันเป็นโครงข่ายประสาทเทียมระดับลึกที่สามารถสร้างข้อมูลใหม่ได้คล้ายกับที่พวกเขาได้รับการฝึกอบรม พวกเขาแข่งขันกันในเกมที่ไม่มีผลรวมซึ่งส่งผลให้ตัวแทนคนหนึ่งแพ้เกมในขณะที่อีกคนชนะ

เครือข่ายปฏิปักษ์ทั่วไปคืออะไร

ในขั้นต้น GAN ได้รับการเสนอให้เป็นแบบจำลองกำเนิดสำหรับการเรียนรู้ของเครื่อง ซึ่งส่วนใหญ่เป็นการเรียนรู้แบบไม่มีผู้ดูแล แต่ GAN ยังมีประโยชน์สำหรับการเรียนรู้ภายใต้การดูแลแบบเต็ม การเรียนรู้กึ่งควบคุม และการเรียนรู้แบบเสริมกำลัง

สองช่วงตึกในการแข่งขันใน GAN คือ:

เครื่องกำเนิด: เป็นโครงข่ายประสาทเทียมที่สร้างผลลัพธ์เทียมคล้ายกับข้อมูลจริง

ผู้แยกแยะ: เป็นโครงข่ายประสาทเทียมที่สามารถระบุผลลัพธ์ที่สร้างขึ้นโดยไม่ได้ตั้งใจ

แนวคิดหลัก

เพื่อให้เข้าใจแนวคิดของ GAN ดีขึ้น เรามาทำความเข้าใจแนวคิดที่เกี่ยวข้องที่สำคัญกันอย่างรวดเร็ว

การเรียนรู้ของเครื่อง (ML)

การเรียนรู้ของเครื่อง

แมชชีนเลิร์นนิงเป็นส่วนหนึ่งของปัญญาประดิษฐ์ (AI) ที่เกี่ยวข้องกับการเรียนรู้และสร้างแบบจำลองที่ใช้ประโยชน์จากข้อมูลเพื่อเพิ่มประสิทธิภาพและความแม่นยำขณะปฏิบัติงานหรือตัดสินใจหรือคาดการณ์

อัลกอริธึม ML สร้างแบบจำลองตามข้อมูลการฝึกอบรม ปรับปรุงด้วยการเรียนรู้อย่างต่อเนื่อง มีการใช้ในหลายสาขา เช่น คอมพิวเตอร์วิทัศน์ การตัดสินใจอัตโนมัติ การกรองอีเมล การแพทย์ การธนาคาร คุณภาพข้อมูล ความปลอดภัยทางไซเบอร์ การรู้จำคำพูด ระบบแนะนำ และอื่นๆ

รูปแบบการเลือกปฏิบัติ

รูปแบบการเลือกปฏิบัติ

ในการเรียนรู้เชิงลึกและแมชชีนเลิร์นนิง โมเดลการเลือกปฏิบัติทำงานเป็นตัวแยกประเภทเพื่อแยกความแตกต่างระหว่างชุดของระดับหรือสองคลาส

ตัวอย่างเช่น การแยกความแตกต่างระหว่างผลไม้หรือสัตว์ต่างๆ

รุ่นกำเนิด

ในแบบจำลองกำเนิด จะมีการสุ่มตัวอย่างเพื่อสร้างภาพที่เหมือนจริงขึ้นมาใหม่ มันเรียนรู้จากภาพจริงของวัตถุบางอย่างหรือสิ่งมีชีวิตเพื่อสร้างความคิดที่เหมือนจริงแต่เลียนแบบ โมเดลเหล่านี้มีสองประเภท:

ตัวเข้ารหัสอัตโนมัติแบบแปรผัน: ใช้ตัวเข้ารหัสและตัวถอดรหัสที่เป็นโครงข่ายประสาทเทียมที่แยกจากกัน วิธีนี้ใช้ได้ผลเนื่องจากภาพที่เหมือนจริงที่กำหนดจะผ่านตัวเข้ารหัสเพื่อแสดงภาพเหล่านี้เป็นเวกเตอร์ในพื้นที่แฝง

ต่อไป ตัวถอดรหัสจะใช้ในการตีความเหล่านี้เพื่อสร้างสำเนาของภาพเหล่านี้ที่เหมือนจริง ในตอนแรก คุณภาพของภาพอาจต่ำ แต่จะเพิ่มขึ้นหลังจากที่ตัวถอดรหัสทำงานได้อย่างสมบูรณ์ และคุณสามารถละเลยตัวเข้ารหัสได้

Generative Adversarial Network (GANs): ตามที่กล่าวไว้ข้างต้น GAN คือเครือข่ายนิวรัลเชิงลึกที่สามารถสร้างข้อมูลใหม่ที่คล้ายคลึงกันจากการป้อนข้อมูลที่ได้รับ มันอยู่ภายใต้การเรียนรู้ของเครื่องแบบไม่มีผู้ดูแล ซึ่งเป็นหนึ่งในประเภทของการเรียนรู้ของเครื่องที่กล่าวถึงด้านล่าง

การเรียนรู้ภายใต้การดูแล

การเรียนรู้ภายใต้การดูแล

ในการฝึกอบรมภายใต้การดูแล เครื่องจักรจะได้รับการฝึกอบรมโดยใช้ข้อมูลที่มีป้ายกำกับอย่างดี ซึ่งหมายความว่าข้อมูลบางส่วนจะถูกแท็กด้วยคำตอบที่ถูกต้องแล้ว ในที่นี้ เครื่องจะได้รับข้อมูลหรือตัวอย่างเพื่อให้อัลกอริธึมการเรียนรู้ภายใต้การดูแลสามารถวิเคราะห์ข้อมูลการฝึกอบรมและสร้างผลลัพธ์ที่แม่นยำจากข้อมูลที่ติดป้ายกำกับนี้

การเรียนรู้แบบไม่มีผู้ดูแล

การเรียนรู้โดยไม่ได้รับการดูแลเกี่ยวข้องกับการฝึกอบรมเครื่องด้วยความช่วยเหลือของข้อมูลที่ไม่ได้ติดป้ายกำกับหรือจัดประเภท ช่วยให้อัลกอริธึมการเรียนรู้ของเครื่องทำงานกับข้อมูลนั้นโดยไม่มีคำแนะนำ ในการเรียนรู้ประเภทนี้ งานของเครื่องคือการจัดหมวดหมู่ข้อมูลที่ไม่เรียงลำดับตามรูปแบบ ความเหมือน และความแตกต่าง โดยไม่ต้องฝึกอบรมข้อมูลล่วงหน้า

ดังนั้น GAN จึงเกี่ยวข้องกับการเรียนรู้แบบไม่มีผู้ดูแลใน ML มีสองรุ่นที่สามารถค้นพบและเรียนรู้รูปแบบโดยอัตโนมัติจากข้อมูลที่ป้อน ทั้งสองรุ่นนี้เป็นเครื่องกำเนิดและจำแนก

มาทำความเข้าใจพวกเขาให้มากขึ้น

ชิ้นส่วนของ GAN

คำว่า "ปฏิปักษ์" รวมอยู่ใน GAN เนื่องจากมีสองส่วน - ตัวสร้างและตัวส่วนแข่งขันกัน สิ่งนี้ทำเพื่อดักจับ กลั่นกรอง และทำซ้ำรูปแบบข้อมูลในชุดข้อมูล มาทำความเข้าใจ GAN ทั้งสองส่วนนี้กันดีกว่า

เครื่องกำเนิดไฟฟ้า

เครื่องกำเนิดไฟฟ้า

เครื่องกำเนิดไฟฟ้าเป็นโครงข่ายประสาทเทียมที่สามารถเรียนรู้และสร้างจุดข้อมูลปลอม เช่น ภาพและเสียงที่ดูสมจริง ใช้ในการฝึกอบรมและดีขึ้นด้วยการเรียนรู้อย่างต่อเนื่อง

ข้อมูลที่สร้างโดยตัวสร้างจะใช้เป็นตัวอย่างเชิงลบสำหรับส่วนอื่นๆ – ตัวส่วนที่เราจะได้เห็นต่อไป เครื่องกำเนิดไฟฟ้าใช้เวกเตอร์ความยาวคงที่แบบสุ่มเป็นอินพุตเพื่อสร้างเอาต์พุตตัวอย่าง มีจุดมุ่งหมายเพื่อนำเสนอผลงานต่อหน้าผู้เลือกปฏิบัติเพื่อให้สามารถจำแนกได้ว่าเป็นของจริงหรือของปลอม

เครื่องกำเนิดไฟฟ้าได้รับการฝึกอบรมด้วยส่วนประกอบเหล่านี้:

  • เวกเตอร์อินพุตที่มีเสียงดัง
  • เครือข่ายตัวสร้างเพื่อแปลงอินพุตแบบสุ่มเป็นอินสแตนซ์ข้อมูล
  • เครือข่าย discriminator เพื่อจำแนกข้อมูลที่สร้างขึ้น
  • การสูญเสียเครื่องกำเนิดไฟฟ้าเพื่อลงโทษเครื่องกำเนิดไฟฟ้าเนื่องจากล้มเหลวในการหลอกผู้เลือกปฏิบัติ

เครื่องกำเนิดไฟฟ้าทำงานเหมือนขโมยเพื่อทำซ้ำและสร้างข้อมูลที่สมจริงเพื่อหลอกผู้เลือกปฏิบัติ มีวัตถุประสงค์เพื่อหลีกเลี่ยงการตรวจสอบหลายครั้ง แม้ว่าจะสามารถล้มเหลวได้อย่างมากในช่วงเริ่มต้น แต่ก็ยังมีการปรับปรุงอย่างต่อเนื่องจนกว่าจะสร้างข้อมูลคุณภาพสูงที่สมจริงหลายรายการและสามารถหลีกเลี่ยงการทดสอบได้ หลังจากความสามารถนี้บรรลุแล้ว คุณสามารถใช้เพียงตัวสร้างโดยไม่ต้องมีตัวแบ่งแยก

ผู้เลือกปฏิบัติ

ผู้เลือกปฏิบัติ

ผู้แยกแยะยังเป็นโครงข่ายประสาทเทียมที่สามารถแยกความแตกต่างระหว่างภาพปลอมกับภาพจริงหรือประเภทข้อมูลอื่นๆ เช่นเดียวกับเครื่องกำเนิดไฟฟ้า มันมีบทบาทสำคัญในช่วงการฝึก

มันทำหน้าที่เหมือนตำรวจจับขโมย (ข้อมูลปลอมโดยเครื่องกำเนิดไฟฟ้า) มีจุดมุ่งหมายเพื่อตรวจจับภาพเท็จและความผิดปกติในอินสแตนซ์ข้อมูล

ตามที่กล่าวไว้ก่อนหน้านี้ ตัวสร้างจะเรียนรู้และปรับปรุงอย่างต่อเนื่องเพื่อไปถึงจุดที่ต้องพึ่งพาตนเองในการผลิตภาพคุณภาพสูงที่ไม่ต้องการผู้เลือกปฏิบัติ เมื่อข้อมูลคุณภาพสูงจากตัวสร้างถูกส่งผ่านผ่านตัวแบ่งแยก จะไม่สามารถแยกความแตกต่างระหว่างภาพจริงและภาพปลอมได้อีกต่อไป ดังนั้นคุณจึงดีที่จะไปกับเครื่องกำเนิดไฟฟ้า

GAN ทำงานอย่างไร?

ในเครือข่ายปฏิปักษ์กำเนิด (GAN) มีสามสิ่งที่เกี่ยวข้อง:

  • แบบจำลองกำเนิดเพื่ออธิบายวิธีการสร้างข้อมูล
  • การตั้งค่าที่เป็นปฏิปักษ์ที่โมเดลได้รับการฝึกอบรม
  • Deep Neural Network เป็นอัลกอริธึม AI สำหรับการฝึกอบรม

โครงข่ายประสาทเทียมทั้งสองของ GAN – เครื่องกำเนิดและการเลือกปฏิบัติ- ถูกใช้เพื่อเล่นเกมที่เป็นปฏิปักษ์ เครื่องกำเนิดไฟฟ้าใช้ข้อมูลที่ป้อนเข้า เช่น ไฟล์เสียง รูปภาพ ฯลฯ เพื่อสร้างอินสแตนซ์ข้อมูลที่คล้ายกันในขณะที่ผู้เลือกปฏิบัติจะตรวจสอบความถูกต้องของอินสแตนซ์ข้อมูลนั้น ฝ่ายหลังจะพิจารณาว่าอินสแตนซ์ข้อมูลที่ตรวจสอบแล้วนั้นเป็นของจริงหรือไม่

GAN ทำงานอย่างไร

ตัวอย่างเช่น คุณต้องการตรวจสอบว่ารูปภาพที่ระบุนั้นเป็นของจริงหรือของปลอม คุณสามารถใช้อินพุตข้อมูลที่สร้างขึ้นด้วยมือเพื่อป้อนไปยังเครื่องกำเนิด มันจะสร้างภาพที่จำลองแบบขึ้นมาใหม่เป็นผลลัพธ์

ขณะทำเช่นนั้น โปรแกรมสร้างมีจุดมุ่งหมายเพื่อให้รูปภาพทั้งหมดที่สร้างขึ้นนั้นถือเป็นของจริง แม้จะเป็นของปลอมก็ตาม มันต้องการสร้างผลลัพธ์ที่พอเหมาะที่จะโกหกและหลีกเลี่ยงการถูกจับ

ถัดไป ผลลัพธ์นี้จะไปที่ตัวแบ่งแยกพร้อมกับชุดรูปภาพจากข้อมูลจริงเพื่อตรวจสอบว่ารูปภาพเหล่านี้เป็นของจริงหรือไม่ มันทำงานได้ไม่ดีกับเครื่องกำเนิดไฟฟ้าไม่ว่าจะพยายามเลียนแบบมากแค่ไหนก็ตาม ผู้เลือกปฏิบัติจะช่วยแยกแยะข้อมูลที่เป็นข้อเท็จจริงออกจากข้อมูลปลอม

ผู้เลือกปฏิบัติจะใช้ทั้งข้อมูลปลอมและข้อมูลจริงเพื่อส่งคืนความน่าจะเป็น 0 หรือ 1 โดยที่ 1 หมายถึงความถูกต้องในขณะที่ 0 หมายถึงของปลอม

มีสองลูปป้อนกลับในกระบวนการนี้:

  • เครื่องกำเนิดไฟฟ้าเข้าร่วมวงตอบรับกับผู้เลือกปฏิบัติ
  • ผู้เลือกปฏิบัติเข้าร่วมวงข้อเสนอแนะอื่นด้วยชุดภาพจริง

การฝึกอบรม GAN ได้ผลเพราะทั้งผู้สร้างและผู้แยกแยะอยู่ในการฝึกอบรม เครื่องกำเนิดไฟฟ้าจะเรียนรู้อย่างต่อเนื่องโดยการส่งผ่านข้อมูลที่ไม่ถูกต้อง ในขณะที่ผู้เลือกปฏิบัติจะเรียนรู้เพื่อปรับปรุงการตรวจจับ ที่นี่ทั้งคู่เป็นไดนามิก

discriminator เป็นเครือข่ายแบบ convolutional ที่สามารถจัดหมวดหมู่รูปภาพที่ให้มา มันทำงานเป็นตัวแยกประเภททวินามเพื่อติดป้ายกำกับรูปภาพว่าเป็นของปลอมหรือของจริง

ในทางกลับกัน เครื่องกำเนิดก็เหมือนเครือข่าย convolutional ผกผันที่สุ่มตัวอย่างข้อมูลเพื่อสร้างภาพ แต่ discriminator จะตรวจสอบข้อมูลโดยใช้เทคนิค downsampling เช่น max-pooling

เครือข่ายทั้งสองพยายามเพิ่มประสิทธิภาพการสูญเสียหรือวัตถุประสงค์ที่แตกต่างกันในเกมฝ่ายตรงข้าม การสูญเสียของพวกเขาทำให้พวกเขาสามารถผลักดันซึ่งกันและกันได้ยากขึ้น

ประเภทของ GANs

ประเภทของ GANs

เครือข่ายปฏิปักษ์ทั่วไปมีหลายประเภทขึ้นอยู่กับการใช้งาน ต่อไปนี้คือประเภท GAN หลักที่ใช้อย่างแข็งขัน:

  • Conditional GAN ​​(CGAN): เป็นเทคนิคการเรียนรู้เชิงลึกที่เกี่ยวข้องกับพารามิเตอร์ตามเงื่อนไขเฉพาะเพื่อช่วยแยกความแตกต่างระหว่างข้อมูลจริงและข้อมูลปลอม นอกจากนี้ยังรวมถึงพารามิเตอร์เพิ่มเติม – “y” ในเฟสตัวสร้างเพื่อสร้างข้อมูลที่สอดคล้องกัน นอกจากนี้ ป้ายกำกับจะถูกเพิ่มลงในอินพุตนี้และป้อนให้กับผู้เลือกปฏิบัติเพื่อเปิดใช้งานเพื่อตรวจสอบว่าข้อมูลนั้นเป็นข้อมูลจริงหรือปลอม
  • Vanilla GAN: เป็นประเภท GAN ธรรมดาที่ตัวจำแนกและตัวสร้างนั้นง่ายกว่าและรับรู้หลายชั้น อัลกอริธึมนั้นเรียบง่าย โดยปรับสมการคณิตศาสตร์ให้เหมาะสมด้วยความช่วยเหลือของการไล่ระดับสีสุ่ม
  • Deep convolutional GAN ​​(DCGAN): เป็นที่นิยมและถือเป็นการนำ GAN ที่ประสบความสำเร็จมากที่สุดไปใช้ DCGAN ประกอบด้วย ConvNets มากกว่า Perceptrons แบบหลายชั้น ConvNets เหล่านี้นำไปใช้โดยไม่ต้องใช้เทคนิค เช่น การรวมสูงสุดหรือการเชื่อมต่อเลเยอร์ทั้งหมด
  • Super Resolution GAN (SRGAN): เป็นการนำ GAN ไปใช้โดยอาศัยเครือข่าย Deep Neural Network ควบคู่ไปกับเครือข่ายที่เป็นปฏิปักษ์เพื่อช่วยในการสร้างภาพคุณภาพสูง SRGAN มีประโยชน์อย่างยิ่งในการอัปสเกลภาพต้นฉบับที่มีความละเอียดต่ำอย่างมีประสิทธิภาพ เพื่อให้รายละเอียดได้รับการปรับปรุง และลดข้อผิดพลาดให้เหลือน้อยที่สุด
  • Laplacian Pyramid GAN (LAPGAN): เป็นการแทนแบบพลิกกลับและเป็นเส้นตรงที่มีภาพแบนด์พาสหลายภาพที่วางเว้นช่องว่างแปดช่องด้วยความถี่ต่ำตกค้าง LAPGAN ใช้เครือข่ายเครื่องจำแนกและเครื่องกำเนิดหลายระดับและระดับ Laplacian Pyramid หลายระดับ

LAPGAN ใช้กันอย่างแพร่หลายเนื่องจากให้คุณภาพของภาพที่เหนือชั้น ภาพเหล่านี้จะถูกลดขนาดลงในแต่ละชั้นของพีระมิดก่อนแล้วจึงเพิ่มขนาดในทุกเลเยอร์ โดยที่แนวคิดต่างๆ จะถูกรบกวนจนกว่าจะได้ขนาดดั้งเดิม

การประยุกต์ใช้ GANs

เครือข่ายปฏิปักษ์ทั่วไปถูกใช้ในด้านต่างๆ เช่น:

ศาสตร์

การประยุกต์ใช้ GANs

GAN สามารถให้วิธีที่แม่นยำและรวดเร็วยิ่งขึ้นในการสร้างแบบจำลองการก่อตัวของไอพ่นพลังงานสูง และทำการทดลองทางฟิสิกส์ เครือข่ายเหล่านี้ยังสามารถฝึกให้ประเมินปัญหาคอขวดในการจำลองสำหรับฟิสิกส์ของอนุภาคที่ใช้ทรัพยากรจำนวนมาก

GAN สามารถเร่งการจำลองและปรับปรุงความเที่ยงตรงของการจำลองได้ นอกจากนี้ GAN ยังช่วยศึกษาสสารมืดด้วยการจำลองเลนส์โน้มถ่วงและปรับปรุงภาพทางดาราศาสตร์

วีดีโอเกมส์

วีดีโอเกมส์

โลกของวิดีโอเกมยังใช้ประโยชน์จาก GAN เพื่อขยายข้อมูล 2 มิติความละเอียดต่ำที่ใช้ในวิดีโอเกมรุ่นเก่า มันจะช่วยให้คุณสร้างข้อมูลดังกล่าวขึ้นใหม่เป็น 4k หรือความละเอียดที่สูงกว่าผ่านการฝึกอบรมภาพ ถัดไป คุณสามารถลดขนาดข้อมูลหรือรูปภาพเพื่อให้เหมาะสมกับความละเอียดที่แท้จริงของวิดีโอเกม

ให้การฝึกอบรมที่เหมาะสมกับโมเดล GAN ของคุณ พวกเขาสามารถให้ภาพ 2D ที่คมชัดและชัดเจนขึ้นด้วยคุณภาพที่น่าประทับใจเมื่อเทียบกับข้อมูลดั้งเดิมในขณะที่ยังคงรักษารายละเอียดของภาพจริงเช่นสี

วิดีโอเกมที่ใช้ประโยชน์จาก GAN ได้แก่ Resident Evil Remake, Final Fantasy VIII และ IX และอื่นๆ

ศิลปะและแฟชั่น

คุณสามารถใช้ GAN เพื่อสร้างงานศิลปะได้ เช่น การสร้างภาพบุคคลที่ไม่เคยมีอยู่จริง ภาพถ่ายในสี การสร้างภาพของนางแบบแฟชั่นที่ไม่จริง และอื่นๆ อีกมากมาย นอกจากนี้ยังใช้ในภาพวาดที่สร้างเงาและภาพร่างเสมือนจริง

การโฆษณา

การใช้ GAN เพื่อสร้างและผลิตโฆษณาของคุณจะช่วยประหยัดเวลาและทรัพยากร ตามที่เห็นด้านบน หากคุณต้องการขายเครื่องประดับ คุณสามารถสร้างแบบจำลองในจินตนาการที่ดูเหมือนมนุษย์จริง ๆ ด้วยความช่วยเหลือของ GAN

ด้วยวิธีนี้ คุณสามารถทำให้นางแบบสวมใส่เครื่องประดับของคุณและแสดงให้ลูกค้าเห็นได้ จะช่วยให้คุณประหยัดจากการจ้างนางแบบและจ่ายเงิน คุณยังสามารถตัดค่าใช้จ่ายเพิ่มเติม เช่น ค่าเดินทาง เช่าสตูดิโอ จัดเตรียมช่างภาพ ช่างแต่งหน้า ฯลฯ

สิ่งนี้จะช่วยได้อย่างมากหากคุณเป็นธุรกิจที่กำลังเติบโตและไม่สามารถจ้างนางแบบหรือสร้างโครงสร้างพื้นฐานสำหรับการถ่ายทำโฆษณาได้

การสังเคราะห์เสียง

คุณสามารถสร้างไฟล์เสียงจากชุดของคลิปเสียงด้วยความช่วยเหลือของ GAN สิ่งนี้เรียกอีกอย่างว่าเสียงกำเนิด โปรดอย่าสับสนกับ Amazon Alexa, Apple Siri หรือเสียง AI อื่น ๆ ที่มีการเย็บชิ้นส่วนเสียงอย่างดีและผลิตตามความต้องการ

แต่กำเนิดเสียงใช้โครงข่ายประสาทเทียมเพื่อศึกษาคุณสมบัติทางสถิติของแหล่งกำเนิดเสียง ถัดไป จะทำซ้ำคุณสมบัติเหล่านั้นโดยตรงในบริบทที่กำหนด ในที่นี้ การสร้างแบบจำลองแสดงถึงการเปลี่ยนแปลงของคำพูดหลังจากแต่ละมิลลิวินาที

ถ่ายทอดการเรียนรู้

ถ่ายทอดการเรียนรู้

การศึกษาการเรียนรู้การโอนย้ายขั้นสูงใช้ GAN ในการปรับพื้นที่ฟีเจอร์ล่าสุด เช่น การเรียนรู้การเสริมแรงเชิงลึก ด้วยเหตุนี้ การฝังแหล่งที่มาและงานที่มุ่งหมายจะถูกป้อนไปยังผู้เลือกปฏิบัติเพื่อกำหนดบริบท ถัดไป ผลลัพธ์จะถูกส่งกลับผ่านตัวเข้ารหัส ด้วยวิธีนี้ โมเดลจะเรียนรู้ต่อไป

แอปพลิเคชันอื่น ๆ ของ GAN ได้แก่:

  • การวินิจฉัยการสูญเสียการมองเห็นทั้งหมดหรือบางส่วนโดยการตรวจจับภาพต้อหิน
  • เห็นภาพการออกแบบอุตสาหกรรม การออกแบบภายใน เสื้อผ้า รองเท้า กระเป๋า และอื่นๆ
  • สร้างลักษณะใบหน้าทางนิติเวชของผู้ป่วยขึ้นใหม่
  • สร้างโมเดล 3 มิติของรายการจากภาพ สร้างวัตถุใหม่เป็น 3D point cloud สร้างโมเดลการเคลื่อนไหวในวิดีโอ
  • โชว์หน้าตาของคนที่อายุเปลี่ยนไป
  • การเสริมข้อมูล เช่น การเสริม DNN classifier
  • ระบายสีส่วนที่ขาดหายไปในแผนที่ ปรับปรุงมุมมองถนน โอนรูปแบบการทำแผนที่ และอื่นๆ
  • สร้างภาพ แทนที่ระบบค้นหาภาพ ฯลฯ
  • สร้างอินพุตควบคุมให้กับระบบไดนามิกที่ไม่ใช่เชิงเส้นโดยใช้รูปแบบ GAN
  • วิเคราะห์ผลกระทบของการเปลี่ยนแปลงสภาพภูมิอากาศในบ้าน
  • สร้างใบหน้าของบุคคลโดยใช้เสียงของพวกเขาเป็นอินพุต
  • สร้างโมเลกุลใหม่สำหรับเป้าหมายโปรตีนหลายอย่างในมะเร็ง พังผืด และการอักเสบ
  • ภาพเคลื่อนไหว gif จากภาพปกติ

มีการใช้งาน GAN เพิ่มขึ้นในด้านต่างๆ มากมาย และการใช้งานของ GAN ก็เพิ่มขึ้นเรื่อยๆ อย่างไรก็ตาม มีการใช้งานในทางที่ผิดหลายครั้งเช่นกัน รูปภาพมนุษย์ที่ใช้ GAN ถูกนำมาใช้ในกรณีการใช้งานที่น่ากลัว เช่น การผลิตวิดีโอและรูปภาพปลอม

นอกจากนี้ยังสามารถใช้ GAN เพื่อสร้างภาพถ่ายและโปรไฟล์ที่เหมือนจริงของผู้คนบนโซเชียลมีเดียที่ไม่เคยมีอยู่บนโลก อื่นๆ ที่เกี่ยวข้องกับการใช้ GNA ในทางที่ผิด ได้แก่ การสร้างภาพลามกอนาจารปลอมโดยไม่ได้รับความยินยอมจากบุคคลที่นำเสนอ การแจกจ่ายวิดีโอปลอมของผู้สมัครทางการเมือง และอื่นๆ

แม้ว่า GNA จะเป็นประโยชน์ในหลาย ๆ ด้าน แต่การใช้ในทางที่ผิดก็อาจเป็นหายนะได้เช่นกัน ดังนั้นจึงต้องมีการบังคับใช้แนวทางที่เหมาะสมในการใช้งาน

บทสรุป

GAN เป็นตัวอย่างที่โดดเด่นอย่างหนึ่งของเทคโนโลยีสมัยใหม่ ให้วิธีสร้างข้อมูลและช่วยเหลือในด้านต่างๆ ที่ไม่เหมือนใครและดีกว่า เช่น การวินิจฉัยด้วยภาพ การสังเคราะห์ภาพ การวิจัย การเสริมข้อมูล ศิลปะและวิทยาศาสตร์ และอื่นๆ อีกมากมาย

คุณอาจสนใจในแพลตฟอร์มการเรียนรู้เครื่องโค้ดต่ำและไม่มีโค้ดสำหรับการสร้างแอปพลิเคชันที่เป็นนวัตกรรมใหม่