AI กระตุ้นให้เกิดปัญหาการขาดแคลน GPU: บล็อกเชนสามารถบรรเทาปัญหาคอขวดของ Machine Learning ได้อย่างไร

บล็อกเชนเป็นสะพานเชื่อมในการเข้าถึง GPU ที่มีต้นทุนการคำนวณต่ำลง โดยอนุญาตให้มีการเข้าถึงโมเดลแบบกระจาย และสร้างตลาดสำหรับโมเดลราคาถูกกว่าพร้อมสิ่งจูงใจในการเข้ารหัส

ชื่อเดิม: "การเพิ่มขึ้นของการขาดแคลน AI และ GPU: บล็อกเชนช่วยบรรเทาปัญหาคอขวดของการเรียนรู้ของเครื่องได้อย่างไร"

เขียนโดย ทอมมี่ อีสต์แมน

เรียบเรียงโดย: Frank, Foresight News

เมื่อปัญญาประดิษฐ์พัฒนาขึ้นและความต้องการ GPU เพิ่มขึ้น อุตสาหกรรมการเรียนรู้ของเครื่องจักรก็เผชิญกับปัญหาเรื่องต้นทุนและการเข้าถึงของ GPU มาดูกันว่าเทคโนโลยีบล็อคเชนสามารถให้บริการโซลูชั่นได้อย่างไร

อุตสาหกรรมจีพียู

มีการเติบโตอย่างมากในแอปพลิเคชันและการบูรณาการที่ใช้ AI ในปีที่ผ่านมา ChatGPT ของ OpenAI กลายเป็นแอปพลิเคชันที่เติบโตเร็วที่สุดเท่าที่เคยมีมา โดยมีผู้ใช้งาน 100 ล้านคนต่อเดือนเพียงสองเดือนหลังจากเปิดตัว เมื่อเปรียบเทียบกันแล้ว TikTok ใช้เวลา 9 เดือนและ Instagram 18 เดือนในการบรรลุเป้าหมายเดียวกัน

ความต้องการปัญญาประดิษฐ์ส่งผลกระทบอย่างมากต่อมูลค่าและความพร้อมใช้งานของหน่วยประมวลผลกราฟิก (GPU) GPU เป็นหน่วยประมวลผลที่ได้รับการปรับให้เหมาะสมสำหรับการคำนวณแบบขนานและประมวลผลข้อมูลจำนวนมากไปพร้อมๆ กัน ซึ่งทำให้มีประโยชน์สำหรับการเรียนรู้ของเครื่อง การตัดต่อวิดีโอ และแอปพลิเคชันเกม เนื่องจากการใช้งาน GPU อเนกประสงค์ในวงจรปัญญาประดิษฐ์ ความต้องการของตลาดสำหรับ GPU จึงเพิ่มขึ้น

GPU ได้รับการพัฒนาและจัดจำหน่ายโดยบริษัทเพียงไม่กี่แห่ง ซึ่งเห็นได้ชัดจากความล่าช้าในห่วงโซ่อุปทานการผลิต พวกเขามีความเกี่ยวข้องอย่างใกล้ชิดกับอุตสาหกรรมบล็อกเชนนับตั้งแต่ช่วงขาขึ้นในปี 2560 โดยนักขุด Ethereum proof-of-work ซื้อ GPU เกือบทุกตัวในปี 2561 Ethereum blockchain ได้ย้ายไปที่ proof-of-stake แล้ว แต่ด้วยการระเบิดของปัญญาประดิษฐ์ เทคโนโลยี blockchain ยังคงมอบวิธีแก้ปัญหาที่เป็นประโยชน์สำหรับปัญหาทั่วไป เช่น การเข้าถึง GPU ค่าใช้จ่ายในการฝึกอบรม การอนุมานแบบกระจาย และอื่นๆ

กระบวนการเรียนรู้ของเครื่องและปัญหาคอขวด

การเรียนรู้ของเครื่องเป็นอุตสาหกรรมขนาดใหญ่และเติบโตอย่างรวดเร็ว การฝึกโมเดลมักจะแบ่งออกเป็นหลายขั้นตอน และแต่ละขั้นตอนก็มีปัญหาคอขวดอยู่บ้าง

1. การฝึกโมเดลพื้นฐาน

การฝึกอบรมโมเดลพื้นฐานเกี่ยวข้องกับการใช้ชุดข้อมูลขนาดใหญ่ (เช่น Wikipedia) และการฝึกอบรมโมเดลพื้นฐานเริ่มต้นเพื่อใช้เป็นโมเดลอัจฉริยะทั่วไปหรือปรับแต่งในที่สุด ซึ่งใช้รูปแบบที่เรียนรู้และความสัมพันธ์เพื่อทำนายรายการถัดไปในลำดับ

ตัวอย่างเช่น โมเดลการสร้างภาพได้รับการฝึกฝนให้เชื่อมโยงรูปแบบภาพกับข้อความที่สอดคล้องกัน ดังนั้นเมื่อได้รับการป้อนข้อความ โมเดลจะสร้างภาพตามรูปแบบที่เรียนรู้เหล่านี้ ในทำนองเดียวกัน สำหรับข้อความ แบบจำลองจะคาดเดาคำถัดไปในสตริงข้อความตามคำและบริบทก่อนหน้า

การฝึกอบรมโมเดลพื้นฐานมีราคาแพงในแง่ของแรงงาน โครงสร้างพื้นฐาน เวลา และความพยายาม และห่วงโซ่อุปทานในปัจจุบันทำให้ยากต่อการได้รับ NVIDIA GPU ที่ล้ำสมัย แม้แต่กับบริษัทที่มีกระเป๋าเงินจำนวนมากก็ตาม

ตัวอย่างเช่น การฝึกอบรมซ้ำของ GPT-3 ของ OpenAI กินเวลานานหลายเดือนและสิ้นเปลืองค่าพลังงานหลายล้านดอลลาร์เพียงอย่างเดียว การฝึกอบรมโมเดลพื้นฐานจึงเป็นความพยายามที่มีราคาแพงมาก โดยมีบริษัทเอกชนเพียงไม่กี่แห่งเท่านั้นที่สามารถเข้าถึงได้

2. การปรับแต่งแบบละเอียด

โดยเฉพาะอย่างยิ่ง มีการใช้ทรัพยากรน้อยกว่าการฝึกอบรมโมเดลพื้นฐาน การปรับแต่งอย่างละเอียดจะปรับโมเดลให้เหมาะสมสำหรับงานเฉพาะ (เช่น โมเดลภาษาสำหรับการเรียนรู้ภาษาถิ่นใหม่) ประสิทธิภาพของโมเดลพื้นฐานในงานเฉพาะสามารถปรับปรุงได้อย่างมากผ่านการปรับแต่งแบบละเอียด

แม้ว่าการขาดแคลน GPU จะส่งผลต่อทั้งสามด้านนี้ แต่การปรับแต่งแบบละเอียดจะได้รับผลกระทบน้อยที่สุด อย่างไรก็ตาม การปรับแต่งอย่างละเอียดจะขึ้นอยู่กับโมเดลพื้นฐานของโอเพ่นซอร์สทั้งหมด หากบริษัทเอกชนตัดสินใจที่จะหยุดโอเพ่นซอร์สโมเดลของตน โมเดลชุมชนจะตามหลังโมเดลที่ล้ำสมัย (SOTA) ในอัตราที่น่าตกใจ

3. การใช้เหตุผล

การเข้าถึงโมเดลถือเป็นขั้นตอนสุดท้ายในขั้นตอนนี้ เช่น การได้รับคำตอบสำหรับคำถามจาก ChatGPT ซึ่งเป็นรูปภาพที่สร้างขึ้นตามการกระจายการแจ้งเตือนของผู้ใช้อย่างเสถียร ซึ่งต้องใช้ทรัพยากร GPU สำหรับการสืบค้นโมเดล การอนุมานเพิ่มขึ้นอย่างรวดเร็วในแง่ของข้อกำหนดด้านการประมวลผล โดยเฉพาะอย่างยิ่งในแง่ของการใช้จ่าย GPU

การอนุมานเกี่ยวข้องกับทั้งผู้ใช้ปลายทางและนักพัฒนาที่รวมโมเดลเข้ากับแอปพลิเคชันของตน ซึ่งเป็นวิธีการรับประกันความมีชีวิตทางเศรษฐกิจของโมเดล แนวคิดนี้มีความสำคัญอย่างยิ่งในการบูรณาการระบบปัญญาประดิษฐ์เข้ากับสังคม และความสำคัญของแนวคิดนี้สะท้อนให้เห็นในอัตราการใช้งานที่รวดเร็วของผู้ใช้ปลายทางที่ใช้เครื่องมือ เช่น ChatGPT

การขาดแคลน GPU ทำให้ต้นทุนการอนุมานเพิ่มขึ้นอย่างรวดเร็ว แม้ว่าข้อกำหนดพื้นฐานสำหรับการอนุมานจะต่ำกว่าการฝึกอบรมโมเดลพื้นฐาน แต่ขนาดของแอปพลิเคชันที่ใช้งานของบริษัทนั้นต้องการโหลด GPU ที่สูงมากในการสืบค้นโมเดล เมื่อความหลากหลายของรุ่น GPU เพิ่มขึ้น (ผ่านการปรับแต่งอย่างละเอียดและการพัฒนาโมเดลพื้นฐานใหม่) ความหลากหลายของแอปพลิเคชันจะเพิ่มขึ้น และความต้องการ GPU จากการอนุมานจะเพิ่มขึ้นอย่างมาก

Blockchain นำเสนอโซลูชั่นสำหรับคอขวดของการเรียนรู้ของเครื่อง

ในอดีต GPU ถูกนำมาใช้เพื่อขุด Ethereum และโทเค็น PoW อื่นๆ ขณะนี้ บล็อกเชนถูกมองว่าเป็นโอกาสพิเศษในการเข้าถึงและเพิ่มการประสานงานระหว่างจุดคอขวดของพื้นที่ GPU โดยเฉพาะอย่างยิ่งในการเรียนรู้ของเครื่อง

สิ่งจูงใจการเข้ารหัส

การใช้งาน GPU ขนาดใหญ่ต้องใช้เงินทุนล่วงหน้าจำนวนมาก ซึ่งขัดขวางความคืบหน้าในด้านนี้สำหรับทุกคน ยกเว้นบริษัทที่ใหญ่ที่สุด สิ่งจูงใจบล็อคเชนสร้างศักยภาพให้เจ้าของ GPU ทำกำไรจากการประมวลผลสำรอง สร้างตลาดที่ถูกกว่าและเข้าถึงได้มากขึ้นสำหรับผู้ใช้

การเข้าถึงแบบกระจาย

ใครๆ ก็สามารถจัดเตรียม/ใช้การคำนวณ โมเดลโฮสติ้ง และโมเดลคิวรีได้ ซึ่งแตกต่างอย่างมากจากความจำเป็นที่ต้องอยู่ในรุ่นเบต้าหรือมีสิทธิ์การเข้าถึงที่จำกัดในพื้นที่แบบเดิม

คุณลักษณะสำคัญที่ blockchain สามารถมอบให้กับพื้นที่การเรียนรู้ของเครื่องคือการเข้าถึงแบบกระจาย แมชชีนเลิร์นนิงมักต้องใช้ศูนย์ข้อมูลขนาดใหญ่ เนื่องจาก FMT ยังไม่บรรลุผลสำเร็จในระดับบน GPU ที่ไม่ใช่คลัสเตอร์ และโปรโตคอลแบบกระจายกำลังพยายามแก้ไขปัญหานี้ และหากสำเร็จ ก็จะเปิดประตูระบายน้ำสำหรับ FMT

การประสานงานด้านการตลาด

ตลาดบล็อกเชนช่วยประสานงานในการซื้อ GPU ช่วยให้บุคคลและบริษัทที่เป็นเจ้าของ GPU สามารถค้นหาผู้ที่ต้องการเช่าได้ แทนที่จะปล่อยให้พวกเขานั่งเฉยๆ และการสร้างรายได้ในขณะที่ GPU ไม่ได้ใช้งานสามารถช่วยชดเชยต้นทุนล่วงหน้าในการซื้อ GPU ได้ ทำให้มีมากขึ้น เอนทิตีมีส่วนร่วมในการโฮสต์ GPU

ความมุ่งมั่นของ Foundry ต่อ AI ที่มีความรับผิดชอบ

สาขาการเรียนรู้ของเครื่องบล็อกเชนเป็นอุตสาหกรรมที่เพิ่งเกิดใหม่ซึ่งมีเพียงไม่กี่โครงการบนเมนเน็ต ปัจจุบัน Foundry กำลังสนับสนุนโครงการ Bittensor AI เช่นเดียวกับ Akash ซึ่งได้รับการพิสูจน์แล้วว่าเป็นวิธีที่มีความหมายในการพัฒนา AI แบบกระจาย

บิทเทนเซอร์

Bittensor เป็นเครือข่ายคอมพิวเตอร์แบบกระจายอำนาจและไม่ได้รับอนุญาตซึ่งช่วยให้เข้าถึงโมเดลได้ง่ายขึ้น และสร้างตลาดโมเดลที่ราคาถูกลงผ่านสิ่งจูงใจด้านการเข้ารหัส ซึ่งใครๆ ก็สามารถโฮสต์โมเดลได้ และอันดับการแจ้งเตือนผู้ใช้ด้วยรูปแบบที่กำหนดจะจับคู่โมเดลสูงสุด

Bittensor ได้เติบโตขึ้นเป็นหนึ่งในโครงการปัญญาประดิษฐ์ที่ใหญ่ที่สุดในสกุลเงินดิจิทัล โดยใช้ประโยชน์จากบล็อกเชนเพื่อสร้างเครือข่ายการอนุมานทางคอมพิวเตอร์ขนาดใหญ่ที่เพิ่งเปิดตัวเครือข่ายย่อยที่จูงใจโหมดต่างๆ รวมถึงการสร้างภาพ ตลาดการทำนาย และอื่นๆ

Foundry ดำเนินการตรวจสอบและขุดบนเครือข่าย และรันโหนด Proof-of-Authority เพื่อให้มั่นใจถึงความเห็นพ้องต้องกัน

อากาศ

Akash เป็นตลาดการประมวลผลสำหรับวัตถุประสงค์ทั่วไปที่ช่วยให้เข้าถึง GPU ในขนาดต่างๆ ได้ง่ายขึ้น ฝึกฝนโมเดลพื้นฐานได้มากขึ้น และลดต้นทุนของ GPU

Akash เพิ่งเปิดตัว GPU Marketplace โดยมีเป้าหมายคล้ายกับการลดอุปสรรคทางการเงินในการเข้าสู่ ลดต้นทุนการประมวลผล GPU และเพิ่มการเข้าถึง และโปรแกรมการฝึกอบรมโมเดลพื้นฐานกำลังเติบโตที่ Akash Foundry ให้บริการการประมวลผล GPU สำหรับเครือข่ายและทำงานร่วมกับทีมเพื่อพัฒนาคุณสมบัติต่างๆ

อะไรต่อไป?

ในขณะที่การเรียนรู้ของเครื่องยังคงถูกรวมเข้ากับองค์กร ความต้องการ GPU จะยังคงเพิ่มสูงขึ้นอย่างต่อเนื่อง ทำให้เกิดปัญหาห่วงโซ่อุปทานอย่างต่อเนื่องในพื้นที่การเรียนรู้ของเครื่อง เทคโนโลยี Blockchain กำลังช่วยเหลือโดยอนุญาตให้มีการเข้าถึงแบบจำลองแบบกระจายและสร้างตลาดแบบจำลองที่ถูกกว่าด้วยสิ่งจูงใจ crypto มอบสะพานเพื่อเข้าถึง GPU ที่มีต้นทุนการประมวลผลต่ำลง