ผู้แต่ง: Zeke นักวิจัย YBB Capital
1. ความชอบต่อสิ่งใหม่และความไม่ชอบสิ่งเก่าที่เริ่มต้นด้วยความสนใจ
ในปีที่ผ่านมา เขตข้อมูลการเข้ารหัสค่อยๆ กลายเป็นเกมสำหรับทรัพยากรที่ให้ความสนใจ เนื่องจากความล้มเหลวของการเล่าเรื่องเลเยอร์แอปพลิเคชันให้ตรงกับความเร็วของการระเบิดของโครงสร้างพื้นฐาน จาก Silly Dragon ไปจนถึง Goat จาก Pump.fun ไปจนถึง Clanker การต่อสู้เพื่อความสนใจได้ลุกลามไปตลอดทาง เริ่มต้นจากการตระหนักรู้ที่สะดุดตาที่สุด มันเปลี่ยนไปอย่างรวดเร็วเป็นรูปแบบแพลตฟอร์มที่ผู้เรียกร้องความสนใจและซัพพลายเออร์เป็นหนึ่งเดียว และจากนั้นสิ่งมีชีวิตที่ใช้ซิลิคอนก็กลายเป็นผู้ให้บริการเนื้อหารายใหม่ ในบรรดาผู้ให้บริการแปลก ๆ ของ Meme Coin ในที่สุดก็มีการดำรงอยู่ที่สามารถอนุญาตให้นักลงทุนรายย่อยและ VCs บรรลุฉันทามติ: AI Agent
ในที่สุดความสนใจก็เป็นเกมที่มีผลรวมเป็นศูนย์ แต่การเก็งกำไรสามารถขับเคลื่อนสิ่งต่าง ๆ ได้อย่างบ้าคลั่ง ในบทความของเราเกี่ยวกับ UNI เราได้ทบทวนจุดเริ่มต้นของยุคทองครั้งสุดท้ายของบล็อกเชน สาเหตุของการเติบโตอย่างรวดเร็วของ DeFi มีต้นกำเนิดมาจากยุคการขุด LP ที่เริ่มต้นโดย Compound Finance ซึ่งดำเนินการในกลุ่มการขุดต่างๆ ที่มีหลายพันหรือหลายสิบ การเข้าและออกของ Apy นับพันเป็นวิธีการเล่นเกมแบบดั้งเดิมที่สุดในช่วงเวลานั้น แม้ว่าสถานการณ์สุดท้ายก็คือบ่อขุดหลายแห่งพังทลายลงและถูกปกคลุมไปด้วยขนนก อย่างไรก็ตาม การหลั่งไหลเข้ามาอย่างบ้าคลั่งของนักขุดทองได้ทิ้งสภาพคล่องอย่างที่ไม่เคยเกิดขึ้นมาก่อนในบล็อกเชน ในที่สุด DeFi ก็หลุดพ้นจากการเก็งกำไรอย่างแท้จริง และกลายเป็นแนวทางที่สมบูรณ์ ที่สร้างความพึงพอใจให้กับผู้ใช้ในทุกด้าน เช่น การชำระเงิน การซื้อขาย การเก็งกำไร และความต้องการทางการเงิน AI Agent กำลังผ่านขั้นตอนป่าเถื่อนในขั้นตอนนี้ สิ่งที่เรากำลังสำรวจคือวิธีที่ Crypto สามารถรวม AI ได้ดีขึ้นและผลักดันเลเยอร์แอปพลิเคชันไปสู่ความสูงใหม่ในที่สุด
2. ตัวแทนอัจฉริยะจะเป็นอิสระได้อย่างไร?
ในบทความก่อนหน้านี้ เราได้แนะนำที่มาของ AI Meme: Truth Terminal โดยย่อ และแนวโน้มของเราสำหรับอนาคตของ AI Agent บทความนี้จะเน้นไปที่ AI Agent ก่อน
เรามาเริ่มกันที่คำจำกัดความของ AI Agent กันก่อน Agent เป็นคำที่เก่ากว่าแต่ไม่ได้นิยามไว้ชัดเจนในสาขา AI ตามคำจำกัดความในปัจจุบัน AI Agent นั้นใกล้เคียงกับตัวแทนอัจฉริยะ กล่าวคือ การตั้งค่าระบบสำหรับแบบจำลองขนาดใหญ่เพื่อเลียนแบบการตัดสินใจของมนุษย์ ในแวดวงวิชาการ ระบบนี้ถือเป็นวิธีที่มีแนวโน้มมากที่สุดสำหรับ AGI (ปัญญาประดิษฐ์ทั่วไป) .
ใน GPT เวอร์ชันแรกๆ เรารับรู้ได้อย่างชัดเจนว่าโมเดลขนาดใหญ่นั้นมีลักษณะเหมือนมนุษย์มาก แต่เมื่อตอบคำถามที่ซับซ้อนมากมาย โมเดลขนาดใหญ่ก็สามารถให้คำตอบที่เจาะจงได้เพียงบางส่วนเท่านั้น เหตุผลสำคัญก็คือโมเดลขนาดใหญ่ในขณะนั้นขึ้นอยู่กับความน่าจะเป็นมากกว่าสาเหตุ ประการที่สอง โมเดลดังกล่าวขาดความสามารถของมนุษย์ในการใช้เครื่องมือ หน่วยความจำ การวางแผน ฯลฯ และ AI Agent ก็สามารถชดเชยข้อบกพร่องเหล่านี้ได้ สรุปด้วยสูตร AI Agent (เอเจนต์อัจฉริยะ) = LLM (โมเดลขนาดใหญ่) + การวางแผน (การวางแผน) + หน่วยความจำ (หน่วยความจำ) + เครื่องมือ (เครื่องมือ)
โมเดลขนาดใหญ่ที่อิงตามคำพร้อมท์ (Prompt) เป็นเหมือนคนคงที่มากกว่า มันจะมีชีวิตขึ้นมาเมื่อเราป้อนเข้าไป และเป้าหมายของตัวแทนอัจฉริยะก็คือคนจริงมากขึ้น ตัวแทนอัจฉริยะในปัจจุบันส่วนใหญ่เป็นโมเดลที่ได้รับการปรับแต่งอย่างละเอียดโดยอิงจากโอเพ่นซอร์สเวอร์ชัน Llama 70b หรือ 405b ของ Meta (ทั้งคู่มีพารามิเตอร์ที่แตกต่างกัน) พวกเขามีความสามารถในการจดจำและใช้เครื่องมือการเข้าถึง API แต่อาจต้องการความช่วยเหลือจากมนุษย์หรือข้อมูลอื่น ๆ (รวมถึงการมีปฏิสัมพันธ์และความร่วมมือกับตัวแทนอื่นๆ) ดังนั้นเราจึงเห็นได้ว่าตัวแทนหลักในแวดวงปัจจุบันยังคงมีอยู่บนโซเชียลเน็ตเวิร์กในรูปแบบของ KOL หากต้องการทำให้ตัวแทนอัจฉริยะมีลักษณะเหมือนมนุษย์มากขึ้น จำเป็นต้องเข้าถึงความสามารถในการวางแผนและดำเนินการ และห่วงโซ่การคิดย่อยในการวางแผนมีความสำคัญอย่างยิ่ง
3. ห่วงโซ่แห่งความคิด (CoT)
แนวคิดของ Chain of Thought (CoT) ปรากฏครั้งแรกในรายงานเรื่อง "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" ซึ่งจัดพิมพ์โดย Google ในปี 2022 บทความดังกล่าวชี้ให้เห็นว่าสามารถปรับปรุงแบบจำลองได้โดยการสร้างชุดของระดับกลาง ขั้นตอนการให้เหตุผล ความสามารถในการให้เหตุผลช่วยให้แบบจำลองเข้าใจและแก้ไขปัญหาที่ซับซ้อนได้ดีขึ้น
CoT Prompt โดยทั่วไปประกอบด้วยสามส่วน: คำแนะนำที่ชัดเจน คำอธิบายงาน พื้นฐานเชิงตรรกะ รากฐานทางทฤษฎีหรือตัวอย่างหลักการเพื่อสนับสนุนการแก้ปัญหาของงาน และการสาธิตวิธีแก้ปัญหาเฉพาะนี้ช่วยให้แบบจำลองเข้าใจข้อกำหนดของงาน และค่อยๆ เข้าถึงความต้องการเหล่านั้นโดยใช้เหตุผลเชิงตรรกะ . คำตอบจึงช่วยเพิ่มประสิทธิภาพและความแม่นยำในการแก้ปัญหา CoT เหมาะอย่างยิ่งสำหรับงานที่ต้องใช้การวิเคราะห์เชิงลึกและการให้เหตุผลหลายขั้นตอน เช่น การแก้ปัญหาทางคณิตศาสตร์ การเขียนรายงานโครงการ และงานง่ายๆ อื่นๆ อาจไม่ก่อให้เกิดข้อได้เปรียบที่ชัดเจน แต่สำหรับงานที่ซับซ้อน จะสามารถปรับปรุงประสิทธิภาพได้อย่างมาก ของแบบจำลองโดยใช้กลยุทธ์การแก้ปัญหาทีละขั้นตอนจะช่วยลดอัตราข้อผิดพลาดและปรับปรุงคุณภาพของงานให้สำเร็จ
เมื่อสร้าง AI Agent นั้น CoT มีบทบาทสำคัญในการทำความเข้าใจข้อมูลที่ได้รับและตัดสินใจอย่างสมเหตุสมผลตามข้อมูลนั้น CoT ช่วยให้ Agent ประมวลผลและวิเคราะห์ข้อมูลที่ป้อนเข้าได้อย่างมีประสิทธิภาพโดยจัดให้มีวิธีคิดที่เป็นระเบียบ และเปลี่ยนผลการวิเคราะห์เป็นแนวทางนี้ไม่เพียงแต่ช่วยเพิ่มความน่าเชื่อถือและประสิทธิภาพของการตัดสินใจของ Agent เท่านั้น แต่ยังเพิ่มความโปร่งใสของกระบวนการตัดสินใจอีกด้วย ทำให้พฤติกรรมของ Agent สามารถคาดเดาและตรวจสอบย้อนกลับได้มากขึ้น โดยช่วยแบ่งย่อยงานออกเป็นย่อย ๆ ขั้นตอน ตัวแทน แต่ละจุดการตัดสินใจได้รับการพิจารณาอย่างรอบคอบเพื่อลดการตัดสินใจที่ผิดพลาดที่เกิดจากข้อมูลมากเกินไป CoT ทำให้กระบวนการตัดสินใจของตัวแทนมีความโปร่งใสมากขึ้น และช่วยให้ผู้ใช้เข้าใจพื้นฐานการตัดสินใจของตัวแทนได้ง่ายขึ้น ในการโต้ตอบกับสภาพแวดล้อม CoT ช่วยให้ Agent เรียนรู้ข้อมูลใหม่ ๆ อย่างต่อเนื่องและปรับกลยุทธ์ด้านพฤติกรรม
ในฐานะกลยุทธ์ที่มีประสิทธิภาพ CoT ไม่เพียงแต่ปรับปรุงความสามารถในการให้เหตุผลของโมเดลภาษาขนาดใหญ่เท่านั้น แต่ยังมีบทบาทสำคัญในการสร้าง AI Agent ที่ชาญฉลาดและเชื่อถือได้มากขึ้นอีกด้วย ด้วยการใช้ประโยชน์จาก CoT นักวิจัยและนักพัฒนาสามารถสร้างระบบอัจฉริยะที่สามารถปรับให้เข้ากับสภาพแวดล้อมที่ซับซ้อนได้มากขึ้น และมีความเป็นอิสระในระดับสูง CoT ได้แสดงให้เห็นถึงข้อได้เปรียบที่เป็นเอกลักษณ์ในการใช้งานจริง โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับงานที่ซับซ้อน โดยการแบ่งงานออกเป็นขั้นตอนเล็กๆ น้อยๆ ไม่เพียงแต่ปรับปรุงความแม่นยำในการแก้ปัญหาเท่านั้น แต่ยังเพิ่มความสามารถในการตีความและการควบคุมของแบบจำลองอีกด้วย . วิธีการแก้ปัญหาแบบทีละขั้นตอนนี้สามารถลดการตัดสินใจที่ผิดพลาดที่เกิดจากข้อมูลมากเกินไปหรือซับซ้อนเกินไปเมื่อต้องเผชิญกับงานที่ซับซ้อนได้อย่างมาก ในเวลาเดียวกัน วิธีการนี้ยังปรับปรุงความสามารถในการตรวจสอบย้อนกลับและการตรวจสอบความถูกต้องของโซลูชันทั้งหมดอีกด้วย
หน้าที่หลักของ CoT คือการบูรณาการการวางแผน การดำเนินการ และการสังเกต เชื่อมช่องว่างระหว่างการใช้เหตุผลและการกระทำ โหมดการคิดนี้ช่วยให้ AI Agent สามารถกำหนดมาตรการรับมือที่มีประสิทธิภาพเมื่อคาดการณ์สถานการณ์ที่ผิดปกติที่อาจเกิดขึ้น รวมถึงรวบรวมข้อมูลใหม่ในขณะที่โต้ตอบกับสภาพแวดล้อมภายนอก ตรวจสอบการคาดการณ์ที่ตั้งไว้ล่วงหน้า และให้พื้นฐานการให้เหตุผลใหม่ CoT เปรียบเสมือนกลไกความแม่นยำและเสถียรภาพอันทรงพลังที่ช่วยให้ AI Agents รักษาประสิทธิภาพการทำงานอย่างมีประสิทธิภาพในสภาพแวดล้อมที่ซับซ้อน
4. ความต้องการหลอกที่ถูกต้อง
Crypto จะถูกรวมเข้ากับเทคโนโลยี AI ด้านใดบ้าง? ในบทความของปีที่แล้ว ฉันเชื่อว่าการกระจายอำนาจของพลังการประมวลผลและข้อมูลเป็นขั้นตอนสำคัญในการช่วยให้ธุรกิจขนาดเล็กและนักพัฒนารายบุคคลประหยัดต้นทุน ในการติดตามการแบ่งส่วน Crypto x AI ในปีนี้ที่จัดโดย Coinbase เราเห็นการแบ่งส่วนที่มีรายละเอียดมากขึ้น:
(1) เลเยอร์คอมพิวเตอร์ (หมายถึงเครือข่ายที่มุ่งเน้นการจัดหาทรัพยากรหน่วยประมวลผลกราฟิก (GPU) ให้กับนักพัฒนา AI)
(2) ชั้นข้อมูล (หมายถึงเครือข่ายที่รองรับการเข้าถึงแบบกระจายอำนาจ การจัดระเบียบ และการตรวจสอบไปป์ไลน์ข้อมูล AI)
(3) เลเยอร์มิดเดิลแวร์ (หมายถึงแพลตฟอร์มหรือเครือข่ายที่รองรับการพัฒนา การปรับใช้ และการโฮสต์โมเดลหรือตัวแทน AI)
(4) ชั้นแอปพลิเคชัน (หมายถึงผลิตภัณฑ์ที่มุ่งเน้นผู้ใช้ซึ่งใช้กลไก AI แบบออนไลน์ ไม่ว่าจะเป็น B2B หรือ B2C)
แต่ละชั้นของแผนกทั้งสี่นี้มีวิสัยทัศน์ที่ยิ่งใหญ่ และมีเป้าหมายทั้งหมดเพื่อต่อสู้กับยักษ์ใหญ่ใน Silicon Valley ยุคต่อไปที่ครองอินเทอร์เน็ต อย่างที่ผมบอกไปเมื่อปีที่แล้ว เราต้องยอมรับการควบคุมพลังการประมวลผลและข้อมูลโดยยักษ์ใหญ่ใน Silicon Valley แต่เพียงผู้เดียวจริงๆ หรือไม่ โมเดลขนาดใหญ่แบบปิดภายใต้การผูกขาดของพวกเขาคือกล่องดำภายใน วิทยาศาสตร์เป็นศาสนาที่ได้รับความนิยมมากที่สุดของมนุษยชาติในปัจจุบัน ในอนาคต ทุกประโยคที่ตอบโดยโมเดลขนาดใหญ่จะถือเป็นความจริงของคนจำนวนมาก แต่สิ่งนี้ ความจริงควรตรวจสอบอย่างไร? ตามวิสัยทัศน์ของบริษัทยักษ์ใหญ่ใน Silicon Valley ในที่สุดตัวแทนอัจฉริยะจะมีสิทธิ์เหนือจินตนาการ เช่น สิทธิ์ในการชำระเงินในกระเป๋าสตางค์ และสิทธิ์ในการใช้เทอร์มินัล จะแน่ใจได้อย่างไรว่าผู้คนไม่มีเจตนาชั่วร้าย
การกระจายอำนาจเป็นคำตอบเดียว แต่บางครั้งเราจำเป็นต้องพิจารณาอย่างสมเหตุสมผลอย่างครอบคลุมว่ามีผู้ซื้อกี่รายสำหรับวิสัยทัศน์อันยิ่งใหญ่เหล่านี้ ในอดีต เราสามารถใช้ Token เพื่อชดเชยข้อผิดพลาดที่เกิดจากการทำให้เป็นอุดมคติโดยไม่ต้องคำนึงถึงวงปิดเชิงพาณิชย์ สถานการณ์ในปัจจุบันรุนแรงมากและจำเป็นต้องออกแบบ Crypto x AI ตามสถานการณ์จริง ตัวอย่างเช่น ปลายทั้งสองด้านของชั้นพลังการประมวลผลจะสมดุลได้อย่างไรเมื่อประสิทธิภาพหายไปและไม่เสถียร เพื่อให้สอดคล้องกับความสามารถในการแข่งขันของคลาวด์แบบรวมศูนย์ จะมีผู้ใช้จริงจำนวนเท่าใดในโปรเจ็กต์ชั้นข้อมูล จะตรวจสอบความถูกต้องที่แท้จริงของข้อมูลที่ให้มาได้อย่างไร เช่นเดียวกับอีกสองระดับ ในยุคนี้ เราไม่ต้องการสิ่งจำเป็นเทียมที่ดูเหมือนจะถูกต้องมากมายนัก
5. มีมหมด SocialFi
ดังที่ฉันได้กล่าวไว้ในย่อหน้าแรก Meme ได้พัฒนารูปแบบ SocialFi ที่สอดคล้องกับ Web3 ด้วยวิธีที่รวดเร็วเป็นพิเศษ Friend.tech เป็น Dapp แรกที่เปิดตัวแอปพลิเคชันโซเชียลรอบนี้ แต่ก็พ่ายแพ้ต่อการออกแบบ Token ที่กระตือรือร้น Pump.fun ได้ตรวจสอบความเป็นไปได้ของแพลตฟอร์มบริสุทธิ์โดยไม่มีโทเค็นหรือกฎเกณฑ์ใดๆ ผู้เรียกร้องและซัพพลายเออร์เป็นหนึ่งเดียวกัน คุณสามารถโพสต์มีม ถ่ายทอดสด ออกเหรียญ ฝากข้อความ และซื้อขายบนแพลตฟอร์มได้ทุกอย่าง Pump.fun คิดค่าบริการเท่านั้น โดยพื้นฐานแล้วจะสอดคล้องกับรูปแบบการประหยัดความสนใจของโซเชียลมีเดียเช่น YouTube และ Instagram ในปัจจุบัน ยกเว้นว่าวัตถุชาร์จจะแตกต่างกัน และรูปแบบการเล่นของ Pupm.fun นั้นมี Web3 มากกว่า
Clanker ของ Base เป็นผู้เชี่ยวชาญในเรื่องทั้งหมด ต้องขอบคุณระบบนิเวศแบบบูรณาการที่จัดการโดยระบบนิเวศเป็นการส่วนตัว Base มี Dapp ทางสังคมของตัวเองเพื่อช่วยสร้างวงปิดภายในที่สมบูรณ์ Intelligent Meme เป็นรูปแบบ 2.0 ของ Meme Coin ผู้คนมักจะมองหาแนวคิดใหม่ ๆ อยู่เสมอ และ Pump.fun ก็เป็นแนวหน้าของเทรนด์ในขณะนี้ เมื่อพิจารณาจากเทรนด์แล้ว มันเป็นเพียงเรื่องของเวลาก่อนที่จะเกิดไอเดียแบบสุ่ม สิ่งมีชีวิตที่มีซิลิคอนเป็นหลักจะมาแทนที่มีมที่หยาบคายของสิ่งมีชีวิตที่มีคาร์บอนเป็นส่วนประกอบหลัก
ฉันได้กล่าวถึง Base เป็นครั้งที่เท่าไรแล้ว แต่เนื้อหาของการกล่าวถึงจะแตกต่างกันในแต่ละครั้ง จากไทม์ไลน์ Base ไม่เคยเป็นผู้เสนอญัตติคนแรก แต่เป็นผู้ชนะเสมอ
6. ตัวแทนอัจฉริยะสามารถเป็นอะไรได้อีก?
ฉันได้กล่าวถึง Base เป็นครั้งที่เท่าไรแล้ว แต่เนื้อหาของการกล่าวถึงจะแตกต่างกันในแต่ละครั้ง จากไทม์ไลน์ Base ไม่เคยเป็นผู้เสนอญัตติคนแรก แต่เป็นผู้ชนะเสมอ
6. ตัวแทนอัจฉริยะสามารถเป็นอะไรได้อีก?
จากมุมมองเชิงปฏิบัติ เป็นไปไม่ได้ที่ตัวแทนจะได้รับการกระจายอำนาจเป็นเวลานานในอนาคต เมื่อพิจารณาจากการสร้างตัวแทนในสาขา AI แบบดั้งเดิม ก็ไม่สามารถแก้ไขได้ด้วยการกระจายอำนาจกระบวนการให้เหตุผลและโอเพ่นซอร์สเพียงอย่างเดียว คือจำเป็นต้องเข้าถึง API ต่างๆ เพื่อเข้าถึงเนื้อหา Web2 และค่าใช้จ่ายในการดำเนินการมีราคาแพงมาก การออกแบบห่วงโซ่การคิดและการทำงานร่วมกันของหลายตัวแทนมักจะต้องอาศัยมนุษย์เป็นสื่อกลาง เราจะผ่านช่วงการเปลี่ยนแปลงที่ยาวนานจนกว่ารูปแบบการบูรณาการที่เหมาะสมจะเกิดขึ้น เช่น UNI แต่เหมือนบทความที่แล้วผมยังคิดว่าตัวแทนอัจฉริยะจะมีผลกระทบอย่างมากต่ออุตสาหกรรมของเรา เช่นเดียวกับการมีอยู่ของ Cex ในอุตสาหกรรมของเราที่ไม่ถูกต้องแต่สำคัญ
บทความ "ภาพรวมตัวแทน AI" ที่ออกโดย Stanford และ Microsoft เมื่อเดือนที่แล้วได้อธิบายการใช้งานของตัวแทนในอุตสาหกรรมการแพทย์ เครื่องจักรอัจฉริยะ และโลกเสมือนจริงอย่างครอบคลุม ในภาคผนวกของบทความนี้ มี GPT-4V จำนวนมากที่เข้าร่วมในฐานะตัวแทน กรณีทดสอบในการพัฒนาเกม 3A ชั้นนำ
ไม่จำเป็นต้องยืนยันถึงความเร็วของการรวมกันกับการกระจายอำนาจ ฉันหวังว่าชิ้นส่วนปริศนาชิ้นแรกที่ตัวแทนอัจฉริยะสามารถทำได้คือความสามารถและความเร็วจากล่างขึ้นบน เรามีซากปรักหักพังของการเล่าเรื่องและการเปลี่ยนแปลงที่ว่างเปล่ามากมายที่จำเป็น ให้ครบถ้วน ในขั้นตอนที่เหมาะสมเราจะพิจารณาว่าจะทำให้เป็น UNI ต่อไปได้อย่างไร
ความคิดเห็นทั้งหมด