เขียนโดย: มู มู
AIGC ได้เจาะลึกประสบการณ์ภาพและเสียงของมนุษย์ตั้งแต่ข้อความ รูปภาพ วิดีโอ ไปจนถึงเสียงพูด แม้แต่ยักษ์ใหญ่ที่เคยต่อต้านเพลง AI อย่างแข็งขันเนื่องจากปัญหาลิขสิทธิ์ก็ยังต้องเปลี่ยนทัศนคติและปรับตัวให้เข้ากับผลิตภัณฑ์ในยุคนั้น
ในเดือนกันยายนปีนี้ Warner Music เซ็นสัญญากับนักร้องเสมือนจริงคนแรก Noonoouri และในเดือนสิงหาคม Universal Music และ YouTube ร่วมกันเปิดตัว "Music AI Incubator" เพื่อแก้ไขปัญหาลิขสิทธิ์เพลงหลังจากการเกิดขึ้นของ AIGC
เมื่อเทียบกับต่างประเทศ จีนดูเหมือนจะยอมรับเพลง AI มากกว่า NetEase Cloud Music ร่วมมือกับ Xiaobing เปิดตัวเครื่องมือสร้างเพลงที่ใช้ AI และสร้างค่ายเพลงเสมือนจริงแห่งแรก "WOWAIDO!"
จังหวะและเสียงร้องที่จำลองโดย AI ได้รับการแนะนำสู่สาธารณะโดยใช้นักร้องเสมือนจริงเป็นตัวพา การเปลี่ยนเสียงการสังเคราะห์ทางกลไกทางอิเล็กทรอนิกส์ที่ปล่อยออกมาจากภาพเสมือนจริงในอดีต และมีเสียงที่ใกล้เคียงกับคนจริง ในเวลาเดียวกัน นักร้องเสมือนจริงที่เปลี่ยนรูปภาพและวนซ้ำอย่างต่อเนื่องได้กลายมาเป็นนักร้อง AI โดยค่อยๆ ทำลายความแตกต่างระหว่างความเป็นจริงและความเป็นจริง และขยายสถานการณ์การใช้งานและมูลค่าเชิงพาณิชย์ให้มากขึ้น
Warner Music เซ็นสัญญานักร้องเสมือน Noonoouri
ในเดือนกันยายนของปีนี้ Noonoouri ผู้มีชื่อเสียงในโลกออนไลน์ที่มีผู้ติดตามมากกว่า 400,000 คนบนโซเชียลมีเดีย Instagram ได้เซ็นสัญญากับ Warner Music และปล่อยซิงเกิลแรกของเธอ "Dominoes" Noonoouri จึงกลายเป็นนักร้องเสมือนจริงคนแรกที่เซ็นสัญญาบันทึกเพลงครั้งใหญ่
อวตารของ Noonoouri เกิดในปี 2018 เป็นภาพอนิเมะที่สร้างโดยนักสร้างสรรค์งานศิลปะ Joerg Zuber ตัวละครอยู่ในตำแหน่งที่เป็นนางแบบ ในอดีต ตัวละครในอนิเมะมีเรื่องราวและโครงเรื่องเพื่อดึงดูดแฟนๆ แต่ Noonoouri เกิดมาเพื่อสนับสนุนแบรนด์แฟชั่นระดับไฮเอนด์ เธอทำงานในนิตยสารแฟชั่นกระแสหลักรายใหญ่และได้ร่วมมือกับแบรนด์ต่างประเทศ เช่น Dior, Miu Miu และ Calvin Klein .
สองปีหลังจากการ "เดบิวต์" ของเธอ นูนูรีมีแฟน ๆ บนอินสตาแกรมเพิ่มขึ้นถึง 360,000 คน แต่ในอีกสองปีถัดมา มันก็เริ่มจืดจาง และจำนวนแฟน ๆ ก็เพิ่มขึ้นเป็น 400,000 คนและหยุดไป จนกระทั่งเธอเข้าร่วมกลุ่มศิลปินของ Warner Music นูนูรีจึงได้ปลดล็อกตัวตนของ "นักร้องเสมือนจริง" บนอินสตาแกรม MV ซิงเกิล "Dominoes" มีผู้เข้าชมมากกว่า 250,000 ครั้ง ถือเป็นผลงานที่ทรงอิทธิพลที่สุดของเธอในช่วงไม่กี่ปีที่ผ่านมา
เพื่อให้ตัวละครเสมือนจริงเคลื่อนไหวได้ มีทั้งแอนิเมชั่น, CG และแม้แต่เทคโนโลยีจับภาพเคลื่อนไหว แต่เสียงของนูนูริมาจากไหน? กำลังจะได้รับลมตะวันออกที่ AI นำมาสู่โมเดลเสมือนจริงนี้ มีรายงานว่าท่อนร้องเพลงของนูนูรีในเพลง "Dominoes" ได้รับการสังเคราะห์จากเสียงของนักร้องตัวจริงด้วยเทคโนโลยีปัญญาประดิษฐ์ (AI) ทั้งนักแต่งเพลงและนักดนตรีของผลงานจะได้รับค่าลิขสิทธิ์และส่วนแบ่งการจัดจำหน่ายที่สอดคล้องกัน
Warner Music ซึ่งเซ็นสัญญากับ Noonoouri คว่ำบาตรเพลง AI ในเดือนเมษายนปีนี้เนื่องจากปัญหาลิขสิทธิ์ แต่ไม่กี่เดือนต่อมา บริษัทยักษ์ใหญ่ด้านแผ่นเสียงก็เปลี่ยนทัศนคติ
Universal Music บริษัทแผ่นเสียงอีกแห่งหนึ่งที่เคยปฏิเสธ AI ได้จับมือกับ YouTube ในเดือนสิงหาคมปีนี้เพื่อเปิดตัว "Music AI Incubator" มีรายงานว่าจะ "ร่วมมือกับศิลปินและนักดนตรีเพื่อสำรวจการประยุกต์ใช้ปัญญาประดิษฐ์ในดนตรีและ คุ้มครองลิขสิทธิ์ผลงานเพลง" . นอกจากนี้ UMG และ Google ซึ่งเป็นบริษัทแม่ของ YouTube กำลังหารือเกี่ยวกับเสียงและท่วงทำนองของศิลปินที่ได้รับใบอนุญาตเพื่อฝึกโมเดล AI เพื่อทดสอบสิ่งต่างๆ
ไม่ใช่เรื่องยากที่จะเข้าใจการเปลี่ยนแปลงของบริษัทแผ่นเสียงไปสู่เทคโนโลยี AI ตั้งแต่ปี 2023 เป็นต้นมา AIGC หรือปัญญาประดิษฐ์เชิงกำเนิด (Generative Artificial Intelligence) กำลังกลายเป็นส่วนหนึ่งของชีวิตประจำวัน การผลิตจากกราฟิก ข้อความ ไปจนถึงวิดีโอและเสียงกำลังได้รับการเปลี่ยนแปลงโดย AI และแทรกซึมเข้าไปในประสบการณ์ภาพและเสียงของสาธารณะ Neal Mohan ซีอีโอของ YouTube กล่าวว่าในปี 2023 เพียงปีเดียว วิดีโอที่เกี่ยวข้องกับเครื่องมือ AI เจนเนอเรชั่นจะถูกรับชมมากกว่า 1.7 พันล้านครั้งบน YouTube
เมื่อต้องเผชิญกับการยอมรับจากสาธารณชนต่อ AIGC บริษัทแผ่นเสียงจึงต้องเปลี่ยนความคิดและคิดว่าทรัพยากรลิขสิทธิ์ที่สะสมไว้จะสามารถนำมารวมกับ AI ได้อย่างไร "โมเดลการฝึกอบรม - เครื่องมือในการผลิต - การกระตุ้นการสร้างสรรค์" เป็นเส้นทางที่ดีและค่อนข้างสมบูรณ์ ที่จริงแล้ว การผสมผสานระหว่างดนตรีและเครื่องมือใหม่ ๆ นั้นไม่ใช่เรื่องใหม่ ตัวอย่างเช่น ซินธิไซเซอร์ดนตรีอิเล็กทรอนิกส์ยุคแรก ๆ
จากซินธิไซเซอร์ไปจนถึงแพลตฟอร์มสร้างเสียงด้วย AI
จากซินธิไซเซอร์ไปจนถึงแพลตฟอร์มสร้างเสียงด้วย AI
ใน "Summer of the Band" ที่ได้รับความนิยมในปัจจุบัน วง "Supermarket" ได้สร้างความประทับใจให้กับแฟนเพลงรุ่นใหม่ในยุคนี้ด้วยดนตรีอิเล็กทรอนิกส์ที่เป็นเอกลักษณ์ของพวกเขา และพวกเขายังเป็นวงดนตรีวงแรกที่นำดนตรีอิเล็กทรอนิกส์มาสู่ประเทศจีน
ดนตรีอิเล็กทรอนิกส์ที่ค่อยๆ ได้รับการยอมรับจากสาธารณชนเกือบทั้งหมดผลิตโดยเครื่องสังเคราะห์เสียง ในยุคแรกๆ ของดนตรีอิเล็กทรอนิกส์ ตัวซินธิไซเซอร์เองก็เป็นเพียงชิ้นส่วนฮาร์ดแวร์ และเสียงที่ถูกสร้างขึ้นนั้นแสดงออกผ่านลำโพงหรือหูฟังหลังจากถูกส่งผ่านเครื่องขยายสัญญาณเครื่องดนตรีไฟฟ้า เมื่อเข้าสู่ยุคคอมพิวเตอร์ซอฟต์แวร์ซินธิไซเซอร์ก็ปรากฏขึ้นมากขึ้นเรื่อย ๆ จากมุมมองของการผลิตเพลงป๊อปสมัยใหม่ตราบใดที่คุณเป็นเจ้าของคอมพิวเตอร์คุณก็พร้อมที่จะใช้ซอฟต์แวร์ซินธิไซเซอร์เพื่อผลิตผลงานดนตรีที่สมบูรณ์
ในปี 2004 ผู้ผลิตเครื่องดนตรี YAMAHA ได้เปิดตัวซอฟต์แวร์สังเคราะห์เสียงร้องอิเล็กทรอนิกส์ VOCALOID ทำให้การสร้างสรรค์ดนตรีอิเล็กทรอนิกส์เข้าถึงได้ง่ายขึ้น ไม่เพียงแต่ดนตรีเท่านั้น แต่ยังรวมถึงการร้องเพลงของมนุษย์ด้วย ผู้สร้างเพียงต้องใส่โทนเสียงและเนื้อเพลงเพื่อสังเคราะห์เสียงร้องที่เหมือนมนุษย์เท่านั้น VOCALOID คือสิ่งที่เรียกว่า “ตระกูล V” ในวงกลมสองมิติในประเทศ
คุณอาจไม่คุ้นเคยกับซอฟต์แวร์ VOCALOID แต่คุณต้องเคยได้ยินเกี่ยวกับไอดอลเสมือนจริง เช่น Hatsune Miku, Luo Tianyi และ Stardust และเสียงของพวกเขามาจาก VOCALOID คุณยังจำเอฟเฟกต์ของเพลงพื้นบ้านฟินแลนด์แบบดั้งเดิม "Eva Polka" เมื่อ Hatsune Miku นำมาร้องใหม่หรือไม่? เพลงคัฟเวอร์นี้กลายเป็นเพลงฮิตในชื่อเพลงหัวหอมแกว่ง
การคัฟเวอร์เพลง Onion Swallowing Song ของ Hatsune Miku ได้รับความนิยมบนอินเทอร์เน็ต
เมื่อ YAMAHA พัฒนา VOCALOID มันใช้ปัญญาประดิษฐ์หรือพื้นฐานของ AI ซึ่งก็คือข้อมูลขนาดใหญ่ พวกเขารวบรวมตัวอย่างเสียงของมนุษย์จำนวนมากและใช้เทคโนโลยีการสังเคราะห์โครงข่ายประสาทเทียมเพื่อสร้างไลบรารีแหล่งกำเนิดเสียง ผู้ใช้สามารถสร้างเอฟเฟกต์การร้องเพลงของมนุษย์ได้โดยการตั้งค่าพารามิเตอร์และเรียกเสียงในห้องสมุด
บริษัทไอดอลเสมือนจริงหลายแห่งใช้ความสามารถของ VOCALOID แต่ข้อบกพร่องของนักร้องเสมือนจริงเหล่านี้ก็ชัดเจนเช่นกัน เนื่องจากเสียงของพวกเขาถูกสังเคราะห์ด้วยระบบอิเล็กทรอนิกส์ ทันทีที่พวกเขาเปิดเสียง พวกเขาจึงมีความรู้สึกทางอิเล็กทรอนิกส์และกลไกที่แตกต่างกัน ดังนั้นขอบเขตการใช้งานของตระกูล V ส่วนใหญ่จึงจำกัดอยู่ที่มิติที่สอง
แต่ตั้งแต่ปี 2023 เป็นต้นมา ผู้คนเสมือนจริงได้กลายเป็นคนจริงมากขึ้นเรื่อยๆ ด้วยการทำซ้ำของเทคโนโลยีภาพ AI การเพิ่มเสียงอิเล็กทรอนิกส์เข้าไปจะทำลายความสมจริงที่ได้รับการอัพเกรดในที่สุด AI สามารถปรับปรุงเอฟเฟ็กต์ภาพได้ และการได้ยินก็ไม่ใช่ปัญหา เสียงคล้ายมนุษย์ที่ฝึกด้วยโมเดลเสียงขนาดใหญ่เริ่มถูกปล่อยออกมาโดยมนุษย์เสมือน
ในเดือนมิถุนายนปีนี้ Xiaoice ซึ่งเปิดตัว "Hanzo Forest Clone" ได้ร่วมมือกับ NetEase Cloud Music เพื่อเปิดตัวซอฟต์แวร์สร้างเพลงด้วย AI "NetEase Cloud Music·X Studio" และก่อตั้งค่ายเพลงที่มีนักร้องเสมือน 12 คน " WOWAIDO!" เหล่านี้ นักร้องเสมือนจริงสามารถร้องเพลงได้ทั้งร็อคและป็อป และทำนองก็ครอบคลุมหลากหลายแนว เช่น หวาน น่ารัก และไพเราะ ในพื้นที่แสดงความคิดเห็นของนักร้องเสมือนจริงเหล่านี้ มีคนพูดว่า "ฉันไม่อยากจะเชื่อเลยว่าสิ่งนี้จะร้องโดย AI"
เป็นที่น่าสังเกตว่าเสียงของนักร้อง AI เหล่านี้ไม่ได้เป็นเพียง "สำเนา" ของเสียงของคนธรรมดาเท่านั้น เบื้องหลังแต่ละเสียงมักจะสังเคราะห์จากแหล่งเสียงที่แตกต่างกันมากมาย มีรายงานว่าแหล่งกำเนิดเสียงมีขนาดใหญ่และได้รับอนุญาต
เพื่อแก้ไขปัญหาลิขสิทธิ์ AIGC ได้เพิ่มความสามารถ "เสียง" เข้าไปในมนุษย์เสมือน การเกิดขึ้นของเครื่องมือสร้าง AI เช่น NetEase Cloud Music·X Studio ช่วยให้นักดนตรีได้รับเสียงร้องที่แหบแห้งภายในไม่กี่วินาที และด้วยการปรับพารามิเตอร์ นักร้องจึงสามารถนำเสนอเอฟเฟกต์ของเพลงได้
เมื่อมองย้อนกลับไปเมื่อฮัทสึเนะ มิคุเกิดครั้งแรก จุดประสงค์ก็เพื่อแก้ไขปัญหาที่โปรดิวเซอร์หรือผู้เรียบเรียงไม่สามารถหานักร้องได้ "ที่เก็บเสียง" ที่มีรูปลักษณ์นอกกรอบ ไม่มีข้อจำกัดด้านสไตล์ และการล้มล้างเสียงของมนุษย์แบบดั้งเดิม ยังเป็นแรงบันดาลใจให้ผู้ผลิตพยายามต่อไป และนี่คือวิธีที่อุตสาหกรรมไอดอลเสมือนจริงเกิดขึ้น
ดังที่ “บิดาของฮัทสึเนะ มิคุ” ฮิโรยูกิ อิโตะ กล่าวไว้ว่า “ยิ่งมีการใช้ผลงานดิจิทัลมากเท่าไร มูลค่าของผลงานก็จะยิ่งสูงขึ้นเท่านั้น” สิ่งที่ผู้สร้างกำลังทำคือ “ฉีดวิญญาณเข้าไปในสิ่งไม่มีชีวิต”
ความคิดเห็นทั้งหมด