วันเสาร์ที่ 4 พฤษภาคม 2024

เดสก์ท็อป v4.2.1

Root Nationข่าวข่าวไอทีAI โคลนเสียงแบบใหม่ของ OpenAI ต้องการเวลาตัวอย่างเพียง 15 วินาทีในการทำงาน

AI โคลนเสียงแบบใหม่ของ OpenAI ต้องการเวลาตัวอย่างเพียง 15 วินาทีในการทำงาน

-

OpenAI เสนอการเข้าถึงที่จำกัดในแพลตฟอร์มการอ่านออกเสียงข้อความที่พัฒนาขึ้นที่เรียกว่า Voice Engine ซึ่งสามารถสร้างเสียงสังเคราะห์จากคลิปเสียงของใครบางคนความยาว 15 วินาที เสียงที่สร้างโดย AI สามารถอ่านข้อความแจ้งตามคำสั่งในภาษาเดียวกับผู้ประกาศหรือในภาษาอื่นๆ หลายภาษา “การใช้งานขนาดเล็กเหล่านี้ช่วยกำหนดแนวทาง ความมั่นใจ และการคิดว่า Voice Engine สามารถนำมาใช้ประโยชน์ในอุตสาหกรรมต่างๆ ได้อย่างไร” OpenAI กล่าวในแถลงการณ์ ในบล็อก.

ในบรรดาบริษัทที่เข้าถึงได้ ได้แก่ บริษัทเทคโนโลยีการศึกษา Age of Learning, แพลตฟอร์มการเล่าเรื่องด้วยภาพ HeyGen, ผู้พัฒนาซอฟต์แวร์ด้านการดูแลสุขภาพ Dimagi, ผู้สร้างแอปสื่อสาร AI Livox และระบบการดูแลสุขภาพ Lifespan

OpenAI กล่าวว่าได้เริ่มพัฒนา Voice Engine ในปลายปี 2022 และเทคโนโลยีดังกล่าวขับเคลื่อนเสียงที่ติดตั้งไว้ล่วงหน้าสำหรับ API การอ่านออกเสียงข้อความและฟังก์ชันการอ่านออกเสียงของ ChatGPT แล้ว ในการให้สัมภาษณ์กับ TechCrunch เจฟฟ์ แฮร์ริส สมาชิกของทีมพัฒนา Voice Engine ของ OpenAI กล่าวว่าโมเดลดังกล่าวได้รับการฝึกอบรมเกี่ยวกับ "การผสมผสานระหว่างข้อมูลที่ได้รับอนุญาตและเปิดเผยต่อสาธารณะ" OpenAI บอกกับสื่อสิ่งพิมพ์ว่าโมเดลนี้จะมีให้สำหรับนักพัฒนาประมาณ 10 คนเท่านั้น

เสียง OpenAI

AI การแปลงข้อความเป็นเสียงเป็นพื้นที่หนึ่งของ AI เจนเนอเรชั่นที่ยังคงมีการพัฒนาอย่างต่อเนื่อง แม้ว่าส่วนใหญ่จะเน้นไปที่เสียงเครื่องดนตรีหรือเสียงที่เป็นธรรมชาติ แต่จำนวนที่น้อยกว่ามุ่งเน้นไปที่การสร้างเสียง ส่วนหนึ่งเป็นเพราะปัญหาที่ OpenAI กล่าวถึง ซึ่งรวมถึงบริษัทต่างๆ เช่น Podcastle และ ElevenLabs ซึ่งจัดหาเทคโนโลยีและเครื่องมือสำหรับการโคลนเสียง AI ซึ่ง Vergecast สำรวจเมื่อปีที่แล้ว

ในเวลาเดียวกัน รัฐบาลสหรัฐฯ กำลังพยายามจำกัดการใช้เทคโนโลยีเสียง AI ที่ผิดจรรยาบรรณ เมื่อเดือนที่แล้ว Federal Communications Commission สั่งห้าม robocalls โดยใช้เสียง AI หลังจากที่ผู้คนได้รับสายสแปมจากเสียง AI ของประธานาธิบดี Joe Biden

ตาม OpenAI พันธมิตรได้ยอมรับนโยบายการใช้งานที่ระบุว่าพวกเขาจะไม่ใช้ Voice Generation เพื่อแอบอ้างเป็นบุคคลหรือองค์กรโดยไม่ได้รับความยินยอม นอกจากนี้ยังกำหนดให้พันธมิตรต้องได้รับ "ความยินยอมโดยชัดแจ้งและแจ้งให้ทราบ" ของผู้พูดดั้งเดิม ไม่ใช่สร้างวิธีให้ผู้ใช้แต่ละรายสร้างเสียงของตนเอง และเพื่อแจ้งให้ผู้ฟังทราบว่าเสียงนั้นถูกสร้างขึ้นโดยปัญญาประดิษฐ์ OpenAI ยังเพิ่มลายน้ำให้กับคลิปเสียงเพื่อติดตามที่มาและควบคุมการใช้เสียงในเชิงรุก

OpenAI ได้เสนอขั้นตอนต่างๆ ที่เชื่อว่าสามารถจำกัดความเสี่ยงที่เกี่ยวข้องกับเครื่องมือดังกล่าว รวมถึงการยุติการรับรองความถูกต้องด้วยเสียงสำหรับการเข้าถึงบัญชีธนาคาร นโยบายเพื่อปกป้องการใช้เสียงของมนุษย์ใน AI การสร้างความตระหนักรู้ถึงการปลอมแปลงของ AI และการพัฒนาการติดตามเนื้อหาที่สร้างโดย AI ระบบ

อ่าน:

Dzherelotheverge
ปิ๊ดปิซาติเซียน
แจ้งเตือนเกี่ยวกับ
ผู้เข้าพัก

1 Comment
ใหม่กว่า
คนแก่กว่า เป็นที่นิยมมากที่สุด
บทวิจารณ์แบบฝัง
ดูความคิดเห็นทั้งหมด
pavlo
pavlo
1 เดือนที่แล้ว

- สุนัขของคุณชื่ออะไร?

gj7yilkxeaa9cif
สมัครรับข้อมูลอัปเดต