ห้องปฏิบัติการวิจัยปัญญาประดิษฐ์ OpenAI ได้ประกาศรายละเอียดของเทคโนโลยีล่าสุดที่จะปรับปรุงการเรนเดอร์ 3 มิติอย่างมาก OpenAI เป็นบริษัทที่อยู่เบื้องหลังโปรแกรมสร้างข้อความเป็นรูปภาพ DALL-Eซึ่งตอนนี้ได้หันมาให้ความสนใจกับการแปลเบาะแสข้อความเป็น 3D point clouds ซึ่งจะเรียกว่า POINT-E
ตาม เอกสาร, POINT-E เผยแพร่โดย OpenAI "สร้างโมเดล 3 มิติในเวลาเพียง 1-2 นาทีบน GPU เดียว" เมื่อเทียบกับโซลูชันอื่นที่มีอยู่ซึ่งอาจใช้เวลาหลายชั่วโมงและต้องใช้ GPU หลายตัว
ข้อความที่ตัดตอนมาจากรายงานให้รายละเอียดตำแหน่งปัจจุบันของ POINT-E ในโลกของการสร้างแบบจำลอง 3 มิติ: "แม้ว่าวิธีการของเราจะยังขาดความทันสมัยในแง่ของคุณภาพของตัวอย่าง แต่ก็เร็วกว่าหนึ่งถึงสองลำดับความสำคัญ การประนีประนอมในทางปฏิบัติสำหรับบางกรณีการใช้งาน"
ทำงานโดยการสร้างภาพสังเคราะห์เดียวด้วยแบบจำลองการแพร่กระจายข้อความและภาพ จากนั้นระบบจะสร้างพอยต์คลาวด์ 3 มิติที่ง่ายต่อการสังเคราะห์ ลดภาระของ GPU แม้ว่าจะไม่สามารถจับรายละเอียดได้ ซึ่งเป็นการแลกเปลี่ยนที่กล่าวถึงในบทความ
AI ทุติยภูมิได้รับการฝึกฝนเพื่อบรรเทาปัญหาเหล่านี้ แต่รายงานอธิบายว่า "บางครั้งอาจพลาดส่วนที่บอบบาง/เบาบางของวัตถุ" เช่น ลำต้นของพืช ทำให้เกิดภาพลวงตาของดอกไม้ลอยน้ำ
OpenAI สัญญาว่าจะฝึกปัญญาประดิษฐ์ให้กับโมเดล 3 มิติหลายล้านโมเดลและข้อมูลเมตาของพวกมัน แม้ว่าขอบเขตของมันยังค่อนข้างจำกัดจนถึงตอนนี้
ตัวอย่างหนึ่งคือการเรนเดอร์วัตถุจริงสำหรับการพิมพ์ 3 มิติ แม้ว่าในขณะที่เทคโนโลยีพัฒนาและปรับปรุง มีแนวโน้มว่าเราจะเห็นการใช้งานในแอปพลิเคชันที่ซับซ้อนมากขึ้น เช่น เกมและแม้แต่โทรทัศน์
โครงการโอเพ่นซอร์ส พร้อมใช้งานบน GitHub.
คุณสามารถช่วยยูเครนต่อสู้กับผู้รุกรานรัสเซีย วิธีที่ดีที่สุดคือบริจาคเงินให้กับกองทัพยูเครนผ่าน เซฟไลฟ์ หรือทางเพจอย่างเป็นทางการ NBU.