วันพุธที่ 8 พฤษภาคม 2024

เดสก์ท็อป v4.2.1

Root Nationข่าวข่าวไอทีเครื่องมือ AI ของ Google Imagen 2 สามารถสร้างวิดีโอความยาว 4 วินาทีได้แล้ว

เครื่องมือ AI ของ Google Imagen 2 สามารถสร้างวิดีโอความยาว 4 วินาทีได้แล้ว

-

Google ไม่มีประวัติที่ดีในการสร้างภาพด้วยปัญญาประดิษฐ์ ใหม่ เรื่องอื้อฉาวโพล่งออกมา เนื่องจากเครื่องสร้างภาพในราศีเมถุนซึ่งสร้างภาพผู้คนอย่างไม่ถูกต้องและเข้าใจผิดเกี่ยวกับเชื้อชาติของพวกเขา หลังจากการร้องเรียนจำนวนมาก บริษัทยักษ์ใหญ่ด้านเทคโนโลยีได้ถอดฟังก์ชันการสร้างใบหน้าออกและส่งไป "เพื่อซ่อมแซม" ในขณะที่เรารอ บริษัทได้เปิดตัวเครื่องมือสร้างภาพ Imagen 2 ที่ได้รับการปรับปรุง ซึ่งเป็นส่วนหนึ่งของแพลตฟอร์มนักพัฒนา Vertex AI อย่างไรก็ตามมีความแตกต่างกันนิดหน่อย - เครื่องมือนี้ยังคงเน้นไปที่ธุรกิจ

Google รูปภาพ 2

Imagen 2 สามารถสร้างและแก้ไขภาพด้วยข้อความแจ้ง คล้ายกับ DALL-E และ Midjourney เครื่องมือนี้สามารถแสดงข้อความ ตราสัญลักษณ์ และโลโก้ในหลายภาษา โดยสามารถเลือกซ้อนทับองค์ประกอบเหล่านี้บนรูปภาพที่มีอยู่ เช่น นามบัตร เสื้อผ้า และผลิตภัณฑ์

หลังจากเปิดตัวครั้งแรกในโหมดแสดงตัวอย่าง ขณะนี้การแก้ไขภาพด้วย Imagen 2 สามารถใช้งานได้ใน Vertex AI พร้อมด้วยความสามารถใหม่สองประการ ได้แก่ การวาดภาพและการระบายสี ฟังก์ชันการลงสีและการลงสีซึ่งนำเสนอมานานแล้วโดยโปรแกรมสร้างภาพยอดนิยมอื่น ๆ รวมถึง DALL-E สามารถใช้เพื่อลบส่วนที่ไม่ต้องการของภาพ เพิ่มส่วนประกอบใหม่ และขยายขอบเขตของภาพเพื่อสร้างขอบเขตที่กว้างขึ้นของภาพ ดู.

Google

แต่การอัพเกรดที่แท้จริงของ Imagen 2 ก็คือ Google เรียกว่า "การแปลงข้อความให้เป็นภาพสด" ขณะนี้เครื่องมือนี้สามารถสร้างวิดีโอความยาว 4 วินาทีได้จากข้อความแจ้ง ซึ่งคล้ายกับเครื่องมือสร้างคลิปที่ขับเคลื่อนด้วย AI เพื่อให้สอดคล้องกับจุดเน้นขององค์กรของโมเดลนี้ Google จึงนำเสนอรูปภาพสดเป็นเครื่องมือสำหรับนักการตลาดและนักสร้างสรรค์ เช่น โปรแกรมสร้าง GIF สำหรับการโฆษณาที่นำเสนอธรรมชาติ อาหาร และสัตว์ ซึ่งเป็นธีมที่ Imagen 2 ได้รับการฝึกฝนมาอย่างสมบูรณ์แบบ

Google อ้างว่าภาพสดสามารถจับภาพ "มุมและการเคลื่อนไหวที่หลากหลาย" ในขณะที่ "รักษาความสม่ำเสมอ" แต่สำหรับตอนนี้พวกเขามีความละเอียดต่ำ: 360x640 และบริษัทสัญญาว่าจะปรับปรุงให้ดีขึ้นในอนาคต

เพื่อลดความกังวลเกี่ยวกับความเป็นไปได้ของ Deepfakes Google กล่าวว่า Imagen 2 จะใช้เทคโนโลยี SynthID พิเศษที่พัฒนาโดย Google DeepMind เพื่อใช้ลายน้ำการเข้ารหัสลับที่มองไม่เห็นกับภาพสด มีความทนทานต่อการแก้ไข รวมถึงการบีบอัด ฟิลเตอร์ และการปรับโทนสี แต่ต้องใช้เครื่องมือแยกต่างหากในการตรวจจับ

อีกด้วย Google เน้นย้ำว่าการสร้างภาพสด "จะได้รับการทดสอบเพื่อความปลอดภัย" “โมเดล Imagen 2 ใน Vertex AI ไม่พบปัญหาเช่นเดียวกับแอปพลิเคชัน Gemini เรายังคงทดสอบและโต้ตอบกับลูกค้าของเราอย่างต่อเนื่อง" ตัวแทนของบริษัทกล่าว

อ่าน:

DzhereloTechCrunch
ปิ๊ดปิซาติเซียน
แจ้งเตือนเกี่ยวกับ
ผู้เข้าพัก

0 ความคิดเห็น
บทวิจารณ์แบบฝัง
ดูความคิดเห็นทั้งหมด
สมัครรับข้อมูลอัปเดต