การพัฒนาหุ่นยนต์ฮิวแมนนอยด์ดำเนินไปอย่างช้าๆ ตลอดช่วงสองทศวรรษที่ผ่านมา แต่เมื่อไม่นานมานี้ เราได้เห็นความก้าวหน้าในสาขานี้มากขึ้นเรื่อยๆ ตามที่เราเขียนไปเมื่อเร็วๆ นี้ มีการนำเสนอหุ่นยนต์ AI ในงาน MWC 2024 อะเมก้าและการพัฒนาอีกอย่างหนึ่ง ยูนิทรี H1ทำลายสถิติความเร็วของหุ่นยนต์ฮิวแมนนอยด์ และตอนนี้ผลลัพธ์ที่น่าทึ่งของความร่วมมือระหว่างบริษัท Figure AI และ OpenAI ก็ปรากฏบนอินเทอร์เน็ต - วิดีโอที่น่าทึ่งของหุ่นยนต์ฮิวแมนนอยด์ที่สามารถสนทนากับผู้คนได้
Startup Figure AI เผยแพร่วิดีโอที่แสดงหุ่นยนต์ Figure 01 ที่ทำงานร่วมกับ Visual Language Model (VLM) ใหม่ ในนั้น รูปที่ 01 กำลังยืนอยู่ที่โต๊ะซึ่งมีจาน แอปเปิ้ล และถ้วย มีเครื่องอบผ้าอยู่ด้านซ้าย และสำหรับคำถามของบุคคล สิ่งที่หุ่นยนต์เห็นต่อหน้าเขา เขาตอบโดยอธิบายทุกสิ่งที่อยู่บนโต๊ะอย่างละเอียด
จากนั้นชายคนนั้นถามว่าเขากินอะไรบางอย่างได้ไหม และหุ่นยนต์ก็ตอบว่า "แน่นอน" จากนั้นเขาก็หยิบแอปเปิ้ลแล้วยื่นให้ชายคนนั้นด้วยการเคลื่อนไหวที่ราบรื่นอย่างช่ำชอง หลังจากนั้น ก็มีการสาธิตที่น่าทึ่งอีกครั้ง ชายคนหนึ่งเทขยะที่ยับยู่ยี่จากตะกร้าหน้ารูปที่ 01 และขอให้หุ่นยนต์อธิบายว่าเหตุใดเขาจึงทำเช่นนี้ และในขณะเดียวกันก็เก็บขยะในตะกร้าด้วย และเขาอธิบาย "ความคิด" ของเขาพร้อมเก็บกระดาษกลับลงถังขยะ “ฉันจึงให้แอปเปิ้ลแก่คุณเพราะมันเป็นของกินได้เพียงชนิดเดียวที่ฉันสามารถให้คุณได้จากโต๊ะ” หุ่นยนต์กล่าว
ตัวแทนของบริษัทอธิบายว่ารูปที่ 01 ใช้แบบจำลองหลายรูปแบบที่ได้รับการฝึกอบรมล่วงหน้า OpenAI, VLM เพื่อทำความเข้าใจรูปภาพและข้อความ และอาศัยเสียงเตือนเพื่อสร้างการตอบกลับ สิ่งนี้แตกต่างจาก GPT-4 ของ OpenAI ซึ่งเน้นไปที่การแจ้งเตือนที่เป็นลายลักษณ์อักษร
นอกจากนี้ยังใช้สิ่งที่บริษัทเรียกว่า "เรียนรู้การปรับแต่งแบบสองมือระดับต่ำ" ระบบจะประสานการปรับเทียบภาพอย่างแม่นยำ (จนถึงระดับพิกเซล) ด้วยโครงข่ายประสาทเทียมสำหรับควบคุมการเคลื่อนไหว “เครือข่ายเหล่านี้รับภาพที่ 10 Hz และสร้างการกระทำ 24-DOF (ท่าข้อมือและมุมข้อต่อนิ้ว) ที่ 200 Hz” รูปที่ AI กล่าวในแถลงการณ์
บริษัทอ้างว่าพฤติกรรมทุกอย่างในวิดีโอนั้นขึ้นอยู่กับการเรียนรู้ของระบบ ดังนั้นจึงไม่มีใครอยู่เบื้องหลังดึงสายของรูปที่ 01 แน่นอนว่ามีความแตกต่างกันนิดหน่อย - ไม่รู้ว่าหุ่นยนต์ผ่านขั้นตอนนี้กี่ครั้ง อาจเป็นครั้งที่ร้อยซึ่งอธิบายการเคลื่อนไหวที่แม่นยำของเขา แต่ไม่ว่าในกรณีใด ความสำเร็จนี้ดูน่าตื่นตาตื่นใจและมหัศจรรย์เล็กน้อย
รูปที่ 01 กำลังเสร็จสิ้นภารกิจในโลกแห่งความเป็นจริงแล้ว
ทุกอย่างเป็นอิสระ:
- การนำทางอัตโนมัติและการจัดการตามแรง
- เรียนรู้โมเดลการมองเห็นสำหรับการตรวจจับถังขยะและการจัดลำดับความสำคัญ
- การจัดการถังปฏิกิริยา (ทนทานต่อการเปลี่ยนแปลง)
- สามารถใช้งานทั่วไปกับงานหยิบ/วางอื่น ๆ ได้ pictwitter.com/0wFmYnq0GC— ฟิกเกอร์ (@Figure_robot) กุมภาพันธ์ 26, 2024
อ่าน: