วันศุกร์ที่ 10 พฤษภาคม 2024

เดสก์ท็อป v4.2.1

Root Nationข่าวข่าวไอทีในโตเกียว ความสำเร็จของหุ่นยนต์ฮิวแมนนอยด์ Alter3 ที่ใช้ GPT-4 ได้รับการแสดงแล้ว

ในโตเกียว ความสำเร็จของหุ่นยนต์ฮิวแมนนอยด์ Alter3 ที่ใช้ GPT-4 ได้รับการแสดงแล้ว

-

ทีมงานจากมหาวิทยาลัยโตเกียวได้เปิดตัว Alter3 หุ่นยนต์ฮิวแมนนอยด์ที่สามารถเคลื่อนไหวได้โดยใช้ GPT-4 Large Language Model (LLM) Alter3 ใช้เครื่องมือล่าสุด เปิด AI เพื่อรับโพสท่าต่างๆ แบบไดนามิก ตั้งแต่ท่าเซลฟี่ไปจนถึงภาพโกสต์ ทั้งหมดนี้ไม่จำเป็นต้องมีรายการฐานข้อมูลที่ตั้งโปรแกรมไว้ล่วงหน้า

“การตอบสนองต่อเนื้อหาการสนทนาของ Alter3 โดยใช้การแสดงออกทางสีหน้าและท่าทางถือเป็นความก้าวหน้าครั้งสำคัญในหุ่นยนต์ฮิวแมนนอยด์ ซึ่งสามารถปรับตัวให้เข้ากับหุ่นยนต์อื่นๆ ได้อย่างง่ายดายโดยมีการเปลี่ยนแปลงเพียงเล็กน้อย” นักวิจัยกล่าว

Alter3

ในด้านบูรณาการ LLM กับหุ่นยนต์ จุดเน้นอยู่ที่การปรับปรุงการสื่อสารขั้นพื้นฐานและการสร้างแบบจำลองการตอบสนองที่สมจริง นักวิจัยยังเจาะลึกความสามารถของ LLM ในการช่วยให้หุ่นยนต์เข้าใจและดำเนินการตามคำสั่งที่ซับซ้อน ซึ่งจะเป็นการเพิ่มฟังก์ชันการทำงานของพวกเขา

ตามธรรมเนียมแล้วการจัดการระดับต่ำ ผลงาน เชื่อมโยงกับฮาร์ดแวร์และอยู่นอกขอบเขตของบริษัท LLM สิ่งนี้สร้างปัญหาให้กับการจัดการงานที่ใช้ LLM โดยตรง เพื่อแก้ไขปัญหานี้ ทีมงานชาวญี่ปุ่นได้พัฒนาวิธีการแปลงการแสดงออกของการเคลื่อนไหวของมนุษย์ให้เป็นโค้ดที่เข้าใจได้สำหรับ Android ซึ่งหมายความว่าหุ่นยนต์สามารถสร้างลำดับของการกระทำได้อย่างอิสระเมื่อเวลาผ่านไป โดยไม่จำเป็นต้องให้นักพัฒนาตั้งโปรแกรมแต่ละส่วนของร่างกายแยกกัน

ในระหว่างการโต้ตอบ บุคคลสามารถออกคำสั่ง Alter3 เช่น “ถ่ายเซลฟี่ด้วย iPhone ของคุณ” ต่อจากนั้น หุ่นยนต์จะเริ่มต้นชุดคำขอไปยัง GPT-4 เพื่อรับคำแนะนำเกี่ยวกับขั้นตอนที่จำเป็น จีพีที-4 จะแปลสิ่งนี้เป็นโค้ด Python ที่ช่วยให้งาน "เข้าใจ" และดำเนินการเคลื่อนไหวที่จำเป็น นวัตกรรมนี้ช่วยให้ Alter3 ขยับร่างกายส่วนบนของเขาได้ในขณะที่ร่างกายส่วนล่างของเขายังคงอยู่กับที่และติดอยู่กับขาตั้ง

Alter3 เป็นการทำซ้ำครั้งที่สามในซีรีส์หุ่นยนต์ฮิวแมนนอยด์ของ Alter ตั้งแต่ปี 2016 โดยมีแอคทูเอเตอร์ 43 ตัวที่รับผิดชอบในการแสดงออกทางสีหน้าและการเคลื่อนไหวของแขนขาที่ขับเคลื่อนโดยลมอัด การกำหนดค่านี้ให้ท่าทางการแสดงออกที่หลากหลาย หุ่นยนต์ไม่สามารถเดินได้ แต่สามารถเลียนแบบการเคลื่อนไหวการเดินและวิ่งโดยทั่วไปได้

Alter3 ยังแสดงให้เห็นถึงความสามารถในการคัดลอกท่าทางของมนุษย์โดยใช้กล้องและเฟรมเวิร์ก OpenPose หุ่นยนต์จะปรับข้อต่อให้เข้ากับท่าทางที่สังเกตได้ และบันทึกการเลียนแบบที่ประสบความสำเร็จเพื่อใช้ในภายหลัง ปฏิสัมพันธ์กับมนุษย์นำไปสู่ท่าทางที่หลากหลายมากขึ้น ซึ่งสนับสนุนแนวคิดที่ว่าการเคลื่อนไหวที่แตกต่างกันนั้นมาจากการเลียนแบบมนุษย์ คล้ายกับวิธีที่ทารกแรกเกิดเรียนรู้ผ่านการเลียนแบบ

ก่อนที่จะมี LLM นักวิจัยต้องควบคุมแอคชูเอเตอร์ทั้ง 43 ตัวอย่างระมัดระวัง เพื่อสร้างท่าทางของบุคคลหรือจำลองพฤติกรรม เช่น การเสิร์ฟชาหรือการเล่นหมากรุก จำเป็นต้องมีการปรับเปลี่ยนด้วยตนเองหลายครั้ง แต่ AI ช่วยให้ทีมเป็นอิสระจากกิจวัตรนี้ “เราคาดหวังให้ Alter3 มีส่วนร่วมในบทสนทนาอย่างมีประสิทธิภาพโดยการแสดงสีหน้าและท่าทางที่เกี่ยวข้องกับบริบท มันแสดงให้เห็นถึงความสามารถในการสะท้อนอารมณ์ เช่น แสดงความเศร้าหรือความสุขในการตอบสนอง ดังนั้นจึงแบ่งปันอารมณ์กับเรา” นักวิจัยกล่าว

อ่าน:

ปิ๊ดปิซาติเซียน
แจ้งเตือนเกี่ยวกับ
ผู้เข้าพัก

0 ความคิดเห็น
บทวิจารณ์แบบฝัง
ดูความคิดเห็นทั้งหมด
สมัครรับข้อมูลอัปเดต