แนวคิดของการสะท้อนวัสดุสั้น ๆ นี้เกิดจากข้อเท็จจริงที่แปลกประหลาดอย่างหนึ่ง อยู่ในขั้นตอนการเพิ่มประสิทธิภาพ Premiere Pro และ After Effects และหลังจากที่ฉันจากไป ASUS ทียูเอฟ GeForce RTX 3090 24GB (รีวิวนี้ทำโดยเพื่อนร่วมงานของฉัน Denys Zaichenko ที่นี่) ฉันได้เรียนรู้ว่าด้วยการอัปเดตล่าสุด ความสามารถในการเพิ่มประสิทธิภาพโปรแกรมสำหรับโปรเซสเซอร์แบบมัลติคอร์ - เพื่อกระจายการเรนเดอร์ระหว่างเธรดของ CPU - หายไป
สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่า Adobe นั้นช้าแต่เปลี่ยนจากการเพิ่มประสิทธิภาพ CPU เป็นการเพิ่มประสิทธิภาพ GPU อย่างแน่นอน หากมีสิ่งใดเรียกว่า GPGPU หรือ GPU วัตถุประสงค์ทั่วไป และอาจมีปัญหาใหญ่ในการปรับให้เหมาะสมสำหรับกรณีนี้ แม้ว่าคุณจะมี Intel Xe Graphics ก็ตาม ASUS RTX3090 24GB!
พื้นฐานของ GPGPU
ดูเหมือนว่าจะไม่มีปัญหาอะไร - เนื่องจาก GPU ในเวอร์ชันใหม่ประกอบด้วยสิ่งที่เรียกว่า โปรเซสเซอร์สตรีม ใน NVIDIA พวกมันถูกเรียกว่าเคอร์เนล CUDA เป็นต้น และโปรเซสเซอร์เหล่านี้ทำงานบนหลักการเดียวกันกับคอร์ของ CPU ทั่วไป
ความแตกต่างของอำนาจ คอร์ของ CPU มีพลังในการประมวลผลสูง แต่มีจำนวนน้อย แม้จะพิจารณาถึงมัลติเธรดก็ตาม และคอร์ของ GPU แม้ว่าจะมีพลังงานน้อย แต่ก็สามารถทำงานบางอย่างได้ และในขณะเดียวกันก็มีมากกว่านั้นหลายร้อยเท่า ถ้าไม่พัน.
เนื้อหาวิดีโอเกี่ยวกับ GPGPU
ไม่อยากอ่าน? ดูวิดีโอ:
การเร่งฮาร์ดแวร์
สมมติว่าใน Premiere Pro การประมวลผลเอฟเฟกต์ Lumetri บนโปรเซสเซอร์ - และยิ่งไปกว่านั้น การเข้ารหัส-ถอดรหัส H264 แบบธรรมดา - ใช้เวลานานมาก และนี่เป็นเรื่องปกติ งานที่แตกต่างกันสำหรับเหล็กที่แตกต่างกันนั้นมีประสิทธิภาพต่างกัน ที่จริงแล้ว แม้แต่ตัวเร่งการประมวลผลวิดีโอฮาร์ดแวร์ขนาดเล็กใน iGPU ก็สร้างปาฏิหาริย์ได้อย่างแท้จริง โดยการเปลี่ยนความเร็วในการเรนเดอร์ในบางครั้งหลายครั้ง!
และในมุมมองของพลังที่เพิ่มขึ้นของ GPU - พูดใน ASUS TUF RTX 3090 มีหน่วยความจำวิดีโอมากถึง 24 กิกะไบต์และแกน CUDA มากกว่าหมื่นคอร์ - ค่อนข้างสมเหตุสมผลที่แอปพลิเคชันได้รับการปรับให้เหมาะสมสำหรับงานดังกล่าว
ภายใต้คนงานขนาดเล็กหลายหมื่นคนที่ทำงานขนานกัน โดยเอาโหลดออกจาก CPU แต่คำถาม การ์ดแสดงผลใช้เวลามากเกินไปหรือไม่? ฉันสังเกตเห็นว่าเมื่อแสดงเอฟเฟกต์หนัก ๆ การเปลี่ยนภาพ และเพียงแค่เปลี่ยนรูปภาพด้วยวิธีเพิ่มเติม คอมพิวเตอร์ก็เริ่มช้าลง
หน่วยความจำของการ์ดแสดงผลอุดตันเป็นศูนย์ โปรเซสเซอร์แทบไม่มีส่วนร่วมในการเรนเดอร์... เช่นเดียวกับ RAM และความแตกต่างก็คือ ฉันมี RAM ขนาด 128 GB
ตัวอย่างเช่น ใน Premiere Pro ครึ่งหนึ่งของ RAM ไม่ได้ใช้งาน โปรเซสเซอร์ว่างอยู่ครึ่งหนึ่ง ตัวถอดรหัส-เอ็นโค้ดเดอร์ผ่อนคลายโดยสิ้นเชิง แต่ VRAM ติดขัดและประสิทธิภาพเกือบเป็นศูนย์
งานร่วมกัน
สิ่งที่แย่ที่สุดเกิดขึ้นเมื่อเรนเดอร์โปรเจ็กต์ที่มีชิ้นส่วนผสมกัน เช่น องค์ประกอบของ After Effects ที่เชื่อมโยงกัน นั่นคือจุดที่หน่วยความจำวิดีโอไปที่ศูนย์เกือบจะในทันทีโดยไม่มีการเตือนล่วงหน้า และเพื่อเพิ่มความเร็วในการเรนเดอร์ จำเป็นต้องปิดแอปพลิเคชั่นทั้งหมดที่กิน VRAM เช่นเดียวกับ Premiere Pro และ After Effects! และปล่อยให้พูดเพียง Media Encoder
และ! ไม่ได้คำนึงถึงจุดสนใจที่สำคัญ สมมุติว่า After Effects ยังกิน RAM และสำหรับแก้มทั้งสองข้างด้วย แต่! เขารู้วิธีระบายแคช! เพิ่มหน่วยความจำสำหรับแอปพลิเคชันอื่น แต่ไม่มีโปรแกรมใดทำงานเช่นนั้นกับหน่วยความจำวิดีโอ! หน่วยความจำถูกบล็อกหรือว่างหลังจากปิดโปรเจ็กต์
และใช่ VRAM นั้นเร็วกว่า DRAM อย่างแน่นอน และบางครั้งก็มากด้วย อย่างไรก็ตาม ในการรีวิว Transcend และไม่ใช่แค่ฉันซ้ำแล้วซ้ำเล่า - สำหรับงาน หน่วยความจำที่ช้าจำนวนมากนั้นดีกว่าหน่วยความจำที่เร็วมากชิ้นเล็กชิ้นน้อย
หากโปรแกรมรู้วิธีอุดตันหน่วยความจำเท่านั้น แต่ไม่ปล่อยให้ว่างอย่างมีประสิทธิภาพที่สุด ความเร็วของหน่วยความจำจะไม่ช่วย และปรากฎว่าฉันมี RAM จำนวนมากในพีซีของฉันสำหรับ Adobe Creative Suite... ซึ่งจะดีถ้าใช้สำหรับการเรนเดอร์
อ่าน: รีวิวแล็ปท็อป ASUS ROG Zephyrus G14 2021: ปลื้มใจ แต่ไม่มีเอฟเฟคสุดว้าว
แต่ไม่เลย - มันอาศัย GTX 1080 Ti ที่โชคร้ายเกือบทั้งหมดซึ่งปริมาณหน่วยความจำน้อยกว่าสิบเท่า! และคุณสามารถพูดได้ว่า มี RTX เหมือนเดิม เหมือนรุ่นเดียวกัน ASUS TUF RTX 3090s ดึง NVLink ด้วยการรวมหน่วยความจำ! แต่ที่นี่อีกครั้งมีความแตกต่างกันนิดหน่อย
สำหรับราคาของ RTX 3090 สองเครื่อง นั่นคือสำหรับ 2x $2000 (ไม่นับ MSRP อีกต่อไป มันไม่สอดคล้องกับความเป็นจริงสมัยใหม่) เราได้รับ... หน่วยความจำ 24 GB ยิ่งไปกว่านั้น มันยังใช้สำหรับการเรนเดอร์ไม่ได้อีกด้วย! ใช่ บางโปรแกรมใช้ฟังก์ชันนี้ ส่วนใหญ่ – การสร้างแบบจำลองและการคำนวณทางวิทยาศาสตร์ และการตั้งค่าที่นั่นก็แย่มาก
และในราคา $4000 เราสามารถเติมช่องหน่วยความจำทั้งหมดด้วย DDR4 ECC dies AMD Threadripper! 256GB จะเป็นเคสที่แย่ที่สุด! และยังมีการแก้ไขข้อผิดพลาดซึ่งไม่มี RTX 3090
เหตุผลเดียวที่ฉันเห็นซึ่งอาจหยุดคุณจากการเพิ่มประสิทธิภาพ GPU เป็นการคำนวณและ RAM เป็นบัฟเฟอร์คือเวลาแฝงระหว่าง RAM และการ์ดกราฟิกจะสูงเกินไปที่จะแทนที่โบนัสปริมาณ ในทางกลับกัน การขาด VRAM ยังคงทำให้กระบวนการช้าลง และอย่างน้อยคุณสามารถเพิ่ม RAM ได้ ถ้าอย่างนั้น!
ผลลัพธ์ GPGPU
นี่คืออันตราย แม้ว่าคุณจะมี ASUS ทียูเอฟ อาร์ทีเอ็กซ์ 3090ซึ่งคุณซื้อเฉพาะสำหรับงาน GPGPU คุณอาจประสบปัญหาคอขวดที่หลีกเลี่ยงได้ หากโปรแกรมใช้ RAM มากกว่า VRAM ฉันไม่เห็นว่าสิ่งนี้สามารถเปลี่ยนแปลงได้อย่างไร - แต่ถ้าแนวโน้มยังคงดำเนินต่อไป มันจะเป็นอนาคตที่ใกล้ตายจริงๆ
ราคาสำหรับ ASUS ทียูเอฟ RTX 3090 24GB
- โรเซตก้า
- ร้านค้าทั้งหมด