ReImagine — เปลี่ยนวิธีสร้างวิดีโอคน ด้วยการสร้างภาพสวยก่อน แล้วค่อยเคลื่อนไหวทีหลัง
ถ้าอยากสร้างวิดีโอคนที่ควบคุมได้ทุกอย่าง ทั้งหน้าตา ท่าทาง และมุมกล้อง — ต้องใช้ข้อมูลวิดีโอหลายมุมมอง ซึ่งหาแทบไม่ได้ในโลกจริง
นี่คือปัญหาที่ทำให้เครื่องมือสร้างวิดีโอคนทุกตัว ต้องเลือกระหว่าง "ควบคุมได้" กับ "ภาพสวย" — ได้อย่างหนึ่ง ก็เสียอีกอย่าง
ลองนึกภาพว่า คุณมีรูปถ่ายด้านหน้าและด้านหลังของคนคนหนึ่ง แล้วอยากสร้างวิดีโอจากมุมไหนก็ได้ ท่าทางอะไรก็ได้ โดยไม่ต้องถ่ายวิดีโอจริงเลย — เคยคิดว่าเป็นไปได้ไหม?
ทีมวิจัยเบื้องหลัง ReImagine พลิกแนวคิดเดิมทั้งหมด แทนที่จะสร้างวิดีโอโดยตรง พวกเขาแยกงานออกเป็น 2 ขั้น:
**ขั้นที่ 1 — สร้างภาพทีละเฟรม ให้สวยที่สุด**
- ใส่รูปตัวอย่างด้านหน้า-หลัง + กำหนดท่าทางและมุมกล้อง
- ระบบสร้างภาพนิ่งที่สวยคมชัดเป็นเฟรมๆ
- ใช้พลังของโมเดลสร้างภาพที่เรียนรู้จากภาพหลายพันล้านรูป
**ขั้นที่ 2 — เชื่อมเฟรมให้เคลื่อนไหวลื่นไหล**
- นำภาพทุกเฟรมมาเรียงกัน
- ใช้เทคนิคกรองความถี่ 3 มิติ ลบอาการกระตุก
- ไม่ต้องฝึกโมเดลเพิ่มเลย แค่ต่อท้ายเป็นขั้นตอนอัตโนมัติ
🎯 ทำไมถึงน่าสนใจ:
- ควบคุมมุมกล้อง ท่าทาง และหน้าตาได้พร้อมกัน — ไม่ต้องเลือก
- คุณภาพภาพดีกว่าวิธีเดิม 2 เท่า ในการทดสอบทุกตัว
- ผสมหน้า + เสื้อผ้า + รองเท้า จากคนละชุดได้ — เหมือนแต่งตัวตุ๊กตาดิจิทัล
- ไม่ต้องมีห้องถ่ายพิเศษ แค่รูปหน้า-หลัง 2 รูปก็พอ
- เปิดให้ใช้ฟรี ทั้งโค้ดและโมเดล
ลองนึกภาพ — ร้านเสื้อผ้าออนไลน์ให้ลูกค้าลองชุดบนหน้าจอ ครีเอเตอร์สร้างตัวละครจากรูปถ่าย 2 รูป สตูดิโอเล็กๆ ทำวิดีโอโฆษณาโดยไม่ต้องจ้างนายแบบมาถ่ายจริง
เมื่อ "สร้างภาพสวยก่อน แล้วค่อยเคลื่อนไหว" กลายเป็นสูตรสำเร็จ วิธีสร้างวิดีโอคนอาจไม่เหมือนเดิมอีกต่อไป
📄 แหล่งข่าว
huggingface-papers