🎬 OmniScript — AI เขียนบทหนังจากวิดีโอยาวได้เองแล้ว
ถ้าคุณเคยดูหนังยาว 2 ชั่วโมง แล้วต้องเขียนสรุปว่าใครทำอะไร พูดอะไร ตอนนาทีที่เท่าไหร่...
คุณจะรู้เลยว่ามันเหนื่อยแค่ไหน
- นักตัดต่อต้องไล่ดูทีละฉาก จดบันทึกทุกรายละเอียด
- คนทำซับไตเติ้ลต้องจับคู่เสียงกับภาพทีละวินาที
- สตูดิโอที่อยากวิเคราะห์หนังคู่แข่ง ต้องจ้างคนนั่งดูซ้ำแล้วซ้ำอีก
เคยไหม... อยากได้ "บทหนัง" จากหนังที่ถ่ายเสร็จแล้ว? แบบที่บอกได้หมดว่าตัวละครทำอะไร พูดอะไร สีหน้าเป็นยังไง เสียงประกอบคืออะไร — พร้อมเวลาแม่นยำทุกฉาก?
ทีมนักวิจัยเปิดตัว OmniScript — โมเดล AI ขนาดเล็กเพียง 8 พันล้านพารามิเตอร์ ที่ดูวิดีโอยาวแล้ว "เขียนบทย้อนกลับ" ได้ทั้งเรื่อง
มันฟังเสียงและดูภาพพร้อมกัน แล้วสร้างสคริปต์แบบแบ่งฉากเป็นชั้นๆ — บอกได้ว่านาทีที่เท่าไหร่เกิดอะไร ตัวละครแสดงออกยังไง มีเสียงอะไรอยู่เบื้องหลัง
🎯 ทำไมน่าสนใจ:
- ตัวเล็กแต่แรง — ชนะโมเดลที่ใหญ่กว่าหลายเท่า และทำได้ใกล้เคียง Gemini 3-Pro
- ดูทั้งภาพและเสียง — ไม่ได้แค่ดูภาพอย่างเดียว แต่จับเสียงพูด เสียงประกอบ ดนตรีด้วย
- ระบุเวลาได้แม่นยำ — ไม่ใช่แค่สรุปรวม แต่บอกได้ว่าแต่ละเหตุการณ์เกิดตอนไหน
- เปิดโอกาสใหม่ — จากค้นหาฉากในหนัง ไปจนถึงสร้างซับไตเติ้ลอัตโนมัติ
ลองนึกภาพ... โปรดิวเซอร์โยนหนังทั้งเรื่องให้ AI แล้วได้บทคืนมาภายในไม่กี่นาที สตูดิโอวิเคราะห์หนังคู่แข่งได้ทันที นักตัดต่อค้นหาฉากที่ต้องการโดยไม่ต้องไล่ดูทั้งเรื่อง
เหมือนมีคนดูหนังแทนคุณ แล้วจดทุกอย่างอย่างละเอียดไม่ตกหล่น
วงการภาพยนตร์และวิดีโอกำลังได้เครื่องมือที่เปลี่ยนวิธีทำงานกับ "เนื้อหายาว" ไปตลอดกาล
📄 แหล่งข่าว
huggingface-papers