🤖 AI ใช้คอมแทนคน — ทำได้ แต่ทำซ้ำแล้วพังทุกที?
ลองนึกภาพว่าคุณจ้างคนมาทำงานบนคอมพิวเตอร์ เปิดเว็บ กรอกฟอร์ม สั่งซื้อของ — วันแรกทำได้สมบูรณ์แบบ แต่พอให้ทำอีกรอบ กลับพลาด
นี่คือปัญหาจริงที่เกิดขึ้นกับ AI ที่ "ใช้คอมพิวเตอร์แทนคน" ในตอนนี้
เคยไหม — สั่งให้ AI ช่วยทำงานบนหน้าจอ มันทำได้ครั้งนึง แต่พอให้ทำอีกทีกลับล้มเหลว ทั้งที่เป็นงานเดิมทุกประการ?
นักวิจัยจากมหาวิทยาลัยแคลิฟอร์เนียเจอปัญหานี้ตรงๆ และตัดสินใจหาคำตอบว่า — ทำไม AI ที่ "ทำได้" ถึง "ทำซ้ำไม่ได้"?
งานวิจัยล่าสุดจาก ArXiv ทดสอบ AI ที่ใช้คอมพิวเตอร์ได้เหมือนคน (Computer Use Agent) ด้วยการสั่งให้ทำงานเดิมซ้ำหลายรอบ แล้ววิเคราะห์ว่าทำไมถึงพลาด
พบ 3 สาเหตุหลัก:
🎯 สิ่งที่ค้นพบ:
- **ความสุ่มระหว่างทำงาน** — AI ตัดสินใจไม่เหมือนเดิมทุกรอบ เหมือนคนที่อารมณ์เปลี่ยนวันต่อวัน บางรอบคลิกถูกที่ บางรอบเลือกผิดปุ่ม
- **คำสั่งไม่ชัดเจน** — ถ้าสั่งงานคลุมเครือ AI ตีความไม่เหมือนกันทุกครั้ง เหมือนบอกพนักงานว่า "จัดการให้หน่อย" โดยไม่บอกรายละเอียด
- **พฤติกรรมไม่คงที่** — แม้สั่งเหมือนกัน AI เลือกวิธีทำต่างกัน บางรอบใช้ทางลัด บางรอบอ้อมไปไกล
เปรียบเทียบง่ายๆ — เหมือนจ้างเชฟทำผัดกะเพรา สูตรเดิม แต่รสชาติออกมาไม่เหมือนกันสักจาน เพราะบางวันใส่พริกมาก บางวันลืมน้ำมันหอย
ลองจินตนาการถ้า AI ช่วยจองตั๋วเครื่องบินให้คุณ — ครั้งแรกจองถูกต้อง ครั้งที่สองจองผิดวัน ครั้งที่สามจองซ้ำสองใบ คุณจะกล้าให้มันทำงานสำคัญไหม?
นักวิจัยเสนอทางออก 3 ข้อ — ต้องทดสอบซ้ำหลายรอบ ไม่ใช่แค่ครั้งเดียว, ต้องให้ AI ถามกลับเมื่อคำสั่งไม่ชัด, และต้องทำให้วิธีการทำงานของ AI คงที่มากขึ้น
งานวิจัยนี้เตือนเราว่า — "ทำได้" กับ "ไว้ใจได้" เป็นคนละเรื่องกัน และก่อนจะปล่อยให้ AI ทำงานแทนเราจริงๆ ยังมีช่องว่างที่ต้องปิดอีกมาก
📄 แหล่งข่าว
huggingface-papers