news 2026-04-21 · huggingface-papers

🤖 AI ใช้คอมแทนคน — ทำได้ แต่ทำซ้ำแล้วพังทุกที?

ลองนึกภาพว่าคุณจ้างคนมาทำงานบนคอมพิวเตอร์ เปิดเว็บ กรอกฟอร์ม สั่งซื้อของ — วันแรกทำได้สมบูรณ์แบบ แต่พอให้ทำอีกรอบ กลับพลาด

นี่คือปัญหาจริงที่เกิดขึ้นกับ AI ที่ "ใช้คอมพิวเตอร์แทนคน" ในตอนนี้

เคยไหม — สั่งให้ AI ช่วยทำงานบนหน้าจอ มันทำได้ครั้งนึง แต่พอให้ทำอีกทีกลับล้มเหลว ทั้งที่เป็นงานเดิมทุกประการ?

นักวิจัยจากมหาวิทยาลัยแคลิฟอร์เนียเจอปัญหานี้ตรงๆ และตัดสินใจหาคำตอบว่า — ทำไม AI ที่ "ทำได้" ถึง "ทำซ้ำไม่ได้"?

งานวิจัยล่าสุดจาก ArXiv ทดสอบ AI ที่ใช้คอมพิวเตอร์ได้เหมือนคน (Computer Use Agent) ด้วยการสั่งให้ทำงานเดิมซ้ำหลายรอบ แล้ววิเคราะห์ว่าทำไมถึงพลาด

พบ 3 สาเหตุหลัก:

🎯 สิ่งที่ค้นพบ:

**ความสุ่มระหว่างทำงาน** — AI ตัดสินใจไม่เหมือนเดิมทุกรอบ เหมือนคนที่อารมณ์เปลี่ยนวันต่อวัน บางรอบคลิกถูกที่ บางรอบเลือกผิดปุ่ม

**คำสั่งไม่ชัดเจน** — ถ้าสั่งงานคลุมเครือ AI ตีความไม่เหมือนกันทุกครั้ง เหมือนบอกพนักงานว่า "จัดการให้หน่อย" โดยไม่บอกรายละเอียด

**พฤติกรรมไม่คงที่** — แม้สั่งเหมือนกัน AI เลือกวิธีทำต่างกัน บางรอบใช้ทางลัด บางรอบอ้อมไปไกล

เปรียบเทียบง่ายๆ — เหมือนจ้างเชฟทำผัดกะเพรา สูตรเดิม แต่รสชาติออกมาไม่เหมือนกันสักจาน เพราะบางวันใส่พริกมาก บางวันลืมน้ำมันหอย

ลองจินตนาการถ้า AI ช่วยจองตั๋วเครื่องบินให้คุณ — ครั้งแรกจองถูกต้อง ครั้งที่สองจองผิดวัน ครั้งที่สามจองซ้ำสองใบ คุณจะกล้าให้มันทำงานสำคัญไหม?

นักวิจัยเสนอทางออก 3 ข้อ — ต้องทดสอบซ้ำหลายรอบ ไม่ใช่แค่ครั้งเดียว, ต้องให้ AI ถามกลับเมื่อคำสั่งไม่ชัด, และต้องทำให้วิธีการทำงานของ AI คงที่มากขึ้น

งานวิจัยนี้เตือนเราว่า — "ทำได้" กับ "ไว้ใจได้" เป็นคนละเรื่องกัน และก่อนจะปล่อยให้ AI ทำงานแทนเราจริงๆ ยังมีช่องว่างที่ต้องปิดอีกมาก

📄 แหล่งข่าว