ยิ่งคิดนาน ยิ่งเก่ง — เทคนิคใหม่ให้ AI เขียนโค้ดแม่นขึ้น 12% โดยไม่ต้องเปลี่ยนสมอง
ถ้าให้คุณแก้โจทย์คณิตยากๆ คุณจะทำยังไง?
ส่วนใหญ่จะขอเวลาคิดเพิ่ม ลองหลายวิธี แล้วเลือกคำตอบที่ดีที่สุด
แต่ถ้า AI ทำแบบเดียวกัน — ลองแก้โค้ดหลายรอบแล้วเลือกรอบที่เวิร์กสุด มันจะเก่งขึ้นได้แค่ไหน?
ปัญหาคือ AI ที่เขียนโค้ดแบบ "ทำทีละขั้นตอน" (เรียกว่า Coding Agent) มันไม่ได้แค่ตอบสั้นๆ
มันต้องอ่านไฟล์ แก้โค้ด รันทดสอบ เจอ error แก้ใหม่ วนไปวนมา บางทีนานหลายร้อยขั้นตอน
- ลองหลายรอบก็ได้ แต่เปรียบเทียบว่ารอบไหนดีกว่ายากมาก
- เหมือนให้เลือกระหว่างเรียงความ 10 ฉบับที่ยาวคนละ 50 หน้า
- วิธีเดิมที่ใช้กับโจทย์สั้นๆ ใช้ไม่ได้เลย
ทีมวิจัยจาก Anthropic เสนอวิธีใหม่ 2 อย่างที่แก้ปัญหานี้ได้:
🔁 วิธีแรก — "จัดแข่งขันตัดสิน"
ให้ AI ลองแก้โค้ดพร้อมกันหลายรอบ แล้วสรุปแต่ละรอบเป็นใบสมัครสั้นๆ จากนั้นจัดแข่งแบบน็อกเอาต์ เปรียบเทียบทีละคู่จนได้ตัวเต็ง
🔄 วิธีที่สอง — "เรียนรู้จากความผิดพลาด"
ลองรอบแรก → สรุปว่าพลาดตรงไหน → เอาบทเรียนไปใช้ในรอบถัดไป ไม่ต้องเริ่มใหม่จากศูนย์
🎯 ผลลัพธ์?
- โจทย์แก้บั๊กในโปรเจกต์จริง — แม่นยำเพิ่มจาก 70.9% เป็น 77.6%
- โจทย์ระดับยากสุด — กระโดดจาก 46.9% เป็น 59.1% (เพิ่ม 12%)
- ไม่ต้องเปลี่ยนตัว AI เลย แค่ให้มัน "คิดฉลาดขึ้น" ตอนทำงาน
ลองนึกภาพแบบนี้ — เหมือนให้ช่างซ่อมรถลองแก้ 5 วิธี แล้วมีหัวหน้าช่างมาเลือกวิธีที่ดีสุด
หรือถ้าแก้ไม่ได้รอบแรก ก็จดไว้ว่าพลาดตรงไหน แล้วลองใหม่โดยไม่ทำผิดซ้ำ
ฟังดูง่าย แต่กับ AI ที่ทำงานหลายร้อยขั้นตอน มันยากมาก จนกว่าจะมีวิธีนี้
นี่คือก้าวสำคัญ — AI เขียนโค้ดจะเก่งขึ้นได้อีกเยอะ โดยไม่ต้องรอรุ่นใหม่ แค่ปล่อยให้มันคิดนานขึ้นอย่างมีระบบ
📄 แหล่งข่าว
huggingface-papers