🔍 MinerU2.5-Pro ทำลายสถิติอ่านเอกสาร แม่นยำ 95.69% บน OmniDocBench
เคยส่งใบเสร็จ สัญญา หรือรายงานให้ AI อ่าน แล้วได้ผลกลับมาผิดเพี้ยน?
ตารางหาย ตัวเลขสลับ สูตรคณิตศาสตร์กลายเป็นอักษรประหลาด
- สแกนเอกสาร 100 หน้า แต่ AI อ่านถูกแค่ 70 หน้า
- ตารางซับซ้อนถูกแปลงเป็นข้อความรก ใช้งานไม่ได้
- กราฟและรูปภาพในรายงาน ถูกข้ามไปเฉยๆ
เคยไหม... ต้องนั่งแก้ไฟล์ที่ AI แปลงมาทีละบรรทัด จนสงสัยว่าให้คนพิมพ์ใหม่เร็วกว่า?
ทีมวิจัย OpenDataLab เปิดตัว MinerU2.5-Pro ระบบอ่านเอกสารรุ่นใหม่ที่ทำคะแนน 95.69% บน OmniDocBench ซึ่งเป็นชุดทดสอบที่ยากที่สุดในวงการ ครอบคลุมเอกสารทุกรูปแบบตั้งแต่ PDF ตาราง สูตรคณิตศาสตร์ ไปจนถึงเอกสารสแกนที่เบลอ
ตัวเลขนี้สูงกว่าคู่แข่งรายใหญ่อย่าง Google Document AI และ GPT-4o ในงานเดียวกัน
🎯 ทำไมถึงน่าสนใจ
- อ่านได้ทุกอย่าง ตั้งแต่ตาราง สูตร กราฟ ไปจนถึงเอกสารภาษาผสม
- รักษาโครงสร้างเดิมของเอกสารไว้ครบ ไม่ต้องจัดใหม่
- เป็น open source ใช้ฟรี ไม่ต้องจ่ายค่า API
- รองรับเอกสารสแกนคุณภาพต่ำที่ระบบอื่นอ่านไม่ออก
ลองนึกภาพว่าคุณมีกองเอกสารเก่า 10 ปี สัญญา ใบแจ้งหนี้ รายงานประจำปี แค่โยนเข้าระบบ ทุกอย่างกลายเป็นข้อมูลดิจิทัลที่ค้นหาได้ แก้ไขได้ วิเคราะห์ได้ทันที
สำนักงานบัญชีไม่ต้องจ้างคนนั่งพิมพ์ซ้ำ โรงพยาบาลแปลงประวัติผู้ป่วยเก่าเข้าระบบได้ในวันเดียว บริษัทกฎหมายค้นหาข้อความในสัญญาเก่าพันฉบับได้ภายในวินาที
เมื่อ AI อ่านเอกสารได้แม่นเกือบ 100% กำแพงสุดท้ายระหว่างโลกกระดาษกับโลกดิจิทัลกำลังจะหายไป
📄 แหล่งข่าว
huggingface-papers