ข้ามไปยังเนื้อหา

แม่นเป๊ะ! GPT-5 ตัดสินคดีชนะผู้พิพากษามนุษย์ขาดลอย

เทคโนโลยี
2 ครั้ง
0 ความเห็น
2 นาที
แม่นเป๊ะ! GPT-5 ตัดสินคดีชนะผู้พิพากษามนุษย์ขาดลอย
Photo by KATRIN BOLOVTSOVA on Pexels
By Suphansa Makpayab
TL;DR

ผลวิจัยล่าสุดชี้ GPT-5 และ Gemini 3 Pro ทำคะแนนเต็ม 100% ในการตัดสินคดีตามตัวบทกฎหมาย ชนะผู้พิพากษามนุษย์ที่ได้เพียง 52% ขาดลอย แต่นักวิชาการชี้ "ความเป๊ะ" อาจไม่ใช่คำตอบของความยุติธรรมเสมอไป เพราะมนุษย์ยังมี "ดุลยพินิจ" ที่ AI เลียนแบบไม่ได้

งานนี้บัลลังก์ศาลอาจมีสั่นคลอน เมื่อผลการศึกษาล่าสุดจาก University of Chicago เปิดเผยว่า AI รุ่นใหม่อย่าง GPT-5 สามารถปฏิบัติตามกฎหมายได้แม่นยำกว่าผู้พิพากษาที่เป็นมนุษย์เสียอีก โดยทำคะแนนความถูกต้องตามตัวบทกฎหมายได้ถึง 100% เต็ม ในขณะที่ตุลาการตัวจริงทำได้เพียง 52% เท่านั้น

การทดลองนี้จัดทำโดยศาสตราจารย์ Eric Posner และนักวิจัย Shivam Saran ที่นำโมเดลภาษาขนาดใหญ่มาทดสอบในสถานการณ์จำลองคดีอุบัติเหตุรถยนต์ เพื่อดูว่าจะเลือกใช้กฎหมายของรัฐไหนมาบังคับใช้ได้ถูกต้องที่สุด ผลปรากฏว่า GPT-5 และคู่แข่งอย่าง Google Gemini 3 Pro สอบผ่านฉลุยแบบไร้ที่ติ ไม่มีการ "มโน" (Hallucination) หรือตรรกะวิบัติแม้แต่น้อย ซึ่งสอดคล้องกับข่าวก่อนหน้านี้ที่ OpenAI เคลมว่า GPT-5 เป็นกลางและมีอคติน้อยที่สุด ทำให้มันตัดสินทุกอย่างไปตามตำราเป๊ะ ๆ โดยไม่สนหน้าอินทร์หน้าพรหม

ในขณะที่โมเดลอื่น ๆ ก็ทำผลงานได้น่าสนใจ (และน่าตกใจ) ดังนี้:

1. Gemini 3 Pro: 100% (เท่ากับ GPT-5)
2. Gemini 2.5 Pro: 92%
3. o4-mini: 79%
4. Llama 4 Maverick: 75%
5. GPT-4.1: 50% (สอบตกเฉย)

แล้วทำไมผู้พิพากษามนุษย์ถึงได้แค่ 52%? นักวิจัยชี้แจงว่า นี่ไม่ใช่ความผิดพลาด แต่เป็น "คุณสมบัติ" ของมนุษย์ที่เรียกว่า ดุลยพินิจ (Discretion) ผู้พิพากษาจริงมักจะมองข้ามกฎที่แข็งทื่อเพื่อหาทางออกที่เหมาะสมทางศีลธรรมและสังคม ในขณะที่ AI นั้นเป็นพวก "Formalist" หรือพวกยึดระเบียบจัด ที่ตัดสินตามตัวอักษรแบบหุ่นยนต์เป๊ะ ๆ โดยไม่สนว่าจำเลยจะน่าเห็นใจแค่ไหน

ประเด็นที่น่าขบคิดปิดท้ายคือ สังคมเราต้องการความยุติธรรมแบบไหน? แบบ AI ที่แม่นยำดั่งจับวางแต่ไร้หัวใจ หรือแบบมนุษย์ที่อาจผิดพลาดแต่มีความเมตตา เพราะถ้าวันหนึ่งเราต้องขึ้นศาล คุณจะเลือกให้ใครเป็นคนเคาะค้อนตัดสินชะตาชีวิตคุณกันแน่?

ความเห็น (0)

เข้าสู่ระบบเพื่อแสดงความเห็น

เข้าสู่ระบบ

ยังไม่มีความเห็น

เป็นคนแรกที่แสดงความเห็นในบทความนี้