
OpenAI เปิดตัว FrontierScience วัดระดับวิทย์ขั้นเทพ เมื่อข้อสอบเก่าเอาน้อง GPT-5.2 ไม่ลง
เมื่อข้อสอบเก่ามัน “หมู” เกินไปสำหรับ AI ยุคนี้ ทาง OpenAI เลยต้องงัดไม้ตายใหม่ออกมาครับ ล่าสุดประกาศเปิดตัว FrontierScience เครื่องมือวัดผล (Benchmark) ตัวใหม่ล่าสุดที่ออกแบบมาเพื่อทดสอบความสามารถด้านวิทยาศาสตร์ระดับ Expert-level โดยเฉพาะ ทั้งฟิสิกส์ เคมี และชีววิทยา สาเหตุหลักก็เพราะว่า Benchmark เดิมอย่าง GPQA ที่เคยเคลมว่าเป็น “Google-Proof” (ยากจนค้น Google ไม่เจอคำตอบ) นั้น ตอนนี้โดน GPT-5.2 เจาะพรุนไปเรียบร้อยด้วยคะแนนสูงถึง 92% (จากเดิม GPT-4 ทำได้แค่ 39%) ทำให้วงการต้องการ...













