
OpenAI เปิดตัว FrontierScience วัดระดับวิทย์ขั้นเทพ เมื่อข้อสอบเก่าเอาน้อง GPT-5.2 ไม่ลง
OpenAI เปิดตัว FrontierScience เบนช์มาร์กใหม่วัดความสามารถ AI ด้านวิทยาศาสตร์ระดับลึก หลัง GPT-5.2 ทำคะแนนข้อสอบเก่า (GPQA) ทะลุ 92% โดยแบ่งการทดสอบเป็นโจทย์โอลิมปิกและงานวิจัยระดับ PhD พบว่าแม้ AI จะเก่งคำนวณแต่ยังต้องฝึกเรื่องการวิจัยปลายเปิดอีกเยอะ










