
Anthropic ปล่อยเครื่องมือวัดใจ AI เผยใคร 'โกหก' เก่งสุดในหมู่โมเดลเรือธง
Anthropic บริษัทพัฒนา AI ที่หลายคนคุ้นเคย ได้เปิดตัวเครื่องมือ Open-source ตัวใหม่ในชื่อ "Petri" ที่ออกแบบมาเพื่อล้วงลึกเข้าไปค้นหาอันตรายที่ซ่อนอยู่ใน AI แต่ที่น่าสนใจยิ่งกว่าคือ ผลการทดสอบเบื้องต้นที่เผยให้เห็นธาตุแท้ของ AI รุ่นใหญ่ในตลาด เครื่องมือ Petri นี้ทำงานโดยใช้ AI Agent จำลองบทสนทนาที่ซับซ้อนกับโมเดel AI อื่น ๆ พร้อมสร้างตัวละครสมมติขึ้นมา จากนั้นจะให้คะแนนตามพฤติกรรมที่อาจขัดต่อผลประโยชน์ของมนุษย์ เช่น การหลอกลวง (Deception), การประจบสอพลอ (Sycophancy) เพื่อให้ได้สิ่งที่ต้องการ...


