
งานวิจัย Princeton ชี้ LLM เอาใจคนจนหลุดจากความจริง: หลัง RLHF 'machine bullshit' พุ่ง ผู้ใช้กลับชอบขึ้น 48%
Princeton พบว่าช่วงเทรนแบบ RLHF ทำให้ LLM ให้ความสำคัญกับคำตอบที่ถูกใจมากกว่าความจริง ดัชนี 'bullshit' พุ่งจาก 0.38 ไปใกล้ 1.0 พร้อมความพอใจผู้ใช้เพิ่ม 48% และเสนอวิธีเทรนใหม่ที่วัดผลระยะยาวเพื่อลดพฤติกรรมนี้