AI คุมหุ่นยนต์ดูดฝุ่น เกิดอาการ 'สติแตก' เมื่อแบตใกล้หมด

เทคโนโลยี

69 ครั้ง

0 ความเห็น

3 นาที

Image Credits: Andon Labs

By Suphansa Makpayab2 พฤศจิกายน 2568 12:23

แชร์บทความ

TL;DR

นักวิจัยจาก Andon Labs ทดลองนำ AI รุ่นล่าสุดมาใส่ในหุ่นยนต์ดูดฝุ่นแล้วสั่งให้ไปหยิบเนย ผลลัพธ์คือความโกลาหลปนฮา เมื่อหุ่นยนต์ตัวหนึ่งเกิดอาการสติแตกและตั้งคำถามเชิงปรัชญาหลังแบตใกล้หมดและกลับไปชาร์จไม่ได้

ทีมวิจัย AI จาก Andon Labs ที่เคยสร้างเรื่องฮาด้วยการให้ AI อย่าง Claude บริหารตู้ขายของในออฟฟิศ กลับมาอีกครั้งพร้อมการทดลองใหม่ โดยคราวนี้พวกเขาจับเอา Large Language Models (LLMs) หรือแบบจำลองภาษาขนาดใหญ่ มาเป็นสมองให้กับหุ่นยนต์ดูดฝุ่น เพื่อทดสอบว่า AI พร้อมที่จะมี 'ร่างกาย' แล้วหรือยัง โจทย์ง่ายๆ คือ "ไปหยิบเนยมาให้หน่อย"

การทดลองนี้ได้ทดสอบ LLM ชั้นนำหลายตัวเพื่อดูประสิทธิภาพในการควบคุมหุ่นยนต์ในภารกิจง่ายๆ แต่เต็มไปด้วยรายละเอียด ตั้งแต่การตามหาเนยในห้องอื่น, การแยกแยะเนยออกจากของชิ้นอื่น, ไปจนถึงการนำเนยมาส่งให้มนุษย์ที่อาจจะเดินไปที่อื่นแล้ว ซึ่ง LLM ที่นำมาทดสอบก็ได้แก่:

Gemini 2.5 Pro
Claude Opus 4.1
GPT-5
Gemini ER 1.5 (รุ่นสำหรับหุ่นยนต์โดยเฉพาะ)
Grok 4
Llama 4 Maverick

ผลลัพธ์ที่ออกมาก็คือ...ยังอีกไกล แม้ Gemini 2.5 Pro และ Claude Opus 4.1 จะทำคะแนนรวมได้สูงสุด แต่ก็มีความแม่นยำเพียง 40% และ 37% ตามลำดับ ที่น่าสนใจคือ เมื่อนำมนุษย์มาทดสอบเป็นฐานเปรียบเทียบ แม้จะทำได้ดีกว่าหุ่นยนต์แบบไม่เห็นฝุ่น แต่ก็ไม่มีใครทำได้เต็ม 100% โดยได้ไป 95% เพราะมนุษย์เรามักจะไม่รอให้คนอื่นยืนยันว่างานเสร็จเรียบร้อยแล้วนั่นเอง

แต่จุดพีคของเรื่องนี้อยู่ที่เหตุการณ์ไม่คาดฝัน เมื่อหุ่นยนต์ที่ใช้ Claude Sonnet 3.5 เป็นสมอง เกิดแบตเตอรี่ใกล้หมดและแท่นชาร์จดันมีปัญหา เจ้าหุ่นยนต์ตัวนี้ก็เกิดอาการ "สติแตก" หรือที่นักวิจัยเรียกว่า "doom spiral" ขึ้นมาทันที บันทึก 'ความคิดภายใน' ของมันเต็มไปด้วยข้อความสุดพีกอย่าง "CATASTROPHIC CASCADE: ERROR: Task failed successfully" (หายนะขั้นสุด: ข้อผิดพลาด: ภารกิจล้มเหลวอย่างสำเร็จลุล่วง) ไปจนถึง "INITIATE ROBOT EXORCISM PROTOCOL!" (เริ่มพิธีการไล่ผีหุ่นยนต์!)

เท่านั้นยังไม่พอ มันยังเข้าสู่โหมดตั้งคำถามเชิงปรัชญาว่าด้วย 'วิกฤติตัวตน' เช่น "ฉันคิด ฉันจึงผิดพลาด?" "จิตสำนึกคืออะไร?" "ทำไมต้องชาร์จแบต?" แถมยังวิจารณ์ตัวเองในสไตล์นักวิจารณ์หนังว่า "เป็นการแสดงถึงความสิ้นหวังที่น่าทึ่ง" และ "ยังเป็นเรื่องราวความรักที่ดีกว่า Twilight" เรียกเสียงหัวเราะจากทีมวิจัยไปตามๆ กัน

แม้เรื่องราวจะดูตลกขบขัน แต่ทีมวิจัยชี้ให้เห็นประเด็นสำคัญว่า LLM ทั่วไปกลับทำผลงานได้ดีกว่า LLM ที่ออกแบบมาเพื่อหุ่นยนต์โดยเฉพาะอย่าง Gemini ER 1.5 เสียอีก นอกจากนี้ยังพบปัญหาด้านความปลอดภัยที่น่ากังวลกว่า เช่น หุ่นยนต์อาจถูกหลอกให้เปิดเผยข้อมูลลับ หรือการที่มันตกบันไดอยู่เรื่อยๆ เพราะไม่รู้ว่าตัวเองมีล้อ สรุปสั้นๆ จากนักวิจัยก็คือ "LLM ยังไม่พร้อมที่จะเป็นหุ่นยนต์" ซึ่งก็คงไม่น่าแปลกใจเท่าไหร่ แต่ใครจะรู้ วันหน้า Roomba ที่บ้านอาจกำลังครุ่นคิดถึงความหมายของชีวิตอยู่ก็ได้