Google จับ AI เล่น Werewolf และ Poker วัดสกิลการโกหกใน Game Arena

Google DeepMind อัปเดต Game Arena เพิ่มเกม Werewolf และ Poker เพื่อทดสอบ AI ในสถานการณ์ที่ข้อมูลไม่ครบถ้วน เน้นวัดสกิลการเข้าสังคม การจับโกหก และการบริหารความเสี่ยง โดยมี Gemini 3 Pro และ Flash ครองแชมป์ปัจจุบัน
โลกแห่งความจริงไม่ได้เดินเป็นช่องสี่เหลี่ยมเป๊ะๆ เหมือนกระดานหมากรุกที่มีข้อมูลครบถ้วน (Perfect Information) เสมอไป ล่าสุด Google DeepMind จึงจับมือกับ Kaggle อัปเกรดแพลตฟอร์ม Game Arena ให้ท้าทายยิ่งขึ้น โดยเพิ่มเกมใหม่อย่าง Werewolf และ Poker เข้ามา เพื่อทดสอบว่าโมเดล AI ตัวท็อปจะรับมือกับความไม่แน่นอน การหลอกลวง และความเสี่ยงได้ดีแค่ไหน
เริ่มจากของเดิมอย่าง Chess (หมากรุก) ที่ใช้วัดความสามารถในการวางแผนระยะยาว ในปีนี้มีการอัปเดต Leaderboard ใหม่ ซึ่งผลปรากฏว่า Gemini 3 Pro และ Gemini 3 Flash ครองตำแหน่งหัวตาราง สิ่งที่น่าสนใจคือ AI ยุคใหม่ไม่ได้ใช้พลังคำนวณดิบๆ แบบ Brute-force เหมือนโปรแกรม Stockfish แต่ใช้ "สัญชาตญาณ" (Intuition) และการจดจำรูปแบบคล้ายมนุษย์ เพื่อตัดตัวเลือกที่ไม่จำเป็นออก ทำให้การเดินหมากมีความเป็นธรรมชาติและเหนือชั้นขึ้นไปอีกขั้น
ไฮไลท์สำคัญอยู่ที่การเพิ่มเกม Werewolf เกมปาร์ตี้ทำลายมิตรภาพที่ต้องใช้ทักษะทางสังคม (Social Deduction) ล้วนๆ นี่เป็นครั้งแรกที่ AI ต้องเล่นเป็นทีมผ่านภาษาธรรมชาติ (Natural Language) โดยต้องแยกแยะความจริงออกจากคำโกหก หรือถ้าเป็นฝ่ายหมาป่าก็ต้องเนียนหลอกเพื่อนให้ได้ ซึ่งถือเป็นการวัด "Soft Skills" ที่จำเป็นสำหรับ AI Assistant ในอนาคต โดยผลการทดสอบพบว่าโมเดลตระกูล Gemini 3 สามารถจับพิรุธจากคำพูดที่ไม่สอดคล้องกับการโหวตของผู้เล่นอื่นได้อย่างแม่นยำ
อีกเกมที่เพิ่มเข้ามาคือ Poker (โป๊กเกอร์) ในรูปแบบ Heads-Up No-Limit Texas Hold'em ซึ่งไม่ได้วัดแค่ดวง แต่วัดการบริหารความเสี่ยง (Risk Management) ภายใต้ข้อมูลที่ไม่ครบถ้วน AI จะต้องประเมินไพ่ในมือคู่แข่งและปรับกลยุทธ์ตามสไตล์การเล่นเพื่อตัดสินใจว่าควรจะหมอบหรือเทหมดหน้าตัก โดยผลการแข่งขันและ Leaderboard ของโป๊กเกอร์จะเปิดเผยในวันที่ 4 กุมภาพันธ์นี้
เพื่อฉลองการเปิดตัว Benchmark ใหม่ ทาง Google DeepMind ได้จัดอีเวนต์ไลฟ์สตรีมการแข่งขันระหว่าง AI โดยมีเซียนตัวจริงอย่าง Hikaru Nakamura (Grandmaster หมากรุก) และตำนานโป๊กเกอร์อย่าง Nick Schulman มาร่วมวิเคราะห์เกม ใครที่อยากเห็นว่า AI จะบลัฟเก่งกว่าคน หรือจะจับโกหกได้แนบเนียนแค่ไหน สามารถไปเกาะขอบสนามรอดูกันได้ที่เว็บไซต์ของ Kaggle งานนี้บอกเลยว่าถ้า AI เริ่มโกหกเก่งขึ้นมาจริงๆ มนุษย์เราอาจจะต้องเริ่มระแวงกันบ้างแล้ว

ความเห็น (0)
เข้าสู่ระบบเพื่อแสดงความเห็น
เข้าสู่ระบบยังไม่มีความเห็น
เป็นคนแรกที่แสดงความเห็นในบทความนี้