ข้ามไปยังเนื้อหา

Google เผยเบื้องหลัง Project Genie ก้าวต่อไปของ AI สู่ World Models

เทคโนโลยี
2 ครั้ง
0 ความเห็น
3 นาที
Google เผยเบื้องหลัง Project Genie ก้าวต่อไปของ AI สู่ World Models
Image Credit: blog.google
By Suphansa Makpayab
TL;DR

ลืม LLM แบบเดิมไปได้เลย! ทำความรู้จัก World Models เทคโนโลยีเบื้องหลัง Project Genie ที่จำลองโลกทั้งใบให้โต้ตอบได้แบบเรียลไทม์ ไม่ต้องง้อ Game Engine

ยุคที่ AI ทำได้แค่แต่งกลอนหรือสรุปรายงานอาจกำลังจะถูกก้าวข้ามไป เมื่อวงการเทคเริ่มมองหาความท้าทายใหม่ที่ใหญ่กว่าเดิม สอดคล้องกับทิศทางที่ บรรดาบิ๊กเทคเริ่มเบนเข็มทุ่มพัฒนา World Models ล่าสุด Google ได้ออกมาเผยเบื้องหลัง Project Genie โปรเจกต์ทดลองที่เปิดให้ผู้ใช้สร้างและเข้าไปสำรวจโลกอินเทอร์แอกทีฟได้ด้วยตัวเอง ซึ่งขับเคลื่อนด้วยเทคโนโลยีที่เรียกว่า World Models

Shlomi Fruchter และ Jack Parker-Holder สองหัวหอกผู้นำทีมพัฒนา Project Genie จาก Google DeepMind อธิบายว่า หาก Large Language Models (LLMs) คือการคาดเดาคำถัดไป World Models ก็คือการคาดเดา "สิ่งที่จะเกิดขึ้นต่อไปในโลกจริง" เมื่อมีคนหรือ AI เข้าไปมีปฏิสัมพันธ์ด้วย ตัวอย่างเช่น หากเราเดินเข้าไปในห้อง เงาในกระจกจะสะท้อนอย่างไร หรือถ้าเตะลูกบอล มันจะกลิ้งไปทางไหน โมเดลนี้สามารถจำลองสภาพแวดล้อมทั้งหมดได้ตั้งแต่ต้นจนจบ (End-to-End) โดยไม่ต้องพึ่งพา Game Engine เลยแม้แต่น้อย

แม้แนวคิดเรื่อง World Models จะเคยถูกพูดถึงมาบ้างตั้งแต่ปี 2018 จากงานวิจัยของทีม Google Brain (ปัจจุบันคือ Google DeepMind) แต่ Project Genie ทำให้มันจับต้องได้มากขึ้น ปัจจุบัน Google ได้เปิดให้สมาชิก AI Ultra ได้ลองสัมผัส Project Genie (เฉพาะผู้ใช้ในสหรัฐฯ อายุ 18 ปีขึ้นไป) โดยวิธีการใช้งานที่ได้ผลลัพธ์เจ๋งที่สุดคือการป้อน Prompt ด้วยภาพประกอบกับข้อความ เช่น อัปโหลดรูปหมาบนชายหาด แล้วพิมพ์อธิบายสภาพคลื่นลม AI ก็จะเนรมิตฉากนั้นให้มีชีวิตและเข้าไปเดินเล่นได้ทันที

ส่วนคำถามที่ว่าสร้างโลกจำลองไปทำไม? คำตอบคือมันมีประโยชน์มหาศาล ตั้งแต่การใช้เป็นสนามเด็กเล่นจำลองสำหรับฝึก AI Agents ให้เรียนรู้งานอันตรายโดยไม่ต้องเสี่ยงพังข้าวของในโลกจริง ไปจนถึงวงการการศึกษาที่ครูสามารถพานักเรียนวาร์ปไปเดินเล่นในยุคโรมโบราณ หรือดำน้ำดูปะการังได้แบบอินเทอร์แอกทีฟ นอกจากนี้ นักพัฒนาเกมและคนทำหนังยังสามารถใช้เทคโนโลยีนี้ขึ้นโครงไอเดียฉากใหม่ๆ ได้อย่างรวดเร็ว ซึ่งในอนาคตมันอาจเบลอเส้นแบ่งระหว่างการนั่งดูหนังเฉยๆ กับการเล่นเกมไปเลย

แม้ตอนนี้ Project Genie จะยังอยู่ในช่วงเริ่มต้น แต่ก็เป็นสัญญาณชัดเจนว่า AI กำลังยกระดับจากการทำความเข้าใจภาษา ไปสู่การทำความเข้าใจฟิสิกส์และตรรกะของโลกแห่งความเป็นจริง ก็ได้แต่หวังว่าโลกเสมือนที่ AI สร้างขึ้นมา จะไม่มี Bug ทะลุกำแพงหรือฟิสิกส์เพี้ยนๆ แบบเกมยุค 90s ให้เห็นก็พอ

ความเห็น (0)

เข้าสู่ระบบเพื่อแสดงความเห็น

เข้าสู่ระบบ

ยังไม่มีความเห็น

เป็นคนแรกที่แสดงความเห็นในบทความนี้