ข้ามไปยังเนื้อหา

Nano Banana Pro 🍌 เปิดตัวแล้ว โมเดลสร้างภาพตัวท็อปจาก Google เข้าใจโลก ใส่ Text แม่นยำ

เทคโนโลยี
3 ครั้ง
0 ความเห็น
3 นาที
Nano Banana Pro 🍌 เปิดตัวแล้ว โมเดลสร้างภาพตัวท็อปจาก Google เข้าใจโลก ใส่ Text แม่นยำ
Image Credit: Google
By Suphansa Makpayab
TL;DR

Google เปิดตัว Nano Banana Pro (Gemini 3 Pro Image) โมเดลสร้างภาพ AI รุ่นล่าสุดที่ยกระดับความสามารถไปอีกขั้น จุดเด่นอยู่ที่การเข้าใจบริบทโลกความจริง สามารถสร้าง Infographic และ Diagram ได้แม่นยำ แก้ปัญหาเรื่องการใส่ข้อความในภาพที่ AI มักทำผิดพลาด ให้ถูกต้องและสวยงาม รองรับหลายภาษา พร้อมฟีเจอร์ควบคุมแสงเงาและความต่อเนื่องของตัวละครที่ดีขึ้น เปิดให้ใช้งานแล้วใน Gemini App และบริการอื่นๆ ของ Google

หลังจากปล่อยให้แฟน ๆ รอคอยกันมาสักพัก ล่าสุด Google DeepMind ได้ประกาศเปิดตัว Nano Banana Pro หรือในชื่อทางเทคนิคคือ Gemini 3 Pro Image ซึ่งเป็นโมเดลสร้างและแก้ไขภาพระดับ State-of-the-art ตัวใหม่ล่าสุด โดยทาง Google เคลมว่ารุ่นนี้ไม่ได้แค่สร้างภาพสวย แต่มาพร้อมกับ "สมอง" ที่ฉลาดขึ้นด้วยขุมพลังของ Gemini 3 Pro ทำให้มีความสามารถในการให้เหตุผล (Reasoning) และมีความรู้รอบตัว (World Knowledge) ที่ดีกว่าเดิมแบบก้าวกระโดด

สิ่งที่ทำให้ Nano Banana Pro แตกต่างจากรุ่นก่อนหน้าอย่างชัดเจน คือความสามารถในการเข้าใจบริบทที่ซับซ้อน มันสามารถเปลี่ยนข้อมูลดิบให้กลายเป็น Visual ที่เข้าใจง่าย เช่น การสร้าง Infographic, แผนภูมิ Diagram จากลายมือที่จดไว้ หรือแม้แต่การทำภาพประกอบสูตรอาหารที่ถูกต้องตามขั้นตอน ยิ่งไปกว่านั้น มันยังเชื่อมต่อกับ Google Search เพื่อดึงข้อมูล Real-time เช่น สภาพอากาศหรือผลกีฬา มาสร้างเป็นภาพกราฟิกได้ทันที

ปัญหาโลกแตกของ AI สร้างภาพคือเรื่อง "ตัวหนังสือ" ที่มักจะเขียนออกมาเป็นภาษาต่างดาว แต่ Nano Banana Pro แก้จุดนี้ได้อยู่หมัด โดย Google ระบุว่า:

  • สามารถเรนเดอร์ Text ในภาพได้อย่างถูกต้อง แม่นยำ และอ่านออก (Legible text)

  • รองรับทั้งข้อความสั้น ๆ แบบโลโก้ ไปจนถึงย่อหน้ายาว ๆ

  • เข้าใจความลึกและมิติ ทำให้จัดวางข้อความบนพื้นผิวต่าง ๆ ได้เนียนตา

  • รองรับหลายภาษา สามารถแปลและปรับข้อความในภาพให้เข้ากับภาษานั้น ๆ ได้เลย

รองรับหลาย Input

ในมุมของนักสร้างสรรค์มืออาชีพ รุ่นนี้มาพร้อมฟีเจอร์ที่เรียกว่า Consistency by design ที่ช่วยให้การคุมโทนงานง่ายขึ้น สามารถผสมผสานภาพต้นฉบับได้สูงสุดถึง 14 ภาพ และรักษาความคงที่ของหน้าตาตัวละคร (Character Consistency) ได้ถึง 5 คนในภาพเดียว ซึ่งเหมาะมากสำหรับการทำ Storyboard หรือภาพเล่าเรื่อง นอกจากนี้ยังมีเครื่องมือปรับแต่งระดับสตูดิโอ เช่น การเปลี่ยนสภาพแสงจากกลางวันเป็นกลางคืน การปรับจุดโฟกัส (Focus) หรือการเปลี่ยน Aspect Ratio โดยที่องค์ประกอบหลักไม่ผิดเพี้ยน

สำหรับการใช้งาน Nano Banana Pro เริ่มเปิดให้ใช้งานแล้ววันนี้ผ่านแอปพลิเคชัน Gemini (เลือกโหมด 'Thinking' เมื่อสร้างภาพ) โดยผู้ใช้ฟรีจะมีโควตาจำกัด ส่วนสมาชิก Google AI Plus, Pro และ Ultra จะได้โควตาที่มากกว่า นอกจากนี้ยังขยายไปสู่ Workspace อย่าง Google Slides, Vids และเครื่องมือสำหรับนักโฆษณาอีกด้วย

ปิดท้ายด้วยเรื่องความปลอดภัย Google ยังคงให้ความสำคัญกับการระบุตัวตนของภาพที่สร้างโดย AI โดยทุกภาพจะฝัง SynthID (ลายน้ำที่มองไม่เห็น) เอาไว้ และสำหรับผู้ใช้ฟรีหรือรุ่น Pro จะมีลายน้ำที่มองเห็นได้ (Visible watermark) แปะอยู่ด้วย เพื่อความโปร่งใส ส่วนรุ่น Ultra สำหรับมืออาชีพจะไม่มีลายน้ำนี้กวนใจ เรียกว่ารอบนี้ Google จัดเต็มกะเอาให้สายกราฟิกทำงานง่ายขึ้น หรือไม่ก็หนาว ๆ ร้อน ๆ กันไปข้างเลยทีเดียว

ความเห็น (0)

เข้าสู่ระบบเพื่อแสดงความเห็น

เข้าสู่ระบบ

ยังไม่มีความเห็น

เป็นคนแรกที่แสดงความเห็นในบทความนี้