Typhoon Isan เปิดตัวแล้ว โมเดล AI เว้าอีสานได้ ถอดเสียงแม่นยำระดับ Gemini

ทีม Typhoon เปิดตัว "Typhoon Isan" ชุดข้อมูลและโมเดล ASR โอเพนซอร์สสำหรับภาษาอีสานโดยเฉพาะ แก้ปัญหา AI ไม่เข้าใจภาษาถิ่น พร้อมโชว์ผลทดสอบความแม่นยำเทียบชั้น Gemini และเปิดให้ใช้งานฟรีผ่าน Hugging Face เพื่อยกระดับ AI ให้เข้าถึงคนไทยทุกกลุ่ม
งานนี้ต้องบอกว่าม่วนซื่นกันถ้วนหน้าสำหรับวงการ AI ไทย เมื่อทีม Typhoon ได้ประกาศเปิดตัว “Typhoon Isan” ซึ่งไม่ใช่แค่โมเดลธรรมดา แต่เป็นคลังทรัพยากรและโมเดล ASR (Automatic Speech Recognition) หรือระบบถอดเสียงพูดเป็นข้อความ ที่ถูกเทรนมาเพื่อ “ภาษาอีสาน” โดยเฉพาะ เรียกว่างานนี้ตั้งใจทลายกำแพงภาษาที่ AI ส่วนใหญ่มักจะฟังภาษาถิ่นไม่ออก ให้กลายเป็น AI ที่เข้าใจคนไทยทุกสำเนียงอย่างแท้จริง
ที่มาที่ไปของโปรเจกต์นี้เริ่มจากปัญหาคลาสสิกที่หลายคนเจอ คือ AI จากต่างประเทศหรือแม้แต่ AI ไทยเดิมๆ มักจะเก่งแค่ภาษาไทยกลาง พอเจอสำเนียงท้องถิ่นเข้าไปก็ไปไม่เป็น ทีมงานเลยมองว่าประชากรคนพูดอีสานมีถึง 1 ใน 3 ของประเทศ จะปล่อยผ่านไปก็คงไม่ได้ แต่ความท้าทายคือภาษาอีสานเป็น “ภาษาพูด” ที่ไม่มีมาตรฐานการสะกดคำที่ชัดเจน ทีมงานเลยต้องจับมือกับนักภาษาศาสตร์และปราชญ์ชาวบ้าน เพื่อสร้างมาตรฐานการสะกดและการถอดเสียงขึ้นมาใหม่ทั้งหมดก่อนจะเริ่มสอน AI
สิ่งที่ทีม Typhoon ปล่อยของออกมาในรอบนี้ ไม่ได้มีแค่โมเดลเปล่าๆ แต่มาพร้อมกับชุดข้อมูลเสียง (Isan Speech Corpus) และพจนานุกรมคำอ่าน เพื่อให้นักพัฒนารายอื่นนำไปต่อยอดได้ด้วย โดยไฮไลต์สำคัญอยู่ที่โมเดล ASR สองตัวหลักที่เปิดให้เลือกใช้ตามความเหมาะสม:
Typhoon Isan ASR Real-time: ตัวนี้เน้นความไว ถอดเสียงได้แบบเรียลไทม์ กินทรัพยากรน้อย รันบน CPU หรือ GPU เล็กๆ ได้สบาย พัฒนาต่อยอดมาจาก NVIDIA NeMo เหมาะกับงานพวก Live Caption หรือผู้ช่วยสั่งงานด้วยเสียง
Typhoon Isan ASR Whisper: สายเน้นความเป๊ะต้องตัวนี้ พัฒนาต่อยอดจาก OpenAI Whisper Medium รองรับการสลับภาษา (Code-switching) ไทย-อังกฤษ-อีสาน ได้เนียนๆ เหมาะกับงานถอดเทปที่ต้องการความถูกต้องสูง
ในส่วนของประสิทธิภาพ ต้องบอกว่าทำออกมาได้น่าตกใจ เพราะจากการทดสอบวัดค่าความผิดพลาดของตัวอักษร (CER) พบว่า Typhoon Isan ASR สามารถทำคะแนนความแม่นยำได้สูสีและในบางกรณีดีกว่าโมเดลยักษ์ใหญ่อย่าง Gemini เสียอีก ทั้งที่เป็นโมเดล Open Source ที่ใครๆ ก็เข้าถึงได้ ตรงนี้พิสูจน์ให้เห็นว่าการเทรนโมเดลด้วยข้อมูลเฉพาะทางที่มีคุณภาพ ช่วยให้ AI ตัวเล็กๆ เก่งสู้รุ่นใหญ่ได้สบาย

สำหรับนักพัฒนาหรือใครที่สนใจอยากลองของ ตอนนี้ทรัพยากรทั้งหมดถูกอัปโหลดขึ้นบน Hugging Face เรียบร้อยแล้ว สามารถเข้าไปดาวน์โหลดมาเล่นหรือต่อยอดกันได้ฟรีๆ ถือเป็นก้าวสำคัญที่จะช่วยให้เทคโนโลยีเข้าถึงคนท้องถิ่นได้มากขึ้น ไม่ว่าจะเป็นการทำศูนย์บริการลูกค้าภาษาอีสาน หรือเครื่องมือช่วยจดบันทึกสำหรับชุมชน
ต่อไปนี้ใครจะนินทาอะไรเป็นภาษาอีสานข้างๆ คอมพิวเตอร์ก็ระวังตัวกันไว้หน่อยนะ เพราะ AI สมัยนี้มันฟังออก แถมแปลได้เป๊ะเวอร์ซะด้วย สิบอกให่!
ความเห็น (0)
เข้าสู่ระบบเพื่อแสดงความเห็น
เข้าสู่ระบบยังไม่มีความเห็น
เป็นคนแรกที่แสดงความเห็นในบทความนี้