ผู้ก่อตั้ง OpenCV เปิดตัว CraftStory สตาร์ทอัพ AI วิดีโอยาวชนยักษ์ใหญ่

CraftStory สตาร์ทอัพใหม่จากผู้ร่วมสร้าง OpenCV โผล่ท้าชน OpenAI Sora และ Google Veo ด้วย Model 2.0 ระบบสร้างวิดีโอคนจริงความยาวได้ถึง 5 นาที เน้นตลาดองค์กร ทำคลิปเทรนนิง-เดโมสินค้าให้เร็วและถูกลงหลายเท่าตัว แม้ทุนแค่ US$2 ล้าน (≈ 65 ล้านบาท) แต่มั่นใจว่าชนะได้ด้วยสมองมากกว่ากระสุนเงิน
วงการ AI วิดีโอมีเรื่องให้ตื่นเต้นอีกครั้ง เมื่อ CraftStory สตาร์ทอัพที่ก่อตั้งโดย Victor Erukhimov หนึ่งในคีย์แมนผู้อยู่เบื้องหลังไลบรารี Computer Vision ระดับตำนานอย่าง OpenCV ได้ฤกษ์ออกจากโหมดซุ่มเงียบ เปิดตัว Model 2.0 ระบบสร้างวิดีโอที่เน้น "มนุษย์" เป็นศูนย์กลาง จุดเด่นที่ทำเอาหลายคนต้องหันขวับคือความสามารถในการสร้างวิดีโอได้ยาวสูงสุดถึง 5 นาที ซึ่งถือว่าทิ้งห่างเจ้าตลาดอย่าง Sora 2 ของ OpenAI ที่ยังติดเพดานบินอยู่ที่ราว 25 วินาที หรือโมเดลอื่น ๆ ที่มักจะหมดแรงกันแถว ๆ 10 วินาทีเท่านั้น ที่น่าทึ่งคือนี่คือผลงานจากเงินทุนตั้งต้นเพียง US$2 ล้าน (≈ 65 ล้านบาท) แต่กล้าหาญชาญชัยลงสนามแข่งกับยักษ์ใหญ่แบบไม่กลัวขนาดกระเป๋าตังค์
เบื้องหลังความอึดของวิดีโอมาจากสถาปัตยกรรมที่เรียกว่า Parallelized Diffusion ซึ่งต่างจากวิธีดั้งเดิมที่สร้างภาพทีละเฟรมต่อกัน (Sequential) ที่มักเจอปัญหา "ยิ่งยาวยิ่งเละ" เพราะความผิดพลาดเล็ก ๆ ช่วงต้นจะสะสมจนปลายคลิปดูไม่ได้ แต่ระบบของ CraftStory รันกระบวนการ Diffusion หลายจุดพร้อมกันตลอดความยาววิดีโอ แถมยังกำหนดให้ส่วนท้ายของคลิปย้อนกลับมามีผลกับช่วงต้นได้ ทำให้คุมคุณภาพได้ตลอดรอดฝั่งโดยไม่ต้องใช้งบประมวลผลมหาศาล นอกจากนี้ ทีมงานยังลงทุนจ้างสตูดิโอถ่ายนักแสดงด้วยกล้องเฟรมเรตสูง เพื่อเก็บรายละเอียดการขยับนิ้วมือให้คมกริบ ตัดปัญหา Motion Blur ที่มักเจอเวลา AI เรียนรู้จากคลิป YouTube ทั่วไป
ในแง่การใช้งาน Model 2.0 ปัจจุบันทำงานแบบ Video-to-Video ผู้ใช้สามารถอัปโหลดภาพนิ่งเพื่อแปลงเป็นตัวละคร แล้วใส่ "Driving Video" หรือคลิปต้นแบบท่าทางลงไป ระบบจะจัดการ Lip-sync ปากให้ตรงเสียงและปรับอารมณ์ท่าทางให้เนียนกริบเหมือนมีผู้กำกับส่วนตัว เป้าหมายหลักของ CraftStory ไม่ใช่การทำคลิปสั้นเต้นโชว์ แต่คือตลาดองค์กรที่ต้องการทำวิดีโอสอนใช้งาน (Training) หรือ Product Demo ขนาดยาว ซึ่งปกติการจ้างโปรดักชันเฮาส์ต้องใช้งบระดับ US$20,000 (≈ 6.5 แสนบาท) และเวลาเป็นเดือน แต่ AI ตัวนี้กะจะมาย่อให้เหลือแค่ไม่กี่นาทีหน้าคอมพิวเตอร์
แม้จะต้องเจอกับคู่แข่งระดับพระกาฬทั้ง OpenAI, Google Veo หรือ Runway แต่ CraftStory เลือกที่จะเจาะช่องว่างทางการตลาดอย่าง "Long-form Human-Centric Video" หรือวิดีโอยาวที่เน้นคนแสดงโดยเฉพาะ โดยได้รับเงินทุนสนับสนุนจาก Andrew Filev ผู้ก่อตั้ง Wrike ที่มองเห็นโอกาสในการลดต้นทุนการผลิตสื่อในองค์กร ปัจจุบัน Model 2.0 เปิดให้ทดลองเล่นแล้ว และในอนาคตเตรียมขยายไปสู่ฟีเจอร์ Text-to-Video งานนี้ต้องรอดูกันว่ามวยรองกระดูกแข็งรายนี้จะยืนระยะได้นานแค่ไหน แต่ที่แน่ ๆ งานวิดีโอพรีเซนต์บริษัทในอนาคต อาจจะไม่มีคนจริงอยู่ในนั้นเลยสักคนก็ได้
หมายเหตุ: การแปลงค่าเงินใช้อัตราแลกเปลี่ยนประมาณ 1 ดอลลาร์สหรัฐ ≈ 32.38 บาท (ข้อมูล ณ 29 ต.ค. 2025)
ความเห็น (0)
เข้าสู่ระบบเพื่อแสดงความเห็น
เข้าสู่ระบบยังไม่มีความเห็น
เป็นคนแรกที่แสดงความเห็นในบทความนี้