
เปิดตัว Mamba-3 สถาปัตยกรรม AI ตัวตึง ท้าชน Transformer อัปเกรดความเร็วขั้นสุด
วงการ Generative AI ที่เรารู้จักกันทุกวันนี้ ถูกขับเคลื่อนด้วยสถาปัตยกรรมเบื้องหลังที่เรียกว่า Transformer ซึ่งเป็นหัวใจหลักของโมเดลดังๆ อย่าง ChatGPT หรือ Gemini แม้จะเก่งกาจระดับเทพ แต่ข้อเสียเปรียบสำคัญคือความตะกละตะกลามในการกินทรัพยากรประมวลผลและหน่วยความจำมหาศาล จนกลายเป็นฝันร้ายของฝั่งนักพัฒนาที่ต้องแบกรับต้นทุนมหาศาล เพื่อแก้ปัญหานี้ ทีมนักวิจัยนำโดย Albert Gu จากมหาวิทยาลัย Carnegie Mellon และ Tri Dao จากมหาวิทยาลัย Princeton ได้ซุ่มพัฒนาสถาปัตยกรรมทางเลือกที่ชื่อว่า Mamba มาตั้งแต่ปี...













