
OpenAI อัปเกรด Responses API ใช้ WebSockets ดันความเร็ว AI Agent พุ่ง 40%
เวลาที่นักพัฒนาสั่งให้ AI Agent อย่าง Codex ช่วยแก้ Bug เบื้องหลังการทำงานนั้นไม่ได้เกิดขึ้นในอึดใจเดียว แต่ AI ต้องสแกนไฟล์ อ่านโค้ดเพื่อสร้าง Context สั่งรัน Tool บนเครื่อง แล้วส่งผลลัพธ์กลับไปกลับมาผ่าน API หลายสิบรอบ ซึ่งกระบวนการเหล่านี้กินเวลาจนผู้ใช้งานอาจจะต้องนั่งจิบกาแฟรอ ในอดีต ปัญหาความล่าช้ามักไปตกอยู่ที่ฝั่ง Inference (กระบวนการประมวลผลของโมเดล) บน GPU แต่เมื่อเทคโนโลยีพัฒนาขึ้น โมเดลรุ่นก่อนหน้าอย่าง GPT-5 และ GPT-5.2 ทำความเร็วได้ราว 65 โทเคนต่อวินาที (TPS) จนกระทั่ง OpenAI...













