ข้ามไปยังเนื้อหา

จับ Claude 16 ตัวรุมสร้าง C Compiler เอง! งบ 6 แสนแต่รัน Doom ได้ฉลุย

เทคโนโลยี
20 ครั้ง
0 ความเห็น
2 นาที
จับ Claude 16 ตัวรุมสร้าง C Compiler เอง! งบ 6 แสนแต่รัน Doom ได้ฉลุย
Photo by Xu Haiwei on Unsplash
By Suphansa Makpayab
TL;DR

Anthropic ทดลองสุดเดือด ปล่อย Claude Opus 4.6 จำนวน 16 ตัวทำงานร่วมกันเขียน C Compiler จากศูนย์ หมดเงินค่า API ไปกว่า 6 แสนบาท ผลลัพธ์คือคอมไพเลอร์ภาษา Rust แสนบรรทัดที่รัน Linux และ Doom ได้สำเร็จ แต่เบื้องหลังยังต้องมีมนุษย์คอยประคองและเจอปัญหาคอขวดเมื่อโค้ดซับซ้อนเกินไป

ใครที่คิดว่าการเขียน C Compiler เป็นเรื่องยากระดับรากเลือด ต้องมาดูการทดลองสุดบ้าพลังของ Nicholas Carlini นักวิจัยจาก Anthropic ที่จับเอา Claude Opus 4.6 จำนวน 16 ตัว มา 'รุม' กันเขียนโค้ดในโปรเจกต์เดียวกัน โดยไม่มีมนุษย์สั่งการแบบจับมือทำ งานนี้ผลาญค่า API ไปจุก ๆ ถึง US$20,000 (≈ 6.6 แสนบาท) ภายในเวลาแค่ 2 สัปดาห์ เพื่อพิสูจน์พลังของระบบ Agent Teams

ระบบการทำงานคือปล่อยให้ AI ทั้ง 16 ตัวรันแยกกันใน Docker แล้วแย่งกันหยิบงานใน Git มาทำ เขียน Lock Files และแก้ Code Conflict กันเองเหมือนทีม Dev ที่ (เกือบ) รู้ใจ ผลลัพธ์ที่ได้คือ Compiler ภาษา Rust ความยาวกว่า 1 แสนบรรทัด ที่เก่งพอจะ Compile Linux Kernel 6.9 ได้ แถมยังผ่านบททดสอบสุดหินอย่างการรันเกม Doom ได้อีกด้วย ซึ่งเป็นคอนเซปต์ที่คล้ายกับตอนที่ Cursor เคยปล่อย AI รุมเขียนโค้ด สร้าง Browser มาก่อนหน้านี้ แต่สเกลและความยากของงานนี้ถือว่าโหดกว่ามาก

แต่ในความว้าวก็ยังมีเรื่องให้ 'เอ๊ะ' อยู่เหมือนกัน เพราะเบื้องหลังความสำเร็จนี้ไม่ได้ Autonomous 100% ขนาดนั้น Carlini ยอมรับว่าต้องคอยสร้างระบบทดสอบ (Test Harness) อย่างละเอียดเพื่อประคองไม่ให้ AI หลงทาง แถมพอโค้ดเริ่มเยอะเกิน 1 แสนบรรทัด น้อง Claude ก็เริ่มออกอาการ 'เอ๋อ' แก้บั๊กจุดหนึ่งไปทำพังอีกจุดหนึ่ง จนแทบจะไปต่อไม่ได้ แถมประสิทธิภาพโค้ดที่ได้ก็ยังสู้ GCC ไม่ได้เลย

สรุปแล้ว นี่คือการโชว์ของที่แพงระยับและน่าตื่นเต้น แต่ก็พิสูจน์ให้เห็นว่า AI Coding Agent ยังมีกำแพงเรื่องความซับซ้อน (Complexity Wall) อยู่ ใครที่เป็น Dev สาย Hardcore ก็คงเบาใจได้ว่าเก้าอี้ยังเหนียวแน่น อย่างน้อยก็จนกว่า AI จะเลิกทำโปรเจกต์พังตอนแก้บั๊กนั่นแหละ

ความเห็น (0)

เข้าสู่ระบบเพื่อแสดงความเห็น

เข้าสู่ระบบ

ยังไม่มีความเห็น

เป็นคนแรกที่แสดงความเห็นในบทความนี้