Terobosan! Agen AI Bangun Compiler C Otonom 99% Akurat
- Istimewa
- 16 agen AI Claude Opus 4.6 secara mandiri membangun compiler C open-source fungsional.
- Compiler tersebut berhasil mengompilasi Linux 6.9 untuk berbagai arsitektur dan mengalahkan 99% tes ekstrem.
- Proyek ini membuktikan kapabilitas rekayasa perangkat lunak otonom di tingkat infrastruktur tanpa pengawasan manusia terpusat.
Laporan teknik terbaru mengguncang dunia pengembangan perangkat lunak. Untuk pertama kalinya, sekumpulan Agen AI Bangun Compiler C kompleks secara otonom dari nol. Eksperimen ini menjadi demonstrasi nyata kemampuan model bahasa besar untuk berkoordinasi dan menghasilkan perangkat lunak kelas infrastruktur. Selama dua minggu, 16 agen berbasis Claude Opus 4.6 berkolaborasi tanpa intervensi manajer manusia. Hasilnya sangat signifikan: sebuah compiler C fungsional yang mampu menangani basis kode besar.
Uji Coba Otonom: Bagaimana Agen Claude Merancang Compiler C?
Para peneliti Anthropic menugaskan proyek ambisius ini kepada 16 instance Claude Opus 4.6. Mereka ingin menguji batas kolaborasi model AI di lingkungan pengembangan yang tidak terkendali. Prosesnya berjalan sepenuhnya otomatis.
Mekanisme Pengembangan Mandiri
Setiap agen beroperasi dalam kontainer Docker yang terisolasi. Mereka berbagi repositori Git yang sama, tetapi bekerja secara independen. Agen-agen ini bertukar kode, menyelesaikan konflik, dan mendorong perubahan (commit) tanpa memerlukan persetujuan manusia.
Agen-agen tersebut mampu menghasilkan sekitar 100.000 baris kode Rust. Proses ini melibatkan hampir 2.000 sesi pengkodean otonom. Biaya API yang dikeluarkan untuk menjalankan eksperimen intensif ini diperkirakan mencapai 20.000 USD. Metodologi ini menunjukkan bahwa agen otonom dapat mengelola basis kode besar melalui mekanisme kontrol versi standar.
Compiler Otonom: Capaian dan Tingkat Akurasi
Hasil akhir proyek adalah sebuah compiler C open-source yang sepenuhnya baru. Compiler ini tidak hanya fungsional, tetapi juga memiliki tingkat kompatibilitas yang mengejutkan untuk sebuah produk yang dibangun tanpa campur tangan manusia langsung.
Compiler tersebut sukses mengompilasi kernel Linux 6.9. Capaian ini mencakup arsitektur x86, ARM, dan RISC-V. Lebih jauh, compiler AI ini juga berhasil menangani proyek open-source besar lainnya, termasuk PostgreSQL, SQLite, Redis, dan FFmpeg.
Saat dihadapkan pada tes ekstrem, compiler ini menunjukkan keandalan luar biasa. Dalam GCC Torture Test Suite, yang dikenal sangat menuntut, compiler AI mencapai tingkat kelulusan 99 persen. Sebagai bukti simbolis kemampuannya, compiler tersebut bahkan berhasil mengompilasi dan menjalankan gim klasik Doom. Pencapaian ini menegaskan bahwa Agen AI Bangun Compiler C dengan kualitas teknik yang serius.