Nvidia Luncurkan Cosmos 3: AI Bisa Lihat, Dengar, dan Bertindak Sekaligus!

Selasa, 2 Juni 2026 - 03:27 WIB

Oleh :

Olin Sianturi

Sumber :

Nvidia

Arsitektur Omnimodel: Satu Model untuk Semua Modalitas

Dua Versi Tersedia: Nano untuk Edge, Super untuk Pusat Data

Nvidia merilis dua varian Cosmos 3 di Hugging Face:

1. Cosmos 3 Nano

Dirancang untuk deployment di edge (robot, drone, kendaraan)
Ringan, hemat daya, latensi ultra-rendah
Ideal untuk aplikasi real-time dengan sumber daya terbatas

2. Cosmos 3 Super

Model skala penuh untuk pelatihan dan simulasi high-fidelity
Digunakan di pusat data untuk menghasilkan data sintetis berkualitas tinggi
Mendukung simulasi kompleks seperti interaksi manusia-robot atau lalu lintas perkotaan

Keduanya dilengkapi skrip pelatihan, alat deployment, dan dataset asli semuanya open-source di GitHub. Ini langkah luar biasa langka untuk model AI mutakhir, yang biasanya dirahasiakan oleh perusahaan besar.

Open Source Total: Nvidia Taruhan pada Transparansi dan Reproduktibilitas

Berbeda dengan pendekatan tertutup banyak raksasa AI, Nvidia melepaskan semua komponen inti Cosmos 3:

Bobot model (model weights)
Skrip pelatihan (training scripts)
Dataset pelatihan
Alat deployment dan evaluasi

Tujuannya jelas: memungkinkan komunitas global memverifikasi klaim performa, mereproduksi hasil, dan membangun ekosistem terbuka bukan hanya mengandalkan angka benchmark dalam siaran pers.

Ini juga sejalan dengan filosofi Cosmos Coalition, yang mendorong kolaborasi alih-alih fragmentasi. Dengan Agile Robots (robotika), Runway (generasi video), dan Black Forest Labs (model multimodal) sebagai mitra inti, aliansi ini ingin menciptakan standar terbuka untuk AI dunia nyata.

Halaman Selanjutnya

Adopsi Industri: Samsung, LG, Li Auto, Doosan Robotics Sudah Bergabung