Nvidia Luncurkan Cosmos 3: AI Bisa Lihat, Dengar, dan Bertindak Sekaligus!

Selasa, 2 Juni 2026 - 03:27 WIB

Oleh :

Olin Sianturi

Sumber :

Nvidia

Gadget – Di tengah hiruk-pikuk pameran teknologi terbesar Asia, Computex 2026 di Taipei, Jensen Huang, CEO Nvidia, mengumumkan terobosan yang berpotensi mengubah wajah kecerdasan buatan selamanya: Cosmos 3. Bukan sekadar model bahasa atau generator gambar, Cosmos 3 adalah model AI fisik (physical AI) pertama di dunia yang sepenuhnya terbuka (open-source), dirancang untuk memahami, mensimulasikan, dan bertindak di dunia nyata secara real-time dan dalam satu sistem terpadu.

Apa Itu “Physical AI”? Mengapa Ini Lebih Sulit dari Bahasa atau Gambar?

Arsitektur Omnimodel: Satu Model untuk Semua Modalitas

Salah satu terobosan utama Cosmos 3 adalah arsitektur omnimodel satu model tunggal yang secara native memproses:

Teks (instruksi, deskripsi)
Gambar (input visual statis)
Video (alur gerak temporal)
Suara ambient (konteks akustik lingkungan)
Aksi (output motorik atau keputusan kontrol)

Berbeda dengan sistem sebelumnya yang menggabungkan beberapa model terpisah (misalnya, CLIP untuk teks-gambar + Diffusion untuk video + policy network untuk aksi), Cosmos 3 menyatukan semuanya dalam satu jaringan neural berbasis mixture-of-transformers.

Keuntungan utamanya:

Latensi lebih rendah: tidak ada transfer antar-model
Konsistensi konteks: semua modalitas diproses dalam ruang representasi yang sama
Generalisasi lebih baik: model belajar hubungan lintas-modalitas secara alami

Contoh praktis: Jika Anda berkata, “Ambil botol itu dan letakkan di meja tanpa membuat suara,” Cosmos 3 akan:

Mengenali objek (“botol”) dari video
Memahami instruksi dari teks
Memprediksi suara benturan dari material botol dan permukaan
Merancang gerakan halus untuk meminimalkan kebisingan

semua dalam satu siklus inferensi.

Dua Versi Tersedia: Nano untuk Edge, Super untuk Pusat Data

Nvidia merilis dua varian Cosmos 3 di Hugging Face:

1. Cosmos 3 Nano

Dirancang untuk deployment di edge (robot, drone, kendaraan)
Ringan, hemat daya, latensi ultra-rendah
Ideal untuk aplikasi real-time dengan sumber daya terbatas

2. Cosmos 3 Super

Model skala penuh untuk pelatihan dan simulasi high-fidelity
Digunakan di pusat data untuk menghasilkan data sintetis berkualitas tinggi
Mendukung simulasi kompleks seperti interaksi manusia-robot atau lalu lintas perkotaan

Keduanya dilengkapi skrip pelatihan, alat deployment, dan dataset asli semuanya open-source di GitHub. Ini langkah luar biasa langka untuk model AI mutakhir, yang biasanya dirahasiakan oleh perusahaan besar.

Open Source Total: Nvidia Taruhan pada Transparansi dan Reproduktibilitas

Berbeda dengan pendekatan tertutup banyak raksasa AI, Nvidia melepaskan semua komponen inti Cosmos 3:

Bobot model (model weights)
Skrip pelatihan (training scripts)
Dataset pelatihan
Alat deployment dan evaluasi

Tujuannya jelas: memungkinkan komunitas global memverifikasi klaim performa, mereproduksi hasil, dan membangun ekosistem terbuka bukan hanya mengandalkan angka benchmark dalam siaran pers.

Ini juga sejalan dengan filosofi Cosmos Coalition, yang mendorong kolaborasi alih-alih fragmentasi. Dengan Agile Robots (robotika), Runway (generasi video), dan Black Forest Labs (model multimodal) sebagai mitra inti, aliansi ini ingin menciptakan standar terbuka untuk AI dunia nyata.

Adopsi Industri: Samsung, LG, Li Auto, Doosan Robotics Sudah Bergabung

Cosmos 3 bukan hanya proyek riset ia sudah diadopsi oleh pemain industri global:

Samsung & LG Electronics: untuk pengembangan perangkat rumah pintar yang responsif terhadap konteks fisik
Li Auto: untuk sistem bantuan pengemudi tingkat lanjut (ADAS) yang memahami niat pejalan kaki
Doosan Robotics: untuk lengan robot industri yang bisa beradaptasi dengan objek tak dikenal

Benchmark independen menunjukkan Cosmos 3 memimpin di kategori text-to-image dan image-to-video, tetapi keunggulan sesungguhnya terletak pada kemampuan prediksi aksi fisik area yang jarang diukur oleh leaderboard tradisional.

Implikasi Masa Depan: Menuju Dunia di Mana Mesin Benar-Benar “Memahami” Realitas

Cosmos 3 adalah bukti bahwa AI generatif mulai melampaui dunia digital dan memasuki ranah fisik. Dengan kemampuan mensimulasikan konsekuensi tindakan sebelum melakukannya, sistem berbasis Cosmos 3 bisa:

Mengurangi kecelakaan robot
Meningkatkan efisiensi logistik otomatis
Mempercepat pengembangan produk melalui simulasi realistis

Namun, tantangan tetap ada:

Validasi keamanan dalam skenario nyata
Bias dalam data simulasi
Ketergantungan pada sensor berkualitas tinggi

Meski demikian, dengan pendekatan terbuka dan kolaboratif, Nvidia memberi dunia alat yang transparan, dapat diaudit, dan dikembangkan bersama langkah penting menuju AI yang tidak hanya cerdas, tapi juga tepercaya.

Kesimpulan: Bukan Sekadar Model AI Ini Fondasi Baru untuk Dunia Otonom

Peluncuran Cosmos 3 di Computex 2026 bukan hanya momen teknis ia adalah pernyataan visi: masa depan AI bukan di layar, tapi di ruang fisik tempat kita hidup. Dan untuk membangunnya dengan benar, kita butuh transparansi, kolaborasi, dan pemahaman mendalam tentang dunia nyata.

Dengan Cosmos 3, Nvidia tidak hanya meluncurkan model ia membuka pintu bagi generasi baru sistem otonom yang benar-benar memahami apa artinya “berada di dunia.” Dan kali ini, semua orang diundang untuk ikut membangunnya.

Dapatkan informasi terbaru seputar Gadget, Anime, Game, Tech dan Berita lainnya setiap hari melalui social media Gadget VIVA. Ikuti kami di :
Instagram	@gadgetvivacoid
Facebook	Gadget VIVA.co.id
X (Twitter)	@gadgetvivacoid
Whatsapp Channel	Gadget VIVA
Google News	Gadget

Nvidia Luncurkan Cosmos 3: AI Bisa Lihat, Dengar, dan Bertindak Sekaligus!

Apa Itu “Physical AI”? Mengapa Ini Lebih Sulit dari Bahasa atau Gambar?

Arsitektur Omnimodel: Satu Model untuk Semua Modalitas

Dua Versi Tersedia: Nano untuk Edge, Super untuk Pusat Data

Open Source Total: Nvidia Taruhan pada Transparansi dan Reproduktibilitas

Adopsi Industri: Samsung, LG, Li Auto, Doosan Robotics Sudah Bergabung

Implikasi Masa Depan: Menuju Dunia di Mana Mesin Benar-Benar “Memahami” Realitas

Kesimpulan: Bukan Sekadar Model AI Ini Fondasi Baru untuk Dunia Otonom

CISA Tetapkan Batas 3 Juni untuk Patch Kerentanan Windows Defender Nightmare Eclipse

tech

China Pecahkan Tiga Rekor Dunia dengan Pertunjukan Drone Terbesar

tech

AS Perketat Aturan Ekspor Chip AI untuk Perusahaan China di Luar Negeri

tech

Nvidia Luncurkan Platform Robot Humanoid H2+ dengan AI Canggih

tech

Traffic DuckDuckGo Melonjak Pasca Google I/O AI, Pilihan Privasi Jadi Kunci

tech

Galaxy Watch 8 Bantu Pantau Risiko Muscle Loss Pasien GLP-1

tech

Timnas Indonesia Dinilai Belum Selevel Vietnam dan Thailand untuk Juara Piala AFF 2026

Bola

Pelatih Vietnam Panas Dingin? Level Timnas Indonesia di Atas ASEAN Jadi Sorotan Media Asing

Bola

3 HP Murah Rp1 Jutaan dengan Dukungan Update Lebih Panjang, Investasi Cerdas untuk Penggunaan Bertahun-tahun

Lifestyle

Marselino dan Ragnar Absen Lagi, Kapan Bisa Bela Timnas Indonesia?

Bola

Viral Video Penggerebekan Rumah Dinas Diduga Pejabat Lapas, Ditemukan Perempuan Muda Bukan Keluarga

Berita

Siapkan Racikan Mengerikan, Misteri Susunan Pemain Timnas Indonesia vs Timor Leste Terungkap, Ini Bocorannya?

Siap

Cegah Bantuan Salah Sasaran, Koto Tangah Garap Verifikasi Ribuan Data PKH dan BPNT

Padang

Getuk Lindri Desa Wisata Tamansari, Jajanan Warna-Warni yang Namanya Terinspirasi dari Bunyi Tumbukan

Wisata

Dukung Lomba Selaju Sampan, Pemko Padang Bersihkan Jalur Sungai Batang Arau

Padang