Nvidia Luncurkan Cosmos 3: AI Bisa Lihat, Dengar, dan Bertindak Sekaligus!

Selasa, 2 Juni 2026 - 03:27 WIB

Oleh :

Olin Sianturi

Sumber :

Nvidia

Gadget – Di tengah hiruk-pikuk pameran teknologi terbesar Asia, Computex 2026 di Taipei, Jensen Huang, CEO Nvidia, mengumumkan terobosan yang berpotensi mengubah wajah kecerdasan buatan selamanya: Cosmos 3. Bukan sekadar model bahasa atau generator gambar, Cosmos 3 adalah model AI fisik (physical AI) pertama di dunia yang sepenuhnya terbuka (open-source), dirancang untuk memahami, mensimulasikan, dan bertindak di dunia nyata secara real-time dan dalam satu sistem terpadu.

Baca Juga

Xiaomi MiMo Code Atasi Masalah AI Mudah Lupa Saat Membantu Koding Proyek Panjang

Peluncuran ini disertai pembentukan Cosmos Coalition, aliansi strategis dengan perusahaan-perusahaan terkemuka seperti Agile Robots, Black Forest Labs, Runway, Skild AI, Generalist, dan LTX, yang bertujuan mempercepat pengembangan open world models model AI yang mampu mereplikasi dinamika dunia fisik secara akurat dan dapat diverifikasi.

Dengan arsitektur revolusioner berbasis mixture-of-transformers, Cosmos 3 bukan hanya "melihat" atau "mendengar" ia memahami sebab-akibat fisik, memprediksi kejadian berikutnya, dan menghasilkan rekomendasi tindakan dalam satu proses inferensi. Ini adalah fondasi kritis bagi robot otonom, kendaraan swakemudi generasi berikutnya, hingga simulasi digital canggih.

Apa Itu “Physical AI”? Mengapa Ini Lebih Sulit dari Bahasa atau Gambar?

Baca Juga

Asus Pad T3201 Resmi Meluncur dengan Teknologi Layar Tandem OLED

Sebagian besar AI modern seperti ChatGPT atau MidJourney beroperasi di ranah simbolik: teks, gambar, atau audio sebagai representasi statis. Namun, dunia fisik tidak statis. Ia dinamis, penuh interaksi, dan tunduk pada hukum fisika.

Sebuah lengan robot yang meraih gelas harus memprediksi:

Bagaimana permukaannya bereaksi saat disentuh?
Apakah isinya akan tumpah jika digerakkan terlalu cepat?
Di mana posisi jari harus ditempatkan agar tidak tergelincir?

Ini bukan masalah bahasa ini masalah fisika, spasial, dan temporal. Physical AI harus menjawab: “Apa yang akan terjadi selanjutnya?” bukan hanya “Apa arti kalimat ini?”

Cosmos 3 dibangun khusus untuk tantangan ini. Ia tidak hanya menerima input dari kamera atau mikrofon, tapi mensintesisnya menjadi simulasi dunia internal yang terus diperbarui, lalu menggunakan simulasi itu untuk merencanakan tindakan optimal.

Halaman Selanjutnya

Arsitektur Omnimodel: Satu Model untuk Semua Modalitas

Nvidia Luncurkan Cosmos 3: AI Bisa Lihat, Dengar, dan Bertindak Sekaligus!

Apa Itu “Physical AI”? Mengapa Ini Lebih Sulit dari Bahasa atau Gambar?

CISA Tetapkan Batas 3 Juni untuk Patch Kerentanan Windows Defender Nightmare Eclipse

tech

China Pecahkan Tiga Rekor Dunia dengan Pertunjukan Drone Terbesar

tech

AS Perketat Aturan Ekspor Chip AI untuk Perusahaan China di Luar Negeri

tech

Nvidia Luncurkan Platform Robot Humanoid H2+ dengan AI Canggih

tech

Traffic DuckDuckGo Melonjak Pasca Google I/O AI, Pilihan Privasi Jadi Kunci

tech

Galaxy Watch 8 Bantu Pantau Risiko Muscle Loss Pasien GLP-1

tech

Timnas Indonesia Dinilai Belum Selevel Vietnam dan Thailand untuk Juara Piala AFF 2026

Bola

Pelatih Vietnam Panas Dingin? Level Timnas Indonesia di Atas ASEAN Jadi Sorotan Media Asing

Bola

3 HP Murah Rp1 Jutaan dengan Dukungan Update Lebih Panjang, Investasi Cerdas untuk Penggunaan Bertahun-tahun

Lifestyle

Marselino dan Ragnar Absen Lagi, Kapan Bisa Bela Timnas Indonesia?

Bola

Viral Video Penggerebekan Rumah Dinas Diduga Pejabat Lapas, Ditemukan Perempuan Muda Bukan Keluarga

Berita

Siapkan Racikan Mengerikan, Misteri Susunan Pemain Timnas Indonesia vs Timor Leste Terungkap, Ini Bocorannya?

Siap

Cegah Bantuan Salah Sasaran, Koto Tangah Garap Verifikasi Ribuan Data PKH dan BPNT

Padang

Getuk Lindri Desa Wisata Tamansari, Jajanan Warna-Warni yang Namanya Terinspirasi dari Bunyi Tumbukan

Wisata

Dukung Lomba Selaju Sampan, Pemko Padang Bersihkan Jalur Sungai Batang Arau

Padang