Siri iOS 27 Pakai Google Gemini & Nvidia-Ini Cara Kerjanya!
- Apple
Gadget – Pada 8 Juni 2026, Apple akan mengungkap wajah baru Siri dalam acara tahunan WWDC (Worldwide Developers Conference). Namun, di balik janji “privasi pertama” yang selalu digaungkan, terungkap fakta mengejutkan: Siri versi terbaru tidak sepenuhnya dibangun oleh Apple sendiri.
Menurut laporan eksklusif dari The Information, arsitektur teknis di balik pembaruan terbesar Siri dalam satu dekade ini mengandalkan tiga pilar eksternal:
- Model AI Google Gemini
- Infrastruktur Google Cloud
- Teknologi Confidential Computing dari Nvidia
Fakta ini membongkar narasi sederhana tentang kemandirian Apple dalam AI dan membuka diskusi penting: seberapa jauh Apple rela berkompromi demi kecepatan inovasi, meski harus bergantung pada rivalnya?
Artikel ini mengupas mekanisme teknis, alasan strategis, isu privasi, serta implikasi jangka panjang dari kemitraan tak terduga antara Apple, Google, dan Nvidia dalam membangun masa depan Siri.
Arsitektur Hybrid: On-Device + Cloud dengan Distilasi Model
Apple tidak menempatkan model Gemini berukuran triliunan parameter langsung di iPhone itu mustahil secara teknis. Sebagai gantinya, perusahaan menggunakan teknik distilasi model (model distillation).
Bagaimana Distilasi Bekerja?
- Google menyediakan output dari model Gemini penuh sebagai “guru”.
- Apple melatih model AI-nya yang jauh lebih kecil (mungkin hanya miliaran parameter) agar meniru pola penalaran dan respons Gemini.
Model hasil distilasi ini kemudian diinstal langsung di perangkat iPhone, iPad, dan Mac untuk menangani permintaan dasar seperti:
- Mengatur timer
- Mengedit teks
- Menjawab pertanyaan umum
Keuntungan utamanya: tidak perlu koneksi internet, dan data pengguna tetap di perangkat sesuai prinsip privasi Apple.
Namun, ketika pertanyaan terlalu kompleks (misalnya: “Buatkan rencana perjalanan 7 hari di Jepang dengan anggaran Rp15 juta”), permintaan tersebut dirutekan ke cloud.
Mengapa Apple Memilih Google Cloud Bukan Server Sendiri?
Apple memang memiliki infrastruktur Private Cloud Compute (PCC) yang berjalan di chip M-series di pusat datanya sendiri. Tapi menurut Ars Technica, PCC kesulitan menjalankan bahkan versi distilasi Gemini secara efisien pada skala besar.
Alasannya sederhana: inferensi AI generasi terbaru membutuhkan GPU kelas data center dalam jumlah besar sesuatu yang Apple belum miliki dalam kapasitas memadai.