Whisk, AI Terbaru Google yang Sulap Gambar jadi Lebih Kreatif dan Unik

Whisk, AI Terbaru Google yang Sulap Gambar jadi Lebih Kreatif dan Unik
Sumber :
  • Whisk AI

Gadget – Raksasa teknologi Google kembali memimpin inovasi kecerdasan buatan (AI) dengan memperkenalkan Whisk, sebuah alat AI terbaru yang memungkinkan pengguna menciptakan gambar baru hanya dengan menggunakan input berupa gambar. Tidak seperti generator gambar AI pada umumnya yang mengandalkan perintah teks, Whisk hadir dengan pendekatan yang lebih praktis dan intuitif.

Tak Perlu Coding! Google Disco Ubah Obrolan Jadi Aplikasi Langsung di Browser

Whisk adalah proyek terbaru dari Google Labs yang resmi diumumkan melalui blog resmi mereka pada Selasa (17/12/2024). Thomas Iljic, Director of Product Management Google Labs, mengatakan bahwa Whisk bertujuan untuk mempermudah proses kreatif dalam pembuatan gambar berbasis AI.

“Kami meluncurkan eksperimen terbaru kami dalam AI generatif: Whisk. Alih-alih menghasilkan gambar dengan perintah teks yang panjang, Whisk memungkinkan Anda memberikan perintah dengan gambar,” jelas Iljic.

Google dan Qualcomm Kolaborasi untuk Merilis PC dengan Sistem Operasi Hibrida!

Cara Kerja Whisk: Lebih Praktis dan Interaktif

Pengguna Whisk hanya perlu menyeret (drag) gambar ke dalam platform sebagai perintah utama. Lebih lanjut, pengguna dapat menggabungkan beberapa gambar sekaligus untuk menciptakan hasil yang lebih kompleks dan sesuai keinginan.

Bikin Video AI Sinematik dengan Google Veo 3, Sudah Bisa di Indonesia Tanpa VPN

Untuk memaksimalkan kemampuannya, Whisk menyediakan tiga kolom input berbeda.

  • Subyek Gambar – Gambar utama yang ingin ditampilkan.
  • Latar Belakang (Scene) – Gambar yang akan digunakan sebagai latar belakang.
  • Inspirasi Gaya (Style) – Gambar yang digunakan sebagai referensi gaya, seperti warna, pola, atau elemen visual lainnya.

Dengan fitur ini, pengguna dapat menciptakan gambar baru yang kaya detail hanya dalam beberapa langkah mudah. Jika hasil awal belum sesuai harapan, pengguna bisa menyunting perintahnya hingga mendapatkan gambar yang diinginkan.

Teknologi di Balik Whisk

Meski terlihat sederhana, teknologi di balik Whisk sebenarnya cukup kompleks. Whisk bekerja dengan bantuan AI Gemini dari Google untuk menganalisis gambar yang diunggah pengguna. Gambar tersebut akan diterjemahkan menjadi perintah teks rinci yang menjelaskan karakteristik visual utamanya.

Selanjutnya, model AI Imagen 3 mengambil perintah teks tersebut dan mengubahnya menjadi gambar baru yang sesuai dengan input pengguna. Namun, Google menegaskan bahwa Whisk hanya mengekstrak karakteristik utama dari gambar referensi, bukan mereplikasinya secara persis.

“Misalnya, subyek yang dihasilkan mungkin memiliki tinggi, bobot, gaya rambut, atau warna kulit yang berbeda dari gambar asli,” tambah Iljic. Dengan begitu, Whisk memberikan ruang kreatif yang lebih luas bagi pengguna untuk bereksplorasi.

Halaman Selanjutnya
img_title