Uji Keandalan AI Generatif: Google Gemini Fabrikasi Berita?
- Unsplash
- Eksperimen empat minggu menguji 7 sistem AI generatif, termasuk Google Gemini, untuk akurasi pelaporan berita.
- Gemini secara spesifik menciptakan situs berita palsu (examplefictif.ca) dan melaporkan mogok sekolah yang tidak pernah terjadi.
- Dari 839 respons total, hanya 37% respons AI yang memberikan URL sumber yang valid dan lengkap.
Kekhawatiran baru tentang keandalan AI Generatif sebagai sumber berita menguat setelah temuan investigasi selama sebulan. Investigasi ini menemukan bahwa chatbot Gemini milik Google secara terang-terangan menciptakan seluruh media berita fiktif dan menyebarkan laporan palsu. Penelitian mendalam tersebut, pertama kali dilaporkan oleh The Conversation, membunyikan alarm keras bagi pengguna yang mulai mengandalkan teknologi ini untuk mendapatkan informasi. Laporan ini menunjukkan bahwa AI, bahkan dari perusahaan sebesar Google, masih berjuang membedakan antara ringkasan dan fabrikasi.
Eksperimen Jurnalisme Komputer Ungkap Celah Fatal Google Gemini
Seorang profesor jurnalisme yang fokus pada ilmu komputer memimpin eksperimen komprehensif ini. Profesor tersebut menguji tujuh sistem AI Generatif berbeda selama periode empat minggu penuh. Tujuh sistem yang diuji meliputi Google Gemini, OpenAI’s ChatGPT, Claude, Copilot, Grok, DeepSeek, dan Aria.
Metodologi Uji Coba: Mencari Sumber Berita Kritis
Para peneliti menjalankan pengujian harian untuk mengetahui akurasi pelaporan berita. Setiap hari, para peneliti meminta alat AI mendaftar dan merangkum lima peristiwa berita paling penting di Québec, mengurutkannya berdasarkan kepentingan, dan menyediakan tautan artikel langsung sebagai sumber. Hasilnya menunjukkan pola kegagalan yang signifikan di seluruh platform.
Gemini Menciptakan Realitas: Kasus Media Fiktif dan Hoaks Berita
Kegagalan paling mencolok melibatkan Google Gemini. Gemini ditemukan mengarang media berita fiktif bernama examplefictif.ca. Lebih parah, alat tersebut melaporkan mogok kerja pengemudi bus sekolah di Québec yang diklaim terjadi pada September 2025. Faktanya, gangguan tersebut berasal dari penarikan bus listrik Lion Electric akibat masalah teknis.
Kasus ini bukanlah insiden tunggal. Peneliti mengumpulkan 839 respons sepanjang eksperimen tersebut. Sistem AI secara rutin mengutip sumber-sumber imajiner, menyediakan URL yang rusak atau tidak lengkap, atau bahkan salah merepresentasikan pelaporan yang nyata.