Qwen3 dari Alibaba: Model AI Multibahasa yang Dukung Bahasa Daerah Indonesia
Kamis, 1 Mei 2025 - 07:31 WIB
Sumber :
- Github Qwen
Dense Model
- Cara Kerja : Seluruh parameter model diaktifkan sekaligus setiap kali digunakan.
- Kelebihan : Menghasilkan hasil yang konsisten dan stabil di semua jenis tugas.
- Kekurangan : Proses inferensinya lebih berat karena membutuhkan konsumsi memori dan komputasi yang lebih tinggi.
- Contoh : Qwen3-32B , model Dense paling besar yang tersedia untuk publik.
MoE Model
- Cara Kerja : Hanya sebagian kecil parameter yang diaktifkan berdasarkan tugas.
- Kelebihan : Lebih efisien dalam hal memori dan komputasi, cocok untuk aplikasi skala besar.
- Kekurangan : Sedikit lebih kompleks dalam implementasi teknis.
- Contoh : Qwen3-235B-A22B , model MoE terbesar dengan total 235 miliar parameter, namun hanya menggunakan 22 miliar parameter saat inferensi.
Performa Qwen3 dalam Benchmark Penting
Salah satu aspek yang membuat Qwen3 menonjol adalah performanya yang luar biasa dalam berbagai benchmark. Berikut adalah hasil pengujian Qwen3 dibandingkan dengan model AI populer lainnya:
ArenaHard (Kemampuan Penalaran)