VIVACOID
JagoDangdut
100KPJ
IntipSeleb
VLIX
Sahijab
ANTV
tvOne
One Pride
Oneprix
Networks
- banyuwangi
- purwasuka
- wisata
- padang
- TECHNO
- siap
- bogor
- banten
- banyumas
- NTT
- cianjur
- Jakarta
- jateng
- teknodaily
- jatim
- medan
- MADURA
- jogja
- lampung
- bali
- sulawesi
- Parenting
- semarang
- malang
- TANGERANG
- KALTIM
- Soccer
- mindset
- ceritakita
- gorontalo
- olret

Xiaomi Pecahkan Rekor AI: 1.000 Token/detik dengan MiMo-V2.5-Pro!

Rabu, 10 Juni 2026 - 00:22 WIB

Oleh :

Olin Sianturi

Xiaomi Pecahkan Rekor AI: 1.000 Token/detik dengan MiMo-V2.5-Pro!

Xiaomi Pecahkan Rekor AI: 1.000 Token/detik dengan MiMo-V2.5-Pro!

Sumber :

Xiaomi

1. FP4 Quantization pada Expert Layers

Baca Juga

Xiaomi Clip Earbuds Resmi Rilis: Desain Open-Ear & Fitur AI

Model MiMo-V2.5-Pro menggunakan arsitektur Mixture of Experts (MoE).
Xiaomi menerapkan kuantisasi FP4 (4-bit floating point) hanya pada expert layers, bukan seluruh model.
Teknik ini dipadukan dengan Quantization-Aware Training (QAT), sehingga kemampuan model tetap terjaga meski presisi dikurangi.

Hasil: ukuran model turun drastis, beban memori berkurang, tanpa kehilangan akurasi signifikan.

Baca Juga

Ayaneo Konkr Pocket Block: Handheld AI Pertama Gaya Retro

2. DFlash Speculative Decoding

DFlash adalah teknik speculative decoding yang memprediksi blok token utuh dalam satu forward pass.
Dalam tugas pemrograman, sistem mencapai rata-rata panjang penerimaan 6,30 token per prediksi jauh di atas metode konvensional.

Baca Juga

Misteri Penjualan GPU Nvidia: Sengaja Dihapus Demi AI?

Ini mengurangi jumlah iterasi inferensi, mempercepat output secara eksponensial.

3. TileRT Persistent-Core GPU Runtime

TileRT mengembangkan runtime GPU khusus yang menggunakan inti persisten (persistent cores) dan pipa heterogen.
Arsitektur ini menghilangkan overhead switching operator, memastikan GPU bekerja pada kapasitas penuh sepanjang waktu.
Tidak ada idle cycle setiap siklus komputasi dimanfaatkan.

Yang mengejutkan: semua ini berjalan di server 8-GPU standar (kemungkinan besar NVIDIA A100/H100), tanpa ASIC, FPGA, atau chip khusus AI. Artinya, infrastruktur yang sudah dimiliki banyak perusahaan cukup untuk menjalankannya.

UltraSpeed API: 10x Lebih Cepat, Tapi 3x Lebih Mahal

Xiaomi menawarkan akses ke kecepatan ini melalui UltraSpeed API, dengan ketentuan:

Harga: 3 kali lipat dari tarif standar MiMo-V2.5-Pro
Kecepatan: ~10 kali lipat output per detik

Efisiensi biaya: Meski lebih mahal per permintaan, biaya per token justru lebih rendah karena throughput jauh lebih tinggi.

Bagi perusahaan yang mengandalkan volume inferensi tinggi, ini bisa berarti penghematan operasional signifikan terutama jika latensi adalah penghalang utama.

Uji Coba Terbatas: 9–23 Juni 2026

Xiaomi membuka uji coba terbatas mulai 9 hingga 23 Juni 2026, dengan syarat ketat:

Akses berbasis aplikasi (bukan terbuka untuk umum)
Prioritas untuk perusahaan dan pengembang profesional
Fitur gratis: 2 minggu akses Chat dengan batasan:
- Maksimal 10 antrian per akun/hari
- Sesi maksimal 30 menit
- Sesi otomatis berakhir setelah 5 menit idle
Tidak mendukung TokenPlan hanya akses API trial

Tujuan uji coba ini jelas: mengumpulkan umpan balik dari pengguna enterprise sebelum peluncuran komersial penuh.

Halaman Selanjutnya

Transparansi: Checkpoint Open-Source Dirilis

<

2

>

Topik Terkait

xiaomi mimo ai inference mimo v25 pro tilert model besar kecepatan ai fp4 quantization speculative decoding hugging face teknologi ai

Jangan Lewatkan

Lenovo IdeaPad Slim 3 17 Inci Meluncur Global, Bawa Prosesor Intel Wildcat Lake dan RAM 32 GB

Lenovo IdeaPad Slim 3 17 Inci Meluncur Global, Bawa Prosesor Intel Wildcat Lake dan RAM 32 GB

Gadget

6 hari lalu

Lenovo IdeaPad Slim 3 17 inci kini hadir di pasar global dengan prosesor Intel Wildcat Lake, RAM hingga 32 GB, dan harga mulai Rp13 jutaan.

Infinix Smart 20 Resmi Diluncurkan, Usung Layar 120Hz dan Helio G81

Infinix Smart 20 Resmi Diluncurkan, Usung Layar 120Hz dan Helio G81

Gadget

6 hari lalu

Infinix kembali memperkuat persaingan di segmen smartphone terjangkau dengan memperkenalkan Infinix Smart 20 di pasar India.

Edifier LolliClip SE Resmi Meluncur, Earbud Open-Ear dengan Dolby Spatial Audio dan Baterai 40 Jam

Edifier LolliClip SE Resmi Meluncur, Earbud Open-Ear dengan Dolby Spatial Audio dan Baterai 40 Jam

Gadget

6 hari lalu

Edifier kembali meramaikan pasar perangkat audio nirkabel dengan meluncurkan LolliClip SE, sebuah earbud open-ear terbaru

Lenovo Bellator Feng 7000X Resmi Meluncur, Desktop Gaming RTX 5060 Ti dengan Intel dan AMD

Lenovo Bellator Feng 7000X Resmi Meluncur, Desktop Gaming RTX 5060 Ti dengan Intel dan AMD

Gadget

6 hari lalu

Lenovo kembali memperkuat lini perangkat gaming mereka dengan menghadirkan desktop terbaru bernama Lenovo Bellator Feng 7000X.

Portronics Titan 35 Resmi Meluncur, Power Bank 20.000mAh dengan Fast Charging 35W dan Kabel Terintegrasi

Portronics Titan 35 Resmi Meluncur, Power Bank 20.000mAh dengan Fast Charging 35W dan Kabel Terintegrasi

Gadget

6 hari lalu

Pasar aksesori mobile kembali kedatangan produk baru yang menarik perhatian. Produsen perangkat elektronik asal India, Portronics

HP x Ferrari Rilis Laptop AI Edisi Terbatas, Harga Rp100 Juta!

HP x Ferrari Rilis Laptop AI Edisi Terbatas, Harga Rp100 Juta!

Gadget

6 hari lalu

HP dan Ferrari luncurkan laptop AI edisi terbatas dengan desain supercar, performa 180 TOPS, dan harga Rp100 juta. Hanya 4.999 unit di dunia!

Terpopuler

Samsung Siapkan 3 Foldable Berbeda: Flip 8, Fold 8, dan Fold 8 Ultra!

Samsung Siapkan 3 Foldable Berbeda: Flip 8, Fold 8, dan Fold 8 Ultra!

Gadget

15 Jun 2026

Samsung siapkan tiga foldable unik: Z Flip 8 konservatif, Z Fold 8 lebih lebar dari tinggi, dan Fold 8 Ultra jadi raja kamera. Bocoran terbaru jelang

Kenapa HP Jadi Lemot Setelah Setahun? Bukan Mitos-Ini Fakta Ilmiahnya!

Kenapa HP Jadi Lemot Setelah Setahun? Bukan Mitos-Ini Fakta Ilmiahnya!

Gadget

15 Jun 2026

HP baru terasa kencang, tapi jadi lemot setelah setahun? Simak 4 penyebab utama dan tips praktis agar performa tetap lancar seperti baru!

Jangan Dipaksa, 7 Tanda Smartphone Anda Sudah Harus Diganti

Jangan Dipaksa, 7 Tanda Smartphone Anda Sudah Harus Diganti

Gadget

15 Jun 2026

Kapan waktu yang tepat untuk ganti hp? Kenali 7 tanda smartphone Anda sudah lemot, baterai bocor, dan harus segera diganti dengan yang baru.

Acer Luncurkan Swift Spin 14 AI & Aspire Go 15 Berbasis Snapdragon!

Acer Luncurkan Swift Spin 14 AI & Aspire Go 15 Berbasis Snapdragon!

Gadget

15 Jun 2026

Acer perluas jajaran laptop Snapdragon dengan Swift Spin 14 AI (convertible) dan Aspire Go 15 (terjangkau). Simak fitur AI, baterai 23 jam, dan harga

Menutup Aplikasi Background Hemat Baterai? Ini Fakta Sebenarnya!

Menutup Aplikasi Background Hemat Baterai? Ini Fakta Sebenarnya!

Gadget

15 Jun 2026

Banyak yang percaya tutup aplikasi background hemat baterai—tapi ini justru bisa bikin boros! Simak penjelasan lengkapnya berdasarkan cara kerja siste

Terpopuler VIVA

Sedang Berlangsung, Link Live Streaming Spanyol Vs Cape Verde

Sedang Berlangsung, Link Live Streaming Spanyol Vs Cape Verde

Bola

16 Jun 2026

Timnas Spanyol bersiap memulai perburuan gelar Piala Dunia 2026 dengan menghadapi Cape Verde pada laga perdana Grup H. Ini Link Live Streaming Spanyol Vs Cape Verde di Pi

Ini Sinyal Kuat Ragnar Oratmangoen ke Persija: Kode Jakmania hingga Dilepas Klub Belgia

Ini Sinyal Kuat Ragnar Oratmangoen ke Persija: Kode Jakmania hingga Dilepas Klub Belgia

Bola

16 Jun 2026

Ragnar Oratmangoen resmi dilepas FCV Dender. Kode Jakmania dan faktor Shin Tae-yong membuat rumor kepindahannya ke Persija makin menguat. ini sinyal kuatnya ke Persija

Istana Ungkap Cara Pemerintah Perkuat Nilai Tukar Rupiah Demi Jaga Kepercayaan Publik

Istana Ungkap Cara Pemerintah Perkuat Nilai Tukar Rupiah Demi Jaga Kepercayaan Publik

Berita

16 Jun 2026

Prasetyo mengungkapkan cara pemerintah yang terus koordinasi dan bekerja sama lintas sektor guna memperkuat nilai tukar rupiah demi meningkatkan kepercayaan masyarakat.

6 Pemain Naturalisasi Timnas Indonesia yang Jadi Mualaf

6 Pemain Naturalisasi Timnas Indonesia yang Jadi Mualaf

Bola

16 Jun 2026

Bek Timnas Indonesia, Justin Hubner, tengah menjadi sorotan publik. Bukan karena aksinya di lapangan hijau, melainkan kabar bahwa ia telah memeluk agama Islam menjelang p

Viral! Pelari Jakarta International Marathon Meninggal Dunia, Apa Penyebabnya?

Viral! Pelari Jakarta International Marathon Meninggal Dunia, Apa Penyebabnya?

Sport

16 Jun 2026

Gelaran BTN Jakarta International Marathon (JAKIM) 2026 diwarnai kabar duka. Seorang peserta kategori half marathon, Agus Putranadi, meninggal dunia setelah mengalami kol

Viva Partner Network

Link Live Streaming Belgia vs Mesir di Piala Dunia 2026, Kick-off Pukul 02.00 WIB

Gadget

6 menit lalu

Belgia vs Mesir tersaji di Grup G Piala Dunia 2026. Simak jadwal, situasi tim, dan link live streaming resminya.

Ribuan Warga Tanjungsari Meriahkan Pawai Obor dan Doa Bersama Sambut 1 Muharam 1448 H

Bogor

20 menit lalu

Ribuan warga Tanjungsari Bogor mengikuti pawai obor dan doa bersama menyambut Tahun Baru Islam 1448 Hijriah dalam suasana religius dan penuh kebersamaan.

GMNI Banyuwangi Soroti Kenaikan Pertamax di Tengah Pelemahan Rupiah, Desak Pemerintah Stop Kebijakan yang Bebani Rakyat!

Banyuwangi

23 menit lalu

Dewan Pimpinan Cabang (DPC) Gerakan Mahasiswa Nasional Indonesia (GMNI) Banyuwangi menyoroti kenaikan harga BBM nonsubsidi jenis Pertamax yang terjadi di tengah pelemahan

Honor X70 Pro Max Tampil Mengejutkan Dengan Baterai Jumbo Dan Layar Terang

Gadget

26 menit lalu

Honor X70 Pro Max hadir dengan baterai jumbo 8.560mAh dan layar AMOLED 6.000 nits. Harga mulai dari Rp4.400.000 untuk pasar China dengan empat pilihan warna.

Isu Terkini

Pilihan Redaksi

DJI Osmo Pocket 4P Resmi Meluncur, Kamera Gimbal Saku dengan Dua Kamera Utama dan Zoom 12x

DJI Osmo Pocket 4P Resmi Meluncur, Kamera Gimbal Saku dengan Dua Kamera Utama dan Zoom 12x

Gadget

15 Jun 2026

DJI kembali membuat gebrakan di pasar kamera portabel dengan memperkenalkan DJI Osmo Pocket 4P.

Update Software Garmin Fenix 8 Hadirkan Perbaikan Baterai Lebih Optimal

Update Software Garmin Fenix 8 Hadirkan Perbaikan Baterai Lebih Optimal

Gadget

15 Jun 2026

Garmin merilis update perangkat lunak 22.37 untuk memperbaiki masalah baterai boros pada seri smartwatch premium Fenix 8 dan Tactix 8 agar lebih optimal.

Lenovo Yoga Pro 7 15ASH11 Tawarkan Layar OLED Terang dan VRAM Jumbo

Lenovo Yoga Pro 7 15ASH11 Tawarkan Layar OLED Terang dan VRAM Jumbo

Gadget

15 Jun 2026

Lenovo Yoga Pro 7 15ASH11 hadir dengan layar OLED 1.100 nits dan dukungan VRAM hingga 96 GB. Laptop ini ditenagai prosesor Ryzen AI Max+ 388 terbaru.