MAI-UI resmi rilis: Agen AI navigasi GUI yang lampaui Gemini 3 Pro.
Tim pengembang MAI-UI resmi merilis keluarga agen foundation GUI terbaru yang dirancang untuk menguasai navigasi antarmuka perangkat seluler dan desktop.
MAI-UI berhasil mencetak rekor baru (State-of-the-Art) pada pengujian AndroidWorld dengan skor 76,7%, mengungguli model besar lainnya seperti Gemini-3-Pro, Seed1.8, dan UI-Tars-2.
Keunggulan utama MAI-UI terletak pada integrasi asli protokol MCP yang menyederhanakan operasi UI kompleks menjadi panggilan API singkat.
Selain itu, model ini mendukung kolaborasi device-cloud yang cerdas, di mana agen dapat memilih untuk mengeksekusi tugas di perangkat atau di cloud berdasarkan sensitivitas data dan tingkat kerumitan tugas.
Sorotan teknis MAI-UI:
- Varian Model Lengkap: Tersedia dalam berbagai ukuran (2B, 8B, 32B, dan 235B) untuk memenuhi berbagai kebutuhan implementasi. Versi 2B dan 8B kini telah dirilis untuk publik.
- Navigasi Cerdas: Mampu berinteraksi secara proaktif dengan menanyakan klarifikasi jika instruksi pengguna kurang jelas.
- Integrasi MCP: Mendukung penggunaan alat Model Context Protocol (MCP) untuk efisiensi eksekusi tugas UI yang panjang.
- Performa Unggul: Mencapai skor 73,5% pada ScreenSpot-Pro dan performa signifikan pada MobileWorld dibandingkan model GUI end-to-end lainnya.
- Online RL: Menggunakan Reinforcement Learning (RL) skala besar untuk meningkatkan akurasi navigasi secara drastis.