Alibaba perkenalkan Qwen3-Max-Thinking: Model penalaran tercanggih dengan kemampuan refleksi diri.
Alibaba resmi meluncurkan Qwen3-Max-Thinking, model penalaran paling mumpuni yang pernah mereka kembangkan.
Melalui pelatihan skala masif dan teknik Reinforcement Learning (RL) tingkat lanjut, model ini dirancang untuk menyelesaikan tugas-tugas kompleks yang membutuhkan logika mendalam, penggunaan alat secara otomatis, serta kemampuan agen AI.
Berikut adalah poin-poin utama mengenai Qwen3-Max-Thinking:
- Penggunaan alat adaptif: Model ini secara cerdas dapat menggunakan fitur Search, Memory, dan Code Interpreter secara otomatis tanpa perlu instruksi manual dari pengguna.
- Skalasi waktu uji (Test-time scaling): Melalui proses refleksi diri dalam beberapa putaran, performa penalarannya diklaim mampu melampaui Gemini 3 Pro.
- Performa unggul di bidang matematika: Mencatat skor 98.0 pada HMMT Feb, menunjukkan kemampuan luar biasa dalam memecahkan masalah matematika tingkat tinggi yang rumit.
- Kemampuan agen pencari: Meraih skor 49.8 pada HLE, membuktikan efektivitasnya dalam melakukan pencarian informasi yang bersifat agenik dan mendalam.
- Fokus pada penalaran: Dirancang agar dapat "berpikir" lebih dalam untuk memberikan solusi pada masalah-masalah tersulit yang tidak bisa ditangani oleh model standar.
Model ini sudah dapat dicoba melalui platform Qwen Chat, memberikan pengalaman baru bagi pengguna yang membutuhkan asisten cerdas dengan kemampuan logika setara manusia.