Dunia kecerdasan buatan kembali diguncang dengan kehadiran AI Alibaba Cloud terbaru 2026. Anak perusahaan Alibaba Group tersebut resmi meluncurkan model AI Qwen3-Max-Thinking, sebuah terobosan yang diklaim mampu menyaingi bahkan melampaui performa model papan atas seperti GPT-5.2-Thinking milik OpenAI dan Gemini 3 Pro besutan Google.
Sebagai flagship terbaru dari tim Qwen, model ini terancang khusus untuk menangani tugas-tugas reasoning (penalaran) kompleks, pemrograman tingkat lanjut, hingga berperan sebagai agen AI yang mampu mengambil keputusan bertahap secara mandiri.
Dominasi Benchmark AI Internasional Qwen3

Alibaba tidak main-main dalam memposisikan model terbarunya. Model AI Qwen3-Max-Thinking telah teruji di 19 benchmark AI internasional dan mencatatkan hasil yang sangat impresif, terutama pada pengujian logika bertahap.
Salah satu pencapaian yang paling tersorot adalah pada Humanity’s Last Exam, sebuah ujian berisi soal matematika dan sains tingkat pascasarjana yang sangat jarang ada di mesin pencari. Berikut adalah perbandingan skornya:
- Qwen3-Max-Thinking: 49,8 poin
- Gemini 3 Pro: 45,8 poin
- GPT-5.2-Thinking: 45,5 poin
Selain itu, pada aspek instruction following di benchmark Arena-Hard v2, Qwen3 meraih skor 90,2 poin. Angka ini jauh mengungguli GPT-5.2 yang mencatat 80,6 poin, menunjukkan keunggulan Qwen3 daripada GPT-5 dalam memahami instruksi kompleks pengguna secara presisi.
Fitur Unggulan Qwen3-Max-Thinking

Salah satu kemampuan reasoning AI Alibaba yang paling inovatif adalah adaptive tool-use. Berbeda dengan AI generasi sebelumnya, Qwen3 mampu memilih dan menggunakan alat secara otomatis di tengah percakapan tanpa instruksi tambahan.
Model ini secara cerdas dapat:
- Memanggil Fitur Pencarian
- Untuk mengambil informasi real-time terbaru.
- Menjalankan Code Interpreter
- Untuk mengeksekusi perhitungan matematika dan kode pemrograman yang rumit.
- Menggunakan Memori
- Mengingat konteks pengguna untuk jawaban yang lebih personal.
Kombinasi ini membantu menekan “halusinasi AI” karena model tidak hanya menebak dari data pelatihan, tetapi juga memverifikasi fakta melalui sumber eksternal dan komputasi nyata.
Inovasi kunci lainnya adalah pendekatan test-time scaling. Alih-alih membuang energi untuk menghasilkan banyak jawaban, Qwen3 menggunakan strategi refleksi bertahap.
Model ini secara aktif belajar dari proses berpikirnya sendiri, menyaring kesimpulan yang sudah pasti, dan memfokuskan komputasi tambahan hanya pada bagian yang masih ambigu. Teknik ini membuat Qwen3 lebih hemat daya namun tetap memberikan jawaban yang jauh lebih akurat.
Ketersediaan dan Harga
Saat ini, model AI Qwen3-Max-Thinking sudah tersedia di layanan Qwen Chat dan dapat diakses oleh pengembang melalui API Alibaba Cloud dengan nama qwen3-max-2026-01-23. Alibaba memposisikan model ini sebagai solusi premium namun tetap kompetitif secara harga, terutama untuk kebutuhan skala perusahaan (enterprise).
Baca Juga:





