Grok-4.20 dan GPT-5.4 Puncaki Peringkat IQ Model Kecerdasan Buatan

Grok-4.20 dan GPT-5.4 Puncaki Peringkat IQ Model Kecerdasan Buatan

Grok-4.20 Expert Mode dan OpenAI GPT-5.4 Pro (Vision) mencatatkan skor tertinggi sebesar 145 poin dalam pengujian tingkat inteligensi model kecerdasan buatan (AI) pada April 2026. Capaian tersebut menempatkan kedua model besutan xAI dan OpenAI ini di posisi pertama berdasarkan hasil tes IQ Mensa Norwegia.

Sebanyak 26 model AI dari berbagai perusahaan teknologi global terlibat dalam pengujian yang dilakukan oleh platform Tracking AI tersebut. Dilansir dari Tekno, perolehan skor tahun ini menunjukkan peningkatan signifikan dibandingkan periode 2025 yang hanya mencapai angka maksimal 135 poin.

Visual Capitalist mengolah data tersebut dan menempatkan Gemini 3.1 Pro Preview di peringkat ketiga dengan skor 141. Sementara itu, Qwen 3.5 milik Alibaba menjadi representasi model AI asal China dengan peringkat tertinggi di posisi ke-10 lewat raihan 130 poin.

Daftar Peringkat IQ Model AI April 2026
PeringkatNama Model AISkor IQ
1Grok-4.20 Expert Mode145
1OpenAI GPT-5.4 Pro (Vision)145
3Gemini 3.1 Pro Preview141
4OpenAI GPT-5.4 Thinking (Vision)139
5OpenAI GPT-5.3136
6Grok-4.20 Expert Mode (Vision)133
6OpenAI GPT-5.4 Thinking133
6Meta Muse Spark133
9Gemini 3.1 Pro Preview (Vision)132
10Qwen 3.5130
10Claude 4.6 Opus130
12Kimi K2.5127
13Manus115
14DeepSeek R1112
15DeepSeek V3111
16Gemini 3.1 Flash110
16Llama 4 Maverick110
18GPT-5.3 (Vision)109
19Claude 4.6 Sonnet106
20Bing Copilot101
21Perplexity97
22Mistral Medium 3.196
23Claude 4.6 Sonnet (Vision)94
24Claude 4.6 Opus (Vision)82
25Llama 4 Maverick (Vision)79
26GPT-5.4 Pro (non-vision)73

Metode pengujian menggunakan 35 teka-teki pola visual dengan perlakuan berbeda antara model teks dan multimodal. Model non-vision menerima konversi deskripsi verbal, sedangkan model vision mengerjakan soal dalam bentuk gambar asli tanpa modifikasi tambahan.

Aturan ketat diterapkan Tracking AI dengan melakukan pengulangan hingga 10 kali jika sebuah model menolak menjawab pertanyaan tertentu. Nilai akhir diambil dari jawaban terakhir yang diberikan oleh model yang bersangkutan dalam proses tersebut.

Hasil penilaian ini lebih difungsikan sebagai alat perbandingan kemampuan penalaran pola dan bukan ukuran mutlak kecerdasan AI secara menyeluruh. Pengukuran inteligensi melalui tes IQ hanya menyentuh satu aspek teknis dari kapabilitas AI yang terus berkembang pesat.

Artikel terkait

Rekomendasi