Advertisement

xAI Rilis Grok 4.1, Klaim Turunkan Halusinasi Tiga Kali

Jumali
Rabu, 19 November 2025 - 04:37 WIB
Jumali
xAI Rilis Grok 4.1, Klaim Turunkan Halusinasi Tiga Kali Grok-4 - Tangkapan layar

Advertisement

Harianjogja.com, JOGJA—xAI merilis Grok 4.1 yang diklaim mampu menekan tingkat halusinasi hingga tiga kali lebih rendah dibanding pendahulunya. Model ini juga memimpin berbagai benchmark performa dan kecerdasan emosional.

Model AI ini merupakan suksesor dari Grok 4 yang telah diluncurkan pada Juli 2025 lalu.

Advertisement

Grok 4.1 hadir dalam dua versi, yakni Grok 4.1 standar dan Grok 4.1 Thinking. Perilisan ini membawa klaim peningkatan signifikan, terutama pada aspek akurasi.

Poin utama yang diklaim xAI dari Grok 4.1 adalah tingkat halusinasi (ketidakakuratan informasi) yang jauh lebih rendah, bahkan hingga tiga kali lipat dibanding pendahulunya.

Berdasarkan pengujian internal yang dilakukan xAI:

- Tingkat "halu" Grok 4.1 hanya sebesar 4,22 persen.

- Angka ini jauh lebih rendah dibanding Grok 4 Fast yang mencapai 12,09 persen.

Pengujian yang sama melalui platform benchmark FActScore juga menunjukkan hasil konsisten. Grok 4.1 mencatat skor 2,97 persen, sementara pendahulunya, Grok 4, memiliki skor 9,89 persen.

"Dalam post-training Grok 4.1, kami fokus pada pengurangan halusinasi untuk prompt pencarian informasi. Selanjutnya kami mengamati penurunan tingkat halusinasi yang signifikan," dikutip dari situs resmi xAI.

Namun, perusahaan AI ini tidak merinci bagaimana perbandingan tingkat halusinasi Grok 4.1 dengan kompetitor utama seperti GPT 5.1 dan model AI lainnya.

Selain lebih minim halusinasi, Grok 4.1 juga menunjukkan performa memuaskan dalam berbagai pengujian performa, mengungguli beberapa pesaing di pasar.

Dalam platform benchmark Text Arena, kedua versi Grok 4.1 berhasil menempati posisi teratas dengan skor Elo hingga 1.488 poin.

Skor ini lebih tinggi dari:

- Gemini 2.5 Pro yang mendapat 1.452 poin (unggul 31 poin).

- Claude Sonnet 4.5 Thinking (1.450 poin).

- GPT-5 (1.437 poin).

Grok 4.1 juga disebut sangat mumpuni dalam interaksi dengan pengguna, termasuk dalam hal kreatif, emosional, maupun kolaboratif.

"Model Grok 4.1 kami sangat mumpuni dalam interaksi kreatif. Model ini lebih peka terhadap maksud yang berkonteks, menarik diajak bicara dan koheren secara personal, sekaligus mempertahankan kecerdasan dan keandalan yang tajam dari pendahulunya," beber xAI.

Pengujian kecerdasan emosional terhadap Grok 4.1 di platform benchmark EQ-Bench semakin menegaskan keunggulan ini. Model AI milik Elon Musk tersebut meraih skor 1.586 poin, melampaui:

- Gemini 2.5 Pro (1.460 poin).

- GPT-5 (1.364 poin).

Model AI Grok 4.1 sudah tersedia untuk pengguna melalui situs grok.com, platform media sosial X/Twitter, serta aplikasi Grok di perangkat iOS maupun Android.

Cek Berita dan Artikel yang lain di Google News

Advertisement

Harian Jogja

Video Terbaru

Berita Lainnya

Advertisement

Harian Jogja

Berita Pilihan

Advertisement

KPK Dalami Dugaan Suap Sugiri Sancoko Libatkan Kerabat

KPK Dalami Dugaan Suap Sugiri Sancoko Libatkan Kerabat

News
| Rabu, 19 November 2025, 05:57 WIB

Advertisement

Bromo Tutup saat Wulan Kapitu, Ini Jadwal dan Aksesnya

Bromo Tutup saat Wulan Kapitu, Ini Jadwal dan Aksesnya

Wisata
| Selasa, 18 November 2025, 20:17 WIB

Advertisement

Advertisement

Advertisement