Inggris vs Kroasia, Ujian Perdana Thomas Tuchel di Piala Dunia 2026
Inggris menghadapi Kroasia pada laga pembuka Grup L Piala Dunia 2026. Duel ini menjadi ujian pertama Thomas Tuchel bersama The Three Lions.
Open AI - Ilustrasi Freepik
Harianjogja.com, JOGJA— OpenAI resmi memperkenalkan tiga model audio terbaru yang membawa kemampuan percakapan berbasis kecerdasan buatan ke level baru. Salah satu fitur yang paling menyita perhatian adalah teknologi penerjemah suara real-time yang memungkinkan dua orang dengan bahasa berbeda berbicara secara langsung tanpa penerjemah manusia.
Teknologi ini diprediksi mengubah cara masyarakat berkomunikasi, terutama bagi pekerja remote, pelancong, pelaku bisnis internasional, hingga pengguna layanan digital lintas negara yang selama ini terkendala bahasa.
Model terbaru tersebut bernama GPT-Realtime-Translate. Teknologi ini mendukung lebih dari 70 bahasa input dan 13 bahasa output.
Dengan kemampuan tersebut, pengguna yang berbicara menggunakan bahasa Indonesia, Jepang, atau bahasa lain dapat saling memahami secara langsung karena sistem AI akan menerjemahkan percakapan secara otomatis saat lawan bicara berbicara.
OpenAI dalam laman resminya menyebut model ini dirancang agar mampu mengikuti ritme percakapan manusia secara natural, termasuk ketika pengguna berbicara cepat, berpindah topik, atau menggunakan istilah lokal tertentu.
Kemampuan tersebut mulai diuji oleh berbagai perusahaan teknologi. Salah satunya startup AI asal India, BolnaAI.
Perusahaan itu mengklaim tingkat kesalahan kata atau Word Error Rate (WER) GPT-Realtime-Translate 12,5 persen lebih rendah dibanding model AI lain yang mereka gunakan sebelumnya, khususnya untuk bahasa Hindi, Tamil, dan Telugu.
Klaim tersebut dinilai penting bagi negara dengan keragaman bahasa tinggi seperti Indonesia karena AI dituntut memahami berbagai dialek serta variasi pengucapan pengguna.
Selain model penerjemah, OpenAI juga meluncurkan GPT-Realtime-Whisper, yaitu teknologi speech-to-text dengan jeda rendah.
Model ini memungkinkan teks muncul secara langsung saat seseorang berbicara sehingga dapat digunakan untuk membuat caption rapat online, kelas virtual, siaran langsung, hingga pencatatan otomatis.
Teknologi tersebut juga diprediksi membantu berbagai sektor seperti layanan pelanggan, tenaga kesehatan, rekrutmen kerja, hingga sistem agen AI berbasis suara yang membutuhkan transkripsi cepat dan akurat.
Kedua model baru itu ditenagai GPT-Realtime-2, model audio terbaru OpenAI yang disebut memiliki kemampuan penalaran setara GPT-5.
Model ini dirancang untuk menangani percakapan lebih kompleks, memahami konteks panjang, serta menjalankan beberapa tugas sekaligus sambil tetap menjaga percakapan terdengar alami.
OpenAI juga meningkatkan context window dari 32K menjadi 128K sehingga AI dapat mengingat percakapan lebih lama dan memproses tugas yang lebih rumit.
Kemampuan parallel tool calls pada GPT-Realtime-2 memungkinkan AI menjalankan beberapa fungsi bersamaan tanpa menghentikan percakapan pengguna.
Dalam pengujian internal, GPT-Realtime-2 mencatat skor akurasi 96,6 persen pada benchmark Big Bench Audio. Angka tersebut meningkat signifikan dibanding GPT-Realtime-1.5 yang sebelumnya hanya mencapai 81,4 persen.
Meski menawarkan teknologi yang lebih canggih, OpenAI mengakui model berbasis suara juga memiliki risiko penyalahgunaan, terutama untuk penipuan digital melalui layanan suara.
Karena itu, perusahaan menanamkan berbagai sistem pengaman untuk mendeteksi percakapan mencurigakan, termasuk spam dan indikasi penipuan.
Realtime API milik OpenAI disebut dapat menghentikan percakapan secara otomatis apabila terdeteksi melanggar pedoman keamanan dan konten berbahaya.
Ketiga model terbaru tersebut kini tersedia melalui Realtime API OpenAI
Untuk biaya penggunaan, GPT-Realtime-2 dipatok US$32 per satu juta token audio input dan US$64 per satu juta token audio output.
Sementara GPT-Realtime-Translate dibanderol US$0,034 per menit dan GPT-Realtime-Whisper dipatok US$0,017 per menit.
Bagi developer dan perusahaan teknologi, peluncuran model audio terbaru ini dinilai membuka peluang besar untuk membangun layanan penerjemah otomatis, transkripsi real-time, hingga asisten suara berbasis AI yang lebih natural.
Cek Berita dan Artikel yang lain di Harian Jogja, dan edisi cetak versi elektronik kami hadir di Epaper Harian Jogja.
Inggris menghadapi Kroasia pada laga pembuka Grup L Piala Dunia 2026. Duel ini menjadi ujian pertama Thomas Tuchel bersama The Three Lions.
Portugal gagal menang di laga pembuka Piala Dunia 2026 usai ditahan Kongo 1-1. Cristiano Ronaldo tak mampu mencetak gol.
Rangkuman 10 berita terpopuler Jogja hari ini, dari kebijakan Sultan, kekeringan Gunungkidul, hingga Messi hattrick di Piala Dunia 2026.
Jadwal SIM keliling Jogja 18 Juni 2026 lengkap, termasuk drive thru dan layanan malam, praktis tanpa antre panjang.
Jadwal SIM keliling Sleman 18 Juni 2026 lengkap, termasuk Simeru dan Satpas, praktis tanpa antre panjang.
Jadwal DAMRI Jogja ke YIA Juni 2026 lengkap, tarif Rp80 ribu, rute langsung tanpa transit dan praktis.