Norwegia Bungkam Swedia 3-1, Haaland Absen tapi Strand Larsen Bersinar
Norwegia kalahkan Swedia 3-1 dalam laga uji coba Piala Dunia 2026. Meski tanpa Erling Haaland, Jorgen Strand Larsen sukses cetak dua gol. Simak ulasannya di sin
Kantor Google - ist/techcrunch
Harianjogja.com, JOGJA—Inovasi terbaru dari Google menghadirkan suara AI yang kini bisa diatur menjadi antusias, serius, hingga santai, bahkan tersedia gratis untuk pengguna.
Model text-to-speech terbaru bernama Gemini 3.1 Flash TTS ini mendukung lebih dari 70 bahasa, termasuk Bahasa Indonesia, dan mulai dirilis global sejak Rabu (15/4/2026).
Kemampuan baru ini membuka peluang besar bagi kreator konten, pendidik, hingga pelaku bisnis di Indonesia untuk menghasilkan audio berkualitas tinggi tanpa harus menggunakan jasa pengisi suara profesional.
Gemini 3.1 Flash TTS merupakan bagian dari pengembangan keluarga AI Gemini yang fokus pada peningkatan kualitas interaksi berbasis suara. Salah satu keunggulan utamanya adalah kemampuan menghasilkan suara yang terdengar lebih natural dan ekspresif, mendekati intonasi manusia.
Fitur yang paling menonjol adalah penggunaan “Audio Tags”, yang memungkinkan pengguna mengatur gaya bicara hanya melalui perintah teks. The Decorder mengungkapkan, dengan fitur ini, pengguna bisa menentukan apakah suara AI terdengar antusias, serius, santai, atau bahkan seperti narator audiobook.
Tak hanya itu, model ini juga mendukung percakapan dengan lebih dari satu pembicara (multi-speaker), sehingga cocok untuk membuat konten seperti podcast atau dialog interaktif tanpa perlu merekam suara manusia.
Pilihan gaya suara yang tersedia juga beragam, mulai dari gaya kasual hingga formal seperti pembawa berita. Pengguna bahkan bisa memilih aksen tertentu, termasuk aksen Amerika dan Inggris, sesuai kebutuhan konten.
Dalam pengujian yang dilakukan oleh Artificial Analysis, model ini mencatat skor Elo 1.211 dan dinilai unggul dalam perbandingan kualitas dan biaya. Bahkan, performanya disebut melampaui beberapa model populer seperti ElevenLabs v3 dan hanya sedikit di bawah Inworld 1.5 Max.
Untuk penggunaan, Google menyediakan akses gratis bagi pengguna umum. Namun, data dari penggunaan versi gratis akan dimanfaatkan untuk pengembangan teknologi lebih lanjut.
Sementara itu, versi berbayar menawarkan tarif sekitar 1 dolar AS per juta token untuk input teks dan 20 dolar AS per juta token untuk output audio. Tersedia juga mode batch dengan biaya lebih rendah.
Saat ini, Gemini 3.1 Flash TTS masih berada dalam tahap pratinjau dan dapat diakses melalui API Gemini, Vertex AI untuk kalangan perusahaan, serta Google Vids bagi pengguna Workspace. Pengguna umum dapat mencoba layanan ini melalui Google AI Studio.
Untuk menjaga transparansi, setiap audio yang dihasilkan akan dilengkapi watermark digital menggunakan teknologi SynthID. Watermark ini tidak terdengar oleh manusia, tetapi dapat dikenali oleh sistem komputer sebagai penanda konten buatan AI.
Dengan hadirnya teknologi ini, pengguna kini memiliki kontrol lebih besar terhadap produksi audio digital. Suara AI tidak lagi terdengar kaku, melainkan mampu menyampaikan emosi dan gaya komunikasi yang lebih hidup sesuai kebutuhan.
Cek Berita dan Artikel yang lain di Harian Jogja, dan edisi cetak versi elektronik kami hadir di Epaper Harian Jogja.
Norwegia kalahkan Swedia 3-1 dalam laga uji coba Piala Dunia 2026. Meski tanpa Erling Haaland, Jorgen Strand Larsen sukses cetak dua gol. Simak ulasannya di sin
Kasus leptospirosis di Bantul capai 123 hingga Mei 2026, enam pasien meninggal akibat terlambat ditangani.
BNPB dirikan dapur umum untuk korban banjir bandang Gorontalo Utara. Ribuan warga terdampak, air kini mulai surut.
Sukoharjo tetapkan siaga darurat kekeringan dan kebakaran hingga November 2026. Tiga kecamatan rawan krisis air.
Penumpang kereta api di Jogja tembus 342 ribu saat libur panjang 2026, naik 45 persen. Stasiun Jogja jadi yang tersibuk.
Bocoran Oppo Find X10 Pro Max terbaru: kamera 200MP, layar 2K, baterai 7.000 mAh, dan chipset Dimensity 9600.