OpenAI Menggagas Teknologi Suara Baru Berbasis AI untuk Masa Depan yang Lebih Aman

Voice Engine Teknologi Suara Baru OpenAI

OpenAI sedang dalam proses menguji teknologi suara baru yang didasarkan pada kecerdasan buatan (AI) dalam upaya eksplorasi kemampuannya, sambil tetap waspada terhadap potensi penyalahgunaan oleh pihak yang tidak bertanggung jawab.

Voice Engine, demikian namanya, “menggunakan input teks dan sampel audio berdurasi 15 detik untuk menghasilkan ucapan yang terdengar alami dan sangat mirip dengan pembicara aslinya,” demikian dijelaskan dalam postingan blog OpenAI minggu lalu. Teknologi ini mampu membuat audio baru dari teks dengan menggunakan suara satu orang sebagai referensi, menerjemahkan audio yang sudah ada ke bahasa lain sambil mempertahankan nada dan aksen asli pembicara, atau menciptakan audio baru dalam bahasa yang berbeda dari bahasa aslinya.

Baca juga: OneDrive for Web Memperkenalkan Mode Offline Baru untuk Kemudahan Akses Berkas

Meskipun Voice Engine sudah ada selama beberapa tahun dan digunakan sebagai dasar untuk API teks-ke-suara OpenAI serta kemampuan kueri suara ChatGPT yang diperkenalkan pada musim gugur tahun lalu, OpenAI baru-baru ini memutuskan untuk menyiapkan Voice Engine untuk digunakan secara lebih luas oleh publik. Namun, mereka memulai langkah ini dengan hati-hati, hanya memberikan akses kepada “sekelompok kecil mitra yang tepercaya”.

OpenAI tidak memberikan informasi tentang berapa lama pratinjau pribadi terbatas ini akan berlangsung atau kapan Voice Engine diperkirakan akan tersedia secara umum. Mereka mengambil pendekatan yang lambat dan hati-hati “karena potensi penyalahgunaan suara sintetis,” seperti yang diungkapkan oleh perwakilan OpenAI. Langkah serupa juga telah diambil oleh OpenAI saat mereka meluncurkan kemampuan teks-ke-video Sora pada bulan Februari, dengan membatasinya hanya untuk sejumlah penguji terpilih.

Voice Engine: Inovasi AI yang Siap Membawa Perubahan di Berbagai Industri

Meskipun masih dalam tahap uji coba, Voice Engine, teknologi suara terbaru dari OpenAI, telah mulai diterapkan dalam berbagai aplikasi dunia nyata di berbagai industri. Salah satunya adalah dalam membantu pasien dengan gangguan bicara untuk berkomunikasi dengan menggunakan suara mereka sendiri, dengan memanfaatkan rekaman video lama mereka sebagai referensi audio. Pembuat konten juga telah memanfaatkannya untuk menerjemahkan aset mereka ke berbagai bahasa, memberi mereka akses ke audiens yang lebih luas.

Baca juga: Mark Zuckerberg memperkenalkan Pembaruan Komunitas WhatsApp, Inilah Fitur-Fiturnya

Sebagai contoh nyata, cuplikan audio yang dihasilkan oleh Voice Engine telah dipamerkan dalam postingan blog terbaru OpenAI. Namun, di balik segala kemampuannya, seperti teknologi Sora sebelumnya, Voice Engine juga memiliki potensi untuk disalahgunakan. Oleh karena itu, OpenAI sedang bekerja keras untuk mengembangkan pagar pembatas yang dapat membatasi kemungkinan kontribusi teknologi ini terhadap penyebaran informasi yang salah.

Salah satu langkah yang diambil adalah dengan mencegah pengguna membuat suara mereka sendiri dari awal, serta memberikan setiap cuplikan audio yang dihasilkan oleh Voice Engine dengan “tanda air” untuk melacak asal setiap cuplikan dan cara penggunaannya.

Selain itu, OpenAI memberikan akses ke Voice Engine hanya kepada kelompok penguji yang mematuhi sejumlah ketentuan untuk mencegah penyalahgunaan teknologi ini. Mereka tidak diperbolehkan menggunakan Voice Engine untuk menyamar sebagai orang lain tanpa izin tertulis, dan harus mengungkapkan kepada audiensnya saat mereka menggunakan Voice Engine untuk membuat audio.

Baca juga: Bocoran Spesifikasi Google Pixel 8a, Tanggal Rilis dan Harganya

Untuk mencegah kerugian yang lebih luas yang mungkin ditimbulkan oleh audio yang dihasilkan oleh AI secara umum, OpenAI juga memberikan beberapa saran bagi pembuat kebijakan dan pengembang. Ini termasuk menerapkan “daftar suara yang dilarang” untuk mencegah peniruan identitas tokoh terkenal, menghindari autentikasi berbasis suara untuk sistem kritis, dan menyebarkan kesadaran masyarakat tentang potensi penyalahgunaan AI.

“Kami menyadari bahwa menghasilkan pidato yang menyerupai suara masyarakat memiliki risiko yang serius…. Kami bekerja sama dengan mitra AS dan internasional dari berbagai kalangan pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya untuk memastikan kami menyertakan masukan mereka saat kami membangun,” kata OpenAI.