Microsoft Vall-E 2 AI Voice Tool, Lebih Manusiawi Tapi Berbahaya
Microsoft telah mengumumkan iterasi baru AI model bahasa codec sarafnya, Vall-E, yang melampaui upaya sebelumnya yang lebih alami, ucapan yang tidak kaku, dan kesamaan pembicara.
Vall-E 2 adalah yang pertama dari jenisnya yang mencapai kesetaraan manusia dalam tolok ukur populer, menunjukkan kemampuan bicara yang sangat canggih sehingga Microsoft memutuskan untuk tidak menjadikannya dapat diakses publik.
Peningkatan Utama di Vall-E 2
Dibangun berdasarkan Vall-E, alat suara AI baru ini mengintegrasikan dua peningkatan besar yang meningkatkan kinerjanya secara signifikan:
- Pemodelan Kode yang Dikelompokkan: Teknik ini memungkinkan Microsoft mengatur kode codec dengan lebih baik, sehingga menghasilkan panjang urutan yang lebih pendek. Hasilnya adalah kecepatan inferensi yang lebih cepat dan kemampuan untuk menangani pemodelan rangkaian panjang dengan lebih efektif.
- Pengambilan Sampel ulang Kesadaran: Peningkatan ini memikirkan kembali proses pengambilan sampel inti asli dengan mencari pengulangan token selama decoding. Proses ini menstabilkan decoding dan mencegah masalah loop tak terbatas yang ditemukan di Vall-E asli.
Microsoft menguji Vall-E 2 menggunakan kumpulan data LibriSpeech dan VCTK, dan berhasil melewati kedua tolok ukur tersebut dengan hasil yang luar biasa. Ketika Microsoft mengklaim Vall-E 2 mencapai paritas manusia, itu berarti alat AI berkinerja lebih baik daripada sampel kebenaran dasar dalam hal ketahanan, kesamaan, dan kealamian.
Vall-E 2 dapat menghasilkan ucapan yang hampir identik dengan pembicara aslinya, menangkap nuansa halus seperti penekanan pada kata yang tepat dalam sebuah kalimat.
Penerapan & Kekhawatiran
Microsoft telah membagikan banyak sampel dari Vall-E 2 di halaman ringkasan proyek, menunjukkan model ucapan yang sangat nyata dan tidak dapat dibedakan. Terlepas dari kemampuannya yang mengesankan, Microsoft telah menekankan bahwa Vall-E 2 hanyalah sebuah proyek penelitian dan tidak memiliki rencana untuk menggabungkan teknologi tersebut ke dalam produk konsumen atau merilis alat tersebut ke masyarakat umum.
Perusahaan menyadari potensi risiko penyalahgunaan, seperti meniru identitas individu atau memalsukan identifikasi suara. Meski demikian, Microsoft yakin Vall-E 2 dapat memiliki aplikasi di berbagai bidang, antara lain:
- Pendidikan
- Terjemahan
- Aksesibilitas
- Jurnalistik
- Konten yang ditulis sendiri
- chat bot
Vall-E 2 mewakili tonggak penting dalam teknologi suara AI, mencapai sintesis ucapan mirip manusia yang mengungguli model sebelumnya dalam hal kealamian dan ketahanan. Meskipun teknologi ini menjanjikan untuk berbagai aplikasi, pendekatan hati-hati Microsoft dalam membatasi aksesnya menggarisbawahi potensi masalah etika dan keamanan yang terkait dengan kemampuan AI canggih tersebut.
VIDEO TERBARU MURDOCKCRUZ :