Saya lanjutkan catatan dari training AI102 Azure. Masih tentang modul speech service.Kali ini tentang speech synthesis markup language. Dengan speech SDK kita bisa mengubah teks jadi speech,contohnya dengan metode SpeakTextAsync() . Selain itu speech service juga mendukung sintaks XML-based untuk menjelaskan karakteristik speech yang mau kita generate. Sintaks SSML (Speech Syntesis Markup Language) dapat digunakan untuk mengatur keluaran suara yang kita buat, misalnya:
- Menentukan gaya suara tertentu, misalnya seperti “excited” (senang) atau “cheerful” (riang) ketika menggunakan suara netral
- Menambahkan pause atau silence
- menentukan phonemes (pengucapan phonetic) tertentu, contohnya “SQL” dibaca menjadi “sequel”
- menyesuaikan prosody dari suara (pitch, timbre dan speaking rate)
- menggunakan ruls “say-as” untuk mendefinisikan string tertentu sebagai tanggal, waktu, nomer telefon dll
- Menambahkan rekaman suara atau audio, contohnya untuk menambahkan pesan tertentu atau mensimulasikan sebuah background noise
SSML dapat mengatur dialog antara 2 suara netral contohnya berikut ini:
a. Ariana (Cheerfully): “I say tomato:
b. Bob: ” I say tomato (pronounced tom-ah-toe).. let’s call the whole thing off!”
Untuk mengubah deskripsi SSML ke speech service, kita bisa menggunakan metoda SpeakSsmkAsync() . Contohnya : speechSynthesizer.SpeakSsmlAsync(ssml_string);
Info lebih lanjut tentang SSML bisa dilihat disini:
Semoga Bermanfaat!
Tinggalkan Balasan