Kategori
machine learning

Speech Synthesis Markup Language

Saya lanjutkan catatan dari training AI102 Azure. Masih tentang modul speech service.Kali ini tentang speech synthesis markup language. Dengan speech SDK kita bisa mengubah teks jadi speech,contohnya dengan metode SpeakTextAsync() . Selain itu speech service juga mendukung sintaks XML-based untuk menjelaskan karakteristik speech yang mau kita generate. Sintaks SSML (Speech Syntesis Markup Language) dapat digunakan untuk mengatur keluaran suara yang kita buat, misalnya:

  1. Menentukan gaya suara tertentu, misalnya seperti “excited” (senang) atau “cheerful” (riang) ketika menggunakan suara netral
  2. Menambahkan pause atau silence
  3. menentukan phonemes (pengucapan phonetic) tertentu, contohnya “SQL” dibaca menjadi “sequel”
  4. menyesuaikan prosody dari suara (pitch, timbre dan speaking rate)
  5. menggunakan ruls “say-as” untuk mendefinisikan string tertentu sebagai tanggal, waktu, nomer telefon dll
  6. Menambahkan rekaman suara atau audio, contohnya untuk menambahkan pesan tertentu atau mensimulasikan sebuah background noise

SSML dapat mengatur dialog antara 2 suara netral contohnya berikut ini:

a. Ariana (Cheerfully): “I say tomato:

b. Bob: ” I say tomato (pronounced tom-ah-toe).. let’s call the whole thing off!”

Untuk mengubah deskripsi SSML ke speech service, kita bisa menggunakan metoda SpeakSsmkAsync() . Contohnya : speechSynthesizer.SpeakSsmlAsync(ssml_string);

Info lebih lanjut tentang SSML bisa dilihat disini:

https://docs.microsoft.com/id-id/azure/cognitive-services/speech-service/speech-synthesis-markup?tabs=csharp

Semoga Bermanfaat!

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *