Key Phrase Extraction


Saya lanjutkan catatan dari training AI102. Hari ini tentang key phrase extraction. Key phrase extraction adalah proses evaluasi teks atau dokumen, kemudian melakukan identifikasi tema utama dari dokumen. Fitur ini bekerja lebih optimal untuk dokumen yang lebih besar, namun ukuran maksimum yang bisa dianalisa adalah 5120 karakter. REST interface dapat menganalisa lebih dari satu dokumen. Respon dari hasil analisis menampilkan frase kunci yang dideteksi pada setiap dokumen.

Fitur berikutnya adalah analisa sentimen. Analisa sentimen digunakan untuk mengevaluasi apakah teks/komentar positif atau negatif. Fitur ini dapat digunakan untuk mengevaluasi sebuah film, buku atau produk berdasarkan sentimen dari review. Selain itu bisa juga untuk mengatur prioritas respon dari customer service terhadap korespondensi melalui email atau pesan sosial media.

Ketika menggunakan language service untuk melakukan evaluasi sentimen, respon dari sistem adalah sentimen dokumen secara umum (overall docuent sentiment) dan sentimen kalimat (sentence sentiment) individu untuk setiap dokumen yang dianalisa.

Sentence sentiment dihitung berdasarkan confidence score untuk positif, negatif dan netral dengan nilai antara 0-1. Overall document sentiment didasarkan pada kalimat2. Bila semua kalimat adalah netral maka sentimen keseluruhan adalah netral. Bila klasifikasi kalimat ada positif dan netral, maka sentimen keseluruhan adalah positif. Bila klasifikasi kalimat ada negatif dan netral, maka sentimen keseluruhan adalah negatif. Bila kalimat memiliki klasifikasi positif dan negatif, maka sentimen keseluruhan adalah gabungan.

Berikutnya ada fitur named entity recognition. Fitur ini akan mengenali entity pada text. Entity yang dikenali diantaranya, person, location, DateTime, Organization, address, email dan URL. Daftar lengkap entitas yang dapat dikenali bisa dilihat pada tautan berikut:

https://docs.microsoft.com/id-id/azure/cognitive-services/language-service/named-entity-recognition/concepts/named-entity-categories

Kemudian ada fitur entity linking. fitur ini berguna pada kasus terdapat sebuah nama yang bisa digunakan pada lebih dari satu entity. Contohnya venus apakah maksudnya planet atau dewa yunani? Fitur entity linking ini dapat digunakan utnuk mengatasi masalah ini dengan member sebuah referensi artikel Wikipedia ke dalam knowledg base.

Contohnya kalimat” saya melihat venus berkilau di langit” akan diasosiasikan dengan link wiki https://en.wikipedia.org/wiki/Venus . Sementara itu kalimat “venus dewa kecantikan akan diasosiasikan dengan halaman wiki berikut: https://en.wikipedia.org/wiki/Venus_(mythology) .

Sampai disini dulu semoga bermanfaat!


Silahkan tuliskan tanggapan, kritik maupun saran