Pembelajaran Mesin Probabilistik


Saya lagi baca buku Machine Learning: A Probabilistic Perspective karya Kevin Murphy. Buku ini menjelaskan tentang Pembelajaran Mesin dengan pendekatan Probabilistik. Jadi sekarang ini kan era Big Data. Konon katanya Saking banyaknya data ini, kita gak akan kerepotan untuk melakukan analisa data tersebut secara manual. Sehingga dikembangkan lah machine learning.

Machine learning bisa dibilang sebagai metode untuk dapat mengenali pola pada data, kemudian menggunakan pola ini untuk memprediksi data berikutnya, atau menggunakan pola ini untuk pengambilan keputusan. Muprhy menggunakan pendekatan teori probabilitas untuk membuat pembelajaran mesin. Teori probabilitas biasanya digunakan untuk berbagai permasalahan yang memiliki ketidakpastian. Dalam mesin learning, contoh ketidakpastian misalnya bagaimana membuat prediksi data berikutnya dari data yang sudah ada? Model apa yang terbaik untuk menjelaskan sekumpulan data? Pengukuran apa yang harus dilakukan berikutnya dll.

Mesin learning biasanya dibagi 2 tipe, prediktif (supervised learning) dan deskriptif (unsupervised learning). Pada supervised learning, tujuannya adalah untuk mempelajari hubungan antara input x ke output y, dari serangkaian pasangan data D yang memiliki label. Data D sering disebut juga data training yang didapat dari sejumlah N training.

Contohnya kita memiliki data tinggi dan berat orang dalam bentuk vektor D. Data ini memiliki fitur, atribut atau covarian. Data input dapat juga berbentuk gambar, kalimat, pesan email, sebuah data time series, graph dll.

Output dari sistem (response variable) juga bisa bermacam bentuk, diantaranya dalam bentuk kategori atau numerik. Contoh data kategori, misalnya laki dan perempuan. Contoh data numerik misalnya nilai tertentu, seperti tingkat penghasilan.

Pada output berbentuk kategori, tugas mesin adalah klasifikasi atau pengenalan pola. Bila data output adalah numerik, maka tugas mesin disebut regression. Variasi lainnya adalah ordinal regression, yaitu ketika output memiliki urutan tertentu, misalnya nilai ujian A, B, C sampai F.

Tipe kedua mesin learning adalah deskriptif atau unsupervised learning. Disini kita hanya diberi input D, dan mesin diminta menemukan pola yang menarik dari data. Teknik ini disebut juga knowledge discovery. Disini tidak ditentukan terlebih dulu, pola seperti apa yang dicari. Sehingga berbeda dengan supervised learning tidak ada ukuran eror yang kita bisa gunakan untuk membandingkan hasil prediksi dari Y dari data X yang ada.

Selain itu ada tipe ketiga dari machine learning, yaitu reinforcement learning (RL). Pada RL mesin belajar untuk mengambil keputusan berdasarkan sinyal reward dan punishment.

Sampai disini dulu catatan tentang buku ini , insyaallah nanti saya lanjutkan pada tulisan berikutnya. Semoga Bermanfaat!

Referensi:

Murphy, K. P. (2012). Machine learning: a probabilistic perspective. MIT press.


Silahkan tuliskan tanggapan, kritik maupun saran