Kategori: machine learning

  • Hidden Markov Model

    Hari ini saya lagi belajar tentang Hidden markov model (HMM). HMM ini adalah pemodelan sistem statistik dimana ada proses markov dan proses yang tidak dapat diamati (unobserved). Jelasin teorinya agak ribet, tapi ada video bagus berikut ini yang ngejelasin HMM dengan mudah: Contohnya di video itu ada Alice dan Bob, mereka berdua berada di kota…

  • Decision Tree – Overfitting

    Saya lanjutkan bahasan tentang Decision Tree . Salah satu kelemahan Decision Tree (DT) adalah Overfitting. Contoh overfitting misalnya pada kasus ada noise (data salah), kemudian dibentuk pohon yang mengakomodasi data ini. Pohon ini cenderung membesar. Jadi tree ini dikatakan terlalu ditune untuk mengakomodasi data training tertentu. error train (h) adalah error tree pada saat training.…

  • Wolfram – New Kind of Science

    Hari ini saya baru baca buku Stephen Wolfram – New Kind of Science. Wolfram ini ahli fisika, komputer dan matematika. Jadi dia berkesimpulan bahwa perkembangan komputer dan pemrograman ini didukung oleh perkembangan matematika. Namun pada kenyataannya di dunia banyak hal yang terlalu kompleks untuk dijelaskan dengan rumus matematika. Misalnya bentuk pohon, bagaimana kita bisa menjelaskan…

  • Decision Tree-2

    Saya lanjutkan pembahasan tentang Decision Tree (DT). Tahapan yang dilakukan adalah dari dataset yang telah memiliki label dilakukan training yang menghasilkan model classifier. Model ini kemudian digunakan untuk melakukan prediksi terhadap instance yang belum memiliki label. Beberapa pertimbangan kapan menggunakan algoritma DT: Instance dapat dideskripsikan sebagai pasangan atribut dan nilai Fungsi target memiliki nilai diskret…

  • Decision Tree

    Hari ini saya belajar tentang Decision Tree (DT). DT ini bisa dibilang salah satu algoritma klasik pada machine learning. DT ini memiliki masalah overfitting. Yaitu pada saat training performanya bagus, namun pada saat test performanya jelek. Hal ini bisa jadi karena dia kehilangan kemampuan melakukan generalisasi, karena sangat ditune pada training datanya. Secara keseluruhan Machine…

  • Bayes Net

    Bayes Net sering disebut sebagai model-model grafik. Ide utamanya adalah menggunakan asumsi conditional independence. Prinsip ini sudah digunakan juga di Naive Bayes (NB). Manfaatnya adalah membuat perhitungan probabilitas menjadi sederhana. Dengan NB kita hanya perlu 2n+1 parameter. Sementara pake Bayes rules dibutuhkan 2^n. Namun asumsi NB ini cukup ekstrem karena menyamaratakan semua conditional independensi dari…

  • Bayesian Network Learning

    Pada tulisan sebelumnya telah dibahas tentang Bayesian Network Learning. Ada 4 kategori. Kali ini akan dibahas tentang kasus pertama yaitu yang graphnya diketahui dan variabelnya juga fully observed. Contohnya pada kasus berikut: Misalnya Flu dan alergi memiliki kemungkinan menyebabkan penyakit sinus, dan sinus memiliki gejala pusing (headache) dan hidung meler (running nose). Maka probability sinus…

  • Bayesian Network

    Hari ini saya belajar tentang bayesian network (Bayesnet). Bayes net ini adalah model grafis probabilitas yang menampilkan representasi dari variabel dan conditional dependensinya (hubungan) menggunakan Directed acyclic graph (DAG). Bisa juga dikatakan bayes net menampilkan representasi dari joint probability distribution (distribusi probabilitas gabungan) dari sekumpulan variabel random Bayes net ini sering digunakan untuk menampilkan hubungan…

  • Klasifikasi – Contoh implementasi

    Pada tulisan sebelumnya telah dibahas tentang supervised learning dan klasifikasi. Sekarang akan diceritakan beberapa contoh implementasi klasifikasi dengan machine learning. Klasifikasi dokumen dan Filtering email spam Pada klasifikasi dokumen, tujuan pembelajaran adalah untuk melakukan klasifikasi input seperti halaman web atau pesan email menjadi kelas C tertentu p(y = c|x, D), x biasanya adalah input teks tertentu. Contoh kasus…

  • Klasifikasi – Supervised Learning

    Saya lanjutkan catatan dari Buku Murphy tentang machine learning. Kali ini ngebahas tentang Supervised Learning. Supervised Learning adalah teknik machine learning yang paling populer. Dengan Supervised learning kita dapat melakukan klasifikasi. Tujuan klasifikasi adalah untuk mengklasifikasikan input X ke output Y. Kalo output Y cuman ada 2, maka kita sebut metode ini klasifikasi biner. Contohnya…