Arthur Samuel – checkers game


Saya lagi baca cerita tentang arthur samuel checkers game. Arthur samuel ini dianggap salah satu pioner artificial intellegence. Dia profesor di MIT. Jadi sekitar tahun 1950 dia bikin program game checker. Checker ini game komputer kayak catur. Jadi dia bikin game yang bisa maen checker sendiri melawan komputer sebanyak ratusan ribu kali. Dari ratusan ribu game itu komputer mempelajari pergerakan dan posisi apa yang bikin menang, dan pergerakan apa yang bikin game itu kalah.

Dengan cara itu komputer bisa ngalahin arthur dalam game checker tersebut. Cara mesin belajar dengan bikin semacam search tree untuk mencari posisi dan pergerakan yang mungkin. Karena pada saat itu memori komputer masih sangat kecil, dia menggunakan teknik yang disebut alpha-beta pruning.

Jadi dia pake sistem skoring. Fungsinya untuk mengukur kemungkinan menang dari posisi di papan saat ini.  Yang dihitung diantaranya jumlah catur tersisa, jumlah raja, dan kemungkinan bidak yang jadi raja. Komputer memilih langkah yang akan dipilih menggunakan strategi minimax. Maksudnya dia akan menghitung nilai optimal dari gerakan yang dapat diambil.

Samuel membuat juga mekanisme seperti  rote learning, dimana komputer mengingat semua posisi yang pernah diambil, serta probabilitas kemenangannya. Program ini terus diperbaiki Samuel sehingga kemudian dapat mengalahkan pemain catur amatir.

Dengan game ini Samuel mengenalkan istilah machine learning. Dia mendifinisikan machine learning sebagai ilmu yang memberikan komputer kemampuan untuk belajar, tanpa harus diprogram secara khusus.

Tom Mitchell profesor komputer di Carnegie Melon kemudian membuat definisi machine learning yang lebih detail. Yaitu sebuah komputer program belajar dari experience E, dari task T dan dengan ukuran performa P, bila performa pada T yang diukur dengan P meningkat dengan eksperience E.

Pada game checker, experience E adalah pengalaman si komputer memainkan ratusan ribu game. Task T adalah task untuk bermain checker dan performan P adalah probabilitas kemenangan game.

Contoh lain misalnya pada program filtering email spam. Email mempelajari bagaimana melakukan klasifikasi email spam yang lebih baik. Jadi klasifikasi email adalah task T, performanya diukur dengan P, dan eksperience E.

Semoga Bermanfaat!

referensi:

https://en.wikipedia.org/wiki/Arthur_Samuel

tentang game checkers:

https://en.wikipedia.org/wiki/Checkers#Computer_draughts


Silahkan tuliskan tanggapan, kritik maupun saran