GAN – Generative Adversarial Nets


Saya baru baca tentang GAN – Generative Adversarial Nets. GAN ini framework yang dikembangkan oleh Ian Goodfellow, Yoshua Bengio dkk. Selama ini teknik Machine learning (ML) digunakan untuk melakukan klasifikasi atau mengenali gambar. Bisa gak teknik ML digunakan untuk membuat gambar baru? Ide ini yang dipikirkan Ian Goodfellow. 

Jadi dia menggabungkan dua neural network untuk membuat sebuah data baru.  Network pertama disebut generator, menggenerate data baru. Caranya adalah kebalikan dari proses klasifikasi data. Jadi diberikan sebuah output, mesin berusaha meng-generate input yang bisa menghasilkan output yang sesuai.

Network yang kedua disebut sebagai discriminator. Discriminator ini adalah sebuah Deep Neural Network yang berfungsi sebagai classifier.  Tugasnya melakukan penilaian terhadap hasil dari generator tadi, misalnya nilainya diberi skala 0-1. 1 diberikan bila gambar yang dihasilkan generator sesuai dengan yang diinginkan. Misalnya kita mau membuat gambar orang. Berarti matanya harus dua, mulutnya satu, telinganya dua, proporsinya seimbang, dsb. 0 diberikan bila gambar yang diberikan generator tidak sesuai dengan yang diinginkan, misalnya matanya satu, mulutnya dua dll. 

Kalo nilai yang dihasilkan discriminator kecil, maka generator akan memperbaiki lagi datanya, untuk kemudian dinilai lagi oleh discriminator. Begitu terus berulang, sampai nilainya tinggi, maksudnya gambarnya yang dihasilkan generator sesuai dengan yang diharapkan. 

Contohnya dari foto2 artis, GAN bisa membuat foto orang yang berbeda/baru. Contohnya bisa dilihat pada video berikut:

Beberapa riset yang menggunakan GAN misalnya oleh NVIDIA, untuk melakukan koreksi pada gambar. Ada juga yang digunakan untuk membuat desain interior secara acak. Selain itu membuat komposisi musik. Ada juga riset yang menggunakan GAN untuk membuat data train untuk self driving car. Contoh lainnya GAN digunakan untuk menggenerate data training medis.

Kelemahan GAN, dia butuh data yang banyak. Selain itu GAN hanya melakukan kombinasi dan tidak bisa menemukan sesuatu yang benar-benar baru. Agak rumit proses optimasi generator dan discriminatornya.

Namun menurut Good fellow ada tantangan juga penyalahgunaan teknik ini untuk kejahatan, membuat deepfake, mengacaukan self-driving car, dll. Paper Ian Godfellow bisa dilihat pada link berikut: https://arxiv.org/pdf/1406.2661.pdf

riset NVIDIA:

interview Ian Goodfellow dengan MIT: https://www.technologyreview.com/s/610253/the-ganfather-the-man-whos-given-machines-the-gift-of-imagination/

reference: 

What is GAN, the AI technique that makes computers creative?


Silahkan tuliskan tanggapan, kritik maupun saran