SSL untuk komputer vision

Tulisan ini merupakan lanjutan bahasan tentang self-supervised learning. Pada tulisan sebelumnya telah dibahas tentang metode non-contrastive energy based SSL. Sekarang akan dibahas metode terbaru SSL untuk komputer vision.

Facebook baru saja mengembangkan metode SEER, metode yang menggunakan milaran parameter ini dapat bekerja pada gambar yang kompleks dengan dimensi tinggi secara efisien. Metode ini adalah pengembangan metode SwAV pada arsitektur convolutional network (ConvNet) dan dapat ditraining pada gambar random tanpa metadata maupun anotasi yang banyak. Convnet cukup besar untuk menangkap dan mempelajari setiap komsep visual dari data yang besar dan kompleks. Setelah melakukan pretraining pada millaran gambar instagram yang tidak memiliki label secara acak, dan dengan fine-tuning secara supervised pada ImageNet,  SEER menghasilkan performa melebihi sistem state-of-the-art self-supervised , dengan akurasi 84.2 persen top-1 pada ImageNet.

Hasil ini menunjukan bahwa SSL dapat digunakan pada komputer vision.

SSL di Facebook

Di Facebook, SSL telah diterapkan pada beberapa domain , selain itu dikembangkan juga riset di bidang SSL. Model pretrained bahasa XLM, telah digunakan Facebook diantaranya untuk deteksi ujaran kebencian. XLM-R, model yang memanfaatkan arsitektur RoBERTa , digunakan juga untuk mendeteksi ujaran kebencian di Facebook dan Instagram. Metode ini dapat mendeteksi ujaran kebencian bahkan pada bahasa yang memiliki training data sedikit.

Demikian rangkuman tulisan Facebook tentang self-supervised learning. Semoga bermanfaat!

referensi:

https://ai.facebook.com/blog/self-supervised-learning-the-dark-matter-of-intelligence/

.

Silahkan tuliskan tanggapan, kritik maupun saran