Malware classification one dimensional CNN

Saya lagi baca paper Efficient malware classification by binary sequences with one dimensional convolutional neural network karya Wei-cheng lin dan yi-ren yeh dari jurnal mathmatics mdpi. Menurut dia mengkonversi malware ke gambar grayscale merusak struktur kode binary yang 1 dimensi. Karena lebar gambar yang udah fix akan memotong urutan kode biner. Jadi mereka mengusulkan metode 1 dimensi CNN untuk klasifikasi malware. Mereka pake 2 dataset benchmark. Performanya lebih baik dibandingkan klasifikasi dengan 2 dimensi. Mereka menggunakan komputasi yang lebih kecil karena pake sequence bit/byte level yang lebih kecil.

Mereka mencoba beberapa urutan. Yang pertama adalah urutan byte. setiap urutan 8 bit di encode menjadi byte. Namun urutan byte akan menjadi panjang. Selain itu ukuran sampel yang berbeda menyulitkan implementasi di CNN. Mereka menggunakan juga resizing atau konpresi untuk menetapkan panhang urutan byte. Setiap sampel di resize menjadi 1×1024, 1×2304, 1×4906 dan 1×16.384. Setelah preprocessing kemudian diklasifikasi dengan CNN 1 dimensi.

Pada model yang diusulkan ada 5/6 blok konvolusi. Sebagian besar blok komvolusi memiliki layer konvolusi 1×3 dengan fungsi aktivasi Leaky RelU. Digunakan juga layer max-pooling setelah blok konvolusi. Kemudian ditambahkan layer konvolusi 1×8 dengan 8 striding dan zero-padding untuk mengubah ukuran input jadi 1 x 1 x 16.384. Layer konvolusi 1 x 8 akan mengurangi ukuran input dari 1 x 1 x 16.384 menjadi 1 x 1 x 2048.Setelah blok konvolusi terakhir tidak ditambahkan layer max-pooling.

Kemudian dicoba juga input sequence bit. Dilakukan resize juga untuk mendapatkan panjang yang tetap. Proses resizing ini sama seperti kompresi data. Dataset yang digunakan adalah Microsoft malware classification challenge dan Malimg. Data dibagi menjadi 80% training, 10% validasi dan 10% testing.

Hasil pengujian pada dataset microsoft diperoleh akurasi 95,49 % untuk sequence 1 x 1024 dan 96,32 untuk sequence 1×2304. Sementara pada dataset malimg diperoleh akurasi 98,47%

Semoga Bermanfaat!

Papernya bisa dilihat disini:

https://www.mdpi.com/2227-7390/10/4/608

Silahkan tuliskan tanggapan, kritik maupun saran

%d blogger menyukai ini: