Dataset Malware


Kemaren pas sharing tentang penelitian malware di acara RKB Pak Budi, ada yang nanya tentang gimana caranya dapetin dataset malware. Berikut ini saya kumpulkan beberapa dataset malware yang bagus:

  1. Sorel20M: dari sophos dan reversing labs, ada 20 juta sampel malware, punya fitur detection metadata, label dan binary
  2. Ember: 1,1 juta PE malware
  3. BODMAS: dari UIUC & blue hoxagon ada 57.293 malware dan 77.142 dalam 581 family.
  4. Malimg: PE malware dari Nataraj ada 9ribuan malware dibagi dalam 25 family
  5. API-Call dataset: dari Ferhat Ozgur Catak, dataset api call malware windows diekstrak dari cuckoo sandbox
  6. Virusshare: ada sekitar 37 juta sampel, musti register dulu kirim email ke [email protected]
  7. Kaggle-Android : dari Shashwat Tiwari, dari 15.036 aplikasi android, (5.560 malware dari Drebin project dan 9.476 benign)
  8. PE Malware-Image: dari angelo oliveira, image greyscale 32 x 32, malware dari virusshare.com. benign dari portableapps.com dan Windows 7 x86 directory.
  9. MalwareZoo: dari ytisf
  10. Contagio : koleksi Mila
  11. Inquest: punya beragam fitur seperti Deep file inspection (DFI), Aggregate reputation database, Indicators of compromise (IOC), Base64 regular expression generator, Mixed hex case generator, UInt() trigger generator dll
  12. Malware Bazar: menyediakan informasi dan statistik malware
  13. Hybrid Analysis: ada fitur analisa malware, berbayar
  14. URLhaus: lebih ke malicious url
  15. VirusBay: platform kolaborasi
  16. OpenAVN: berbayar
  17. bisa dicari juga di https://datasetsearch.research.google.com/ dan https://www.kaggle.com/datasets
  18. Bisa juga ngumpulin sendiri pake Honeypot

Ada yang mau nambahin?

Semoga Bermanfaat!

referensi:

https://resources.infosecinstitute.com/topic/top-7-malware-sample-databases-and-datasets-for-research-and-training/


Silahkan tuliskan tanggapan, kritik maupun saran