Wayback Machine

Akhirnya saya coba nulis blog lagi. Setelah blog sebelumnya dihapus sama mas admin tanpa pemberitahuan (maaf ya curcol dikit 🙂 maklum korban gagal move on).  Padahal banyak materi pengajaran yang saya simpen disana, dan beberapa tulisan yang menarik tentang security, malware dll.  Yah salah sendiri juga sih gak pernah back up materi2 itu . Ok, Let’s move on.

Dalam rangka mencari beberapa tulisan lama saya, saya ketemu dengan beberapa project menarik di internet yang menyimpan (archive) web di internet. Contohnya wayback machine . Project ini melakukan crawling secara automatis ke beberapa website, kemudian disimpan di dalam database. Bisa dibilang web ini seperti petugas perpustakaan yang setiap hari melakukan kliping koran, dan menyimpan kliping tersebut dalam sebuah database.  Jadi di web ini kita bisa mencari halaman web lama yang sudah tidak ada di database google. waybackmashine

Saya mencoba memasukkan alamat blog sebelumnya blog.politekniktelkom.ac.id/jul di wayback machine. Dan ternyata blog ini sempat disimpan 5 kali oleh project  ini. Disini akan ditampilkan tanggal berapa wayback machine melakukan penyimpanan terhadap blog saya. Saya coba pilih hasil crawling terbaru yaitu Desember 2012, dan web ini menampilkan isi dari blog saya pada tanggal tersebut.Screenshot

Sayangnya tulisan yang saya cari dibuat tahun 2013, dan belum ada di database mereka. Menurut saya cukup menarik  ide dari pembuat proyek ini untuk menyimpan website, sehingga dapat bermanfaat untuk kasus seperti saya, atau untuk mereka yang melakukan riset.  Kira-kira berapa besar yah harddisk yang mereka butuhkan? terus bagaimana caranya mereka memilih web mana yang akan disimpan?

Silahkan tuliskan tanggapan, kritik maupun saran