Sila rujuk bahagian pertama terlebih dahulu.
Anda dah tahu serba sedikit tentang Wayback Machine dari post pertama. Mari kita menyelam lebih jauh ke dalam WM dalam forensik digital dengan langkah seterusnya.
Dalam post yang pertama tentang WM, saya sudah tunjukkan bagaimana WM menyimpan snapshot laman web. Jadi, kita boleh melihat perbezaan laman web setiap tahun/bulan/hari ataupun mencari bukti sebarang salah laku yang berkaitan dengan copywriting pada post / page atau lain-lain perkara yang berkaitan dengan intellectual property.
Menganalisa HTML code menggunakan Wayback Machine
Dalam post ini, saya akan tunjukkan cara bagaimana menganalisa HTML code daripada snapshot WM. Untuk pengetahuan anda, kita boleh memuat turun HTML code daripada snapshot yang dihasilkan oleh WM. Untuk tujuan ini, kita memerlukan RubyInstaller dan RubyGems.
Ruby adalah salah satu cabang bahasa programming. Disebabkan saya menggunakan Windows, maka saya memerlukan RubyInstaller untuk Windows. Untuk tahu lebih lanjut tentang Ruby, sila baca terus di wikipedia.
RubyGems adalah package manager untuk Ruby mengikut format & library tertentu. Ya, saya takkan cerita panjang tentang RubyGems, sila baca lebih lanjut di wikipedia.
Muat turun snapshot Wayback Machine menggunakan RubyInstaller
Langkah Pertama: Install RubyIinstaller (https://rubyinstaller.org/downloads/)
Langkah Kedua: Install WM downloader (https://rubygems.org/gems/wayback_machine_downloader/ )
command: gem install wayback_machine_downloader
Langkah Ketiga: guna command prompt untuk muat turun snapshot
Perhatikan bahawa untuk basic command yang saya gunakan:
- Perlu ada command wayback_machine_downloader
- Perlu ada URL laman web
- Perlu ada tarikh snapshot
- Maklumat tambahan (saya pilih -f)
Oleh itu: wayback_machine_downloader http://joharirahmad.com -f 20160313205223
Tunggu sehingga habis muat turun. By default, semua benda yang dimuat turun ada dalam folder C:\Ruby25-x64\bin\websites\<nama laman web>
Dokumentasi penuh boleh didapati di sini: https://github.com/hartator/wayback-machine-downloader
Berikut adalah hasil daripada command yang saya guna di atas. Lihat hasilnya seperti berikut:
Langkah keempat: Buka index.html menggunakan text editor.
Berdasarkan folder yang dibuat, terdapat file index.html. Untuk menganalisa HTML code pada file index.html itu, buka file tersebut dengan menggunakan text editor / notepad / sublime. Daripada HTML code tersebut, kita dapat melihat penggunaan HTML, javascript dan css pada laman web.
Peringatan
- Snapshot WM hanya menyimpan client side code iaitu HTML, CSS, image dan JS. Oleh itu, snapshot WM TIDAK menyimpan file .php atau .aspx. Sebagai contoh, sila rujuk screenshot yang di buat di atas. Snapshot itu diambil berdasarkan laman web berasaskan wordpress. Tetapi, apabila kita memuat turun snapshot tersebut, tiada file .php daripada wordpress berada di dalam folder tersebut.
- File yang dimuat turun adalah mengikut structure folder laman web. Sebagai contoh, jika gambar disimpan di dalam folder images, maka folder images tersebut akan dibuat mengikut susunan yang sebenar.
Next post: Case Studies bagaimana saya membuat forensic digital menggunakan WM dalam satu kes di internet.