Mesin Pencari Yang Lebih Canggih Dari Google Bagian 2
lebakcyber.net – Pada pembahasan mengenai mesin pencari yang lebih canggih dari Google bagian 2 ini kita akan coba mempelajari tentang bagaimana cara kerja dari mesin pencari Memex (Memory and Index) tersebut.
Cara Kerja Mesin Pencari Memex
Cara kerja dari mesin pencari Memex lebih kompleks daripada mesin pencari seperti Google, Yahoo dan Bing. Hal tersebut karena semua informasi yang ada diinternet terkait topik atau masalah yang sedang diselidiki nantinya akan disisir oleh mesin pencari tersebut, termasuk informasi dari iklan yang diposting secara online.
Selanjutnya Memex akan mengambil informasi seperti gambar, nomor telepon dan juga lokasi metadatanya untuk selanjutnya dipetakan dan hasil pencariannya akan ditampilkan dalam bentuk infografis.
Hasil pencarian yang diberikan oleh Google, Yahoo ataupun bing sebenarnya hanya baru 4 sampai 5 persennya saja dari total seluruh data yang ada di internet. Masih banyak bagian gelap dari internet tempat dimana banyak kegiatan illegal dilakukan, dan bagian gelap dari internet itu disebut Deep Web.
Apa Sebenarnya Deep Web
Mungkin sebagian dari kalian masih ada yang belum mengetahui apa itu Deep Web. Ada baiknya sebelum kita membahas mengenai deep web, kalian harus tahu terlebih dahulu mengenai surface web.
Surface Web adalah sekumpulan halaman web yang bisa diakses dan dilakukan pencarian menggunakan mesin pencari konvensional seperti Google, Yahoo dan Bing. Halaman tersebut bisa diakses karena terhubung dengan halaman publik lainnya dan secara leluasa bisa diindex dan ditampilkan oleh mesin pencari konvensional.
Mesin pencari seperti Google, Yahoo dan Bing hanya bisa melakukan pencarian pada surface web. Algoritma yang mesin pencari konvensional tersebut gunakan dilakukan dalam skala besar atau yang biasa disebut dengan spiders (laba-laba). Spiders sendiri nantinya akan menjelajahi setiap halaman web baru, melakukan pengarsipan pada lokasinya dan membuat catatan konten dan history kerja dari semua link yang keluar dan masuk halaman web.
Situs-situs seperti Facebook, wikipedia, kaskus, Reddit dan lebakcyber merupakan situs yang dapat diakses oleh publik dan situs-situs tersebut masuk kedalam surface Web. Yang menarik adalah, surface web hanya terdiri dari 4% dari semua konten yang ada di internet. Sisanya tersembunyi didalam deep web.
Konten yang bisa ditemukan didalam deep web sendiri sangat besar, kira-kira 500 kali lebih besar dari konten yang diindeks oleh mesin pencari konvensional seperti Google. Pasti kalian kaget bukan, jika kalian merasa surface web saja sudah besar sekali, apalagi yang ada didalam deep web.
Jaringan Deep Web sendiri adalah jaringan yang berisi situs-situs illegal yang selama ini belum tersentuh dan tidak bisa dijangkau oleh mesin pencari konvensional. Biasanya situs-situs yang ada didalam deep web digunakan untuk kegiatan digital yang bersifat rahasia dan illegal.
Informasi yang ada didalam deep web sendiri jumlahnya lebih besar 400 sampai 500 kali lipat dibandingkan dengan surface web. Deep Web diperkirakan memiliki total kapasitas 7500 TB (TeraByte) informasi, sedangkan jumlah total kapasitas surface web hanya sekitar 19 TB.
Memex Bisa Menjelajahi Deep Web
Mesin pencari Google dan Memex sendiri memiliki perbedaan yang sangat signifikan, jika internet diibaratkan sebuah lautan, maka google adalah kapal yang berlayar dipermukaan laut, sementara Memex diibaratkan sebagai kapal selam yang bisa menjelajah hingga kelaut dalam.
Jaringan deep web merupakan jaringan situs illegal yang selama ini belum tersentuh dan belum bisa dijangkau oleh mesin pencari konvensional. Namun tidak dipungkiri memang ada beberapa cara agar bisa mengakses deep web.
Mesin pencari Memex sendiri memiliki algoritma yang lebih investigatif dalam menemukan hubungan antara data didalam setiap situs yang berbeda bahkan situs-situs yang berada didalam deep web.
Itulah informasi mengenai mesin pencari yang lebih canggih dari Google, semoga informasi mengenai mesin pencari Memex ini bisa menambah pengetahuan kalian mengenai dunia internet.