Apa itu Page Rank?
PageRank adalah sebuah
algoritma yang telah
dipatenkan yang
berfungsi menentukan
situs web mana yang
lebih penting/populer.
PageRank merupakan
salah satu fitur utama
mesin pencari Google
dan diciptakan oleh
pendirinya, Larry Page
dan Sergey Brin yang
merupakan mahasiswa
Ph.D. Universitas
Stanford.
Trus bagaimana cara
kerja Page Rank?
Sebuah situs akan
semakin populer jika
semakin banyak situs lain
yang meletakan link
yang mengarah ke
situsnya, dengan asumsi
isi/content situs tersebut
lebih berguna dari isi/
content situs lain.
PageRank dihitung
dengan skala 1-10.
Contoh: Sebuah situs
yang mempunyai
Pagerank 9 akan di
urutkan lebih dahulu
dalam list pencarian
Google daripada situs
yang mempunyai
Pagerank 8 dan
kemudian seterusnya
yang lebih kecil.
Banyak cara digunakan
search engine dalam
menentukan kualitas/
rangking sebuah
halaman web, mulai dari
penggunan META Tags,
isi dokumen, penekanan
pada content dan masih
banyak teknik lain atau
gabungan teknik yang
mungkin digunakan. Link
popularity, sebuah
teknologi yang
dikembangkan untuk
memperbaiki
kekurangan dari
teknologi lain (Meta
Keywords, Meta
Description) yang bisa
dicurangi dengan
halaman yang khusus di
desain untuk search
engine atau biasa
disebut doorway pages.
Dengan algoritma
‘ PageRank’ ini, dalam
setiap halaman akan
diperhitungkan inbound
link (link masuk) dan
outbound link (link
keuar) dari setiap
halaman web.
PageRank, memiliki
konsep dasar yang sama
dengan link popularity,
tetapi tidak hanya
memperhitungkan
“ jumlah” inbound dan
outbound link.
Pendekatan yang
digunakan adalah sebuah
halaman akan diangap
penting jika halaman lain
memiliki link ke halaman
tersebut. Sebuah
halaman juga akan
menjadi semakin penting
jika halaman lain yang
memiliki rangking
(pagerank) tinggi
mengacu ke halaman
tersebut.
Dengan pendekatan yang
digunakan PageRank,
proses terjadi secara
rekursif dimana sebuah
rangking akan
ditentukan oleh rangking
dari halaman web yang
rangkingnya ditentukan
oleh rangking halaman
web lain yang memiliki
link ke halaman
tersebut. Proses ini
berarti suatu proses yang
berulang (rekursif). Di
dunia maya, ada jutaan
bahkan milyaran
halaman web. Oleh
karena itu sebuah
rangking halaman web
ditentukan dari struktur
link dari keseluruhan
halaman web yang ada di
dunia maya. Sebuah
proses yang sangat besar
dan komplek.
Mau tahu algoritma page
rank?
Dari pendekatan yang
sudah dijelaskan pada
artikel konsep pagerank,
Lawrence Page and
Sergey Brin membuat
algoritma pagerank
seperti di bawah :
Algoritma awal PR(A) =
(1-d) + d ( ( PR(T1) / C
(T1) ) + … + ( PR(Tn) / C
(Tn) ) )
Salah satu alogtima lain
yang dipublikasikan PR
(A) = (1-d) / N + d ( ( PR
(T1) / C(T1) ) + … + ( PR
(Tn) / C(Tn) ) )
* PR(A) adalah Pagerank
halaman A
* PR(T1) adalah Pagerank
halaman T1 yang
mengacu ke halaman A
* C(T1) adalah jumlah
link keluar (outbound
link) pada halaman T1
* d adalah damping
factor yang bisa diberi
antara 0 dan 1.
* N adalah jumlah
keseluruhan halaman
web (yang terindex oleh
google)
Random surfer model
merupakan pendekatan
yang menggambarkan
bagaimana sesungguhnya
yang dilakukan seorang
pengunjung di depan
sebuah halaman web. Ini
berarti peluang atau
probabilitas seorang user
mengklik sebuah link
sebanding dengan jumlah
link yang ada pada
halaman tersebut.
Pendekatan ini yang
digunakan pagerank
sehingga pagerank dari
link masuk (inbound link)
tidak langsung
didistribusikan ke
halaman yang dituju,
melainkan dibagi dengan
jumlah link keluar
(outbound link) yang ada
pada halaman tersebut.
Rasanya semua juga
menganggap ini adil.
Karena bisa anda
bayangkan apa jadinya
jika sebuah halaman
dengan rangking tinggi
mengacu ke banyak
halaman, mungkin
teknologi pagerank tidak
akan relevan digunakan.
Metode ini juga memiliki
pendekatan bahwa
seorang user tidak akan
mengklik semua link
yang ada pada sebuah
halaman web. Oleh
karena itu pagerank
menggunakan damping
factor untuk mereduksi
nilai pagerank yang
didistribusikan sebuah
halaman ke halaman
lain. Probabilitas seorang
user terus mengkilk
semua link yang ada
pada sebuah halaman
ditentukan oleh nilai
damping factor (d) yang
bernilai antara 0 sampai
1. Nilai damping factor
yang tinggi berarti
seorang user akan lebih
banyak mengklik sebuah
halaman sampai dia
berpindah ke halaman
lain. Setelah user
berpindah halaman maka
probabilitas
diimplemntasikan ke
dalam algoritma
pagerank sebagai
konstanta (1-d) . Dengan
mengeluarkan variable
inbound link (link
masuk), maka
kemungkinan seorang
user untuk berpindah ke
halaman lain adalah (1-
d), hal ini akan membuat
pagerank selalu berada
pada nilai minimum.
Dalam algoritma
pagerank yang lain,
terdapat nilai N yang
merupkan jumlah
keseluruhan halaman
web, jadi seorang user
memiliki probabilitas
mengunjungi sebuah
halaman dibagi dengan
total jumlah halaman
yang ada. Sebaagai
contoh, jika sebuah
halaman memiliki
pagerank 2 dan total
halaman web 100 maka
dalam seratus kali
kunjungan dia
mengunjungi halaman itu
sebanyak 2 kali (catatan,
ini adalah probabilitas).
0 comments:
Post a Comment