Collaborative Filtering (CF)
merupakan teknologi yang berkembang dibidang aplikasi e-Commerce. Tujuan
utamanya adalah memberikan rekomendasi kepada user yang akan memilih atau
membeli produk tertentu berdasarkan rating yang diberikan oleh user lainnya. Konsep
sederhananya adalah berupa asumsi bahwa seseorang yang menyukai suatu produk
tertentu, maka produk tersebut juga akan disukai oleh orang lainnya.
Algoritma CF bekerja berdasarkan ketersediaan matrik Item-user Rating dengan ukuran m x n sebagai berikut :
dimana Rmn merupakan
matrik nilai rating user-item yang diberikan oleh user tertentu terhadap suatu
item, m (baris) merepresentasikan
sejumlah user, sedangkan n (kolom)
merepresentasikan sejumlah item tertentu. Dengan demikian, element matrik rmn berarti
nilai rating yang diberikan oleh user ke - m
terhadap item ke n.
Ada dua pendekatan sistem
rekomendasi menggunakan CF :
1. User-based collaborative filtering
Algoritma ini bekerja berdasarkan asumsi bahwa setiap
user merupakan bagian dari kelompok yang memiliki kesamaan dengan user lainnya.
Dasar dari rekomendasi dengan algoritma ini adalah bahwa rekomendasi yang
dihasilkan disusun berdasarkan item-item yang disukai oleh setiap user. Item
yang direkomendasikan merupakan hasil rekomendasi menurut apa yang disukai para
user lainnya. Dengan kata lain, user yang memiliki kesamaan hubungan (atribut)
akan tertarik terhadap item yang sama. Berikut adalah langkah-langkah dari
algoritma user-based collaborative filtering :
a. Tentukan
matrik rating user item.
b. Hitung
nilai similarity antar user terhadap pemilihan item tertentu dengan persamaan :
1)
Cosine-based similarity
Metode ini biasa digunakan untuk menghitung kesamaan
rating yang diberikan satu user dengan user lainnya. Persamaannya adalah
sebagai berikut :
Dimana sim(u,v)
adalah nilai similarity antara user ke u dan
v terhadap item – item yang
dipilihnya, rui adalah
nilai rating user ke – u terhadap
item ke i dan rvi adalah nilai rating user ke v terhadap item ke i.
2)
Correlation-based similarity
Metode ini digunakan untuk mengukur seberapa dekat
hubungan antar dua variabel. Dasar dari metode ini adalah model regresi linier
sehingga hasil perhitungan similarity menyatakan hubungan yang linier diantara
kedua variabel tersebut. Berikut adalah persamaan correlation-based similairity
:
Dimana sim(u,v)
adalah nilai similarity antara user ke u dan
v terhadap item – item yang
dipilihnya, ru dan rv merupakan rata-rata rating user ke – u dan
v. Yang dihitung dengan persamaan sebagai berikut :
Sedangkan rui merupakan rating user ke u terhadap item ke i, dan
rvi merupakan rating user
ke v terhadap item ke i.
c. Hitung
nilai prediksi user tertentu terhadap suatu item dengan persamaan :
Dimana pa,i nilai
prediksi daru user a terhadap item ke
i; Pa,u merupakan nilai similarity antara user a dan u; sedangkan n merupakan jumlah user yang memiliki
jarak terdekat dengan Pa,u.
2. Item-based collaborative filtering
Algoritma ini bekerja untuk mencari hubungan antar
item berdasarkan tabel rating untuk membentuk sebuah rekomendasi terhadap suatu
item kepada user. Untuk menghasilkan rekomendasi, terlebih dahulu diperlukan
sebuah model korelasi antar item dengan tujuan mengetahui hubungan antar item
menurut nilai rating yang diperoleh. Model korelasi dapat dilakukan secara
offline menggunakan berbagai teknik lainnya, misalnya association rule,
klasifikasi atau clustering. Berikut adalah langkah-langkah dari algoritma
user-based collaborative filtering :
a. Tentukan
matrik rating user item.
b. Hitung
nilai similarity antar user terhadap pemilihan item tertentu dengan persamaan :
1)
Adjusted Cosine-based similarity
Metode ini digunakan menghitung similarity dari user
yang memberikan rating berbeda dan sangat mencolok. Misalnya, jika suatu item
diberikan skala rating dari 1 sampai 5, beberapa user mungkin memberikan rating
5 terhadap beberapa item yang mereka sukai dengan pertimbangan "item itu
tidak terlalu buruk", sedangkan beberapa user lain, mungkin akan
memberikan nilai rating 5 hanya bagi item yang "benar-benar mereka
sukai". Untuk mengatasi perbedaan permasalahn skala ini, maka metode
adjusted cosine similiarity ini digunakan. Berikut persamaan untuk metode ini :
Dimana sim(ip,iq)
adalah nilai similarity antara item ip
dan iq dari kolom matrik
rating user, Rk,p
merupakan nilai rating user k terhadap
item p, Rk,q merupakan nilai rating user k terhadap item q, sedangkan Rk adalah rata-rata rating dari user k.
2)
Correlation-based similarity
Metode ini digunakan untuk mengukur seberapa dekat
hubungan antar dua variabel. Dasar dari metode ini adalah model regresi linier
sehingga hasil perhitungan similarity menyatakan hubungan yang linier diantara
kedua variabel tersebut. Berikut adalah persamaan correlation-based similairity
:
Dimana sim(ip,iq)
adalah nilai similarity antara item ip
dan iq dari kolom matrik
rating user, Rk,p adalah
nilai rating item p yang diberikan
oleh user k, Rk,q adalah nilai rating item q yang diberikan oleh user k, Rp dan Rq berturut turut merupakan rata-rata rating item
ke – p dan q. Yang dihitung dengan persamaan sebagai berikut :
Sedangkan Rpi merupakan rating item ke p oleh user ke i, dan Rqi merupakan rating item ke q oleh user ke i.
c. Hitung
nilai prediksi user tertentu terhadap suatu item dengan persamaan Weighted Sum:
Dimana Ra,k
nilai prediksi daru user a terhadap
item ke k; sim(ik, it) merupakan nilai similarity antara
item k dan t; dimana K merupakan nilai
similarity item yang paling dekat dengan item yang sedang dihitung (item k), sedangkan Ra,t adalah nilai rating
user a terhadap item ke t.
0 komentar:
Post a Comment