Sistem Rekomendasi dengan Collaborative Filtering (CF)

Posted by Pengen Online Aja Sih on 5:21 PM

Collaborative Filtering (CF) merupakan teknologi yang berkembang dibidang aplikasi e-Commerce. Tujuan utamanya adalah memberikan rekomendasi kepada user yang akan memilih atau membeli produk tertentu berdasarkan rating yang diberikan oleh user lainnya. Konsep sederhananya adalah berupa asumsi bahwa seseorang yang menyukai suatu produk tertentu, maka produk tersebut juga akan disukai oleh orang lainnya.

Algoritma CF bekerja berdasarkan ketersediaan matrik Item-user Rating dengan ukuran m x n sebagai berikut :


dimana Rmn merupakan matrik nilai rating user-item yang diberikan oleh user tertentu terhadap suatu item, m (baris) merepresentasikan sejumlah user, sedangkan n (kolom) merepresentasikan sejumlah item tertentu. Dengan demikian, element matrik rmn berarti nilai rating yang diberikan oleh user ke - m terhadap item ke n.
Ada dua pendekatan sistem rekomendasi menggunakan CF :
1.       User-based collaborative filtering
Algoritma ini bekerja berdasarkan asumsi bahwa setiap user merupakan bagian dari kelompok yang memiliki kesamaan dengan user lainnya. Dasar dari rekomendasi dengan algoritma ini adalah bahwa rekomendasi yang dihasilkan disusun berdasarkan item-item yang disukai oleh setiap user. Item yang direkomendasikan merupakan hasil rekomendasi menurut apa yang disukai para user lainnya. Dengan kata lain, user yang memiliki kesamaan hubungan (atribut) akan tertarik terhadap item yang sama. Berikut adalah langkah-langkah dari algoritma user-based collaborative filtering :
a.       Tentukan matrik rating user item.
b.      Hitung nilai similarity antar user terhadap pemilihan item tertentu dengan persamaan :
1)      Cosine-based similarity
Metode ini biasa digunakan untuk menghitung kesamaan rating yang diberikan satu user dengan user lainnya. Persamaannya adalah sebagai berikut :


Dimana sim(u,v) adalah nilai similarity antara user ke u dan v terhadap item – item yang dipilihnya, rui adalah nilai rating user ke – u terhadap item ke i dan rvi adalah nilai rating user ke v terhadap item ke i.
2)      Correlation-based similarity
Metode ini digunakan untuk mengukur seberapa dekat hubungan antar dua variabel. Dasar dari metode ini adalah model regresi linier sehingga hasil perhitungan similarity menyatakan hubungan yang linier diantara kedua variabel tersebut. Berikut adalah persamaan correlation-based similairity :


Dimana sim(u,v) adalah nilai similarity antara user ke u dan v terhadap item – item yang dipilihnya, ru dan rv  merupakan rata-rata rating user ke – u dan v. Yang dihitung dengan persamaan sebagai berikut :


Sedangkan rui merupakan rating user ke u terhadap item ke i, dan rvi merupakan rating user ke v terhadap item ke i.

c.       Hitung nilai prediksi user tertentu terhadap suatu item dengan persamaan :

     
Dimana pa,i nilai prediksi daru user a terhadap item ke i; Pa,u merupakan nilai similarity antara user a dan u;  sedangkan n merupakan jumlah user yang memiliki jarak terdekat dengan Pa,u.

2.       Item-based collaborative filtering
Algoritma ini bekerja untuk mencari hubungan antar item berdasarkan tabel rating untuk membentuk sebuah rekomendasi terhadap suatu item kepada user. Untuk menghasilkan rekomendasi, terlebih dahulu diperlukan sebuah model korelasi antar item dengan tujuan mengetahui hubungan antar item menurut nilai rating yang diperoleh. Model korelasi dapat dilakukan secara offline menggunakan berbagai teknik lainnya, misalnya association rule, klasifikasi atau clustering. Berikut adalah langkah-langkah dari algoritma user-based collaborative filtering :
a.       Tentukan matrik rating user item.
b.      Hitung nilai similarity antar user terhadap pemilihan item tertentu dengan persamaan :
1)      Adjusted Cosine-based similarity
Metode ini digunakan menghitung similarity dari user yang memberikan rating berbeda dan sangat mencolok. Misalnya, jika suatu item diberikan skala rating dari 1 sampai 5, beberapa user mungkin memberikan rating 5 terhadap beberapa item yang mereka sukai dengan pertimbangan "item itu tidak terlalu buruk", sedangkan beberapa user lain, mungkin akan memberikan nilai rating 5 hanya bagi item yang "benar-benar mereka sukai". Untuk mengatasi perbedaan permasalahn skala ini, maka metode adjusted cosine similiarity ini digunakan. Berikut persamaan untuk metode ini :


Dimana sim(ip,iq) adalah nilai similarity antara item ip dan iq dari kolom matrik rating user, Rk,p merupakan nilai rating user k terhadap item p, Rk,q merupakan nilai rating user k terhadap item q, sedangkan Rk  adalah rata-rata rating dari user k.
2)      Correlation-based similarity
Metode ini digunakan untuk mengukur seberapa dekat hubungan antar dua variabel. Dasar dari metode ini adalah model regresi linier sehingga hasil perhitungan similarity menyatakan hubungan yang linier diantara kedua variabel tersebut. Berikut adalah persamaan correlation-based similairity :


Dimana sim(ip,iq) adalah nilai similarity antara item ip dan iq dari kolom matrik rating user, Rk,p adalah nilai rating item p yang diberikan oleh user k, Rk,q adalah nilai rating item q yang diberikan oleh user k,  Rp  dan Rq berturut turut merupakan rata-rata rating item ke – p dan q. Yang dihitung dengan persamaan sebagai berikut :


Sedangkan Rpi merupakan rating item ke p oleh user ke i, dan Rqi merupakan rating item ke q oleh user ke i.

c.       Hitung nilai prediksi user tertentu terhadap suatu item dengan persamaan Weighted Sum:

     
Dimana Ra,k nilai prediksi daru user a terhadap item ke k; sim(ik, it) merupakan nilai similarity antara item k dan t;  dimana K merupakan nilai similarity item yang paling dekat dengan item yang sedang dihitung (item k), sedangkan Ra,t adalah nilai rating user a terhadap item ke t.


Nama Anda
New Johny WussUpdated: 5:21 PM

0 komentar:

Post a Comment

CB