《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 協同過濾推薦研究綜述
協同過濾推薦研究綜述
來源:微型機與應用2013年第6期
張 瑤, 陳維斌, 傅順開
(華僑大學 計算機科學與技術學院, 福建 廈門 361000)
摘要: 推薦技術是目前在很多領域中廣泛使用的技術之一。而協同過濾推薦算法是應用在推薦技術中很成功的算法。主要介紹了協同過濾推薦技術,總結了當前推薦算法的傳統方法、改進算法以及性能評測方法。同時,分析了協同過濾推薦算法中的問題以及相應的解決辦法。最后闡述了協同過濾推薦系統中仍需解決的問題和未來可能的發展方向。
Abstract:
Key words :

摘  要:推薦技術是目前在很多領域中廣泛使用的技術之一。而協同過濾推薦算法是應用在推薦技術中很成功的算法。主要介紹了協同過濾推薦技術,總結了當前推薦算法的傳統方法、改進算法以及性能評測方法。同時,分析了協同過濾推薦算法中的問題以及相應的解決辦法。最后闡述了協同過濾推薦系統中仍需解決的問題和未來可能的發展方向。            
關鍵詞:推薦系統; 協同過濾推薦算法; 稀疏性冷啟動;性能評測

    每天,人們都要面對很多的選擇,通常會以周圍人的意見作出選擇。然而,面對海量的網絡資源時,要從中作出最適合的選擇就變得非常困難。電子商務系統作為目前典型的成功互聯網應用,提供了更豐富的物品。為幫助大家更快速準確地定位自己的需求,推薦系統在電子商務系統中應運而生,例如知名的亞馬遜等平臺[1]。
    目前,應用于推薦系統的算法主要分三類:基于內容的過濾推薦算法、協同過濾推薦算法及混合推薦算法。
    基于內容的過濾推薦算法[2]是對用戶的興趣進行分析,構成用戶配置文件,并將其和文件集中的文件用共同的特征變量表示。最后比較兩者的相似度來為用戶進行推薦。隨后,通過用戶的反饋信息,不斷更新用戶配置文件,以此來動態地為用戶推薦感興趣的信息[3]。
    協同過濾推薦算法是通過用戶對項目的評分數據,找到與目標用戶或項目相似的對象作為候選推薦。當前主要的協同過濾推薦算法有兩種:基于用戶(user-based)和基于項目(item-based)的協同過濾推薦算法。基于用戶的協同過濾推薦算法認為,如果用戶對一些項目的評分比較相似, 那么他們對其他項目的評分也比較相似;基于項目的協同過濾推薦算法認為,項目間的評分具有相似性,可以通過用戶對目標項目的若干相似項目的評分來估計該項目的分值[4-5]。
    混合推薦算法[6]是將基于內容的過濾和協同過濾相結合的方法,既保留了用戶配置文件來代表用戶的興趣,同時又根據該配置文件來尋找相似的用戶,兩種方法互補完成推薦。
    本文主要介紹協同過濾推薦算法,因為目前它的應用最為普遍。
1 協同過濾推薦技術
    協同過濾推薦技術之所以得到廣泛的應用,主要得益于它獨立于被推薦對象的內容,只依靠用戶對項目的評分或是喜好就可以為用戶推薦。同時,還可以幫助用戶發掘潛在的興趣。這些優點使得它幾乎適用于所有領域。
1.1 當前的協同過濾推薦算法
   當前最常用的協同過濾推薦算法是基于用戶和基于項目的算法。基于用戶的協同過濾技術[7]首先獲取用戶對于項目的評分,然后通過用戶間的相似性尋找目標用戶的最近鄰居,最后利用預測函數和鄰居用戶的評分來完成推薦;基于項目的協同過濾技術[5,8]則根據項目間相似性得到目標項目的相似項目集合,然后通過預測函數和相似項目集合來產生推薦列表。
    下文將詳細地介紹和討論以上兩種算法及其一些改進算法。
1.2 基于用戶的協同過濾推薦算法
    基于用戶的協同過濾算法是早期較傳統的一種自動協同過濾技術。它主要依靠系統中的用戶評分矩陣來計算用戶間的相似性,再根據相似性來計算目標用戶對于項目的預測評分。
    定義 用戶評分矩陣
    一個m×n的矩陣。m和n分別代表矩陣中的用戶數和項目數。矩陣中的元素代表用戶對項目的評分或偏好。
1.2.1 相似性計算方法
    協同過濾推薦算法本質上是基于近鄰的搜索算法,其核心是計算用戶/項目間的相似性。常用的相似性度量方法主要有三種[5,8]:余弦相似性度量方法、皮爾森相關相似度量方法、修正的余弦相似性度量方法。
    余弦相似性度量方法:該方法把用戶對項目的評分看作是一個n維向量,則用戶間的相似性就由兩個用戶向量間的余弦夾角來決定。
    修正的余弦相似性度量方法:該方法是對余弦相似性度量方法的改進算法。它通過減去用戶對于項目的平均分來彌補不同用戶對項目的評分尺度不同的問題。
    
1.2.2 評分預測
    預測評分可由相似度作為權重,通過計算鄰居用戶對未評分項目的加權平均值來得出。
    該方法的不足之處在于:(1)如果用戶評分的項目較少,推薦效果會比較差。對于一個新加入系統的用戶,這個方法完全無法“工作”。(2)為了反應用戶最新狀態,需要在線計算詳盡用戶,這可能導致在線響應速度低下。
1.3 基于項目的協同過濾推薦算法
    基于項目的協同過濾算法[5]依賴的是項目間的相似性,這對更新的實時性要求較低,因此也是目前應用較多的一種算法。該算法與基于用戶的協同過濾算法在過程上類似,只是在相似度上稍有不同。
    在相似性度量方法上,1.2.1中提到的方法仍適用,只是此時計算相似度的對象不同。除此之外,針對項目間相似性的度量,還可使用條件概率度量方法[9]。之所以可以用它來計算相似度是因為,如果選擇一個項目的用戶中也有很多用戶選擇另一個項目,則兩個項目相似。
1.4 協同過濾推薦改進算法
1.4.1 基于項目評分預測的協同過濾推薦算法

 參考文獻[8]提出了一種對未評分項目預測評分的改進算法。該算法先找出用戶i和j分別評分的項目集合的并集Iij,然后計算用戶i和j對于Iij中各自未評分項目的評分,最后利用基于用戶的協同過濾算法來計算用戶i和j的相似度,并產生相應的推薦列表。
    該算法在一定程度上解決了稀疏性的問題,使得兩個用戶共同評分的項目有所增加,同時在計算兩個用戶的相似性時,也不會出現用戶未評分項目為0的狀況,提高了推薦精度。但是,由于采用的是傳統的相似度量方法,算法的冷啟動問題仍未得到根本的解決。
1.4.2 基于項目聚類的協同過濾推薦算法
    參考文獻[4]是將項目以K均值方法進行聚類,然后計算目標項目與聚類中心的相似性,并選擇相似度大于e的聚類來作為搜索鄰居的項目空間,最終完成推薦。
    該算法選擇若干個聚類來搜索項目的鄰居,可以減少搜索空間,提高搜索效率,但相似性閾值e的選取需進行權衡。用戶需要不斷調整e來進行聚類數量的控制,以此來調整精度。
1.4.3 基于項目類別相似性的協同過濾推薦算法[10]
    參考文獻[10]同時考慮評分和類別相似性,并將類別表達成一顆類別樹(如圖1所示)來計算類別相似性,然后通過權重系數α將兩者進行加權組合,得出綜合相似性。

    該算法計算的是綜合相似性,從而在一定程度上提高了推薦精度,緩解了稀疏性問題。但它也有一定的缺點:(1)類別標示一般需要人工標注,工作量太大,并會造成一定的主觀偏見;(2)權重系數的選取一般只能靠經驗來定。
1.4.4 其他的改進算法
    隨著研究的深入,更多的改進推薦算法被提出。如參考文獻[11]是在1.4.1中所提到算法的基礎上,通過引入類別相似性來改進;參考文獻[12]是綜合評分相似度和類別相似度,并引入閾值來調整評分相似性和最近鄰的選取;參考文獻[13]也利用“組合”的思想,但不再是相似度組合,而是將用戶加權評分和項目加權評分進行組合來達到與1.4.1中算法一樣的目的。這些算法都改進了精度,緩解了稀疏性、冷啟動等問題。
2 系統性能的評測
    對推薦系統來說,系統的性能直接影響用戶對系統的使用程度。因為推薦出來的項目不符合用戶的興趣,用戶對系統的信任度就會下降。常用的精度測評方法有平均絕對誤差MAE、規范化的平均絕對誤差NMAE方法和召回率—精度等方法。以前大家關注較多的是精度問題,現在評測一個系統的性能,除了精度之外,新穎性、多樣性、覆蓋率等更多指標越來越受重視[14]。
    多樣性可以分為系統用戶間多樣性和用戶內多樣性[15]。前者反映了系統為不同用戶推薦不同項目的能力,可以通過計算用戶對之間的漢明距離,然后取均值來得出;后者反映了系統為一個用戶推薦不同種類項目的能力,可以通過計算某一用戶推薦列表中的項目間相似度的差距,最后取均值來得出。
    新穎度指系統可以為用戶推薦的非流行項目的能力。較常使用的是計算一個用戶推薦列表中商品的平均度[16],商品的平均度越低證明商品的新穎度越高。
    覆蓋率可以體現出系統為用戶推薦的項范圍的大小,若覆蓋率太低,推薦范圍太窄,用戶滿意度就可能會下降。較常用的為推薦覆蓋率[14],用來計算推薦項占全部項的比例。
3 推薦系統面臨的問題
3.1 稀疏性問題

 推薦系統中,由于用戶瀏覽的項目有限,導致用戶評分矩陣非常稀疏,從而使得推薦精度不高。參考文獻[4,8,11]的出發點都是希望緩和矩陣稀疏性問題。因為如果兩個用戶沒有共同評分的項目,那將無法計算他們的相似度。同樣的,如果兩個項目共同評分的用戶交集為空,則項目之間的相似度也無法得出。目前解決稀疏性問題效果較好的是奇異值分解(SVD)的技術[17]。在推薦時,可以先使用SVD方法計算出項目評分,然后再計算相似度最終得出預測。SVD的方法在評分預測上不依賴相似度方法進行計算,并且通過維數化簡來得到密集的矩陣。雖然解決了數據稀疏性問題,但是在化簡過程中丟失掉了一些數據信息,精度也會受到一定的影響。
3.2 冷啟動問題
 冷啟動問題[7,17]分為新項目和新用戶問題。參考文獻[10-13]的出發點就是為了解決冷啟動問題。因為當一個系統增加一個新的項目并且該項目沒有任何用戶對其進行評分時,這個項目就無法被推薦出去,新項目問題就產生了。新用戶問題的產生是由于系統的用戶增多,當用戶沒有對系統中的項目進行評價時,系統無法分析出用戶的偏好,也就無法產生推薦。
    目前對于冷啟動問題的解決有兩種方法:眾數法和信息熵法。
    一般而言,大部分用戶對于喜愛和不喜愛的項目評分較為相似,所以評分的數值分布在一定范圍內的概率較大。因此可以使用眾數法來對新項目或新用戶對項目的評分進行預測。
     對于冷啟動問題也可采用信息熵法來解決。對于新項目問題,排序計算所得的信息熵,選取其中信息熵較大的用戶,通過預測這些用戶對該項目的平均評分來作為新項目的預測評分。對于新用戶問題,排序用戶信息熵值,然后選擇其中較大熵值的用戶來預測新用戶對某一項目的評分。
    本文介紹了協同過濾推薦算法的傳統算法和改進算法。最后對于系統的性能評測做了詳細介紹,對系統常見問題也進行了分析研究。
    很多研究者提出的改進算法都是用來解決系統的稀疏性和冷啟動問題,并且在一定程度上緩解了這些問題。可見稀疏性和冷啟動問題對于推薦系統的精度影響尤為重要。另外,一個系統的推薦性能是否良好,也需要一定的策略來評估。這些方面也是繼續改進的研究方向。
參考文獻
[1] LINDEN G, SMITH B,YORK J. Amazon.com recommendations item-to-item collaborative filtering[J].IEEE Computer Society, 2003(1-2):76-80.
[2] METEREN R V. M.v.S. using content-based filtering for  recommendation[C]. In CML/MLNET Workshop on Machine  Learning and the New Information Age,Baecelona, 2000:47-56.
[3] 黃萱菁,夏迎炬, 吳立德. 基于向量空間模型的文本過濾系統[J].軟件學報, 2003,14(3):435-442.
[4] 鄧愛林,左子葉,朱揚勇. 基于項目聚類的協同過濾推薦算法[J]. 小型微型計算機系統, 2004,25(9):1665-1670.
[5] Badrul Sarwar, G.K., KONSTAN J, et al. Item based collaborative filtering recommendation algorithms[C]. Proceedings of the 10th International World Wide Web Confer-ence, 2001.
[6] 曹毅.基于內容和協同過濾的混合模式推薦技術研究[D].長沙:中南大學,2007.
[7] EKSTRAND M D, RIDEL J T, KONSTAN J A. Collaborative filtering recommender systems[M]. Hanover:Now Publishers Inc, 2010:81-173.
[8] 鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J]. 軟件學報, 2003,14(9):1621-1628.
[9] 周軍鋒,湯顯,郭景峰.一種優化的協同過濾推薦算法[J].計算機研究與發展, 1994,41(10):1842-1847.
[10] 李聰,梁昌勇,董珂.基于項目類別相似性的協同過濾推薦算法[J]. 合肥工業大學學報(自然科學版), 2008,31(3):360-363.
[11] 張忠平,郭獻麗.一種優化的基于項目評分預測的協同過濾推薦算法[J].計算機應用研究, 2008,25(9):2658-2660.
[12] 汪靜,印鑒. 一種優化的Item-based協同過濾推薦算法[J]. 小型微型計算機系統, 2010,31(22):2337-2342.
[13] 馬麗. 基于組合加權評分的Item-based協同過濾推薦系統[J]. 現代圖書情報技術, 2008(11):60-64.
[14] 朱郁筱,呂琳媛.推薦系統評價指標綜述[J]. 電子科技大學學報, 2012,41(2):163-175.
[15] Zhou Tao, Jiang Luoluo, Su Riqi, et al. Effect of initial  configuration on network-based recommendation[J]. Europhysics Letters, 2008(81):58004-58007.
[16] Zhang Zike, Liu Chuang, Zhang Yicheng, et al. Solving the cold-start problem in recommender systems with social tags[J]. Europhysics Letters, 2010,92(2): 28002-28007.
[17] 孫小華.協同過濾系統的稀疏性與冷啟動問題研究[D].
       杭州:浙江大學,2005.

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 丝袜美女足交 | 欧美人一级淫片a免费播放 欧美人妖猛交 | 一品毛片| 岛国毛片在线 | 欧美中文字幕无线码视频 | 欧美在线视频免费 | 亚洲欧洲日韩综合 | 免费成人午夜视频 | 曰批全过程免费视频免费 | 综合自拍亚洲综合图区美腿丝袜 | 欧美日韩在线视频免费完整 | 国产精品视频久 | 综合网女女网 | 国产麻豆福利a v在线播放 | 99视频在线观看免费视频 | 日韩三级影院 | 欧美精品区| 久色网 | 青春草免费视频 | 暴力调教抖s浪荡总裁受文 白洁性荡生活l六 | 国产全黄三级国产全黄三级书 | 一本一道dvd在线播放器 | 120秒视频高清观看免费 | 九九久久99| 第一福利网址导航 | 午夜私人福利影院 | 麻豆国产高清在线播放 | 999成人国产精品 | 自拍偷拍亚洲图片 | 欧美超级碰碰 | 欧美一区二区三区不卡免费观看 | 一级一片一_级一片一 | 黄色在线视频网 | 日韩成人国产精品视频 | 国产成人亚洲精品91专区高清 | 亚洲日本中文 | 人人澡 人人澡 人人看欧美 | 性欧美.video.free | 精品欧美一区视频在线观看 | 欧美日本视频一区 | 抖音成人短视频 |