本發(fā)明涉及的是一種智能交互領(lǐng)域的技術(shù),具體是一種基于滑動式交互操作的推薦系統(tǒng)及方法。
背景技術(shù):
基于智能終端上人機交互操作的推薦方法主要作用是可以從各類人機交互操作中提取隱式的用戶對內(nèi)容的喜好程度,從而彌補大多數(shù)用戶在瀏覽過程結(jié)束后不評分帶來的數(shù)據(jù)稀疏問題,其中較為廣泛被應(yīng)用的就是訪問頻率和閱讀停留時間。訪問頻率是利用用戶對內(nèi)容的訪問次數(shù)來進(jìn)行推薦的,即越多的訪問次數(shù)就表示用戶對內(nèi)容的興趣越大。閱讀停留時間則是利用了用戶在瀏覽過程中的平均速度,即越低的瀏覽平均速度表示用戶對內(nèi)容的興趣大。
技術(shù)實現(xiàn)要素:
本發(fā)明針對現(xiàn)有技術(shù)多通過頁面停留時間或點擊次數(shù)作為隱式反饋,其推薦準(zhǔn)確性較低等缺陷,提出一種基于滑動式交互操作的推薦系統(tǒng)及方法。
本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
本發(fā)明涉及一種基于滑動式交互操作的推薦系統(tǒng),包括:特征提取模塊、模型訓(xùn)練模塊、評分預(yù)測模塊和推薦模塊,其中:模型訓(xùn)練模塊根據(jù)已有的數(shù)據(jù)確定正穩(wěn)定性邊界bp和負(fù)穩(wěn)定性邊界bn,并訓(xùn)練評分分類器,特征提取模塊從用戶本次瀏覽過程中的滑動信息提取瀏覽速度穩(wěn)定度和瀏覽速度序列,評分預(yù)測模塊接收本次瀏覽的瀏覽速度穩(wěn)定度和瀏覽速度序列并根據(jù)從模型訓(xùn)練模塊接收的正穩(wěn)定性邊界bp、負(fù)穩(wěn)定性邊界bn和評分分類器以獲得用戶興趣,推薦模塊接收用戶興趣并生成推薦列表。
本發(fā)明涉及上述系統(tǒng)的實現(xiàn)方法,包括以下步驟:
1)監(jiān)測用戶本次瀏覽過程中的滑動信息,從中提取瀏覽速度穩(wěn)定度stabtest和瀏覽速度序列;
2)將瀏覽速度穩(wěn)定度stabtest分別與正穩(wěn)定性邊界bp和負(fù)穩(wěn)定性邊界bn比較,如stabtest>bp則推薦與本次瀏覽同類的內(nèi)容,如stabtest<bn則屏蔽與本次瀏覽同類的內(nèi)容,如果bn≤stabtest≤bp,則進(jìn)行下一步驟;
3)對瀏覽速度序列進(jìn)行切分降維,利用評分分類器預(yù)測用戶興趣,根據(jù)用戶興趣向用戶推薦內(nèi)容。
所述的瀏覽速度穩(wěn)定度為用戶瀏覽時所有滑動速度出現(xiàn)頻率的不同數(shù)值數(shù)。
所述的瀏覽速度序列為一m×m的速度轉(zhuǎn)移矩陣,m為瀏覽過程中的滑動速度個數(shù),矩陣中第i行j列元素為由滑動速度vi向滑動速度vj轉(zhuǎn)移的次數(shù)。
所述的正穩(wěn)定性邊界bp為將已有的正樣本集合ir根據(jù)瀏覽速度穩(wěn)定度降序排列后所有正混淆度大于正混淆閾值的樣本中瀏覽速度穩(wěn)定度的最大值。
所述的負(fù)穩(wěn)定性邊界bn為將已有的負(fù)樣本集合inr根據(jù)瀏覽速度穩(wěn)定度升序排列后所有負(fù)混淆度大于負(fù)混淆閾值的樣本中瀏覽速度穩(wěn)定度的最小值。
所述的瀏覽速度序列的切分是指將瀏覽速度序列的行與列分別按照快速-負(fù)速度、慢速-負(fù)速度、慢速-正速度和快速-正速度分為16個子矩陣。
所述的瀏覽速度序列采用主成分分析法進(jìn)行降維。
所述的評分分類器采用支持向量機方法訓(xùn)練獲得。
技術(shù)效果
與現(xiàn)有技術(shù)相比,本發(fā)明對用戶瀏覽速度的隱藏特征進(jìn)一步提取,有效的提高推薦的準(zhǔn)確性,能夠有效判斷用戶在瀏覽過程中的興趣變化,從而更加準(zhǔn)確及時地判斷用戶最終對內(nèi)容的興趣程度。
附圖說明
圖1為本發(fā)明流程示意圖;
圖2為正負(fù)樣本的瀏覽速度穩(wěn)定度示意圖;
圖3為正負(fù)樣本的瀏覽速度穩(wěn)定度的累積概率密度圖;
圖4為瀏覽速度序列的區(qū)分結(jié)果圖;
圖5為速度空間切分是示意圖;
圖6為瀏覽速度序列切分示意圖;
圖7為推薦準(zhǔn)確率示意圖;
圖8為本發(fā)明的roc和auc圖;
圖9為結(jié)合icf的性能評估圖;
圖10為結(jié)合svd++的性能評估圖。
具體實施方式
本實施例涉及一種基于滑動式交互操作的推薦系統(tǒng),包括:特征提取模塊、模型訓(xùn)練模塊、評分預(yù)測模塊和推薦模塊,其中:模型訓(xùn)練模塊根據(jù)已有的數(shù)據(jù)確定正穩(wěn)定性邊界bp和負(fù)穩(wěn)定性邊界bn,并訓(xùn)練評分分類器,特征提取模塊從用戶本次瀏覽過程中的滑動信息提取瀏覽速度穩(wěn)定度和瀏覽速度序列,評分預(yù)測模塊接收本次瀏覽的瀏覽速度穩(wěn)定度和瀏覽速度序列并根據(jù)從模型訓(xùn)練模塊接收的正穩(wěn)定性邊界bp、負(fù)穩(wěn)定性邊界bn和評分分類器以獲得用戶興趣,推薦模塊接收用戶興趣并生成推薦列表。
如圖1所示,上述系統(tǒng)的實施方法,包括以下步驟:
1)監(jiān)測用戶本次瀏覽過程中的滑動信息,從中提取瀏覽速度穩(wěn)定度stabtest和瀏覽速度序列。
所述的瀏覽速度穩(wěn)定度為用戶適用觸摸屏瀏覽時所有滑動速度出現(xiàn)頻率的不同數(shù)值數(shù)。如圖2所示,圖中顯示了一個正樣本的瀏覽速度分布和一個負(fù)樣本的瀏覽速度分布。正樣本是指用戶有興趣瀏覽的內(nèi)容,負(fù)樣本是指用戶沒有興趣瀏覽的內(nèi)容。在一個樣本中的瀏覽過程中存在np個不同的滑動速度,每個滑動速度出現(xiàn)的頻率為
所述的瀏覽速度序列為一m×m的速度轉(zhuǎn)移矩陣,m為瀏覽過程中的滑動速度個數(shù),矩陣中第i行j列元素為由滑動速度vi向滑動速度vj轉(zhuǎn)移的次數(shù)。如圖4所示,從瀏覽速度序列降維后的結(jié)果看出,大部分正負(fù)樣本都可以通過決策邊界區(qū)分開。
2)將瀏覽速度穩(wěn)定度stabtest分別與正穩(wěn)定性邊界bp和負(fù)穩(wěn)定性邊界bn比較,如stabtest>bp則推薦與本次瀏覽同類的內(nèi)容,如stabtest<bn則屏蔽與本次瀏覽同類的內(nèi)容,如果bn≤stabtest≤bp,則進(jìn)行下一步驟。
所述的正穩(wěn)定性邊界bp為將已有的正樣本集合ir根據(jù)瀏覽速度穩(wěn)定度降序排列后所有正混淆度大于正混淆閾值的樣本中瀏覽速度穩(wěn)定度的最大值。首先,將正樣本集合ir根據(jù)瀏覽速度穩(wěn)定度降序排列,及排序后應(yīng)當(dāng)滿足
所述的負(fù)穩(wěn)定性邊界bn為將已有的負(fù)樣本集合inr根據(jù)瀏覽速度穩(wěn)定度升序排列后所有負(fù)混淆度大于負(fù)混淆閾值的樣本中瀏覽速度穩(wěn)定度的最小值。首先,將負(fù)樣本集合inr根據(jù)瀏覽速度穩(wěn)定度升序排列,即排列后應(yīng)當(dāng)滿足
3)對瀏覽速度序列進(jìn)行切分降維,利用評分分類器預(yù)測用戶興趣,根據(jù)用戶興趣向用戶推薦。
如圖5~6所示,所述的瀏覽速度序列進(jìn)行切分是指:將每個滑動速度轉(zhuǎn)化為[-1,1]范圍中的相對速度,即將滑動速度轉(zhuǎn)化為[-1,1]的相對速度,區(qū)間[-1,1]為速度空間。相對速度在[-1,-0.5]的為快速-負(fù)速度,區(qū)間(-0.5,0]的相對速度為慢速-負(fù)速度,區(qū)間(0,0.5]的相對速度為慢速-正速度,區(qū)間(0.5,1]的相對速度為快速-正速度。將瀏覽速度序列的行和列按照上述四個區(qū)間劃分為16塊,并歸為4類即快速-快速(ff)、快速-慢速(fs)、慢速-快速(sf)以及慢速-慢速(ss)。
利用已有的數(shù)據(jù)訓(xùn)練獲得評分分類器,即對已有數(shù)據(jù)的瀏覽速度序列進(jìn)行切分降維,再利用機器學(xué)習(xí)中的支持向量機方法訓(xùn)練獲得評分分類器。得到推測的用戶興趣后采用協(xié)同過濾技術(shù)向用戶推薦內(nèi)容。
如圖7所示,可以看到在不同的智能終端屏幕大小下,本方法都能達(dá)到80%以上的準(zhǔn)確率。隨著屏幕尺寸從4.8英寸增大到9.7英寸,準(zhǔn)確率從93.08%降到了83.87%。這是因為隨著屏幕增大,用戶瀏覽完全部內(nèi)容所需的滑動次數(shù)變少,進(jìn)而導(dǎo)致了準(zhǔn)確率的下降。但是可以看到,即使是最低的準(zhǔn)確率也有83.87%。這說明屏幕尺寸的影響并不大。
如圖8所示,顯示了roc圖像,roc為受試者操作特征??梢钥吹皆诓煌钠聊怀叽缦?,本發(fā)明的性能都遠(yuǎn)大于隨機預(yù)測算法的性能。它們對應(yīng)的auc分別為0.9304、0.9099、0.8856和0.8383。這些auc都十分靠近理想值1,auc為受試者操作特征曲線下面積,tpr為檢測正確率。
如圖9~10所示,可以看到與協(xié)同過濾(icf)方法結(jié)合后,普通的or(樂觀估計)、nr(自然估計)方法相比,在命中率方面提高了16.35%,而在命中排序則提高了40.32%。與奇異值分解(svd++)方法結(jié)合后,可以看到與普通的or和nr相比,在命中率方面提高了23.69%、42.07%,在命中排序方面則提高了14.70%、33.87%。
與現(xiàn)有技術(shù)相比,本發(fā)明對用戶瀏覽速度的隱藏特征進(jìn)一步提取,有效的提高推薦的準(zhǔn)確性,能夠有效判斷用戶在瀏覽過程中的興趣變化,從而更加準(zhǔn)確及時地判斷用戶最終對內(nèi)容的興趣程度。
上述具體實施可由本領(lǐng)域技術(shù)人員在不背離本發(fā)明原理和宗旨的前提下以不同的方式對其進(jìn)行局部調(diào)整,本發(fā)明的保護(hù)范圍以權(quán)利要求書為準(zhǔn)且不由上述具體實施所限,在其范圍內(nèi)的各個實現(xiàn)方案均受本發(fā)明之約束。