亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng)的制作方法_2

文檔序號(hào):9788025閱讀:來源:國(guó)知局
指代在更大范圍的多個(gè)系統(tǒng)或整體市場(chǎng)中的銷售量或衡量流行程度、趨勢(shì)的其他數(shù)值等。
[0036]如圖2所示,上述系統(tǒng)預(yù)測(cè)的工作過程為:
[0037]1:數(shù)據(jù)準(zhǔn)備模塊的數(shù)據(jù)準(zhǔn)備階段。
[0038]獲取系統(tǒng)中的每個(gè)用戶對(duì)于物品的評(píng)價(jià),獲取系統(tǒng)中每個(gè)商品的流行度信息。將原始數(shù)據(jù)預(yù)處理后,生成用戶-物品評(píng)分矩陣,物品流行度向量。
[0039]用戶的評(píng)價(jià)和物品流行度可以通過人工或機(jī)器方式來獲取。并通過把用戶的評(píng)價(jià)映射為采用1-5分的評(píng)分來衡量用戶對(duì)商品的喜好程度,并由此產(chǎn)生用戶-物品評(píng)分稀疏矩陣R(其中無評(píng)分的元素設(shè)為空或值為零),但不局限于這種方式。
[0040]商品的流行度可以采用第三方指數(shù)、銷售額等方式進(jìn)行定義,并經(jīng)過數(shù)值映射到在一定固定范圍內(nèi)變動(dòng)的數(shù)值。并記全體商品的流行度變量為b。流行度的獲取方式、變換形式不局限于上述方式。
[0041]2:特征建模模塊的用戶喜好特征、物品流行度特征建模階段。
[0042]根據(jù)系統(tǒng)中已知的用戶對(duì)已有物品的評(píng)價(jià)矩陣、物品流行度向量,通過功能性矩陣分解方法生成用戶對(duì)不同物品的喜好距離矩陣、物品特征距離矩陣,以便建立可以區(qū)分不同用戶、不用商品特征的的數(shù)學(xué)模型。
[0043]假設(shè)有N個(gè)用戶和M個(gè)商品所構(gòu)成的用戶-物品評(píng)價(jià)矩陣R中,代表了用戶對(duì)商品的評(píng)價(jià),其中和分別視為用戶、商品的模型參數(shù),均為K維向量。全部用戶、商品模型參數(shù)記為U、V。那么可以使用用戶的模型參數(shù)、商品的模型參數(shù)內(nèi)積表示用戶的評(píng)分,而R中的未知元素也可以通過來獲得。同時(shí),物品模型參數(shù)U還可以通過流行度回歸模型系數(shù)映射為物品流行度向量,也即。
[0044]假設(shè)表示矩陣R中已知的用戶對(duì)商品j的評(píng)分集合,那么想要獲取R中全部未知元素(即用戶評(píng)分)、流行度回歸模型系數(shù)以達(dá)到最準(zhǔn)確的流行度預(yù)測(cè)、評(píng)分預(yù)測(cè)結(jié)果需要求解以下最優(yōu)化問題:
[0045]本優(yōu)化過程要通過多次迭代的最優(yōu)化來求解,即以下3步:
[0046]已知,更新;已知,更新U;更新。
[0047]在實(shí)際求解上述最優(yōu)化問題的操作中,本系統(tǒng)可以對(duì)流行度回歸模型系數(shù)的LI范數(shù)進(jìn)行進(jìn)一步約束,以避免模型系數(shù)浮動(dòng)范圍過大產(chǎn)生過擬合。該約束的取值范圍可根據(jù)實(shí)際數(shù)據(jù)的規(guī)模N、M和模型參數(shù)維度K進(jìn)行調(diào)節(jié)。
[0048]3:預(yù)測(cè)模塊的關(guān)鍵先導(dǎo)用戶的選取階段:
[0049]在本階段需要在聯(lián)合考慮了用戶區(qū)分度、流行度預(yù)測(cè)準(zhǔn)確度、推薦結(jié)果準(zhǔn)確度后從現(xiàn)有系統(tǒng)中的選取出的關(guān)鍵先導(dǎo)用戶,因此需要根據(jù)上步驟的評(píng)分矩陣R、物品流行度向量,分解生成最合適的U、V矩陣數(shù)值。
[0050]本系統(tǒng)把關(guān)鍵先導(dǎo)用戶對(duì)商品的評(píng)價(jià)映射為商品的模型參數(shù)的映射函數(shù)記為T。那么為了使得用戶模型參數(shù)(喜好距離矩陣U)產(chǎn)生最大的區(qū)分度,可以把最優(yōu)化選取先導(dǎo)用戶的問題轉(zhuǎn)化為構(gòu)建三向決策樹模型中選取最優(yōu)分支節(jié)點(diǎn)的問題(如圖3所示)。
[0051]決策樹中的分支節(jié)點(diǎn)視為一個(gè)先導(dǎo)用戶P。所有商品視為葉子節(jié)點(diǎn)。根據(jù)先導(dǎo)用戶對(duì)商品的評(píng)價(jià)(好、壞、不確定),把所有的商品分為三個(gè)部分,并成為當(dāng)前決策樹節(jié)點(diǎn)的三個(gè)兒子節(jié)點(diǎn):左節(jié)點(diǎn)L(p)、中節(jié)點(diǎn)U(p)、右節(jié)點(diǎn)D(p)。在全部用戶中,必定有一個(gè)用戶可以使得這種分劃產(chǎn)生的預(yù)測(cè)誤差最小,視其為先導(dǎo)用戶P。預(yù)測(cè)誤差函數(shù)可用以下公式進(jìn)行計(jì)算:
[0052]對(duì)每個(gè)兒子節(jié)點(diǎn)采用相同的遞歸操作,從而構(gòu)建完整的最大層級(jí)為P層的決策樹。
[0053]4:預(yù)測(cè)模塊的物品流行度的預(yù)測(cè)、物品推薦的輸出階段。
[0054]對(duì)于每一個(gè)新的待預(yù)測(cè)物品m,本系統(tǒng)首先獲取上述P個(gè)先導(dǎo)用戶對(duì)該待預(yù)測(cè)物品的評(píng)價(jià),并根據(jù)這P個(gè)先導(dǎo)用戶的用戶特征模型,生成該新物品的特征向量。隨后通過全體用戶模型參數(shù)與該物品特征向量的內(nèi)積獲得全體用戶的預(yù)測(cè)評(píng)分,并根據(jù)此評(píng)分推薦給目標(biāo)用戶;根據(jù)流行度回歸模型系數(shù)與新物品特征向量的乘積得到該物品的預(yù)測(cè)流行度。一般來講,高流行度的物品會(huì)獲取大規(guī)模用戶的喜愛,但這類商品的用戶群重疊度較高;低流行度的不同“小眾”物品則會(huì)在不同的小群體中獲得較高喜好度??梢愿鶕?jù)實(shí)際情況機(jī)動(dòng)的參考本系統(tǒng)輸出的兩個(gè)預(yù)測(cè)指標(biāo),以便選擇合適的目標(biāo)用戶群。
[0055]本發(fā)明提出了僅采用少量具有顯著區(qū)分度的“關(guān)鍵”用戶的評(píng)價(jià)來對(duì)新物品流行度和新物品在全體用戶中喜好度進(jìn)行聯(lián)合預(yù)測(cè),該聯(lián)合預(yù)測(cè)系統(tǒng)采用了諸如功能性矩陣分解、線性回歸等技術(shù)手法來構(gòu)建可使得預(yù)測(cè)誤差降最低的最優(yōu)用戶選擇決策樹模型,并應(yīng)用于聯(lián)合預(yù)測(cè),該系統(tǒng)降低了數(shù)據(jù)處理的復(fù)雜度,提高了運(yùn)行速度,可以極大地降低新商品投入市場(chǎng)之后市場(chǎng)調(diào)研所需要人工費(fèi)用,減少時(shí)間代價(jià),但同時(shí)并不減少預(yù)測(cè)的準(zhǔn)確度。
[0056]以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。
【主權(quán)項(xiàng)】
1.一種基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于包括: 數(shù)據(jù)準(zhǔn)備模塊:將用戶的原始評(píng)價(jià)數(shù)據(jù)預(yù)處理,生成用戶-物品評(píng)分矩陣、物品流行度向量; 特征建模模塊:根據(jù)數(shù)據(jù)準(zhǔn)備模塊的用戶-物品評(píng)分矩陣、物品流行度向量,采用功能性矩陣分解方法、線性回歸方法生成用戶對(duì)不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量; 預(yù)測(cè)模塊:僅使用少量關(guān)鍵用戶對(duì)物品的評(píng)價(jià),估算物品屬性的特征向量,從而預(yù)測(cè)預(yù)測(cè)物品的未來流行度、預(yù)測(cè)全體用戶對(duì)該物品的喜好程度; 所述預(yù)測(cè)模塊把少量關(guān)鍵用戶的喜好特征矩陣、少量關(guān)鍵用戶對(duì)新物品的評(píng)價(jià),映射為該新物品的屬性特征向量,然后使用新物品的屬性特征向量與全體用戶喜好特征矩陣相乘來預(yù)測(cè)全體用戶喜好程度,使用新物品的屬性特征向量與線性預(yù)測(cè)系數(shù)相乘得到未來流行度預(yù)測(cè)結(jié)果。2.根據(jù)權(quán)利要求1所述的基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于: 所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中涉及的物品,是指現(xiàn)已存在于該系統(tǒng)中的商品; 所述預(yù)測(cè)模塊,其中涉及的物品包括現(xiàn)已存在于該系統(tǒng)中的商品、對(duì)不存在于目前系統(tǒng)的、可以被加入至當(dāng)前系統(tǒng)的新物品。3.根據(jù)權(quán)利要求1所述的基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于:所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中的預(yù)處理和建立數(shù)學(xué)模型時(shí),將用戶對(duì)某物品的評(píng)價(jià)數(shù)值化、歸一化為用戶-物品評(píng)分矩陣中相交的元素;將多維度物品屬性特征通過線性預(yù)測(cè)系數(shù)映射為一維的流行度向量,并對(duì)流行度向量進(jìn)行非線性變換處理使其處于一定的變化范圍之內(nèi)。4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于:所述預(yù)測(cè)模塊,包括選取少量關(guān)鍵用戶子模塊,該子模塊根據(jù)所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊所得到的用戶喜好特征矩陣、物品屬性特征矩陣、回歸系數(shù)向量,從現(xiàn)有系統(tǒng)全部用戶中選取出少量最優(yōu)的用戶作為關(guān)鍵用戶,隨后僅僅使用這些少量關(guān)鍵用戶對(duì)新物品的評(píng)價(jià),來預(yù)測(cè)該物品的流行度和在全體用戶中的喜好程度。5.根據(jù)權(quán)利要求4所述的基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于:所述的選取少量關(guān)鍵用戶子模塊,把最優(yōu)化選取少量關(guān)鍵用戶的問題轉(zhuǎn)化為構(gòu)建三向決策樹模型中選取最優(yōu)分支節(jié)點(diǎn)的問題。6.根據(jù)權(quán)利要求5所述的基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),其特征在于:所述決策樹模型,構(gòu)建方法為: 1)決策樹中每個(gè)葉子節(jié)點(diǎn)包含一組屬性特征類似的物品,決策樹每層的每個(gè)分支節(jié)點(diǎn)包含一個(gè)用戶,根據(jù)每個(gè)用戶對(duì)子節(jié)點(diǎn)中物品的評(píng)價(jià),均能把這些物品分劃為無交集的三個(gè)子集,作為當(dāng)前決策樹節(jié)點(diǎn)的三個(gè)兒子節(jié)點(diǎn):左節(jié)點(diǎn)L(p)、中節(jié)點(diǎn)U(p)、右節(jié)點(diǎn)D(p);在全部用戶中,必定有一個(gè)用戶P能使得分劃后的三個(gè)子集里的物品流行度預(yù)測(cè)誤差與用戶喜好度誤差之和為最小,把該用戶P記為決策樹本分支的節(jié)點(diǎn),并視為一個(gè)關(guān)鍵用戶; 2)對(duì)決策樹每層的每個(gè)兒子節(jié)點(diǎn)均采用相同的遞歸分割操作,構(gòu)建最大層級(jí)為P層的決策樹;當(dāng)需要獲取待預(yù)測(cè)物品的屬性特征時(shí),根據(jù)P個(gè)關(guān)鍵用戶對(duì)該物品的評(píng)價(jià),選擇決策路徑,并到達(dá)相應(yīng)的的葉子節(jié)點(diǎn)之中,進(jìn)而得到該物品屬性特征,以便用于預(yù)測(cè)。
【專利摘要】本發(fā)明公開一種基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),包括:數(shù)據(jù)準(zhǔn)備模塊,將用戶的原始評(píng)價(jià)數(shù)據(jù)預(yù)處理,生成用戶-物品評(píng)分矩陣、物品流行度向量;特征建模模塊,生成用戶對(duì)不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量;預(yù)測(cè)模塊,把少量關(guān)鍵用戶的喜好特征矩陣、對(duì)新物品的評(píng)價(jià),映射為該新物品的屬性特征向量,使用新物品的屬性特征向量與線性預(yù)測(cè)系數(shù)相乘得到未來流行度預(yù)測(cè)結(jié)果。本發(fā)明僅采用少量具有顯著區(qū)分度的“關(guān)鍵”用戶的評(píng)價(jià)來對(duì)新物品流行度和新物品在全體用戶中喜好度進(jìn)行聯(lián)合預(yù)測(cè),提高運(yùn)行速度,減少時(shí)間代價(jià),并保證預(yù)測(cè)的準(zhǔn)確度。
【IPC分類】G06Q30/02
【公開號(hào)】CN105550901
【申請(qǐng)?zhí)枴緾N201510968255
【發(fā)明人】陳凱, 奚國(guó)堅(jiān), 苗仲辰, 周異, 苗麗, 吳敏辰
【申請(qǐng)人】上海交通大學(xué), 中國(guó)太平洋保險(xiǎn)(集團(tuán))股份有限公司
【公開日】2016年5月4日
【申請(qǐng)日】2015年12月21日
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1