一種面向冷啟動學生用戶的工作推薦系統(tǒng)及推薦方法
【專利摘要】本發(fā)明公開了一種面向冷啟動學生用戶的工作推薦系統(tǒng)及推薦方法。針對新學生用戶沒有歷史評分的情況,系統(tǒng)以用戶屬性為基礎計算用戶之間相似度,然后根據近鄰用戶對用人單位的評分預測該新用戶對用人單位的評分,預測評分在一定程度上反映了新用戶對這些用人單位的興趣度,基于該預測評分即可對新用戶進行工作推薦。考慮到新用戶對用人單位的預測評分可能來自于不同數量的近鄰用戶對該用人單位的評分,系統(tǒng)引入評分支持度評價預測評分的可信度,以達到優(yōu)化推薦效果的目的。在工作推薦領域,用戶的興趣并不能直接轉化成對用人單位的錄用行為,系統(tǒng)又引入的興趣效能參數,以進一步優(yōu)化推薦效果。
【專利說明】
一種面向冷啟動學生用戶的工作推薦系統(tǒng)及推薦方法
技術領域
[0001] 本發(fā)明屬于數據挖掘的技術領域,具體涉及一種面向冷啟動學生用戶的工作推薦 系統(tǒng)及推薦方法,適用于工作推薦結果的優(yōu)化。
【背景技術】
[0002] 個性化推薦技術在電子商務領域已經得到了成功的應用,在人力資源領域,工作 推薦系統(tǒng)可以幫助建立求職者和招聘者之間的聯系。當面向高校畢業(yè)生的時候,工作推薦 系統(tǒng)面臨著一些新的挑戰(zhàn)。例如:學生通常沒有工作經歷,缺乏工作培訓,有時他們也缺乏 明確的求職目標。高校需要一種引導性的工作推薦系統(tǒng),將學生可能的潛在就業(yè)單位在學 生開始求職之前推薦給學生,以幫助學生明晰求職目標,做好求職準備。在這種情況下,學 生用戶沒有行為信息,屬于冷啟動的情況。因此,傳統(tǒng)的基于內容或基于協同過濾的推薦模 型無法應對這種情況。高校擁有大量歷史的就業(yè)信息和人才培養(yǎng)數據。
[0003] 文南犬《A Hybrid Job Recommendation Framework for University Students》給 出了一種基于學生用戶屬性相似度進行工作推薦的方法,該方法通過計算待就業(yè)學生用戶 與已就業(yè)學生用戶的屬性相似度,基于相似度將已就業(yè)學生用戶的就業(yè)單位直接推薦給待 就業(yè)學生用戶,并進行了推薦優(yōu)化。該方法未考慮學生用戶對用人單位的興趣評分和投遞 簡歷的過程。本發(fā)明的學生用戶屬性相似度計算部分只是利用了該文獻的過程,但基于相 似度的評分預測及推薦優(yōu)化該文獻未涉及,也不具有本發(fā)明的優(yōu)點。
【發(fā)明內容】
[0004] 本發(fā)明要解決的技術問題:克服現有技術的不足,提供一種面向冷啟動學生用戶 的工作推薦系統(tǒng)及推薦方法,基于興趣效能的工作推薦優(yōu)化針對工作推薦雙向選擇的特 點,提高了推薦效率。
[0005] 本發(fā)明通過學生用戶屬性計算待就業(yè)學生用戶與已就業(yè)學生用戶之間的相似度, 并基于近鄰模型預測待就業(yè)學生用戶對某用人單位的評分。鑒于工作推薦系統(tǒng)的雙向推 薦,及已就業(yè)學生用戶對用人單位評分數量分布不均等特點,提出了評分支持度和興趣效 能優(yōu)化參數,提供了更好的工作推薦效果。
[0006] 本發(fā)明解決上述技術問題采用的技術方案:一種面向冷啟動學生用戶的工作推薦 系統(tǒng),包括:學生用戶屬性模塊、學生用戶屬性相似度計算模塊、基于近鄰模型的預測評分 模塊、基于評分支持度的工作推薦優(yōu)化模塊和基于興趣效能的工作推薦優(yōu)化模塊;其中:
[0007] 學生用戶屬性模塊,用于存儲學生用戶屬性,學生屬性為就業(yè)密切相關的各類信 息,包括專業(yè)、生源地、性別、課程和成績多種;
[0008] 學生用戶屬性相似度計算模塊,利用學生用戶屬性,計算學生用戶屬性相似度;所 述學生用戶屬性相似度為學生用戶間各屬性相似度加權之和,如公式1所示,其中X和Y代表 兩個學生,ai代表學生用戶的某一種屬性,Wi是代表該屬性的權重,Wi取值在0-1之間,并且 Ewi = 1,即各個屬性權重之和為1,
[0009] S(X, V) = ELi w: SLm(Xajl YUi) (1 ):
[0010] 基于近鄰模型的預測評分模塊,根據屬性相似的已就業(yè)學生用戶對用人單位的評 分,預測待就業(yè)學生用戶對用人單位的評分;基于具有相似屬性的學生用戶具有相似的求 職興趣的思想,根據學生用戶屬性相似度計算結果,選取與待就業(yè)學生用戶相似度大于某 一閾值的近鄰已就業(yè)學生用戶,并計算待就業(yè)學生對近鄰已就業(yè)學生用戶已評分的用人單 位的預測評分,預測評分計算如公式2所示,代表學生用戶u對用人單位e的預測評分, KNN(u)代表與待就業(yè)學生u的屬性相似度大于某一閾值的已就業(yè)學生集,sim(u,v)代表學 生用戶u和v的相似度,代表學生用戶v對用人單位e的評分;獲得待就業(yè)學生用戶對所有 近鄰已就業(yè)學生用戶已評分用人單位的預測評分后,則根據預測評分的大小進行工作推 薦;
[0012]基于評分支持度的工作推薦優(yōu)化模塊,用于對基于預測評分的工作推薦效果的優(yōu) 化,使待就業(yè)學生用戶獲得更多的感興趣的推薦;預測評分可能來源于多個近鄰已就業(yè)學 生用戶對項目的評分,也有可能僅來自一個近鄰已就業(yè)學生用戶對項目的評分,來自多個 近鄰已就業(yè)學生用戶的評分的預測評分可信度高,來自少量已就業(yè)學生用戶的預測評分的 可信度低;為了降低數據稀疏對預測評分的影響,采用預測評分支持度,定義如公式3所示, 其中sn表示生成預測評分的近鄰已就業(yè)學生用戶數,sn max表示所有預測評分的最大近鄰已 就業(yè)學生用戶數,snmin表示所有預測評分的最小近鄰已就業(yè)學生用戶數,sn的數值在計算 預測評分時同時獲得,
[0014] 獲得預測評分支持度后,將推薦排序依據定義為預測評分與評分支持度乘積,如 公式4所示,
[0015] Sort = ru e * Support ( 1 );
[0016] 基于興趣效能的工作推薦優(yōu)化模塊,用于提升系統(tǒng)的推薦效率,使待就業(yè)學生用 戶獲得更大的被錄用的幾率;工作推薦系統(tǒng)是一類雙向推薦系統(tǒng),學生用戶在選擇用人單 位的同時,用人單位也在選擇學生用戶,將某用人單位實際錄用的人數nofkr與收到學生用 戶投遞簡歷的數量m nt_st的比值定義為用人單位的興趣效能,如公式5所示,
[0018] 基于興趣效能的工作推薦優(yōu)化模塊可與基于評分支持度的工作推薦優(yōu)化模塊組 合使用,進行用人單位推薦時,將排序依據定義為基于近鄰模型的預測評分模塊的預測評 分、基于評分支持度的工作推薦優(yōu)化模塊的評分支持度、基于興趣效能的工作推薦優(yōu)化模 塊的興趣效能三者的乘積,如公式6所示,
[0019] Sort'. = fu,c * Support * Efficiency. (6 )
[0020] -種面向冷啟動學生用戶的工作推薦方法,步驟如下:
[0021] (1)首先需計算學生用戶屬性的相似度,并預測評分,學生用戶屬性包括多種數據 類型,學生用戶屬性相似度可定義為學生用戶間各屬性相似度加權之和,如公式1所示,其 中X和Y代表兩個學生用戶,Wi是學生第i個屬性的權重,ai代表第i個屬性。
[0022] S(X, Y) = Σι:=? wf, sim(Xai, Υα.) ( 1)
[0023] (2)獲得了學生用戶之間的屬性相似度后,則可利用近鄰模型計算待就業(yè)學生用 戶對某用人單位的預測評分;預測評分計算如公式2所示,f u,c代表待就業(yè)學生用戶u對用人 單位e的預測評分,sim(U,v)代表學生用戶1!和7的相似度,r ve代表已就業(yè)學生用戶v對用人 單位e的評分,計算預測評分的同時,可以獲得用于計算預測評分的近鄰用戶數sn,
[0025] (3)根據用于生成預測評分的近鄰用戶數sn,計算預測評分的支持度,如公式3所 示,其中sn表示生成預測評分的近鄰學生用戶數,snmax表示所有預測評分的最大近鄰學生 用戶數,snmin表示所有預測評分的最小近鄰學生用戶數,
[0027] (4)根據用人單位實際錄用的人數noffer與收到學生投遞簡歷的數量mnterest的比 值計算用人單位的興趣效能,如公式5所示,
[0029] (5)將預測評分、評分支持度與興趣效能的乘積作為工作推薦的依據,如公式5所 示,進行工作推薦,
[0030] Sort, = i\, c * Support * Efficiency (5 )
[0031] 本發(fā)明的原理:首先需計算學生用戶屬性的相似度,并預測評分。學生用戶屬性包 括多種數據類型,學生用戶屬性相似度可定義為學生間各屬性相似度加權之和。如公式1所 示,其中X和Y代表兩個學生用戶,^是學生第i個屬性的權重代表第i個屬性。
[0032] S(^, Y) - Σ/Lt sim(Xa., Υα.) ( 1)
[0033] 獲得了學生用戶之間的屬性相似度后,則可利用近鄰模型計算待就業(yè)學生對某用 人單位的預測評分。
[0034] 本發(fā)明特征在于對預測評分的優(yōu)化,以提升推薦效果:具體包括:
[0035](一)基于評分支持度的工作推薦優(yōu)化
[0036] 面對新用戶冷啟動問題,利用用戶的屬性信息進行推薦是應對冷啟動問題的重要 方法。本發(fā)明利用學生用戶的屬性信息,計算學生用戶的相似度,并基于近鄰模型進行評分 預測?;诮彽耐扑]模型的推薦效果與數據的稠密程度密切相關。預測評分可能來源于 多個近鄰用戶對項目的評分,也有可能僅來自一個近鄰用戶對項目的評分。若近鄰用戶對 某特定項目給予了較高評分,且僅有該近鄰用戶對這個項目評分,則待推薦的新用戶對這 個項目的評分就是該近鄰用戶對其的評分,這個評分的可信度顯然是不高的。在工作推薦 領域,由于用人單位的招聘規(guī)模及熱門程度不同,廣泛存在著評分不均勻的情況,有些用人 單位獲得了大量評分,而有些用人單位僅獲得了極少量的評分。
[0037] 本優(yōu)化方法在利用近鄰模型預測學生用戶對用人單位的評分的同時,記錄了 生成該預測評分的近鄰學生用戶數sn,然后計算該預測評分的支持度,最后根據預測評分 和支持度進行工作推薦。
[0038]預測評分支持度參數,定義如下:
[0040]其中sn表示生成預測評分的近鄰已就業(yè)學生用戶數,snmax表示所有預測評分的最 大近鄰已就業(yè)學生用戶數,snmin表示所有預測評分的最小近鄰已就業(yè)學生用戶數,將生成 預測評分的近鄰已就業(yè)學生用戶數與所有預測評分的最小近鄰已就業(yè)學生用戶數的差值 跟所有預測評分的最大近鄰已就業(yè)學生用戶數與最小近鄰已就業(yè)學生用戶數的差值的比 值作為預測評分的支持度。
[0041 ]獲得預測評分支持度后,將推薦排序依據定義為預測評分與評分支持度乘積,如 公式(3)所示。
[0042] Sort = ru>e * Support (3)
[0043] (二)基于興趣效能的工作推薦優(yōu)化
[0044] 評分預測的最終目的是將符合用戶的興趣的項目推薦給用戶,并且用戶對該項目 產生購買或其他行為,而不是預測評分是否符合用戶最終對該項目的評分。在實際推薦過 程中,往往會出現用戶對推薦列表中的某個項目感興趣,但由于各種原因最終并沒有產生 購買等行為。在這種情況下,推薦雖然符合了用戶的興趣,但可能并不滿足用戶的實際需 求,這種推薦可以認為是低效的或者無效的。工作推薦是一類雙向推薦系統(tǒng),這樣的問題更 為明顯。根據學生的特點為學生推薦用人單位,推薦單位若符合學生的興趣,學生就會投遞 簡歷。當學生發(fā)生投遞簡歷的行為時,可以認為推薦有效。但是,學生投遞簡歷的最終目的 是獲得用人單位的錄用,若不能獲得錄用,推薦其實是無效的。由于求職招聘是一類雙向選 擇的過程,學生最終能否獲得錄用取決于用人單位的需求與學生的能力的匹配程度,而不 是學生的主觀意愿,因此常常會出現學生投遞了大量的簡歷而沒有獲得錄用的情況。
[0045] 本優(yōu)化方法將某用人單位實際錄用的人數noffa與收到學生用戶投遞簡歷的數量 nint_st的比值定義為用人單位的興趣效能,如公式(4)所示:
[0047] 進行用人單位推薦時,將排序依據定義為預測評分、評分支持度和興趣效能三者 的乘積,如公式(5)所示:
[0048] Sort, = rq;e * Support * Efficiency CS)
[0049] 本發(fā)明的原理在于:
[0050] -種面向冷啟動學生用戶的工作推薦系統(tǒng),系統(tǒng)通過計算學生用戶屬性相似度進 行評分預測應對學生用戶的冷啟動問題。針對預測評分系統(tǒng)給出了兩種優(yōu)化方法:基于評 分支持度的工作推薦優(yōu)化和基于興趣效能的工作推薦優(yōu)化。基于評分支持度的工作推薦優(yōu) 化通過評分支持度參數降低了稀疏且分布不均的歷史評分數據對推薦的影響,提升了推薦 效果?;谂d趣效能的工作推薦優(yōu)化針對工作推薦雙向選擇的特點,通過興趣效能參數考 量了應聘某用人單位競爭的激烈程度,提高了推薦效率。
[0051] 本發(fā)明優(yōu)點及功效在于:
[0052] (1)本發(fā)明采用學生用戶屬性計算學生相似度,進行評分預測有效地應對了新學 生用戶沒有歷史評分的冷啟動問題;
[0053] (2)本發(fā)明通過評分支持度參數考量了預測評分的可信度,降低了數據稀疏的影 響,提升了推薦效果;
[0054] (3)本發(fā)明通過興趣效能參數考量學生用戶獲得用人單位錄用的可能性,提高了 推薦效率。
[0055] 本發(fā)明優(yōu)點及功效(1)中,學生用戶屬性相似度計算方法與文獻《A Hybrid Job Recommendation Framework for University Students》中所提及方法相同,但是該文獻 未使用屬性相似度進行待就業(yè)學生用戶對用人單位的評分預測,優(yōu)點及功效(2)、(3)該文 獻未涉及,而且本發(fā)明提出的評分支持度和興趣效能優(yōu)化參數,提供了更好的工作推薦效 果。
【附圖說明】
[0056] 圖1是面向冷啟動學生用戶工作推薦系統(tǒng)框架圖;
[0057]圖2是基于屬性的評分預測模型處理流程。
【具體實施方式】
[0058]基于具有相似屬性的用戶有著相似的興趣這一思想,通過分析就業(yè)歷史數據,并 結合求職招聘領域的特點,可以發(fā)現具有相似條件的學生就業(yè)去向相近。本發(fā)明基于學生 屬性信息構建了一個面向冷啟動學生用戶的工作推薦系統(tǒng)。
[0059] 本發(fā)明通過針對待就業(yè)學生用戶沒有歷史評分的情況,系統(tǒng)以學生屬性為基礎計 算用待就業(yè)學生用戶與已就業(yè)學生用戶間相似度,然后根據近鄰已就業(yè)學生用戶對用人單 位的評分預測該待就業(yè)學生用戶對用人單位的評分,基于該預測評分即可對待就業(yè)學生用 戶進行工作推薦。考慮到待就業(yè)學生用戶對用人單位的預測評分可能來自于不同數量的近 鄰已就業(yè)用戶對該用人單位的評分,系統(tǒng)引入評分支持度評價預測評分的可信度,以達到 優(yōu)化推薦效果的目的。在工作推薦領域,學生用戶的興趣并不能直接轉化成對用人單位的 錄用行為,系統(tǒng)又引入的興趣效能參數,以進一步優(yōu)化推薦效果。
[0060] 1.學生用戶屬性相似度計算
[0061] 圖示如圖1所示。系統(tǒng)進行推薦的基礎是學生屬性相似度的計算,鑒于學生屬性包 含多種數據類型,學生用戶屬性相似度可通過學生用戶間各屬性相似度加權之和計算。如 公式1所示,其中X和Y代表兩個學生用戶,^是學生第i個屬性的權重代表第i個屬性。
[0062] S:(^, r) = wt sim(xa., (1)
[0063] 學生用戶屬性中的相似度定義為若屬性值相同相似度為1,如屬性值不同相似度 為〇,形式化定義如下:
[0065]學生用戶屬性中的數字型屬性相似度計算公式如下所示,其中氣代表 屬性ai取值的最大值和最小值。
[0067]本發(fā)明系統(tǒng)中使用學生專業(yè)、生源地和平均成績三個屬性作為相似度計算依據, 專業(yè)和生源地為枚舉屬性,平均成績?yōu)閿抵祵傩浴?br>[0068] 專業(yè)是影響學生求職的重要因素。專業(yè)相似度如果能準確地體現出專業(yè)間的差 異,將為工作推薦提供有力的支持。但是專業(yè)數據信息為專業(yè)的名稱,是枚舉型的,根據對 枚舉型數據相似度的定義,兩個學生用戶的專業(yè)名稱相同則專業(yè)相似度為1,不同則為0。用 專業(yè)名稱衡量專業(yè)的相似度太粗粒度了,是不夠準確的。例如:計算機應用技術專業(yè)與電子 信息工程專業(yè)之間的相似度明顯應大于其與經濟管理專業(yè)的相似度。同時,對于同專業(yè)的 學生來說,其研究方向不同,就業(yè)的方向也存在著明顯的差異。例如,計算機應用技術專業(yè) 中的虛擬現實方向和工程應用方向,其就業(yè)方向也存在著明顯的不同。因此,利用專業(yè)名稱 計算專業(yè)相似度既不能準確體現出專業(yè)之間的差異,也不無法反映專業(yè)內部的差異。高校 為不同專業(yè)的學生提供了不同的培養(yǎng)計劃,培養(yǎng)計劃中既包括公共基礎課,又包含了專業(yè) 基礎課和專業(yè)方向課。學生可以根據自己的專業(yè)方向和專業(yè)興趣選修相應的課程。本發(fā)明 使用課程集的相似度作為專業(yè)的相似度。課程集相似度計算公式如下所示,其中C(X)和C (Y)代表學生所修課程集。
[0070]系統(tǒng)分別學生用戶之間課程集、生源地和平均成績的相似度,然后計算學生用戶 之間的總相似度,各屬性權重通過超參數檢驗,根據推薦效果獲得。
[0071] 2、待就業(yè)學生用戶對用人單位的評分預測及工作推薦
[0072] 如圖2所示,獲得學生用戶屬性相似度后可進行評分預測。預測評分計算公式如下 所示,e代表待就業(yè)學生用戶u對用人單位e的預測評分,sim(u,v)代表待就業(yè)學生用戶u 和已就業(yè)學生用戶v的相似度,r ve代表已就業(yè)學生用戶v對用人單位e的評分。
[0074] 獲得了待就業(yè)學生用戶的對用人單位的預測評分后,則可根據評分的大小進行推 薦,算法如下。
[0075] 算法1:基于預測評分的工作推薦算法 [0076]輸入:待就業(yè)學生用戶u、已就業(yè)學生用戶集V [0077] 輸出:推薦工作單位列表E
[0078] a.算法首先計算待就業(yè)學生用戶u與所有已就業(yè)學生用戶集V中的每一個學生用 戶v之間的屬性相似度,依據相似度大小對已有用戶集V進行排序;
[0079] b.選取與待就業(yè)學生用戶u最相似的K個已就業(yè)學生用戶,獲得K個已就業(yè)學生用 戶的就業(yè)單位列表,并匯總為單位列表E;
[0080] c.根據K個最相似已就業(yè)學生用戶對單位列表E中的每個單位e的評分,計算加權 平均分,作為待就業(yè)學生用戶u對單位e的預測評分;
[0081] d.根據預測評分對單位列表E進行排序,系統(tǒng)可以根據需要推薦前N個項目。
[0082] 3、基于評分支持度的工作推薦優(yōu)化
[0083]本系統(tǒng)利用學生用戶的屬性信息,計算學生用戶的相似度,并基于近鄰模型進行 評分預測?;诮彽耐扑]模型的推薦效果與數據的稠密程度密切相關。預測評分可能來 源于多個近鄰用戶對項目的評分,也有可能僅來自一個近鄰用戶對項目的評分。若近鄰用 戶對某特定項目給予了較高評分,且僅有該近鄰用戶對這個項目評分,則待推薦的新用戶 對這個項目的評分就是該近鄰用戶對其的評分,這個評分的可信度顯然是不高的。在工作 推薦領域,由于用人單位的招聘規(guī)模及熱門程度不同,廣泛存在著評分不均勻的情況,有些 用人單位獲得了大量評分,而有些用人單位僅獲得了極少量的評分。
[0084]本發(fā)明方法在利用近鄰模型預測學生用戶對用人單位的評分的同時,記錄了 生成該預測評分的近鄰已就業(yè)學生用戶數sn,然后計算該預測評分的支持度,最后根據預 測評分和支持度進行工作推薦。
[0085]預測評分支持度參數,定義如下:
[0087]其中sn表示生成預測評分的近鄰已就業(yè)學生用戶數,snmax表示所有預測評分的最 大近鄰已就業(yè)學生用戶數,snmin表示所有預測評分的最小近鄰已就業(yè)學生用戶數,將生成 預測評分的近鄰已就業(yè)學生用戶數與所有預測評分的最小近鄰已就業(yè)學生用戶數的差值 跟所有預測評分的最大近鄰已就業(yè)學生用戶數與最小近鄰已就業(yè)學生用戶數的差值的比 值作為預測評分的支持度。
[0088] 獲得預測評分支持度后,將推薦排序依據定義為預測評分與評分支持度乘積,公 式如下所示。
[0089] Sort = fLi c * Support (7)
[0090] 4、基于興趣效能的工作推薦優(yōu)化
[0091] 評分預測的最終目的是將符合用戶的興趣的項目推薦給用戶,并且用戶對該項目 產生購買或其他行為,而不是預測評分是否符合用戶最終對該項目的評分。在實際推薦過 程中,往往會出現用戶對推薦列表中的某個項目感興趣,但由于各種原因最終并沒有產生 購買等行為。在這種情況下,推薦雖然符合了用戶的興趣,但可能并不滿足用戶的實際需 求,這種推薦可以認為是低效的或者無效的。工作推薦是一類雙向推薦系統(tǒng),這樣的問題更 為明顯。根據學生的特點為學生推薦用人單位,推薦單位若符合學生的興趣,學生就會投遞 簡歷。當學生發(fā)生投遞簡歷的行為時,可以認為推薦有效。但是,學生投遞簡歷的最終目的 是獲得用人單位的錄用,若不能獲得錄用,推薦其實是無效的。由于求職招聘是一類雙向選 擇的過程,學生最終能否獲得錄用取決于用人單位的需求與學生的能力的匹配程度,而不 是學生的主觀意愿,因此常常會出現學生投遞了大量的簡歷而沒有獲得錄用的情況。
[0092] 本發(fā)明將某用人單位實際錄用的人數與收到學生用戶投遞簡歷的數量 nint_st的比值定義為用人單位的興趣效能,公式如下所示:
[0094] 進行用人單位推薦時,將排序依據定義為預測評分、評分支持度和興趣效能三者 的乘積,公式如下所示:
[0095] Sort' = * Support * Efficiency C 9 )...
[0096] 提供以上實施例僅僅是為了描述本發(fā)明的目的,而并非要限制本發(fā)明的范圍。本 發(fā)明的范圍由所附權利要求限定。不脫離本發(fā)明的精神和原理而做出的各種等同替換和修 改,均應涵蓋在本發(fā)明的范圍之內。
【主權項】
1. 一種面向冷啟動學生用戶的工作推薦系統(tǒng),其特征在于:包括學生用戶屬性模塊、學 生用戶屬性相似度計算模塊、基于近鄰模型的預測評分模塊、基于評分支持度的工作推薦 優(yōu)化模塊和基于興趣效能的工作推薦優(yōu)化模塊;其中: 學生用戶屬性模塊,用于存儲學生用戶屬性,學生屬性為就業(yè)密切相關的各類信息,包 括專業(yè)、生源地、性別、課程和成績多種; 學生用戶屬性相似度計算模塊,利用學生用戶屬性,計算學生用戶屬性相似度;所述學 生用戶屬性相似度為學生用戶間各屬性相似度加權之和,如公式1所示,其中X和Y代表兩個 學生,日1代表學生用戶的某一種屬性,Wi是代表該屬性的權重,Wi取值在0-1之間,并且Ewi =1,即各個屬性權重之和為1,(1); 基于近鄰模型的預測評分模塊,根據屬性相似的已就業(yè)學生用戶對用人單位的評分, 預測待就業(yè)學生用戶對用人單位的評分;基于具有相似屬性的學生用戶具有相似的求職興 趣的思想,根據學生用戶屬性相似度計算結果,選取與待就業(yè)學生用戶相似度大于某一闊 值的近鄰已就業(yè)學生用戶,并計算待就業(yè)學生對近鄰已就業(yè)學生用戶已評分的用人單位的 預測評分,預測評分計算如公式2所示,Pu,e代表學生用戶U對用人單位e的預測評分,K順(U) 代表與待就業(yè)學生U的屬性相似度大于某一闊值的已就業(yè)學生集,sim(u,v)代表學生用戶U 和V的相似度,rve代表學生用戶V對用人單位e的評分;獲得待就業(yè)學生用戶對所有近鄰已就 業(yè)學生用戶已評分用人單位的預測評分后,則根據預測評分的大小進行工作推薦;(2) 基于評分支持度的工作推薦優(yōu)化模塊,用于對基于預測評分的工作推薦效果的優(yōu)化, 使待就業(yè)學生用戶獲得更多的感興趣的推薦;預測評分可能來源于多個近鄰已就業(yè)學生用 戶對項目的評分,也有可能僅來自一個近鄰已就業(yè)學生用戶對項目的評分,來自多個近鄰 已就業(yè)學生用戶的評分的預測評分可信度高,來自少量已就業(yè)學生用戶的預測評分的可信 度低;為了降低數據稀疏對預測評分的影響,采用預測評分支持度,定義如公式3所示,其中 sn表示生成預測評分的近鄰已就業(yè)學生用戶數,Snmax表示所有預測評分的最大近鄰已就業(yè) 學生用戶數,snmin表示所有預測評分的最小近鄰已就業(yè)學生用戶數,sn的數值在計算預測 評分時同時獲得,(3) 獲得預測評分支持度后,將推薦排序依據定義為預測評分與評分支持度乘積,如公式4 所示,(4) ; 基于興趣效能的工作推薦優(yōu)化模塊,用于提升系統(tǒng)的推薦效率,使待就業(yè)學生用戶獲 得更大的被錄用的幾率;工作推薦系統(tǒng)是一類雙向推薦系統(tǒng),學生用戶在選擇用人單位的 同時,用人單位也在選擇學生用戶,將某用人單位實際錄用的人數noffer與收到學生用戶投 遞簡歷的數量mnterest的比值定義為用人單位的興趣效能,如公式5所示,(5) 基于興趣效能的工作推薦優(yōu)化模塊可與基于評分支持度的工作推薦優(yōu)化模塊組合使 用,進行用人單位推薦時,將排序依據定義為基于近鄰模型的預測評分模塊的預測評分、基 于評分支持度的工作推薦優(yōu)化模塊的評分支持度、基于興趣效能的工作推薦優(yōu)化模塊的興 趣效能Ξ者的乘積,如公式6所示,(6)。2.-種面向冷啟動學生用戶的工作推薦方法,其特征在于步驟如下: (1) 首先需計算學生用戶屬性的相似度,并預測評分,學生用戶屬性包括多種數據類 型,學生用戶屬性相似度可定義為學生用戶間各屬性相似度加權之和,如公式1所示,其中X 和Y代表兩個學生用戶,wi是學生第i個屬性的權重,ai代表第i個屬性。(1) (2) 獲得了學生用戶之間的屬性相似度后,則可利用近鄰模型計算待就業(yè)學生用戶對 某用人單位的預測評分;預測評分計算如公式2所示,fu,e代表待就業(yè)學生用戶U對用人單位 e的預測評分,sim(u,v)代表學生用戶U和V的相似度,rve代表已就業(yè)學生用戶V對用人單位e 的評分,計算預測評分的同時,可W獲得用于計算預測評分的近鄰用戶數sn,(2) (3) 根據用于生成預測評分的近鄰用戶數sn,計算預測評分的支持度,如公式3所示,其 中sn表示生成預測評分的近鄰學生用戶數,Snmax表示所有預測評分的最大近鄰學生用戶 數,snmin表示所有預測評分的最小近鄰學生用戶數,(3) (4) 根據用人單位實際錄用的人數noffer與收到學生投遞簡歷的數量mnterest的比值計算 用人單位的興趣效能,如公式5所示,<:4> (5) 將預測評分、評分支持度與興趣效能的乘積作為工作推薦的依據,如公式5所示,進 行工作推薦,(百)。
【文檔編號】G06Q50/20GK106097204SQ201610474388
【公開日】2016年11月9日
【申請日】2016年6月24日
【發(fā)明人】劉睿, 榮文戈, 唐翠, 歐陽元新, 熊璋
【申請人】北京航空航天大學