本發(fā)明涉及計算機技術領域,尤其涉及一種確定相似職位的方法及裝置。
背景技術:
網(wǎng)上求職已經(jīng)成為當今社會人才交流的一種主要方式,求職者可以在第三方的人才招聘網(wǎng)站上尋求合適的工作。
現(xiàn)有技術中,人才招聘網(wǎng)站擁有大量的職位,求職者登錄人才招聘網(wǎng)站之后,可以依靠關鍵字去搜索可能適合自己的職位。并且,為了方便求職者更快的找到合適的職位,人才招聘網(wǎng)站可以向求職者推薦與某一職位相似的職位,即該職位的相似職位。通常,人才招聘網(wǎng)站所推薦的相似職位是與求職者輸入的關鍵字匹配的其他職位。
但是,現(xiàn)有技術中,存在由于僅根據(jù)求職者輸入的關鍵字確定相似職位,而導致確定的相似職位不準確的問題。
技術實現(xiàn)要素:
本發(fā)明提供一種確定相似職位的方法及裝置,用以解決現(xiàn)有技術中由于僅根據(jù)求職者輸入的關鍵字確定相似職位,而導致確定的相似職位不準確的問題。
第一方面,本發(fā)明提供一種確定相似職位的方法,包括:
根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度;其中,N為大于1的整數(shù);
根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位。
在一種可能的設計中,所述根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度,包括:
將所述N個職位中各職位的職位信息劃分為M類子信息;其中,M為大于1的整數(shù);
根據(jù)所述N個職位的各類子信息,確定所述兩兩職位間各類子信息的相似度;
根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度。
在一種可能的設計中,所述根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度,包括:
根據(jù)所述求職者的輸入,確定基于所述M類子信息中的K類子信息確定所述兩兩職位間的相似度;其中,K為大于0且小于或等于M的整數(shù);
根據(jù)所述兩兩職位間所述K類子信息中各類子信息的相似度,確定所述兩兩職位間的相似度。
在一種可能的設計中,所述M類子信息包括下述中的至少一種:
職位基本信息、職位描述信息或職位重要信息。
在一種可能的設計中,所述職位基本信息包括下述中的至少一種:
學歷要求、工作年限、公司行業(yè)、公司資質(zhì)、公司類型或工作地點。
在一種可能的設計中,所述職位描述信息包括:
職責描述和/或技能要求。
在一種可能的設計中,所述職位重要信息包括:薪資范圍。
在一種可能的設計中,所述根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位,包括:
根據(jù)所述兩兩職位間的相似度,將與所述各職位的相似度大于或等于預設相似度的職位,確定為所述各職位的相似職位;
或者,
根據(jù)所述兩兩職位間的相似度,將與所述各職位間最相似的預設數(shù)量個職位,確定為所述各職位的相似職位。
在一種可能的設計中,所述根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位之后,還包括:
確定求職者當前瀏覽的職位為所述N個職位中的第一職位,并將所述第一職位的相似職位推薦給所述求職者。
在一種可能的設計中,所述根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位之后,還包括:
根據(jù)所述各職位與所述各職位的相似職位間的相似度,對所述各職位的相似職位進行降序排序。
第二方面,本發(fā)明提供一種確定相似職位的裝置,包括:
相似度確定模塊,用于根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度;其中,N為大于1的整數(shù);
相似職位確定模塊,用于根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位。
在一種可能的設計中,所述相似度確定模塊,具體用于:
將所述N個職位中各職位的職位信息劃分為M類子信息;其中,M為大于1的整數(shù);
根據(jù)所述N個職位的各類子信息,確定所述兩兩職位間各類子信息的相似度;
根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度。
在一種可能的設計中,所述相似度確定模塊,根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度,具體包括:
根據(jù)所述求職者的輸入,確定基于所述M類子信息中的K類子信息確定所述兩兩職位間的相似度;其中,K為大于0且小于或等于M的整數(shù);
根據(jù)所述兩兩職位間所述K類子信息中各類子信息的相似度,確定所述兩兩職位間的相似度。
在一種可能的設計中,所述M類子信息包括下述中的至少一種:
職位基本信息、職位描述信息或職位重要信息。
在一種可能的設計中,所述職位基本信息包括下述中的至少一種:
學歷要求、工作年限、公司行業(yè)、公司資質(zhì)、公司類型或工作地點。
在一種可能的設計中,所述職位描述信息包括:
職責描述和/或技能要求。
在一種可能的設計中,所述職位重要信息包括:薪資范圍。
在一種可能的設計中,所述相似職位確定模塊,具體用于:
根據(jù)所述兩兩職位間的相似度,將與所述各職位的相似度大于或等于預設相似度的職位,確定為所述各職位的相似職位;
或者,
根據(jù)所述兩兩職位間的相似度,將與所述各職位間最相似的預設數(shù)量個職位,確定為所述各職位的相似職位。
在一種可能的設計中,所述裝置還包括:推薦模塊,用于確定求職者當前瀏覽的職位為所述N個職位中的第一職位,并將所述第一職位的相似職位推薦給所述求職者。
在一種可能的設計中,所述裝置還包括:排序模塊,用于根據(jù)所述各職位與所述各職位的相似職位間的相似度,對所述各職位的相似職位進行降序排序。
本發(fā)明提供的確定相似職位的方法及裝置,通過根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度,并根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位,實現(xiàn)了根據(jù)職位固有的職位信息來確定相似職位,與現(xiàn)有技術中將與用戶輸入的關鍵字匹配的所有職位都互相確定為相似職位相比,所確定的相似職位的準確性更高,從而提高了所確定的相似職位的準確性。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明確定相似職位的方法實施例一的流程圖;
圖2為本發(fā)明確定相似職位的方法實施例二的流程圖;
圖3為本發(fā)明確定兩兩職位間職位基本信息的相似度的流程示意圖;
圖4為本發(fā)明確定兩兩職位間職位描述信息的相似度的流程示意圖;
圖5為本發(fā)明確定兩兩職位間職位重要信息的相似度的流程示意圖;
圖6為本發(fā)明處理兩兩職位間的相似度的流程示意圖;
圖7為本發(fā)明確定相似職位的裝置的結構示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖1為本發(fā)明確定相似職位的方法實施例一的流程圖,本實施例的方法可以應用于任何需要確定相似職位的系統(tǒng)中,例如職位推薦系統(tǒng)中,具體可以由運行該系統(tǒng)的設備執(zhí)行。如圖1所示,本實施例的方法可以包括:
步驟101、根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度。
本步驟中,N為大于1的整數(shù)。其中,所述職位由用人單位(即,公司)提供。職位的職位信息是指在該職位的職位詳情頁中所呈現(xiàn)出的所有關于該職位的信息??蛇x的,所述職位信息包括:學歷要求、工作年限、公司資質(zhì)、公司類型、公司行業(yè)、公司地點、職責描述、技能要求、薪資范圍等等。在上述職位信息中,可以根據(jù)實際情況確定當兩個職位的職位信息中的某一項不相同時,可以認為這兩個職位為不相似(即,相似度為0)的兩個職位。例如,由于求職者在求職時一般都需要選擇同一工作地點的職位,因此當職位1與職位2工作地點不相同時,可以認為職位1與職位2相似度為0。再例如,由于公司行業(yè)的不同時所提供的職位一般也完全不同,因此當職位1與職位2分別所屬公司的公司行業(yè)不同時,可以認為職位1與職位2的相似度為0。可選的,所述N個職位可以為該系統(tǒng)中的所有職位,或者也可以為該系統(tǒng)中的部分職位。當所述N個職位為系統(tǒng)中的所有職位時,具體的可以在本步驟中確定職位間是否不相似。當所述N個職位為系統(tǒng)中的部分職位時,可以在進行本步驟前,預先根據(jù)確定職位間不相似的相關信息(例如,工作地點、公司行業(yè)等)對系統(tǒng)中所有的職位進行劃分,將有相似性可能(即,相似性不為0)的職位確定為該N個職位??蛇x的,由于公司所發(fā)布的職位都有對應的有效期限,因此上述系統(tǒng)中的所有職位優(yōu)選為系統(tǒng)中在有效期限內(nèi)的所有職位。
需要說明的是,本發(fā)明中,相似度越大表示越相似,相似度為0表示不相似。
步驟102、根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位。
本步驟中,根據(jù)由N個職位的職位信息確定的兩兩職位間的相似度,進一步確定各職位的相似職位。本步驟中確定的某一職位的相似職位的個數(shù)與推薦給求職者的該職位的相似職位的個數(shù)可以相等,或者,本步驟中確定的一職位的相似職位的個數(shù)可以大于推薦給求職者的該職位的相似職位的個數(shù)。
本實施例中,通過根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度,并根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位,實現(xiàn)了根據(jù)職位固有的職位信息來確定相似職位,與現(xiàn)有技術中將與用戶輸入的關鍵字匹配的所有職位都互相確定為相似職位相比,所確定的相似職位的準確性更高,從而提高了所確定的相似職位的準確性。
圖2為本發(fā)明確定相似職位的方法實施例二的流程圖,圖2在圖1所示實施例的基礎上主要描述了根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度的一種可選的實現(xiàn)方式。如圖2所示,本實施例的方法可以包括:
步驟201、將N個職位中各職位的職位信息劃分為M類子信息。
本步驟中,M為大于1的整數(shù)。具體的,可以根據(jù)職位信息的特點對職位信息進行劃分。可選的,上述M類子信息包括下述中的至少一種:職位基本信息、職位描述信息或職位重要信息??蛇x的,所述職位基本信息包括下述中的至少一種:學歷要求、工作年限、公司資質(zhì)、公司類型、公司行業(yè)或工作地點??蛇x的,所述職位描述信息包括:職責描述和/或技能要求??蛇x的,所述職位重要信息包括:薪資范圍。
步驟202、根據(jù)所述N個職位的各類子信息,確定所述N個職位中兩兩職位間各類子信息的相似度。
本步驟中,假設M=3,且該3類子信息分別為職位基本信息、職位描述信息和職位重要信息。以下對具體確定兩兩職位間各類子信息的相似度進行舉例說明。具體的,可以通過如下方式1確定兩兩職位間職位基本信息的相似度,可以通過如下方式2確定兩兩職位間職位描述信息的相似度,可以通過如下方式3確定兩兩職位間職位重要信息的相似度。
方式1
如圖3所示,職位A的職位基本信息包括了學歷要求、工作地點、公司類型等,其中學歷要求例如為本科、工作地點例如為上海、公司類型例如為私營;職位B的職位基本信息同樣包括了學歷要求、工作地點、公司類型等,其中學歷要求例如為本科,工作地點例如為北京,公司類型例如為國有。首先,對職位A和職位B的職位基本信息進行離散化。具體的,可以將職位A的職位基本信息中各信息都離散化為1,將職位B的職位基本信息中的各信息與職位A的職位基本信息中的相應信息進行比較,若相同則離散化為1,否則離散化為0?;谏鲜鰧β毼籄及職位B的職位基本信息的假設,職位A離散化后的結果為“1、1、1”,職位B離散化后的結果為“1、0、0”。之后,將職位A離散化后的結果作為一個集合,將職位B離散化后的結果作為另一個集合,并確定這兩個集合的杰卡德相似系數(shù)。最終,將確定得到的杰卡德相似系數(shù)確定為職位A和職位B間職位基本信息的相似度。需要說明的是,方式1中進行離散化是可選步驟,方式1中也可以直接將職位A的職位基本信息作為一個集合,將職位B的職位基本信息作為另一個集合,并確定這兩個集合的杰卡德相似系數(shù)。
方式2
如圖4所示,職位A的職位描述信息包括了職責描述和技能要求,職位B的職位描述信息同樣包括了職責描述和技能要求。首先,對職位A的職位描述信息進行分詞獲得職位A分詞集合,并對職位B的職位描述信息進行分詞獲得職位B分詞集合。之后,從職位A分詞集合中提取關鍵詞獲得職位A關鍵詞集合,從職位B分詞集合中提取關鍵詞獲得職位B關鍵詞集合。之后,根據(jù)各主題詞的近義詞集合確定職位A關鍵詞集合對應的職位A主題詞集合,根據(jù)各主題詞的近義詞集合確定職位B關鍵詞集合對應的職位B主題詞集合。其中,主題詞的近義詞集合中體現(xiàn)出了該近義詞集合的各元素與該主題詞之間的語義關聯(lián)度。在具體實現(xiàn)時可以通過對所有職位的職位信息進行分詞、生成近義詞集合處理來獲得主題詞的近義詞集合。具體的,可以通過Word2Vector算法基于對所有職位的職位信息的分詞生成近義詞集合。需要說明的是,職位A主題詞集合包括職位A關鍵詞集合中各關鍵詞與其所屬的主題詞之間的語義關聯(lián)度,職位B主題詞集合包括職位B關鍵詞集合中各關鍵詞與其所屬的主題詞之間的語義關聯(lián)度。之后,確定職位A主題詞集合與職位B主題詞集合的修正余弦相似度。最終,將確定得到的修正余弦相似度確定為職位A和職位B間職位描述信息的相似度。
方式3
如圖5所示,職位A的職位重要信息包括了薪資范圍,職位B的職位重要信息同樣包括了薪資范圍。首先,判斷職位A與職位B的薪資范圍是否重合。當不重合時,確定職位A和職位B間職位重要信息的相似度為0。當重合時,進一步的可以根據(jù)職位A和職位B的薪資范圍中的最高薪資確定職位A和職位B間職位重要信息的相似度。具體的,可以通過職位A和職位B的最高薪資中較低薪資除以較高薪資的方式確定職位A和職位B間職位重要信息的相似度。例如,假設職位A的最高薪資為一萬元,職位B的最高薪資為一萬六千元,則職位A和職位B間職位重要信息的相似度為0.625??蛇x的,也可以通過職位A和職位B的薪資范圍中的平均薪資確定職位A和職位B間職位重要信息的相似度。
步驟203、根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度。
本步驟中,可以根據(jù)所述兩兩職位間某一類或多類子信息的相似度,確定所述兩兩職位間的相似度。具體可以包括:根據(jù)求職者的輸入,確定基于所述M類子信息中的K類子信息確定所述兩兩職位間的相似度;其中,K為大于0且小于或等于M的整數(shù);根據(jù)所述兩兩職位間所述K類子信息中各類子信息的相似度,確定所述兩兩職位間的相似度。具體的,可以通過求職者在人才招聘網(wǎng)站上所選擇的相似度確定方式,確定基于所述M類子信息中的哪一類或哪幾類子信息確定兩兩職位間的相似度。其中,所述相似度確定方式指示了使用所述M類子信息中的哪一類或哪幾類確定兩兩職位間的相似度。當根據(jù)用戶的輸入確定基于M類子信息中的一類子信息(即,K等于1)確定所述兩兩職位間的相似度時,可以直接將兩兩職位間該類子信息的相似度作為所述兩兩職位間的相似度。當根據(jù)用戶的輸入確定基于M類子信息中多類子信息(即,K大于1)確定所述兩兩職位間的相似度時,可以將兩兩職位間該多類子信息的相似度直接平均或加權求和后作為所述兩兩職位間的相似度。
步驟204、根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位。
本步驟中,具體可以為根據(jù)所述兩兩職位間的相似度,將與所述各職位的相似度大于或等于預設相似度的職位,確定為所述各職位的相似職位?;蛘咭部梢詾楦鶕?jù)所述兩兩職位間的相似度,將與所述各職位間最相似的預設數(shù)量個職位,確定為所述各職位的相似職位??蛇x的,在步驟204之后還可以包括:將各職位的相似職位存儲在存儲設備中。例如,可以將各職位的相似職位存儲在HBase數(shù)據(jù)庫中。可選的,在步驟204之后還可以包括:根據(jù)所述各職位與所述各職位的相似職位間的相似度,對所述各職位的相似職位進行降序排序。
例如,如圖6所示,職位A與職位C間的相似度S(A,C)等于0.7,職位A與職位B間的相似度S(A,B)等于0.75,職位A與職位D間的相似度S(A,D)等于0.65,職位A與職位E間的相似度S(A,E)等于0.35,且職位B、職位C、職位D、職位E都為職位A的相似職位。在對職位A的相似職位進行存儲之前,可以根據(jù)職位A與職位A的相似職位間的相似度對職位A的相似職位進行降序排序。具體的,排序后的順序為職位B、職位C、職位D、職位E。在排序后可以將排序后的結果存儲至HBase數(shù)據(jù)庫中。
可選的,本實施例的系統(tǒng)還可以執(zhí)行職位推薦的相關操作,具體步驟205所示。
步驟205、確定求職者當前瀏覽的職位為所述N個職位中的第一職位,并將所述第一職位的相似職位推薦給所述求職者。
本步驟中,求職者可以通過打開人才招聘網(wǎng)站的某一職位的職位詳情頁來瀏覽該職位。因此,用于前端頁面展示的前端展示系統(tǒng)可以通過將求職者所打開的職位詳情頁對應的職位確定為第一職位。如圖6所示,求職者瀏覽職位A的職位詳情頁時,前端展示系統(tǒng)可以從職位A的職位詳情頁中獲得職位A的標識(ID,Identity),并將獲得的職位A的ID發(fā)送至職位推薦系統(tǒng)。職位推薦系統(tǒng)在獲得職位A的ID后可以根據(jù)職位A的ID從HBase數(shù)據(jù)庫中獲得職位A的相似職位(具體可以是一個相似職位的列表,該列表中元素的先后順序體現(xiàn)出其與職位A的相似度,元素越靠前相似度越大),并將職位A的相似職位發(fā)送給前端展示系統(tǒng)以使前端展示系統(tǒng)生成職位A的相似職位的可點擊跳轉(zhuǎn)的鏈接,并通過職位A的職位詳情頁對職位A的相似職位及鏈接進行展示。
需要說明的是,上述職位詳情頁可以用于展示與該職位詳情頁對應的職位的信息,進一步的還可以用于展示該職位詳情頁對應的職位的相似職位。
本實施例中,通過根據(jù)N個職位的各類子信息,確定所述N個職位中兩兩職位間各類子信息的相似度,根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度,并根據(jù)所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位,實現(xiàn)了根據(jù)職位信息確定職位間的相似性,從而提高了所確定的相似職位的準確性。同時,通過確定求職者當前瀏覽的職位為所述N個職位中的第一職位,并將所述第一職位的相似職位推薦給所述求職者,提高了向應聘者推薦的職位的準確率,從而提高了應聘者找到合適職位的效率。
圖7為本發(fā)明確定相似職位的裝置的結構示意圖,本實施例提供的裝置可以應用于圖1-圖2實施例的方法中,實現(xiàn)其系統(tǒng)的功能。如圖7所示,本實施例的裝置可以包括:相似度確定模塊701和相似職位確定模塊702。其中,相似度確定模塊701,用于根據(jù)N個職位的職位信息,確定所述N個職位中兩兩職位間的相似度;其中,N為大于1的整數(shù);相似職位確定模塊702,用于根據(jù)相似度確定模塊701確定的所述兩兩職位間的相似度,確定所述N個職位中各職位的相似職位。
可選的,相似度確定模塊701,具體用于:將所述N個職位中各職位的職位信息劃分為M類子信息;其中,M為大于1的整數(shù);根據(jù)所述N個職位的各類子信息,確定所述兩兩職位間各類子信息的相似度;根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度。
進一步可選的,相似度確定模塊701,根據(jù)所述兩兩職位間各類子信息的相似度,確定所述兩兩職位間的相似度,具體包括:根據(jù)所述求職者的輸入,確定基于所述M類子信息中的K類子信息確定所述兩兩職位間的相似度;其中,K為大于0且小于或等于M的整數(shù);根據(jù)所述兩兩職位間所述K類子信息中各類子信息的相似度,確定所述兩兩職位間的相似度。
可選的,所述M類子信息包括下述中的至少一種:職位基本信息、職位描述信息或職位重要信息。
可選的,所述職位基本信息包括下述中的至少一種:學歷要求、工作年限、公司行業(yè)、公司資質(zhì)、公司類型或工作地點。
可選的,所述職位描述信息包括:職責描述和/或技能要求。
可選的,所述職位重要信息包括:薪資范圍。
可選的,所述相似職位確定模塊702,具體用于:根據(jù)所述兩兩職位間的相似度,將與所述各職位的相似度大于或等于預設相似度的職位,確定為所述各職位的相似職位;或者,根據(jù)所述兩兩職位間的相似度,將與所述各職位間最相似的預設數(shù)量個職位,確定為所述各職位的相似職位。
可選的,本實施例的裝置還包括:推薦模塊703,用于確定求職者當前瀏覽的職位為所述N個職位中的第一職位,并將所述第一職位的相似職位推薦給所述求職者。
可選的,本實施例的裝置還包括:排序模塊704,用于根據(jù)所述各職位與所述各職位的相似職位間的相似度,對所述各職位的相似職位進行降序排序。
本實施例的裝置,可以用于執(zhí)行圖1-圖2所示方法實施例的技術方案,其實現(xiàn)原理和技術效果類似,此處不再贅述。
本領域普通技術人員可以理解:實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質(zhì)脫離本發(fā)明各實施例技術方案的范圍。