本發(fā)明涉及人員招聘,尤其涉及一種確定簡歷級別的方法及裝置。
背景技術:
在招聘業(yè)務線中,存有著大量的人員投遞的簡歷。招聘人員需要在這海量的簡歷中找到所需的工作人員,任務量大,且查找工作單調乏味。
技術實現要素:
本發(fā)明提供一種確定簡歷級別的方法及裝置,可幫助招聘人員根據應聘者簡歷的級別更好的識別應聘者的優(yōu)秀程度,更為有效的搜尋各種等級需求的人員。
第一方面,本發(fā)明提供一種確定簡歷級別的方法,包括:獲取目標簡歷的特征信息,所述特征信息包括應聘者基本信息、工作經歷、專業(yè)技能和過往榮譽;根據所述特征信息及預設分類算法,確定所述目標簡歷的級別。
進一步地,所述獲取目標簡歷的特征信息,包括:提取所述目標簡歷的特征;對所述特征進行特征處理,獲得所述特征信息,所述特征信息為特征類型與特征數據的對應關系。
進一步地,所述根據所述特征信息及預設分類算法,確定所述目標簡歷的級別,包括:將所述特征信息輸入至簡歷評級模型,確定所述目標簡歷的級別,所述簡歷評級模型是根據邏輯回歸算法獲得的。
進一步地,所述根據邏輯回歸算法獲得所述簡歷評級模型之后,所述方法還可以包括:采用驗證矩陣對所述簡歷評級模型進行調優(yōu)處理,獲得優(yōu)化后的簡歷評級模型,所述驗證矩陣用于優(yōu)化所述簡歷評級模型,所述驗證矩陣包括受試者工作特征曲線ROC曲線、平衡F分數和召回率。
進一步地,不同行業(yè)所對應的所述簡歷評級模型不同。
第二方面,本發(fā)明提供一種確定簡歷級別的裝置,包括:獲取模塊,用于獲取目標簡歷的特征信息,所述特征信息包括應聘者基本信息、工作經歷、專業(yè)技能和過往榮譽;處理模塊,用于根據所述獲取模塊獲得的所述特征信息及預設分類算法,確定所述目標簡歷的級別。
進一步地,所述獲取模塊具體用于:提取所述目標簡歷的特征;對所述特征進行特征處理,獲得所述特征信息,所述特征信息為特征類型與特征數據的對應關系。
進一步地,所述處理模塊具體用于:將所述特征信息輸入至簡歷評級模型,確定所述目標簡歷的級別,所述簡歷評級模型是根據邏輯回歸算法獲得的。
進一步地,所述處理模塊還可以用于:在根據邏輯回歸算法獲得所述簡歷評級模型之后,采用驗證矩陣對所述簡歷評級模型進行調優(yōu)處理,獲得優(yōu)化后的簡歷評級模型,所述驗證矩陣用于優(yōu)化所述簡歷評級模型,所述驗證矩陣包括受試者工作特征曲線ROC曲線、平衡F分數和召回率。
進一步地,不同行業(yè)所對應的所述簡歷評級模型不同。
本發(fā)明提供的確定簡歷級別的方法及裝置,根據應聘者簡歷的特征信息,結合預設分類算法,確定該應聘者簡歷的級別,可以幫助招聘人員根據應聘者簡歷的級別更好的識別應聘者的優(yōu)秀程度,更為有效的搜尋各種等級需求的人員。
附圖說明
為了更清楚地說明本發(fā)明或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發(fā)明確定簡歷級別的方法實施例一的流程圖;
圖2為本發(fā)明獲取測試樣本集合的示意圖;
圖3為本發(fā)明獲取訓練模型的示意圖;
圖4為本發(fā)明獲取優(yōu)化模型的示意圖;
圖5為本發(fā)明確定簡歷級別的裝置實施例一的結構示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明中的附圖,對本發(fā)明中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的說明書和權利要求書中的術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
現有技術中,招聘企業(yè)在找尋簡歷的時,無法有效的認知簡歷所有者所處的一個明確的層級,例如有些企業(yè)希望招聘高端人才,但是目前簡歷的各種顯示信息中無明確的表明,企業(yè)需要花費大量時間閱讀簡歷信息,才能從中篩選出需要的人才,既耗時又費力。
基于上述問題,本發(fā)明提供一種確定簡歷級別的方法及裝置,通過確定簡歷的級別,級別例如為新人、一般、精英、資深及更高等,以幫助招聘人員根據應聘者簡歷的級別更好的識別應聘者的優(yōu)秀程度,更為有效的搜尋各種等級需求的人員,提升用戶體驗;且,能夠使簡歷投遞人員了解自身水平,加強對自身的定位理解。
圖1為本發(fā)明確定簡歷級別的方法實施例一的流程圖,如圖1所示,本實施例的方法包括:
S101、獲取目標簡歷的特征信息,該特征信息包括應聘者基本信息、工作經歷、專業(yè)技能和過往榮譽。
其中,基本信息例如為年齡、學歷及畢業(yè)學校等。
S102、根據特征信息及預設分類算法,確定該目標簡歷的級別。
該步驟中,預設分類算法具體為預先設定的基于機器學習的分類算法,包括但不限于邏輯回歸算法。其中,機器學習(Machine Learning,簡稱:ML)主要使用歸納、綜合方法。
基于機器學習的分類算法主要是將樣本集分為訓練樣本集合和測試樣本集合;使用其中的訓練樣本集合進行訓練獲得訓練模型;之后,再使用其中的測試樣本集合對該訓練模型進行測試優(yōu)化,得到最后的優(yōu)化模型。
結合本實施例,首先,在簡歷數據庫中抽取部分簡歷;對該部分簡歷中每一簡歷,根據該簡歷對應的特征信息,采用預定的級別,例如為新人、一般、精英、資深及更高共四類,確定簡歷的級別,從而確定測試樣本集合,如圖2所示,其中,虛線部分為特征信息示例說明,具體參考圖示,此處不再一一贅述;采用預設分類算法對該訓練樣本集合進行訓練,獲得訓練模型,如圖3所示;最后,采用測試樣本集合對該訓練模型進行測試優(yōu)化,得到最后的優(yōu)化模型,即下文中提及的簡歷評級模型,如圖4所示。其中,測試樣本集合中,可將簡歷、該簡歷的特征信息與該簡歷的級別根據簡歷標識(例如ID或名稱)進行對應,例如圖3中所示的“簡歷A_1簡歷A_1的特征信息簡歷A_1的級別。
補充說明的是,在對該訓練模型進行測試優(yōu)化,得到最后的優(yōu)化模型的過程中,根據測試樣本集合中簡歷的測試結果進行樣本集、預設分類算法參數和特征信息的調整,以得到最優(yōu)模型。例如,樣本集調整可以包括訓練樣本集合和測試樣本集合的比例設置和樣本集采集數量調整等;預設分類算法參數調整可以包括損失參數的設置、正則化規(guī)則的設置、正則系數的設置和迭代次數的調整等;特征信息調整可以包括特征的選取、特征離散化的設置以及特征標準化的調整,等等。上述僅為示例說明,具體樣本集、預設分類算法參數和特征信息的調整可根據實際需求進行設置,本發(fā)明不對其進行限制。
可選地,該步驟可以包括:將特征信息輸入至簡歷評級模型,確定目標簡歷的級別,該簡歷評級模型是根據邏輯回歸算法獲得的。
本實施例提供的確定簡歷級別的方法,根據應聘者簡歷的特征信息,結合預設分類算法,確定該應聘者簡歷的級別,可以幫助招聘人員根據應聘者簡歷的級別更好的識別應聘者的優(yōu)秀程度,更為有效的搜尋各種等級需求的人員。
在上述實施例的基礎上,獲取目標簡歷的特征信息可以包括:提取目標簡歷的特征;對特征進行特征處理,獲得特征信息,該特征信息為特征類型與特征數據的對應關系。
首先,提取目標簡歷的特征,包括:基本特征、工作特征、技能特征和榮譽特征等。
然后,對于上述特征處理,獲得特征信息。具體如下:
1、對基本特征進行特征處理獲得基本信息
基本特征中主要包含對于確定級別有用的信息,基本信息例如年齡、婚否和學歷等。
與基本特征相對應,基本信息例如為:年齡23、婚否否、學歷碩士。
2、對工作特征進行特征處理獲得工作經歷
工作特征主要包含以往的工作的公司、公司規(guī)模、每段工作經歷的年限、在工作中主要擔當的職責、日常的匯報對象、日常的下屬信息等。
與工作特征相對應,工作經歷例如為:公司騰訊、年限4。
因為用戶的簡歷實際是通過在網站中填選后生成,所以相關信息已經存儲為結構化數據存儲于數據庫中,并不需要進行分詞后的結構化處理。
3、對技能特征進行特征處理獲得專業(yè)技能
專業(yè)技能處理最終形式為:技能名稱使用時長。例如,JAVA 10。
4、對榮譽特征進行特征處理獲得過往榮譽
通過有效歸類,將榮譽特征拆分為以下幾種:在校榮譽、公司榮譽、社會榮譽和專業(yè)榮譽等。
過往榮譽處理最終形式為:榮譽類型榮譽獲取數量,例如,公司榮譽3。
進一步地,在根據邏輯回歸算法獲得簡歷評級模型之后,該方法還可以包括:采用驗證矩陣對簡歷評級模型進行調優(yōu)處理,獲得優(yōu)化后的簡歷評級模型。其中,驗證矩陣用于優(yōu)化簡歷評級模型,該驗證矩陣可以包括受試者工作特征曲線(receiver operating characteristic curve:簡稱ROC)曲線、平衡F分數(包括F1SCORE和F2SCORE)和召回率(RECALL),等等,如圖4所示。
另外,由于不同行業(yè)在能力水平上的劃分有較大的差別,所以在將樣本集輸入到預設分類算法之前,根據不同的行業(yè),將簡歷進行二次拆分,按照不同的行業(yè)輸入到對應的預設分類算法中,最終生成的簡歷評級模型實際為多個,每一個行業(yè)都會有一個簡歷評級模型。
圖5為本發(fā)明確定簡歷級別的裝置實施例一的結構示意圖,如圖5所示,本實施例確定簡歷級別的裝置10包括:獲取模塊11和處理模塊12。其中,獲取模塊11和處理模塊12耦接。
該獲取模塊11,用于獲取目標簡歷的特征信息。該特征信息可以包括應聘者基本信息、工作經歷、專業(yè)技能和過往榮譽,等等
該處理模塊12,用于根據獲取模塊11獲得的特征信息及預設分類算法,確定目標簡歷的級別。
本實施例的裝置,可以用于執(zhí)行圖1所示方法實施例的技術方案,其實現原理類似,此處不再贅述。
可選地,獲取模塊11可具體用于:提取目標簡歷的特征;對目標簡歷的特征進行特征處理,獲得特征信息。該特征信息可以具體為特征類型與特征數據的對應關系。
可選地,處理模塊12可具體用于:將特征信息輸入至簡歷評級模型,確定目標簡歷的級別。其中,該簡歷評級模型可以是處理模塊12根據邏輯回歸算法獲得的,但本發(fā)明不以此為限制,也就是說,簡歷評級模型也可以是處理模塊12根據其他預設分類算法獲得的,其他預設分類算法例如為基于支撐向量機的分類算法,等等。
進一步地,處理模塊12還可以用于:在根據邏輯回歸算法獲得簡歷評級模型之后,采用驗證矩陣對簡歷評級模型進行調優(yōu)處理,獲得優(yōu)化后的簡歷評級模型。該驗證矩陣用于優(yōu)化所述簡歷評級模型。具體地,驗證矩陣可以包括ROC曲線、平衡F分數(包括F1SCORE和F2SCORE)和召回率等。
還需說明的是,不同行業(yè)所對應的簡歷評級模型可相同或不同。當不同行業(yè)所對應的簡歷評級模型不同時,處理模塊12分別根據邏輯回歸算法獲得不同行業(yè)的簡歷評級模型。也即,不同行業(yè)的簡歷評級模型對應的訓練樣本集合及測試樣本集合均是基于各自行業(yè)的。
本實施例提供的確定簡歷級別的裝置,根據應聘者簡歷的特征信息,結合預設分類算法,確定該應聘者簡歷的級別,可以幫助招聘人員根據應聘者簡歷的級別更好的識別應聘者的優(yōu)秀程度,更為有效的搜尋各種等級需求的人員。
本領域普通技術人員可以理解:實現上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可獲取存儲介質中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質。
最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的范圍。