亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法

文檔序號(hào):10726006閱讀:371來源:國知局
一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法
【專利摘要】本發(fā)明設(shè)計(jì)了一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,在保證匹配正確率的同時(shí)可以匹配自由格式的簡歷,以及匹配分段的工作經(jīng)歷和教育經(jīng)歷。本發(fā)明可以為各種不同文件格式、不同語言、自由排版的簡歷提取所有字段,格式化為標(biāo)準(zhǔn)的統(tǒng)一格式的簡歷。支持的文件格式有doc、docx,pdf、txt和html等,支持的語言有中文和英文。對(duì)中文簡歷的解析提取正確率在95%以上,每分鐘可以解析200—300份簡歷,每天可以處理15—30萬份簡歷,節(jié)省人工簡歷處理時(shí)間達(dá)99.9%,節(jié)約人力成本超過85%。本發(fā)明部署在互聯(lián)網(wǎng)上,可以為各招聘網(wǎng)站、軟件公司、獵頭公司/人才中介機(jī)構(gòu)和企業(yè)的HR部門提供簡歷的解析服務(wù)。
【專利說明】
一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是指一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,通過電子郵件接收應(yīng)聘簡歷的人才招聘方式不斷得到各招聘者的青睞。
[0003]目前,招聘者一般會(huì)在發(fā)布的招聘啟事中公布用于接收應(yīng)聘簡歷的招聘郵箱。這樣,應(yīng)聘者可以根據(jù)招聘單位公布的招聘郵箱,將簡歷郵件直接發(fā)送至招聘郵箱中。同時(shí),招聘者通過簡歷解析系統(tǒng)對(duì)招聘郵箱中接收的簡歷郵件進(jìn)行解析,提取出關(guān)鍵字和關(guān)鍵內(nèi)容。從而減輕工作壓力,提高效率。
[0004]現(xiàn)有的很多技術(shù)方案采用簡單的關(guān)鍵字匹配方法,比如要提取簡歷中的姓名,一定要在姓名的內(nèi)容前找到“姓名”的關(guān)鍵字,性別前要找到“性別”關(guān)鍵字,采用這種簡單的關(guān)鍵字匹配的方法,只能匹配特定格式的簡歷,對(duì)自由格式的簡歷匹配準(zhǔn)確率低。
[0005]而且現(xiàn)有的很多方案不能匹配工作經(jīng)歷和教育經(jīng)歷中的分段經(jīng)歷,導(dǎo)致無法知道該人才在特定的時(shí)間內(nèi)處于什么階段。

【發(fā)明內(nèi)容】

[0006]針對(duì)上述現(xiàn)有技術(shù)的缺陷及存在的技術(shù)問題,本發(fā)明設(shè)計(jì)了一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,在保證匹配正確率的同時(shí)可以匹配自由格式的簡歷,以及匹配分段的工作經(jīng)歷和教育經(jīng)歷。
[0007]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,系統(tǒng)是指基于云服務(wù)開發(fā)的一種應(yīng)用系統(tǒng),其實(shí)施流程如下:
[0008]1、企業(yè)HR登陸系統(tǒng),將收到的各類簡歷郵件上傳到系統(tǒng)中;
[0009]2、系統(tǒng)判斷簡歷格式是否支持,將格式符合系統(tǒng)要求的簡歷文件進(jìn)行解析;
[0010]3、系統(tǒng)將解析后的簡歷統(tǒng)一格式化后導(dǎo)出;
[0011]進(jìn)一步地,所述簡歷郵件解析系統(tǒng)支持的文件格式有doc、docx、pdf、txt和html,支持的語言包括中文和英文;
[0012]進(jìn)一步地,所述簡歷郵件解析系統(tǒng)根據(jù)如下方法對(duì)簡歷進(jìn)行解析:
[0013]首先提取簡歷語言,按照不同語言初始化解析器,再采用分部提取的方法,先按照關(guān)鍵字等特征提取簡歷中的類,然后對(duì)工作經(jīng)歷類、教育經(jīng)歷類和項(xiàng)目經(jīng)驗(yàn)類進(jìn)行提取分段,再對(duì)類和分段提取字段,如果未提取到關(guān)鍵信息類再對(duì)簡歷文本進(jìn)行一次回溯匹配。
[0014]進(jìn)一步地,所述類為:具有某一共同特征的文本,比如在簡歷中的基本信息類、工作經(jīng)歷類、教育經(jīng)歷類、項(xiàng)目經(jīng)驗(yàn)類等。
[0015]進(jìn)一步地,所述分段為:指類中某時(shí)間階段關(guān)聯(lián)的文本,比如工作經(jīng)歷、教育經(jīng)歷、項(xiàng)目經(jīng)驗(yàn)中某一時(shí)間段的文本。
[0016]進(jìn)一步地,所述字段:是指簡歷文本中表達(dá)實(shí)際含義的最小單位,比如“男”、“女”這種是只有內(nèi)容,沒有標(biāo)題的字段,還有一種是“工作地:上海”這種既有標(biāo)題又有內(nèi)容的字段。
[0017]進(jìn)一步地,對(duì)于沒有關(guān)鍵字的簡歷內(nèi)容,采用云端的特征匹配的算法,對(duì)簡歷的姓名、公司、行業(yè)、職位、職能、學(xué)校、專業(yè)、證書等內(nèi)容和部署在云上的特征庫進(jìn)行匹配,極大的提高了匹配的準(zhǔn)確度和完整度。
[0018]進(jìn)一步地,對(duì)于簡歷內(nèi)容中包含時(shí)間段的內(nèi)容采用回溯算法,時(shí)間段是一個(gè)比較特殊的文本信息,一般出現(xiàn)在工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)中,如果在按照關(guān)鍵字匹配的時(shí)候未匹配到工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)的類信息,但是文本中又出現(xiàn)了時(shí)間段,這時(shí)就需要在時(shí)間段附近尋找類的特征信息,比如找到了類似某某公司,那么可以基本確定這是工作經(jīng)歷,這時(shí)就可以啟動(dòng)回溯算法,重新去提取工作經(jīng)歷,然后再執(zhí)行一遍提取分段,提取字段的過程。
[0019]基于上述發(fā)明的簡歷郵件解析系統(tǒng)及方法,與現(xiàn)有技術(shù)相比,本發(fā)明可以為各種不同文件格式、不同語言、自由排版的簡歷提取所有字段,格式化為標(biāo)準(zhǔn)的統(tǒng)一格式的簡歷。支持的文件格式有doc、docx,pdf、txt和html等,支持的語言有中文和英文。對(duì)中文簡歷的解析提取正確率在95%以上,每分鐘可以解析200—300份簡歷,每天可以處理15—30萬份簡歷,節(jié)省人工簡歷處理時(shí)間達(dá)99.9%,節(jié)約人力成本超過85%。本發(fā)明部署在互聯(lián)網(wǎng)上,可以為各招聘網(wǎng)站、軟件公司、獵頭公司/人才中介機(jī)構(gòu)和企業(yè)的HR部門提供簡歷的解析服務(wù)。
【附圖說明】
[0020]圖1是本發(fā)明的總體思路流程示意圖。
[0021]圖2是本發(fā)明的簡歷解析流程圖。
【具體實(shí)施方式】
[0022]下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】作詳細(xì)說明,進(jìn)一步闡明本發(fā)明的優(yōu)點(diǎn)及相對(duì)于現(xiàn)有技術(shù)的突出貢獻(xiàn),可以理解的,下述的實(shí)施例僅是對(duì)本發(fā)明較佳實(shí)施方案的詳細(xì)說明,不應(yīng)該解釋為對(duì)本發(fā)明技術(shù)方案的任何限制。
[0023]如圖1-2所示,本發(fā)明提供一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,系統(tǒng)是指基于云服務(wù)開發(fā)的一種應(yīng)用系統(tǒng),其實(shí)施流程如下:
[0024]1、企業(yè)HR登陸系統(tǒng),將收到的各類簡歷郵件上傳到系統(tǒng)中;
[0025]2、系統(tǒng)判斷簡歷格式是否支持,將格式符合系統(tǒng)要求的簡歷文件進(jìn)行解析;
[0026]3、系統(tǒng)將解析后的簡歷統(tǒng)一格式化后導(dǎo)出;
[0027]進(jìn)一步地,所述簡歷郵件解析系統(tǒng)支持的文件格式有doc、docx、pdf、txt和html,支持的語言包括中文和英文;
[0028]進(jìn)一步地,所述簡歷郵件解析系統(tǒng)根據(jù)如下方法對(duì)簡歷進(jìn)行解析:
[0029]首先提取簡歷語言,按照不同語言初始化解析器,再采用分部提取的方法,先按照關(guān)鍵字等特征提取簡歷中的類,然后對(duì)工作經(jīng)歷類、教育經(jīng)歷類和項(xiàng)目經(jīng)驗(yàn)類進(jìn)行提取分段,再對(duì)類和分段提取字段,如果未提取到關(guān)鍵信息類再對(duì)簡歷文本進(jìn)行一次回溯匹配。
[0030]進(jìn)一步地,所述類為:具有某一共同特征的文本,比如在簡歷中的基本信息類、工作經(jīng)歷類、教育經(jīng)歷類、項(xiàng)目經(jīng)驗(yàn)類等。
[0031]進(jìn)一步地,所述分段為:指類中某時(shí)間階段關(guān)聯(lián)的文本,比如工作經(jīng)歷、教育經(jīng)歷、項(xiàng)目經(jīng)驗(yàn)中某一時(shí)間段的文本。
[0032]進(jìn)一步地,所述字段:是指簡歷文本中表達(dá)實(shí)際含義的最小單位,比如“男”、“女”這種是只有內(nèi)容,沒有標(biāo)題的字段,還有一種是“工作地:上海”這種既有標(biāo)題又有內(nèi)容的字段。
[0033]進(jìn)一步地,對(duì)于沒有關(guān)鍵字的簡歷內(nèi)容,采用云端的特征匹配的算法,對(duì)簡歷的姓名、公司、行業(yè)、職位、職能、學(xué)校、專業(yè)、證書等內(nèi)容和部署在云上的特征庫進(jìn)行匹配,極大的提高了匹配的準(zhǔn)確度和完整度。
[0034]進(jìn)一步地,對(duì)于簡歷內(nèi)容中包含時(shí)間段的內(nèi)容采用回溯算法,時(shí)間段是一個(gè)比較特殊的文本信息,一般出現(xiàn)在工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)中,如果在按照關(guān)鍵字匹配的時(shí)候未匹配到工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)的類信息,但是文本中又出現(xiàn)了時(shí)間段,這時(shí)就需要在時(shí)間段附近尋找類的特征信息,比如找到了類似某某公司,那么可以基本確定這是工作經(jīng)歷,這時(shí)就可以啟動(dòng)回溯算法,重新去提取工作經(jīng)歷,然后再執(zhí)行一遍提取分段,提取字段的過程。
[0035]基于上述發(fā)明的簡歷郵件解析系統(tǒng)及方法,與現(xiàn)有技術(shù)相比,本發(fā)明可以為各種不同文件格式、不同語言、自由排版的簡歷提取所有字段,格式化為標(biāo)準(zhǔn)的統(tǒng)一格式的簡歷。支持的文件格式有doc、docx,pdf、txt和html等,支持的語言有中文和英文。對(duì)中文簡歷的解析提取正確率在95%以上,每分鐘可以解析200—300份簡歷,每天可以處理15—30萬份簡歷,節(jié)省人工簡歷處理時(shí)間達(dá)99.9%,節(jié)約人力成本超過85%。本發(fā)明部署在互聯(lián)網(wǎng)上,可以為各招聘網(wǎng)站、軟件公司、獵頭公司/人才中介機(jī)構(gòu)和企業(yè)的HR部門提供簡歷的解析服務(wù)。
【主權(quán)項(xiàng)】
1.一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,其特征在于:所述系統(tǒng)是指基于云服務(wù)開發(fā)的一種應(yīng)用系統(tǒng),使整個(gè)系統(tǒng)實(shí)現(xiàn)簡歷解析后以統(tǒng)一格式導(dǎo)出。2.根據(jù)權(quán)利要求1所述的一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,其特征在于:所述簡歷郵件解析系統(tǒng)支持的文件格式有doc、docx、pdf、txt和html,支持的語言包括中文和英文。3.根據(jù)權(quán)利要求1所述的一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,其特征在于:所述簡歷郵件解析系統(tǒng)根據(jù)如下方法對(duì)簡歷進(jìn)行解析:首先提取簡歷語言,按照不同語言初始化解析器,再采用分部提取的方法,先按照關(guān)鍵字等特征提取簡歷中的類,然后對(duì)工作經(jīng)歷類、教育經(jīng)歷類和項(xiàng)目經(jīng)驗(yàn)類進(jìn)行提取分段,再對(duì)類和分段提取字段,如果未提取到關(guān)鍵信息類再對(duì)簡歷文本進(jìn)行一次回溯匹配。4.根據(jù)權(quán)利要求1所述的一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,其特征在于:對(duì)于沒有關(guān)鍵字的簡歷內(nèi)容,采用云端的特征匹配的算法,對(duì)簡歷的姓名、公司、行業(yè)、職位、職能、學(xué)校、專業(yè)、證書等內(nèi)容和部署在云上的特征庫進(jìn)行匹配。5.根據(jù)權(quán)利要求1所述的一種基于云服務(wù)的簡歷郵件解析系統(tǒng)及方法,其特征在于:對(duì)于簡歷內(nèi)容中包含時(shí)間段的內(nèi)容采用回溯算法,時(shí)間段是一個(gè)比較特殊的文本信息,一般出現(xiàn)在工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)中,如果在按照關(guān)鍵字匹配的時(shí)候未匹配到工作經(jīng)歷、教育經(jīng)歷和項(xiàng)目經(jīng)驗(yàn)的類信息,但是文本中又出現(xiàn)了時(shí)間段,這時(shí)就需要在時(shí)間段附近尋找類的特征信息,比如找到了類似某某公司,那么可以基本確定這是工作經(jīng)歷,這時(shí)就可以啟動(dòng)回溯算法,重新去提取工作經(jīng)歷,然后再執(zhí)行一遍提取分段,提取字段的過程。
【文檔編號(hào)】G06Q10/10GK106096913SQ201610412262
【公開日】2016年11月9日
【申請(qǐng)日】2016年6月14日 公開號(hào)201610412262.8, CN 106096913 A, CN 106096913A, CN 201610412262, CN-A-106096913, CN106096913 A, CN106096913A, CN201610412262, CN201610412262.8
【發(fā)明人】包谞斌, 胡健, 錢宏立
【申請(qǐng)人】嘉興飛刀軟件科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1