亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

電力項目防重復(fù)檢測方法及裝置與流程

文檔序號:12825909閱讀:251來源:國知局
電力項目防重復(fù)檢測方法及裝置與流程

本發(fā)明涉及數(shù)據(jù)庫技術(shù)領(lǐng)域,特別是涉及電力項目防重復(fù)檢測方法及裝置。



背景技術(shù):

電力企業(yè)項目種類繁多、數(shù)量龐大,在綜合計劃審核過程中需要處理海量的資料與數(shù)據(jù),防止實施重復(fù)的電力項目。

現(xiàn)有的審核方式為人工審核,由審核人員對比本次提交申請的電力項目的各種項目信息與之前通過審核的電力項目的各種信息。當(dāng)電力項目的某種項目信息不同時,審核人員還需要人工對比剩余項目信息,較為繁瑣。

可見,現(xiàn)有的審核方式增加了審核的時間,提高了人工成本,降低了審核效率。



技術(shù)實現(xiàn)要素:

本發(fā)明實施例的目的在于提供一種電力項目防重復(fù)檢測方法及裝置,以減少審核時間和成本,提高審核效率。具體技術(shù)方案如下:

一種電力項目防重復(fù)檢測方法,包括:

獲得用戶輸入的待檢測的電力項目信息;

確定所述電力項目信息中的關(guān)鍵詞;

根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;

按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;

將排序后的各項目信息作為檢測結(jié)果輸出。

可選的,所述預(yù)設(shè)電力項目檢索庫的構(gòu)建過程包括:

獲得多個電力項目文檔;

根據(jù)預(yù)設(shè)的項目關(guān)鍵字,獲得各所述電力項目文檔的項目信息;

確定各所述電力項目文檔的項目信息中的關(guān)鍵詞;

將各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建為預(yù)設(shè)電力項目檢索庫。

可選的,所述確定所述電力項目信息中的關(guān)鍵詞,包括:

對所述電力項目信息進行分詞,獲得多個詞語;

對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

可選的,所述確定各所述電力項目文檔的項目信息中的關(guān)鍵詞,包括:

對各所述電力項目文檔的項目信息進行分詞,獲得多個詞語;

對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

可選的,所述預(yù)設(shè)的項目關(guān)鍵字,包括:項目名稱、建設(shè)開始年份、項目所在地、電壓等級、建設(shè)內(nèi)容、項目性質(zhì)、項目所屬單位、主體名稱、購置內(nèi)容、業(yè)務(wù)科目、大修內(nèi)容、建設(shè)性質(zhì)、變壓站、變壓線、設(shè)備名稱、設(shè)備調(diào)度號、內(nèi)容名稱中的一個或多個。

可選的,在所述根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度之前,所述方法還包括:

獲得用戶輸入的電力項目的限定條件;

確定預(yù)設(shè)電力項目檢索庫中滿足所述限定條件的項目信息;

所述根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度,包括:

根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與滿足所述限定條件的各項目信息的相似度。

一種電力項目防重復(fù)檢測裝置,包括:信息獲得單元、關(guān)鍵詞確定單元、相似度計算單元、排序單元和輸出單元,

所述信息獲得單元,用于獲得用戶輸入的待檢測的電力項目信息;

所述關(guān)鍵詞確定單元,用于確定所述電力項目信息中的關(guān)鍵詞;

所述相似度計算單元,用于根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;

所述排序單元,用于按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;

所述輸出單元,用于將排序后的各項目信息作為檢測結(jié)果輸出。

可選的,所述裝置還包括:電力項目檢索庫構(gòu)建單元,所述電力項目檢索庫構(gòu)建單元包括:文檔獲得子單元、項目信息獲得子單元、關(guān)鍵詞確定子單元和構(gòu)建子單元,

所述文檔獲得子單元,用于獲得多個電力項目文檔;

所述項目信息獲得子單元,用于根據(jù)預(yù)設(shè)的項目關(guān)鍵字,獲得各所述電力項目文檔的項目信息;

所述關(guān)鍵詞確定子單元,用于確定各所述電力項目文檔的項目信息中的關(guān)鍵詞;

所述構(gòu)建子單元,用于將各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建為預(yù)設(shè)電力項目檢索庫。

可選的,所述關(guān)鍵詞確定單元包括:分詞子單元和分析子單元,

所述分詞子單元,用于對所述電力項目信息進行分詞,獲得多個詞語;

所述分析子單元,用于對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

可選的,所述裝置還包括:限定條件獲得單元和項目篩選單元,

所述限定條件獲得單元,用于在所述相似度計算單元計算相似度之前,獲得用戶輸入的電力項目的限定條件;

所述項目篩選單元,用于確定預(yù)設(shè)電力項目檢索庫中滿足所述限定條件的項目信息;

所述相似度計算單元,具體用于:

根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與滿足所述限定條件的各項目信息的相似度。

本發(fā)明實施例提供的一種電力項目防重復(fù)檢測方法及裝置,可以獲得用戶輸入的待檢測的電力項目信息;確定所述電力項目信息中的關(guān)鍵詞;根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;將排序后的各項目信息作為檢測結(jié)果輸出。本發(fā)明實現(xiàn)了電力項目的自動查找,可以按照相似度對預(yù)設(shè)電力項目檢索庫中各項目信息進行排序,使得審核人員可以輕易的確定是否有重復(fù)的電力項目,減少了審核時間和成本,提高了審核效率。

當(dāng)然,實施本發(fā)明的任一產(chǎn)品或方法必不一定需要同時達到以上所述的所有優(yōu)點。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例提供的一種電力項目防重復(fù)檢測方法的流程圖;

圖2為本發(fā)明實施例提供的一種電力項目防重復(fù)檢測方法的預(yù)設(shè)電力項目檢索庫的構(gòu)建過程流程圖;

圖3為本發(fā)明實施例提供的另一種電力項目防重復(fù)檢測方法的流程圖;

圖4為本發(fā)明實施例提供的一種電力項目防重復(fù)檢測裝置的結(jié)構(gòu)示意圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

如圖1所示,本發(fā)明實施例提供的一種電力項目防重復(fù)檢測方法,可以包括:

s100、獲得用戶輸入的待檢測的電力項目信息;

其中,電力項目信息可以具體包括:項目名稱、建設(shè)開始年份、項目所在地、電壓等級等中的一個或多個,例如:用戶輸入的待檢測的電力項目信息為:2016年的35kv電網(wǎng)基建項目。

s200、確定所述電力項目信息中的關(guān)鍵詞;

其中,步驟200可以包括:

對所述電力項目信息進行分詞,獲得多個詞語;

對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

具體的,可以使用paoding分析器進行分詞。

其中,語法分析(syntacticanalysis或parsing)是根據(jù)某種給定的形式文法對由單詞序列(如英語單詞序列)構(gòu)成的輸入文本進行分析并確定其語法結(jié)構(gòu)的一種過程。

具體的,可以使用語法分析器進行分詞及語法分析從而確定關(guān)鍵詞。語法分析器在進行語法分析后,可以生成語法分析樹,從而根據(jù)該語法分析樹確定關(guān)鍵詞。

仍使用“2016年35kv電網(wǎng)基建項目”為例進行說明,進行分詞后,獲得“2016年”、“的”、“35kv”、“電網(wǎng)”、“基建”、“項目”這些詞語。進行語法分析后,確定關(guān)鍵詞為:2016年”、“35kv”、“基建”。

s300、根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;

其中,如圖2所示,所述預(yù)設(shè)電力項目檢索庫的構(gòu)建過程可以包括:

s001、獲得多個電力項目文檔;

其中,步驟s001獲得的多個電力項目文檔可以為已審核通過的電力項目文檔。

s002、根據(jù)預(yù)設(shè)的項目關(guān)鍵字,獲得各所述電力項目文檔的項目信息;

其中,所述預(yù)設(shè)的項目關(guān)鍵字,可以包括:項目名稱、建設(shè)開始年份、項目所在地、電壓等級、建設(shè)內(nèi)容、項目性質(zhì)、項目所屬單位、主體名稱、購置內(nèi)容、業(yè)務(wù)科目、大修內(nèi)容、建設(shè)性質(zhì)、變壓站、變壓線、設(shè)備名稱、設(shè)備調(diào)度號、內(nèi)容名稱中的一個或多個。

具體的,可以在電力項目文檔中查找所述預(yù)設(shè)的項目關(guān)鍵字,并將查找到的項目關(guān)鍵字后方的一段文字(例如項目關(guān)鍵字與后方的句號之間的文字)作為與該項目關(guān)鍵字對應(yīng)的項目信息。當(dāng)然,也可以通過查找與預(yù)設(shè)的項目關(guān)鍵字對應(yīng)的文字來獲得電力項目文檔的項目信息,例如:根據(jù)表格中單元格的對應(yīng)關(guān)系獲得與包含項目關(guān)鍵字的單元格對應(yīng)的單元格內(nèi)的電力項目文檔的項目信息。

其中,同一電力項目文檔的各項目信息可以具有對應(yīng)關(guān)系,例如:各項目信息都設(shè)置有其所歸屬的電力項目文檔的文檔id。這樣,通過該文檔id就可以確定各項目的對應(yīng)關(guān)系。

s003、確定各所述電力項目文檔的項目信息中的關(guān)鍵詞;

其中,步驟s003可以包括:

對各所述電力項目文檔的項目信息進行分詞,獲得多個詞語;

對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

其中,步驟s003的執(zhí)行原理與步驟s200的執(zhí)行原理相同,不再贅述。

s004、將各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建為預(yù)設(shè)電力項目檢索庫。

具體的,可以根據(jù)各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建索引(index)。構(gòu)建索引后,步驟s300可以使用索引通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度。

其中,索引可以由若干段(segment)組成,每一段由若干的文檔(document)組成,每一個文檔由若干的域(field)組成,每一個域由若干的項(term)組成。項是最小的索引概念單位,它直接代表了一個字符串,如2017年。域是一個關(guān)聯(lián)的元組,由一個域名和一個域值組成,域名是一個字符串,域值是一個項,如:建設(shè)年份:2017年。一個項目信息涉及的所有域可以構(gòu)成一個文檔,多個文檔可以構(gòu)成一個段。

s400、按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;

s500、將排序后的各項目信息作為檢測結(jié)果輸出。

本發(fā)明實施例提供的一種電力項目防重復(fù)檢測方法,可以獲得用戶輸入的待檢測的電力項目信息;確定所述電力項目信息中的關(guān)鍵詞;根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;將排序后的各項目信息作為檢測結(jié)果輸出。本發(fā)明實現(xiàn)了電力項目的自動查找,可以按照相似度對預(yù)設(shè)電力項目檢索庫中各項目信息進行排序,使得審核人員可以輕易的確定是否有重復(fù)的電力項目,減少了審核時間和成本,提高了審核效率。

如圖3所示,本發(fā)明實施例提供的另一種電力項目防重復(fù)檢測方法,可以包括:

s100、獲得用戶輸入的待檢測的電力項目信息;

s200、確定所述電力項目信息中的關(guān)鍵詞;

s210、獲得用戶輸入的電力項目的限定條件;

其中,限定條件可以為電力項目文檔的提交時間、電壓等級等。

s220、確定預(yù)設(shè)電力項目檢索庫中滿足所述限定條件的項目信息;

例如:用戶輸入的電力項目的限定條件為110kv。那么就可以將項目信息中包含110kv的電力項目文檔的各項目信息確定為滿足該限定條件的項目信息。這樣,后續(xù)用戶輸入的待檢測的電力項目信息,如項目所在地為某省時,就可以僅計算確定的滿足該限定條件的項目信息與用戶輸入的電力項目信息的相似度。

其中,步驟s210、s220與步驟s100、s200的執(zhí)行順序本發(fā)明在此不做限定,具體的,步驟s210、s220只需在步驟s310之前執(zhí)行即可。

s310、根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與滿足所述限定條件的各項目信息的相似度;

其中,步驟s310為圖1所示實施例中步驟s300的一種具體實施方式。

s400、按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;

s500、將排序后的各項目信息作為檢測結(jié)果輸出。

圖3所示方法實現(xiàn)了查找范圍的縮小,節(jié)省了計算時間,提高了審核效率。

與上述方法實施例相對應(yīng),本發(fā)明實施例還提供了一種電力項目防重復(fù)檢測裝置。

如圖4所示,本發(fā)明實施例提供的一種電力項目防重復(fù)檢測裝置,可以包括:信息獲得單元100、關(guān)鍵詞確定單元200、相似度計算單元300、排序單元400和輸出單元500,

所述信息獲得單元100,用于獲得用戶輸入的待檢測的電力項目信息;

其中,電力項目信息可以具體包括:項目名稱、建設(shè)開始年份、項目所在地、電壓等級等中的一個或多個,例如:用戶輸入的待檢測的電力項目信息為:2016年的35kv電網(wǎng)基建項目。

所述關(guān)鍵詞確定單元200,用于確定所述電力項目信息中的關(guān)鍵詞;

其中,所述關(guān)鍵詞確定單元200可以包括:分詞子單元和分析子單元,

所述分詞子單元,用于對所述電力項目信息進行分詞,獲得多個詞語;

所述分析子單元,用于對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

所述相似度計算單元300,用于根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;

所述排序單元400,用于按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;

所述輸出單元500,用于將排序后的各項目信息作為檢測結(jié)果輸出。

進一步,圖4所示裝置還可以包括:電力項目檢索庫構(gòu)建單元,所述電力項目檢索庫構(gòu)建單元包括:文檔獲得子單元、項目信息獲得子單元、關(guān)鍵詞確定子單元和構(gòu)建子單元,

所述文檔獲得子單元,用于獲得多個電力項目文檔;

所述項目信息獲得子單元,用于根據(jù)預(yù)設(shè)的項目關(guān)鍵字,獲得各所述電力項目文檔的項目信息;

其中,所述預(yù)設(shè)的項目關(guān)鍵字,可以包括:項目名稱、建設(shè)開始年份、項目所在地、電壓等級、建設(shè)內(nèi)容、項目性質(zhì)、項目所屬單位、主體名稱、購置內(nèi)容、業(yè)務(wù)科目、大修內(nèi)容、建設(shè)性質(zhì)、變壓站、變壓線、設(shè)備名稱、設(shè)備調(diào)度號、內(nèi)容名稱中的一個或多個。

所述關(guān)鍵詞確定子單元,用于確定各所述電力項目文檔的項目信息中的關(guān)鍵詞;

其中,關(guān)鍵詞確定子單元可以包括:詞語獲得子單元和語法子單元,

所述詞語獲得子單元,用于對各所述電力項目文檔的項目信息進行分詞,獲得多個詞語;

所述語法子單元,用于對獲得的多個詞語進行語法分析,確定所述多個詞語中的關(guān)鍵詞。

所述構(gòu)建子單元,用于將各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建為預(yù)設(shè)電力項目檢索庫。

具體的,可以根據(jù)各所述電力項目文檔的項目信息及各所述電力項目文檔的項目信息中的關(guān)鍵詞構(gòu)建索引(index)。

其中,索引可以由若干段(segment)組成,每一段由若干的文檔(document)組成,每一個文檔由若干的域(field)組成,每一個域由若干的項(term)組成。項是最小的索引概念單位,它直接代表了一個字符串,如2017年。域是一個關(guān)聯(lián)的元組,由一個域名和一個域值組成,域名是一個字符串,域值是一個項,如:建設(shè)年份:2017年。一個項目信息涉及的所有域可以構(gòu)成一個文檔,多個文檔可以構(gòu)成一個段。

本發(fā)明實施例提供的一種電力項目防重復(fù)檢測裝置,可以獲得用戶輸入的待檢測的電力項目信息;確定所述電力項目信息中的關(guān)鍵詞;根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與預(yù)設(shè)電力項目檢索庫中各項目信息的相似度;按照所述相似度對所述預(yù)設(shè)電力項目檢索庫中各項目信息進行排序;將排序后的各項目信息作為檢測結(jié)果輸出。本發(fā)明實現(xiàn)了電力項目的自動查找,可以按照相似度對預(yù)設(shè)電力項目檢索庫中各項目信息進行排序,使得審核人員可以輕易的確定是否有重復(fù)的電力項目,減少了審核時間和成本,提高了審核效率。

進一步,本發(fā)明實施例提供的電力項目防重復(fù)檢測裝置還可以包括:限定條件獲得單元和項目篩選單元,

所述限定條件獲得單元,用于在所述相似度計算單元300計算相似度之前,獲得用戶輸入的電力項目的限定條件;

所述項目篩選單元,用于確定預(yù)設(shè)電力項目檢索庫中滿足所述限定條件的項目信息;

所述相似度計算單元300,具體用于:

根據(jù)所述關(guān)鍵字,通過空間向量模型計算所述待檢測的電力項目信息與滿足所述限定條件的各項目信息的相似度。

需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。

本說明書中的各個實施例均采用相關(guān)的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。

以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1