本申請涉及信息搜索領(lǐng)域,具體而言,涉及一種法律條文的搜索方法及裝置。
背景技術(shù):
法律條文,是指現(xiàn)行有效的法律、行政法規(guī)、司法解釋、地方法規(guī)、地方規(guī)章、部門規(guī)章及其他規(guī)范性文件以及對于該等法律法規(guī)的不時(shí)修改和補(bǔ)充。廣義上講,法律泛指一切規(guī)范性文件。裁判文書記載著人民法院審理過程和結(jié)果,是訴訟活動(dòng)結(jié)果的載體,也是人民法院確定和分配當(dāng)事人實(shí)體權(quán)利義務(wù)的惟一憑證。裁判文書,既是當(dāng)事人享有權(quán)利和負(fù)擔(dān)義務(wù)的憑證,也是上級(jí)人民法院監(jiān)督下級(jí)人民法院民事審判活動(dòng)的重要依據(jù)。一份結(jié)構(gòu)完整、要素齊全、邏輯嚴(yán)謹(jǐn)?shù)牟门形臅瑧?yīng)當(dāng)包括該糾紛案件的案情描述,原告與被告當(dāng)事人及其委托人的信息,以及法院對案件實(shí)施判決所依據(jù)的法律條文等。當(dāng)今,法律工作者在訴訟案件中經(jīng)常需要尋找與當(dāng)前正在處理的案情相似的法律法規(guī)。對普通人而言,在遇到糾紛時(shí),也希望能夠?qū)ふ业筋愃破湓庥龅姆煞ㄒ?guī)作為法律認(rèn)定的參考。因此,可以通過輸入包括案情描述信息在內(nèi)搜索查詢文本,得到與輸入的文本相關(guān)的生效判決的裁判文書,并由此得到法院對案件實(shí)施判決依據(jù)的法律條文。然而當(dāng)前法律法規(guī)的搜索過程中,當(dāng)前的搜索引擎主要是針對基于案情輸入的搜索文本進(jìn)行字詞的拆分和匹配。例如,基于案情輸入的搜索詞為飆車,并不足以對法律條文進(jìn)行搜索,因此很難搜索到與案情描述相關(guān)的法律條文。
針對相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請的主要目的在于提供一種法律條文的搜索方法及裝置,以解決相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請的一個(gè)方面,提供了一種法律條文的搜索方法。該方法包括:獲取搜索查詢文本中的搜索關(guān)鍵詞;獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及獲取目標(biāo)裁判文書集合的目標(biāo)法律條文。
進(jìn)一步地,獲取目標(biāo)裁判文書集合的目標(biāo)法律條文包括:對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;以及將篩除后的候選法律條文作為目標(biāo)法律條文。
進(jìn)一步地,篩除后的候選法律條文包括多條條文,在對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文之后,在將篩除后的候選法律條文作為目標(biāo)法律條文之前,該方法還包括:根據(jù)預(yù)設(shè)條件確定每份目標(biāo)裁判文書的權(quán)重值;統(tǒng)計(jì)各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù);根據(jù)每份目標(biāo)裁判文書的權(quán)重值和各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù)對多條條文進(jìn)行排序,得到排序后的多條條文;根據(jù)排序后的多條條文,確定返回至目標(biāo)地址的目標(biāo)條文,將篩除后的候選法律條文作為目標(biāo)法律條文包括:將目標(biāo)條文作為目標(biāo)法律條文。
進(jìn)一步地,在根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合之前,該方法還包括:對候選裁判文書建立倒排索引,得到第一倒排表,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合包括:在第一倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
進(jìn)一步地,在根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合之前,該方法還包括:對候選裁判文書進(jìn)行分段解析,確定候選裁判文書中的搜索段,其中,搜索段是候選裁判文書中對案情內(nèi)容進(jìn)行描述的段落;對候選裁判文書和候選裁判文書中的搜索段建立倒排索引,得到第二倒排表,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合包括:在第二倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種法律條文的搜索裝置。該裝置包括:第一獲取單元,用于獲取搜索查詢文本中的搜索關(guān)鍵詞;第二獲取單元,用于獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;擴(kuò)充單元,用于根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;搜索單元,用于根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及第三獲取單元,用于獲取目標(biāo)裁判文書集合的目標(biāo)法律條文。
進(jìn)一步地,第三獲取單元包括:獲取模塊,用于對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;篩除模塊,用于對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;以及確定模塊,用于將篩除后的候選法律條文作為目標(biāo)法律條文。
進(jìn)一步地,篩除后的候選法律條文包括多條條文,該裝置還包括:第一確定單元, 用于根據(jù)預(yù)設(shè)條件確定每份目標(biāo)裁判文書的權(quán)重值;統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù);排序單元,用于根據(jù)每份目標(biāo)裁判文書的權(quán)重值和各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù)對多條條文進(jìn)行排序,得到排序后的多條條文;第二確定單元,用于根據(jù)排序后的多條條文,確定返回至目標(biāo)地址的目標(biāo)條文,確定模塊還用于將目標(biāo)條文作為目標(biāo)法律條文。
進(jìn)一步地,該裝置還包括:第一創(chuàng)建單元,用于對候選裁判文書建立倒排索引,得到第一倒排表,搜索單元還用于在第一倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
進(jìn)一步地,該裝置還包括:第三確定單元,用于對候選裁判文書進(jìn)行分段解析,確定候選裁判文書中的搜索段,其中,搜索段是候選裁判文書中對案情內(nèi)容進(jìn)行描述的段落;第二創(chuàng)建單元,用于對候選裁判文書和候選裁判文書中的搜索段建立倒排索引,得到第二倒排表,搜索單元還用于在第二倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
通過本申請,采用以下步驟:獲取搜索查詢文本中的搜索關(guān)鍵詞;獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,解決了相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,首先通過搜索查詢文本獲取到目標(biāo)裁判文書集合,再獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,即通過目標(biāo)裁判文書集合建立了搜索查詢文本與法律條文之間的聯(lián)系,進(jìn)而達(dá)到能夠獲取與輸入的搜索查詢文本相關(guān)的法律條文的效果。
附圖說明
構(gòu)成本申請的一部分的附圖用來提供對本申請的進(jìn)一步理解,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請第一實(shí)施例的法律條文的搜索方法的流程圖;
圖2是根據(jù)本申請第二實(shí)施例的法律條文的搜索方法的流程圖;
圖3是根據(jù)本申請第一實(shí)施例的法律條文的搜索裝置的示意圖;以及
圖4是根據(jù)本申請第二實(shí)施例的法律條文的搜索裝置的示意圖。
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請方案,下面將結(jié)合本申請實(shí)施例中的附圖,對本申請實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請保護(hù)的范圍。
需要說明的是,本申請的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實(shí)施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請的實(shí)施例,提供了一種法律條文的搜索方法。
圖1是根據(jù)本申請第一實(shí)施例的法律條文的搜索方法的流程圖。如圖1所示,該方法包括以下步驟:
步驟S101,獲取搜索查詢文本中的搜索關(guān)鍵詞。
本申請第一實(shí)施例中的搜索查詢文本即是在當(dāng)事人需要獲得生效判決的裁判文書作為處理糾紛的參考時(shí),基于糾紛案情輸入的文本。例如,當(dāng)事人基于正在處理的糾紛案情輸入的搜索查詢文本為:一車正在飆車時(shí),撞上正常行駛的客車,相關(guān)補(bǔ)償事宜。當(dāng)事人通過輸入搜索查詢文本希望獲取到與輸入的文本相關(guān)的生效判決的裁判文書及法院對案件實(shí)施判決依據(jù)的法律法條作為后續(xù)處理的參考。
獲取搜索查詢文本中的搜索關(guān)鍵詞。例如,搜索查詢文本為:一車正在飆車時(shí),撞上正常行駛的客車,相關(guān)補(bǔ)償事宜。獲取到搜索查詢文本中的搜索關(guān)鍵詞為“飆車”、“補(bǔ)償”。
步驟S102,獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞。
所謂法律詞是指在司法領(lǐng)域有專門或特定意義的詞或詞組,例如“追逐競駛”一詞,是法律文獻(xiàn)中的標(biāo)準(zhǔn)用語,但通常而言,就是“飆車”的意思。
例如,上述步驟S101獲取到的搜索關(guān)鍵詞為“飆車”、“補(bǔ)償”。獲取與“飆車”含義相近和/或相同的法律詞為“追逐競駛”,獲取與“補(bǔ)償”含義相近和/或相同的法 律詞為“賠償”。
步驟S103,根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本。
根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,例如,根據(jù)“飆車”含義相近或同義的“追逐競駛”,“補(bǔ)償”含義相近和/或相同的法律詞“賠償”對搜索查詢文本“一車正在飆車時(shí),撞上正常行駛的客車,相關(guān)補(bǔ)償事宜”進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本為:“一車正在飆車時(shí),撞上正常行駛的客車,相關(guān)補(bǔ)償事宜”,“追逐競駛”,“賠償”。
步驟S104,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
目標(biāo)裁判文書集合包括與擴(kuò)充后的查詢文本匹配的所有目標(biāo)裁判文書集合,可以包含一份以上目標(biāo)裁判文書集合,也可以為空。
通過上述步驟,根據(jù)與搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充后,在更大的范圍內(nèi)對裁判文書進(jìn)行搜索,從而得到更豐富的搜索結(jié)果即返回更多的目標(biāo)裁判文書集合。當(dāng)輸入的搜索關(guān)鍵詞不是法律詞時(shí),也可以通過擴(kuò)充對其進(jìn)行彌補(bǔ),因此搜索到符合需求的目標(biāo)裁判文書集合,提高了目標(biāo)裁判文書集合的召回率。
可選地,在根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合之前,本申請第一實(shí)施例提供的法律條文的搜索方法還包括:對候選裁判文書建立倒排索引,得到第一倒排表,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合包括:在第一倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
倒排索引,即實(shí)際應(yīng)用中根據(jù)屬性的值來查找記錄。倒排索引的原理如下:
采用分詞器對輸入的源數(shù)據(jù)庫中每個(gè)文檔執(zhí)行分詞處理,將每個(gè)文檔中提取出的關(guān)鍵詞與該文檔建立鏈接;當(dāng)輸入要查詢的關(guān)鍵詞后,便可反向的列出所有包含該關(guān)鍵詞的文檔,省去了在每個(gè)文檔中順序地尋找關(guān)鍵詞的過程,即通過建立倒排索引表達(dá)到了由部分屬性查找數(shù)據(jù)來源的目的。
倒排索引的具體實(shí)現(xiàn)方式可以是業(yè)內(nèi)比較成熟的全文搜索引擎框架(Lucene),也可以是基于Lucene開發(fā)的企業(yè)級(jí)搜索應(yīng)用服務(wù)器(Solr)或全文搜索引擎(Elasticsearch)。除此之外,也可以開發(fā)一套滿足需求的搜索引擎。至于究竟采用何種倒排索引方式,在實(shí)際情況中可以根據(jù)具體問題而定,本申請第一實(shí)施例不限定其實(shí)現(xiàn)方式。
此步驟對每個(gè)候選裁判文書的全文建立倒排索引,輸入搜索查詢文本后,使用與 倒排索引采用的搜索引擎中相同的分詞器對搜索查詢文本進(jìn)行分詞,分詞后得到一個(gè)或多個(gè)關(guān)鍵詞,查詢倒排表,返回對應(yīng)的目標(biāo)裁判文書集合。
可選地,本申請第一實(shí)施例提供的法律條文的搜索方法,在根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合之前,該方法還包括:對候選裁判文書進(jìn)行分段解析,確定候選裁判文書中的搜索段,其中,搜索段是候選裁判文書中對案情內(nèi)容進(jìn)行描述的段落;對候選裁判文書和候選裁判文書中的搜索段建立倒排索引,得到第二倒排表,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合包括:在第二倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
一般而言,裁判文書具有一定格式,即需要在特定段落中描述案件相關(guān)的各種要素。例如,在裁判文書開始,需要寫明原告當(dāng)事人信息及其委托人信息,然后寫明被告當(dāng)事人信息及其委托人信息等。因此,可以通過對候選裁判文書中特定信息的捕捉,將候選裁判文書的各個(gè)段落進(jìn)行分段。再如,在原告訴稱段落中,主要記錄原告在狀告被告時(shí)所陳述的主觀事實(shí);另外在經(jīng)審理查明段落中,主要記錄了法院在綜合原告與被告的陳述之后,結(jié)合原告與被告雙方舉證最終認(rèn)定的事實(shí)。裁判文書中的案情描述段落,如原告訴稱段落與經(jīng)審理查明段落(搜索段)等,可以作為案情內(nèi)容關(guān)鍵詞的倒排索引目標(biāo)裁判文書集合。
相對于對候選裁判文書的全文進(jìn)行分詞,對每個(gè)候選裁判文書的各個(gè)案情描述段落建立倒排索引,能夠減少倒排表的存儲(chǔ)空間,同時(shí)也減輕了非案情描述相關(guān)的段落中含有關(guān)鍵詞帶來的冗余索引。
步驟S105,獲取目標(biāo)裁判文書集合的目標(biāo)法律條文。
分好段落的裁判文書中,有一個(gè)段落描述的是法院對案件實(shí)施判決的法律依據(jù),通常稱之為法律法條段。法律法條段包含有法院具體使用了哪些法律法條作為判決依據(jù)的信息。例如,一篇裁判文書中法律法條段的摘要如下:
“綜上所述,依據(jù)《中華人民共和國勞動(dòng)法》第二條、第五十條,《中華人民共和國勞動(dòng)合同法》第三十一條之規(guī)定,判決如下:”
通過該裁判文書中法律法條段的摘要可知,法院對該案件的判決依據(jù)有三條法律條文,即《中華人民共和國勞動(dòng)法》第二條,《中華人民共和國勞動(dòng)法》第五十條和《中華人民共和國勞動(dòng)合同法》第三十一條,最終對案件提出了判決結(jié)果。通常,法律條文信息含有“第*條”的字樣,且“*”為數(shù)字。
在分好段落的裁判文書中,需要對裁判文書的法律法條段進(jìn)行信息抽取,得到法律條文。信息抽取的方式有多種,例如通過正則表達(dá)式搜索,或基于有限狀態(tài)機(jī)的規(guī)則匹配的方法等搜索方式。其實(shí)質(zhì)是當(dāng)裁判文書滿足了一定的預(yù)設(shè)條件時(shí),如本實(shí)施 例中的預(yù)設(shè)條件為“第*條”,系統(tǒng)會(huì)按照預(yù)設(shè)規(guī)則返回相應(yīng)的信息,如本實(shí)施例中的預(yù)設(shè)規(guī)則為,將“第*條”及其前文中距“第*條”最近的書名號(hào)(《》)中的全部內(nèi)容組合為“《》第*條”的格式,作為搜索的返回信息。至于究竟采用何種信息抽取方式,在實(shí)際情況中可以根據(jù)具體問題而定,本申請第一實(shí)施例不限定其實(shí)現(xiàn)方式。
將所有裁判文書與各個(gè)裁判文書通過信息抽取得到的所有法律條文建立鏈接。對裁判文書進(jìn)行分段、信息抽取與建立鏈接的處理后,當(dāng)指定一篇裁判文書時(shí),就可以得到法院在該裁判文書中作為判決依據(jù)的法律條文。
本申請第一實(shí)施例提供的法律條文的搜索方法,通過獲取搜索查詢文本中的搜索關(guān)鍵詞;獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,解決了相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,首先通過搜索查詢文本獲取到目標(biāo)裁判文書集合,再獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,即通過目標(biāo)裁判文書集合建立了搜索查詢文本與法律條文之間的聯(lián)系,進(jìn)而達(dá)到能夠獲取與輸入的搜索查詢文本相關(guān)的法律條文的效果。
圖2是根據(jù)本申請第二實(shí)施例的法律條文的搜索方法的流程圖。圖2可以作為圖1所示實(shí)施例的一種優(yōu)選實(shí)施方式。如圖2所示,該方法包括如下的步驟:
步驟S201,獲取搜索查詢文本中的搜索關(guān)鍵詞。
此步驟與本申請第一實(shí)施例的步驟S101相同,在此不再贅述。
步驟S202,獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞。
此步驟與本申請第一實(shí)施例的步驟S102相同,在此不再贅述。
步驟S203,根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本。
此步驟與本申請第一實(shí)施例的步驟S103相同,在此不再贅述。
步驟S204,根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
此步驟與本申請第一實(shí)施例的步驟S104相同,在此不再贅述。
步驟S205,對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文。
首先,在得到目標(biāo)裁判文書集合后,按照裁判文書的結(jié)構(gòu)對目標(biāo)裁判文書集合進(jìn) 行分段。然后,在分好段落的目標(biāo)裁判文書集合確定出法律法條段,最后,對目標(biāo)裁判文書集合的法律法條段進(jìn)行信息抽取,得到目標(biāo)裁判文書集合的法律條文,在本申請第二實(shí)施例中將其作為候選法律條文。與本申請第一實(shí)施例中步驟S105的信息抽取方法相同,本申請第二實(shí)施例不限定信息抽取方法的實(shí)現(xiàn)方式。
步驟S206,對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文。
其中,目標(biāo)裁判文書集合包括多份目標(biāo)裁判文書,對所有目標(biāo)裁判文書進(jìn)行信息抽取后得到的候選法律條文,因此在候選法律條文中極有可能會(huì)存在重復(fù)的法律條文。例如,輸入一條案情描述文本(搜索查詢文本),得到兩份相關(guān)的目標(biāo)裁判文書,其中一份目標(biāo)裁判文書在最終判決時(shí)依據(jù)了《中華人民共和國勞動(dòng)法》第二條,《中華人民共和國勞動(dòng)法》第五十條和《中華人民共和國勞動(dòng)合同法》第三十一條,另一份目標(biāo)裁判文書在最終判決時(shí)依據(jù)了《中華人民共和國勞動(dòng)法》第二條和《中華人民共和國勞動(dòng)法》第三十九條,那么在對目標(biāo)裁判文書進(jìn)行信息抽取后會(huì)顯示兩條“《中華人民共和國勞動(dòng)法》第二條”信息,而這兩條信息是相同的,因此需要對這兩條相同的法律條文信息進(jìn)行篩除,只保留一條“《中華人民共和國勞動(dòng)法》第二條”信息,即可以消除相同法律條文造成的信息冗余。
步驟S207,將篩除后的候選法律條文作為目標(biāo)法律條文。
當(dāng)事人想要查詢類似的糾紛案件采用了哪些法律條文,在輸入案情描述(搜索查詢文本)后,經(jīng)過對輸入信息的擴(kuò)充得到所有目標(biāo)裁判文書。對所有目標(biāo)裁判文書抽取所有的候選法律條文進(jìn)行篩除,篩除后的候選法律條文中,每一條候選法律條文只出現(xiàn)一次,因此可以將篩除后的候選法律條文作為目標(biāo)法律條文,供當(dāng)事人參考。
可選地,本申請第二實(shí)施例提供的法律條文的搜索方法,篩除后的候選法律條文包括多條條文,在對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文之后,在將篩除后的候選法律條文作為目標(biāo)法律條文之前,該方法還包括:根據(jù)預(yù)設(shè)條件確定每份目標(biāo)裁判文書的權(quán)重值;統(tǒng)計(jì)各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù);根據(jù)每份目標(biāo)裁判文書的權(quán)重值和各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù)對多條條文進(jìn)行排序,得到排序后的多條條文;根據(jù)排序后的多條條文,確定返回至目標(biāo)地址的目標(biāo)條文,將篩除后的候選法律條文作為目標(biāo)法律條文包括:將目標(biāo)條文作為目標(biāo)法律條文。
在將篩除后的候選法律條文作為目標(biāo)法律條文之前,可以對篩除后的候選法律條文進(jìn)行排序,按照一定的預(yù)設(shè)條件確定候選法律條文對當(dāng)事人輸入案情的相關(guān)度。該預(yù)設(shè)條件是預(yù)先設(shè)置的命中條件,預(yù)先定義該命中條件,并且定義的方式并不唯一。 通過案情描述搜索與該案情相似的裁判文書時(shí),搜索到的裁判文書與案情描述的相似程度必然有所不同,由此可知,不同的目標(biāo)裁判文書對應(yīng)的候選法律條文與當(dāng)事人輸入的案情描述的關(guān)聯(lián)程度也不同,因此,需要賦予不同的目標(biāo)裁判文書以不同的權(quán)重,以使目標(biāo)法律條文的排序與該案情描述的關(guān)聯(lián)程度相關(guān)。例如,實(shí)現(xiàn)方式可以如下:
若輸入的案情描述匹配到了m個(gè)裁判文書,并且根據(jù)預(yù)設(shè)條件分別賦予了該m個(gè)裁判文書各自的權(quán)重值,其各自的權(quán)重值可以表示為w1,w2,…,wm,每個(gè)裁判文書對應(yīng)的權(quán)重值表示該裁判文書與輸入的案情描述的相似程度。該m個(gè)裁判文書經(jīng)過分段解析與篩除后得到了n個(gè)候選的法律條文,并且第j篇裁判文書中應(yīng)用了第i個(gè)法律條文的條件滿足yij,
也即,第j篇裁判文書中要么應(yīng)用了第i個(gè)法律條文,要么未應(yīng)用第i個(gè)法律條文。那么,在特定案情描述下第i個(gè)法律條文的得分(RankScorei)可以表示為:
也即,第i個(gè)法律條文的得分(RankScorei)是所有應(yīng)用了該法律條文的裁判文書的權(quán)重值之和。最后,對各個(gè)法律條文的得分進(jìn)行降序排列,按照當(dāng)前排列返回或取排名靠前的法律法條進(jìn)行返回。至于究竟取幾條法律條文,可以在預(yù)設(shè)條件中預(yù)先定義。
本申請第二實(shí)施例提供的法律條文的搜索方法,通過獲取搜索查詢文本中的搜索關(guān)鍵詞;獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;對目標(biāo)裁判文書集合的每份目標(biāo)裁判文書中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;以及將篩除后的候選法律條文作為目標(biāo)法律條文。解決了相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,進(jìn)而達(dá)到能夠獲取與輸入的搜索查詢文本相關(guān)的法律條文的效果,通過篩除目標(biāo)裁判文書集合抽取出的候選法律條文,得到篩除后的法律條文,將篩除后的候選法律條文作為目標(biāo)法律條文,達(dá)到了消除相同法律條文造成的信息冗余的效果。
需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請實(shí)施例還提供了一種法律條文的搜索裝置,需要說明的是,本申請實(shí)施例的法律條文的搜索裝置可以用于執(zhí)行本申請實(shí)施例所提供的用于法律條文的搜索方法。以下對本申請實(shí)施例提供的法律條文的搜索裝置進(jìn)行介紹。
圖3是根據(jù)本申請第一實(shí)施例的法律條文的搜索裝置的示意圖。如圖3所示,該裝置包括:第一獲取單元10、第二獲取單元20、擴(kuò)充單元30、搜索單元40和第三獲取單元50。
第一獲取單元10,用于獲取搜索查詢文本中的搜索關(guān)鍵詞。
第二獲取單元20,用于獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞。
擴(kuò)充單元30,用于根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本。
搜索單元40,用于根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
第三獲取單元50,用于獲取目標(biāo)裁判文書集合的目標(biāo)法律條文。
本申請第一實(shí)施例提供的裁判文書的法律條文的搜索裝置,通過第一獲取單元10獲取搜索查詢文本中的搜索關(guān)鍵詞;第二獲取單元20獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;擴(kuò)充單元30根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;搜索單元40根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及第三獲取單元50獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,解決了相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,通過第三獲取單元50獲取目標(biāo)裁判文書集合的目標(biāo)法律條文,進(jìn)而達(dá)到能夠獲取與輸入的搜索查詢文本相關(guān)的法律條文的效果。
可選地,在本申請第一實(shí)施例提供的法律條文的搜索裝置中,該裝置還包括:第一創(chuàng)建單元,用于對候選裁判文書建立倒排索引,得到第一倒排表,搜索單元還用于在第一倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
可選地,在本申請第一實(shí)施例提供的法律條文的搜索裝置中,該裝置還包括:第三確定單元,用于對候選裁判文書進(jìn)行分段解析,確定候選裁判文書中的搜索段,其中,搜索段是候選裁判文書中對案情內(nèi)容進(jìn)行描述的段落;第二創(chuàng)建單元,用于對候選裁判文書和候選裁判文書中的搜索段建立倒排索引,得到第二倒排表,搜索單元還用于在第二倒排表中輸入擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
圖4是根據(jù)本申請第二實(shí)施例的法律條文的搜索裝置的示意圖。圖4可以作為圖3所示實(shí)施例的一種優(yōu)選實(shí)施方式。如圖4所示,該裝置包括:第一獲取單元10、第二獲取單元20、擴(kuò)充單元30、搜索單元40和第三獲取單元50,其中,第三獲取單元 50包括獲取模塊501、篩除模塊502和確定模塊503。
第一獲取單元10,用于獲取搜索查詢文本中的搜索關(guān)鍵詞。
第二獲取單元20,用于獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞。
擴(kuò)充單元30,用于根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本。
搜索單元40,用于根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合。
第三獲取單元50包括:獲取模塊501,用于對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;篩除模塊502,用于對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;確定模塊503,用于將篩除后的候選法律條文作為目標(biāo)法律條文。
本申請實(shí)第二施例提供的裁判文書的法律條文的搜索裝置,通過第一獲取單元10獲取搜索查詢文本中的搜索關(guān)鍵詞;第二獲取單元20獲取與搜索關(guān)鍵詞含義相近和/或相同的法律詞;擴(kuò)充單元30根據(jù)搜索關(guān)鍵詞含義相近和/或相同的法律詞對搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;搜索單元40根據(jù)擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;獲取模塊501對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;篩除模塊502對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;確定模塊503將篩除后的候選法律條文作為目標(biāo)法律條文,解決了相關(guān)技術(shù)中根據(jù)輸入的搜索詞難以獲取相關(guān)的法律條文的問題,進(jìn)而達(dá)到能夠獲取與輸入的搜索查詢文本相關(guān)的法律條文的效果,通過獲取模塊501對目標(biāo)裁判文書集合中的每份目標(biāo)裁判文書進(jìn)行分段解析,獲取目標(biāo)裁判文書集合的候選法律條文;篩除模塊502對目標(biāo)裁判文書集合的候選法律條文進(jìn)行篩除,得到篩除后的候選法律條文;確定模塊503將篩除后的候選法律條文作為目標(biāo)法律條文,達(dá)到了消除相同法律條文造成的信息冗余的效果。
可選地,在本申請第二實(shí)施例提供的法律條文的搜索裝置中,篩除后的候選法律條文包括多條條文,該裝置還包括:第一確定單元,用于根據(jù)預(yù)設(shè)條件確定每份目標(biāo)裁判文書的權(quán)重值;統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù);排序單元,用于根據(jù)每份目標(biāo)裁判文書的權(quán)重值和各條條文在每份目標(biāo)裁判文書中出現(xiàn)的次數(shù)對多條條文進(jìn)行排序,得到排序后的多條條文;第二確定單元,用于根據(jù)排序后的多條條文,確定返回至目標(biāo)地址的目標(biāo)條文,確定模塊還用于將目標(biāo)條文作為目標(biāo)法律條文。
所述法律條文的搜索裝置包括處理器和存儲(chǔ)器,上述第一獲取單元、第二獲取單元、擴(kuò)充單元、搜索單元和第三獲取單元等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理 器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來實(shí)現(xiàn)相應(yīng)的功能。
處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過調(diào)整內(nèi)核參數(shù)來實(shí)現(xiàn)對法律條文的搜索。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取搜索查詢文本中的搜索關(guān)鍵詞;獲取與所述搜索關(guān)鍵詞含義相近和/或相同的法律詞;根據(jù)所述搜索關(guān)鍵詞含義相近和/或相同的法律詞對所述搜索查詢文本進(jìn)行擴(kuò)充,得到擴(kuò)充后的搜索查詢文本;根據(jù)所述擴(kuò)充后的搜索查詢文本進(jìn)行搜索,得到目標(biāo)裁判文書集合;以及獲取所述目標(biāo)裁判文書集合的目標(biāo)法律條文。
需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本申請的各模塊或各步驟可以用通用 的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本申請不限制于任何特定的硬件和軟件結(jié)合。
以上僅為本申請的優(yōu)選實(shí)施例,并不用于限制本申請,對于本領(lǐng)域的技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的保護(hù)范圍之內(nèi)。