本發(fā)明涉及一種法律信息查詢的方法和裝置,尤其涉及一種根據(jù)法律咨詢問題,給出相應(yīng)法條的方法和裝置。
背景技術(shù):
現(xiàn)有法律法規(guī)咨詢服務(wù)多采取數(shù)據(jù)庫檢索方式實(shí)現(xiàn),提供關(guān)鍵字和主題詞兩個(gè)維度的模糊查詢、目錄查詢、領(lǐng)域查詢、分類查詢和機(jī)構(gòu)查詢。功能上以簡單問答、關(guān)鍵字匹配為主,缺乏語義容錯(cuò)理解機(jī)制;服務(wù)上以網(wǎng)頁文字訪問為主,無法支撐復(fù)雜的法律咨詢、案情分析、法律檢索服務(wù)場景。當(dāng)用戶咨詢問題不夠詳細(xì)時(shí),無法給出準(zhǔn)確地法律條文,甚至因?yàn)闊o法識(shí)別用戶的法律問題而無法給出相應(yīng)的法律條文。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種法律信息查詢的方法和裝置,克服現(xiàn)有技術(shù)中的問題,能夠準(zhǔn)確把握用戶問題,進(jìn)而給出正確的法律條文,提高了法律信息查詢時(shí)的準(zhǔn)確率。
根據(jù)上述目的,本發(fā)明提供一種法律信息查詢的方法,包括:
提供法律知識(shí)庫,所述法律知識(shí)庫包含法律條文,每條法律條文關(guān)聯(lián)有相對(duì)應(yīng)的法律法規(guī)要素;對(duì)法律咨詢問題進(jìn)行自然語義要素提取,以得到所述法律咨詢問題對(duì)應(yīng)的自然語義要素;判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配;若存在,則輸出所述匹配的法律條文。
在一實(shí)施例中,所述判斷的步驟包括:將所述法律咨詢問題對(duì)應(yīng)的自然語義要素映射到法律法規(guī)要素,作為法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素;判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配。
在一實(shí)施例中,所述判斷的步驟包括:判斷所述法律知識(shí)庫中是否存在完全匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述完全匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素完全匹配;若存在,則在所述輸出的步驟中輸出所述完全匹配的法律條文。
在一實(shí)施例中,所述判斷的步驟還包括:若沒有完全匹配的法律條文,則判斷是否存在部分匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述部分匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素的一部分相匹配;若存在,則在所述輸出的步驟中輸出所述部分匹配的法律條文。
在一實(shí)施例中,所述判斷的步驟還包括:若沒有完全匹配的法律條文,則判斷是否存在部分匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述部分匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素的一部分相匹配;若存在,則所述方法還包括:根據(jù)所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素,生成反問問題進(jìn)行反問;以及對(duì)反問得到的答復(fù)進(jìn)行自然語義要素提取,以得到補(bǔ)充的自然語義要素;其中,所述判斷的步驟還包括:判斷所述補(bǔ)充的自然語義要素與所述部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素是否完全匹配;若完全匹配,則在所述輸出的步驟中輸出完全匹配的法律條文。
在一實(shí)施例中,所述根據(jù)所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素,生成反問問題進(jìn)行反問包括:將所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素組合成選擇性問題進(jìn)行反問。
在一實(shí)施例中,所述方法還包括:在自然語義要素提取步驟之前,對(duì)所述法律咨詢問題進(jìn)行預(yù)處理,所述預(yù)處理包括非法詞過濾、前后綴過濾、停詞過濾和/或拼音過濾;所述自然語義要素提取步驟是對(duì)經(jīng)預(yù)處理的法律咨詢問題進(jìn)行自然語義要素提取。
在一實(shí)施例中,所述方法還包括:所述法律知識(shí)庫是可擴(kuò)展數(shù)據(jù)庫,以接收用戶導(dǎo)入的其他法律數(shù)據(jù)庫。
在一實(shí)施例中,所述法律知識(shí)庫包括多個(gè)按照地域和/或法律類別進(jìn)行分類的子庫,所述判斷步驟包括:根據(jù)所述法律咨詢問題的地域和/或法律類別,在相應(yīng)的地域和/或法律類別字庫中進(jìn)行是否存在匹配的法律條文的判斷。
在一實(shí)施例中,所述方法還包括:若所述法律咨詢問題為語音信息,則將所述語音信息轉(zhuǎn)換成文字信息,以供自然語義要素提取。
在一實(shí)施例中,所述方法還包括:提供歷史咨詢問題庫,所述歷史咨詢問題庫中的每條歷史咨詢問題關(guān)聯(lián)有相對(duì)應(yīng)的自然語義要素;判斷所述歷史咨詢問題庫中是否存在相匹配的歷史咨詢問題,使得用戶輸入問題對(duì)應(yīng)的自然語義要素與所述相匹配的歷史咨詢問題對(duì)應(yīng)的自然語義要素匹配;若存在,則輸出相匹配的歷史咨詢問題,供用戶選擇。
在一實(shí)施例中,所述法律咨詢問題通過以下至少一種方式獲?。何⑿?、網(wǎng)頁、應(yīng)用軟件、電話、短信、實(shí)體機(jī)器人和自主咨詢終端。
對(duì)應(yīng)上述方法,本發(fā)明還提供一種法律信息查詢的裝置,所述裝置包括:法律知識(shí)庫,所述法律知識(shí)庫包含法律條文,每條法律條文關(guān)聯(lián)有相對(duì)應(yīng)的法律法規(guī)要素;自然語義要素提取模塊,用于對(duì)法律咨詢問題進(jìn)行自然語義要素提取,以得到所述法律咨詢問題對(duì)應(yīng)的自然語義要素;匹配模塊,用于判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配;輸出模塊,用于響應(yīng)于所述法律知識(shí)庫中存在匹配的法律條文,則輸出所述匹配的法律條文。
在一實(shí)施例中,所述匹配模塊包括:映射子模塊,用于將所述法律咨詢問題對(duì)應(yīng)的自然語義要素映射到法律法規(guī)要素,作為法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素;判斷子模塊,用于判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配。
在一實(shí)施例中,所述匹配模塊進(jìn)一步用于判斷所述法律知識(shí)庫中是否存在完全匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述完全匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素完全匹配;所述輸出模塊進(jìn)一步用于響應(yīng)于所述法律知識(shí)庫中存在完全匹配的法律條文,則輸出所述完全匹配的法律條文。
在一實(shí)施例中,所述匹配模塊進(jìn)一步用于響應(yīng)于沒有完全匹配的法律條文,則判斷是否存在部分匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述部分匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素的一部分相匹配;所述輸出模塊進(jìn)一步用于響應(yīng)于所述法律知識(shí)庫中存在部分匹配的法律條文,則輸出所述部分匹配的法律條文。
在一實(shí)施例中,所述匹配模塊進(jìn)一步用于響應(yīng)于沒有完全匹配的法律條文,則判斷是否存在部分匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述部分匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素的一部分相匹配;所述裝置還包括:反問模塊,用于根據(jù)所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素,生成反問問題進(jìn)行反問;所述自然語義要素提取模塊還用于對(duì)反問得到的答復(fù)進(jìn)行自然語義要素提取,以得到補(bǔ)充的自然語義要素;所述匹配模塊進(jìn)一步用于判斷所述補(bǔ)充的自然語義要素與所述部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素是否完全匹配;所述輸出模塊進(jìn)一步用于響應(yīng)于所述補(bǔ)充的自然語義要素與所述部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素完全匹配,則輸出完全匹配的法律條文。
在一實(shí)施例中,所述反問模塊包括:組合模塊,用于將所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素組合成選擇性問題進(jìn)行反問。
在一實(shí)施例中,所述裝置還包括:預(yù)處理模塊,用于在自然語義要素提取之前,對(duì)所述法律咨詢問題進(jìn)行預(yù)處理,所述預(yù)處理包括非法詞過濾、前后綴過濾、停詞過濾和/或拼音過濾;所述自然語義要素提取模塊對(duì)經(jīng)預(yù)處理的法律咨詢問題進(jìn)行自然語義要素提取。
在一實(shí)施例中,所述裝置還包括:擴(kuò)展接口,用于接收用戶導(dǎo)入的其他法律數(shù)據(jù)庫。
在一實(shí)施例中,所述法律知識(shí)庫包括多個(gè)按照地域和/或法律類別進(jìn)行分類的子庫,所述裝置還包括:分類模塊,用于識(shí)別所述法律咨詢問題的地域和/或法律類別;所述匹配模塊進(jìn)一步用于響應(yīng)所述法律咨詢問題的地域和/或法律類別,在相應(yīng)的地域和/或法律類別字庫中進(jìn)行是否存在匹配的法律條文的判斷。
在一實(shí)施例中,所述裝置還包括:語音轉(zhuǎn)換模塊,用于響應(yīng)于所述法律咨詢問題為語音信息,則將所述語音信息轉(zhuǎn)換成文字信息,以供自然語義要素提取。
在一實(shí)施例中,所述裝置還包括:歷史咨詢問題庫,所述歷史咨詢問題庫中的每條歷史咨詢問題關(guān)聯(lián)有相對(duì)應(yīng)的自然語義要素;問題查找模塊,用于判斷所述歷史咨詢問題庫中是否存在相匹配的歷史咨詢問題,使得用戶輸入問題對(duì)應(yīng)的自然語義要素與所述相匹配的歷史咨詢問題對(duì)應(yīng)的自然語義要素匹配;問題輸出模塊,用于響應(yīng)所述歷史咨詢問題庫中存在相匹配的歷史咨詢問題,則輸出相匹配的歷史咨詢問題,供用戶選擇。
在一實(shí)施例中,所述裝置還包括:咨詢問題獲取模塊,用于通過以下至少一種方式:微信、網(wǎng)頁、應(yīng)用軟件、電話、短信、實(shí)體機(jī)器人和自主咨詢終端獲取所述法律咨詢問題。
如上所述,本發(fā)明提供的法律信息查詢的方法和裝置,具有反問機(jī)制,能夠同用戶互動(dòng),并得到完整的法律咨詢問題,進(jìn)而給出準(zhǔn)確的法律條文。
附圖說明
圖1示出了本發(fā)明一個(gè)方面的法律信息查詢的方法的流程圖;
圖2示出了完全匹配和部分匹配情況下的方法流程圖;
圖3示出了反問機(jī)制的方法流程圖;
圖4示出了本發(fā)明一個(gè)方面的法律信息查詢的裝置的結(jié)構(gòu)圖。
具體實(shí)施方式
本發(fā)明基于自然語義要素提取技術(shù)提取問題中的自然語義要素,進(jìn)而判斷問題的自然語義要素與法條的法律法規(guī)要素匹配度,同時(shí)提供然語義容錯(cuò)機(jī)制、可拓展的外部數(shù)據(jù)接口。對(duì)于咨詢問題可能存在不完整的情況,本發(fā)明的核心在于提供反問機(jī)制,以得到完善的咨詢問題,進(jìn)而給出準(zhǔn)確的法律條文。此外,本發(fā)明還支持:微信、網(wǎng)頁、應(yīng)用軟件、電話、短信、實(shí)體機(jī)器人和自主咨詢終端作為咨詢問題的獲取渠道。
本發(fā)明法律信息查詢的方法提供有法律知識(shí)庫,法律知識(shí)庫內(nèi)包括眾多法律條文,法律知識(shí)庫可以是現(xiàn)有的法典、地方法規(guī)等等,根據(jù)不同客戶的尋求進(jìn)行定制。
預(yù)先對(duì)法律知識(shí)庫內(nèi)的法律條文進(jìn)行法律法規(guī)要素提取,得到每個(gè)法律條文對(duì)應(yīng)的法律法規(guī)要素,可以將提取得到的法律法規(guī)要素也保存在法律知識(shí)庫內(nèi)。這里的法律法規(guī)要素主要指在法律領(lǐng)域的專業(yè)用語,例如自然語義中的“房子”,在法律領(lǐng)域?qū)?yīng)的是“不動(dòng)產(chǎn)”,而“不動(dòng)產(chǎn)”就是法律法規(guī)要素。由于法條中一定包含的是法律用語,鑒于此,法條的關(guān)鍵字就是法條的法律法規(guī)要素。那么只要能夠提取法條的關(guān)鍵字,則能夠得到法條對(duì)應(yīng)的法律法規(guī)要素。現(xiàn)有技術(shù)中可見,通過人工方式對(duì)法典或法規(guī)中的法條直接進(jìn)行法律法規(guī)要素的提取。同時(shí)現(xiàn)有技術(shù)中有很多對(duì)文本進(jìn)行關(guān)鍵詞提取的技術(shù),主要包括TF-IDF(詞頻-逆文檔頻率)、Topic-Model(主題-模型)等算法,運(yùn)用這些算法對(duì)法條進(jìn)行關(guān)鍵詞提取就可以得到法條對(duì)應(yīng)的法律法規(guī)要素。
TF-IDF的基本思想是:判斷一個(gè)詞在一篇文章中是否重要,一個(gè)容易想到的衡量指標(biāo)就是詞頻,重要的詞往往會(huì)在文章中多次出現(xiàn)。但另一方面,不是出現(xiàn)次數(shù)多的詞就一定重要,因?yàn)橛行┰~在各種文章中都頻繁出現(xiàn),那它的重要性肯定不如那些只在某篇文章中頻繁出現(xiàn)的詞重要性強(qiáng)。從統(tǒng)計(jì)學(xué)的角度,就是給予那些不常見的詞以較大的權(quán)重,而減少常見詞的權(quán)重。IDF(逆文檔頻率)就是這個(gè)權(quán)重,TF則指的是詞頻。
而Topic-Model則認(rèn)為文章是由主題組成,文章中的詞,是以一定概率從主題中選取的。不同的主題下,詞語出現(xiàn)的概率分布是不同的。比如“魚雷”一詞,在“軍事”主題下出現(xiàn)的概率遠(yuǎn)大于在“食品”主題下出現(xiàn)的概率。即Topic-Model認(rèn)為文檔和詞語之間還有一層關(guān)系。
請參看圖1,圖1示出了本發(fā)明一個(gè)方面的法律信息查詢的方法的流程圖。所述方法包括:
101:對(duì)法律咨詢問題進(jìn)行自然語義要素提取,以得到所述法律咨詢問題對(duì)應(yīng)的自然語義要素;
102:判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配;
103:若存在,則輸出所述匹配的法律條文。
步驟101對(duì)法律咨詢問題進(jìn)行自然語義要素提取,實(shí)際上還是直接用前述的關(guān)鍵詞提取技術(shù)將法律咨詢問題中的關(guān)鍵詞提取出來,即得到自然語義要素。正如前述,很多情況下,用戶都會(huì)直接用“房子”這類通俗的語言來進(jìn)行提問,而非直接用“不動(dòng)產(chǎn)”這樣的描述。
步驟102是判斷問題對(duì)應(yīng)的自然語義要素描述和法律條文對(duì)應(yīng)的法律法規(guī)要素描述的匹配度,當(dāng)兩者匹配后,表示用戶所提問題即對(duì)應(yīng)了相關(guān)的法律條文,則在步驟103中給出相應(yīng)的法律條文。
在一實(shí)施例中,步驟102的判斷過程還包括步驟:
a)將所述法律咨詢問題對(duì)應(yīng)的自然語義要素映射到法律法規(guī)要素,作為法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素;
b)判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配。
步驟a)是將前述例子中的問題的自然語義要素“房子”映射到法律法規(guī)要素“不動(dòng)產(chǎn)”得到問題對(duì)應(yīng)的法律法規(guī)要素“不動(dòng)產(chǎn)”,步驟b)判斷問題對(duì)應(yīng)的法律法規(guī)要素“不動(dòng)產(chǎn)”是否能匹配到法律知識(shí)庫中的法條對(duì)應(yīng)的法律法規(guī)要素“不動(dòng)產(chǎn)”。步驟1021中的映射步驟可以通過現(xiàn)有技術(shù)中的映射數(shù)據(jù)庫實(shí)現(xiàn),也可通過人工翻譯來實(shí)現(xiàn)。圖1中所指的匹配包括了兩種情況:完全匹配和部分匹配。
在一實(shí)施例中,具體請參看圖2,所述方法包括如下步驟:
200:輸入匹配度;
201:判斷是否存在完全匹配的法律條文,若存在則進(jìn)入步驟202,否則進(jìn)入步驟203;
202:給出完全匹配的法律條文,進(jìn)入步驟205;
203:判斷是否存在部分匹配的法律條文,若存在則進(jìn)入步驟204,否則進(jìn)入步驟205;
204:給出部分匹配的法律條文,進(jìn)入步驟205;
205:結(jié)束。
在一實(shí)施例中,首先通過映射關(guān)系將法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素找到。此種情況下,完全匹配包含兩種情況:一、咨詢問題所有法律法規(guī)要素都唯一地對(duì)應(yīng)了法條的法律法規(guī)要素,法條所有法律法規(guī)要素也都唯一地對(duì)應(yīng)了咨詢問題的法律法規(guī)要素,存在一一對(duì)應(yīng)的關(guān)系;二、法條所有的法律法規(guī)要素都包含在問題法律法規(guī)要素內(nèi),但問題還有其他法律法規(guī)要素沒有包含在法條法律法規(guī)要素內(nèi)。同樣部分匹配也包括兩種情況:一、咨詢問題所有法律法規(guī)要素都包含在法條法律法規(guī)要素內(nèi),但法條法律法規(guī)要素里還有沒有被問題法律法規(guī)要素覆蓋的部分;二、咨詢問題部分法律法規(guī)要素包含法條部分法律法規(guī)要素,但法條法律法規(guī)要素里還有沒有被問題法律法規(guī)要素覆蓋的部分。
例如一個(gè)咨詢問題對(duì)應(yīng)的法律法規(guī)要素為(A、B、C、D、E、F、G),若法律知識(shí)庫中存在一個(gè)法條對(duì)應(yīng)的法律法規(guī)要素也正好為(A、B、C、D、E、F、G),則這種匹配就為完全匹配?;蛘?,存在一個(gè)法條對(duì)應(yīng)的法律法規(guī)要素為(B、C、D、E、F),則這種匹配也是完全匹配。若法律知識(shí)庫存在一個(gè)(A、B、C、D、E、F、G、H、I),則法條中還有沒有被匹配到的(H、I),這種就是部分匹配的情況。若存在一個(gè)(C、D、E、F、G、H、I、J、K)的法律條文,其中有(C、D、E、F、G)有所匹配,而法律條文中的(H、I、J、K)沒有匹配到,這種情況也是部分匹配??傊?,當(dāng)法律條文中的法律法規(guī)要素全被匹配到時(shí)則是完全匹配,若法律條文中存在沒有匹配到的法律法規(guī)要素,則是部分匹配的情況。
在另一優(yōu)選實(shí)施例中,當(dāng)存在前述部分匹配的情況時(shí)還包括反問機(jī)制。請參見圖3,步驟如下:
301:根據(jù)所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素,生成反問問題進(jìn)行反問;
302:對(duì)反問得到的答復(fù)進(jìn)行自然語義要素提取,以得到補(bǔ)充的自然語義要素;
303:判斷所述補(bǔ)充的自然語義要素與所述部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素是否完全匹配,若完全匹配則進(jìn)入步驟304,否則進(jìn)入步驟305;
304:輸出完全匹配的法律條文;
305:結(jié)束。
反問的目的是在于更加完整地得到咨詢問題的內(nèi)容,從而能夠更加有針對(duì)性地給出相應(yīng)的法條,反問的過程就是不斷在完善問題內(nèi)容的過程。當(dāng)補(bǔ)充的問題內(nèi)容(問題對(duì)應(yīng)的自然語義要素)足夠多到能夠?qū)?yīng)到相應(yīng)的法條上時(shí),給出相應(yīng)的法條。
在一優(yōu)選實(shí)施例中,將部分匹配的法律條文中沒有匹配到的法律法規(guī)要素組合成選擇性問題進(jìn)行反問。緊接著前述例子,若法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素為(A、B、C、D、E、F、G),部分匹配的法律條文有兩個(gè),一個(gè)條文對(duì)應(yīng)的法律法規(guī)要素為(A、B、C、D、E、F、G、H),另一條文對(duì)應(yīng)的法律法規(guī)要素為(A、B、C、D、E、F、G、I),則將沒有被匹配到的法律法規(guī)要素(H)、(I)生成選擇性問題,即生成類似“請問您是指H還是I”,若得到的反問回答為“H”則將對(duì)應(yīng)(A、B、C、D、E、F、G、H)的法律條文輸出。
在另一優(yōu)選實(shí)施例中,在自然語義要素提取步驟之前,對(duì)法律咨詢問題進(jìn)行預(yù)處理,這里預(yù)處理包括非法詞過濾、前后綴過濾、停詞過濾和/或拼音過濾。然后,再進(jìn)行法律法規(guī)要素提取、匹配等操作。所述預(yù)處理的目的是為了過濾掉對(duì)咨詢問題內(nèi)容本身沒有意義的部分,進(jìn)而能夠使得提取出來的法律法規(guī)要素包含了用戶真正想問的內(nèi)容。
非法詞是指一些敏感詞匯,有違法律或者道德的內(nèi)容,現(xiàn)在已經(jīng)有很多非法詞停詞庫可供使用,選用任意停詞庫,對(duì)照即可進(jìn)行非法詞的停詞過濾。
前后綴過濾和停詞過濾都是將文本中沒有實(shí)際意義的詞語過濾掉,前后綴過濾主要是過濾掉一些副詞、形容詞等。停詞過濾是通過現(xiàn)有的停詞庫,來對(duì)照完成無意義詞的過濾。
拼音過濾是指將用戶誤輸入的拼音字符過濾掉,或者通過詞庫直接翻譯成對(duì)應(yīng)的文字。
在一優(yōu)選實(shí)施例中,本發(fā)明提供的法律知識(shí)庫是可擴(kuò)展數(shù)據(jù)庫,以接收用戶導(dǎo)入的其他法律數(shù)據(jù)庫。這樣就能夠適應(yīng)法律、法規(guī)變化,或者新增法律法規(guī)的情況。
由于各個(gè)地方的法律、法規(guī)可能會(huì)出現(xiàn)不同,各個(gè)用戶所需的法律類別也不盡相同,在一優(yōu)選實(shí)施例中,本發(fā)明提供的法律知識(shí)庫包括多個(gè)按照地域和/或法律類別進(jìn)行分類的子庫,根據(jù)不同用戶問題類別,在相應(yīng)的地域和/或法律類別字庫中進(jìn)行是否存在匹配的法律條文的判斷。這樣就降低了數(shù)據(jù)庫成本,同時(shí)大大降低了進(jìn)行匹配運(yùn)算時(shí)的運(yùn)算量。
在一優(yōu)選實(shí)施例中,若用戶輸入的法律咨詢問題為語音信息,則將語音信息轉(zhuǎn)換為文字信息。目前語音轉(zhuǎn)文字技術(shù)已經(jīng)相當(dāng)成熟,在實(shí)際應(yīng)用中可直接將算法嵌入本發(fā)明方法中即可。
用戶在輸入問題時(shí)可能無法確切知道自己的問題應(yīng)當(dāng)包含哪些自然語義要素和內(nèi)容,在另一優(yōu)選實(shí)施例中,本發(fā)明將用戶曾經(jīng)問過的問題作為歷史用戶問句保存在歷史咨詢問題庫中,當(dāng)用戶輸入問題的過程中,將用戶已經(jīng)輸入的問題自然語義要素與歷史用戶問句庫中的歷史用戶問句對(duì)應(yīng)的自然語義要素進(jìn)行實(shí)時(shí)匹配,可以預(yù)先用前述的關(guān)鍵詞提取技術(shù),將歷史用戶問句庫中的歷史用戶問句對(duì)應(yīng)的自然語義要素都提取出來,并保存在歷史用戶問句庫中。。當(dāng)發(fā)現(xiàn)歷史用戶問句庫中存在相匹配的歷史用戶問句,則輸出相匹配的歷史咨詢問題,供用戶選擇,用戶只需選擇確認(rèn)其想要問的問題即可,既提高了用戶體驗(yàn),又避免了當(dāng)用戶問題內(nèi)容不夠全面時(shí)可能存在的無法提供法條,或需要不斷反問用戶才能給出法條的情況。例如,歷史問句庫中存在一個(gè)歷史問句包括的自然語義要素為(A、B、C、D、E、F),另一個(gè)歷史問句包括的自然語義要素為(M、B、Q、D、F),則當(dāng)用戶輸入(B、D)時(shí),由于(A、B、C、D、E、F)和(M、B、Q、D、F)都包含了(B、D),則將上述來兩個(gè)歷史問句推薦出來供用戶選擇。在另一種情況下,用戶直接輸入了包含自然語義要素(A、B、C、D、E、F)的問句,同歷史用戶問句庫中的一個(gè)歷史用戶問句的自然語義要素完全匹配,此時(shí)將此歷史用戶問句推薦出來供用戶確認(rèn)。
對(duì)應(yīng)前述一種法律信息查詢的方法,本發(fā)明還提供一種法律信息查詢的裝置,請參見圖4,圖4示出了本發(fā)明法律信息查詢的裝置一實(shí)施例的結(jié)構(gòu)圖。裝置400包括:自然語義要素提取模塊401、匹配模塊402和輸出模塊403。將法律咨詢問題輸入自然語義要素提取模塊401,并提取法律咨詢問題對(duì)應(yīng)的自然語義要素,將提取的法律咨詢問題自然語義要素輸入匹配模塊402,匹配模塊402以法律知識(shí)庫中的法律條文對(duì)應(yīng)的法律法規(guī)要素為基礎(chǔ),進(jìn)行匹配度運(yùn)算。若存在相匹配的法律條文和法律咨詢問題,則讓輸出模塊403輸出相匹配的法律條文,在此實(shí)施例中,所述相匹配包括前述的完全匹配情況或部分匹配情況。
所述匹配模塊402可以包括:
映射子模塊,用于將所述法律咨詢問題對(duì)應(yīng)的自然語義要素映射到法律法規(guī)要素,作為法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素;
判斷子模塊,用于判斷所述法律知識(shí)庫中是否存在匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的法律法規(guī)要素與所述匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素相匹配。
在一個(gè)例子中,所述匹配模塊進(jìn)一步用于判斷所述法律知識(shí)庫中是否存在完全匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述完全匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素完全匹配;
所述輸出模塊進(jìn)一步用于響應(yīng)于所述法律知識(shí)庫中存在完全匹配的法律條文,則輸出所述完全匹配的法律條文。
在另一個(gè)例子中,所述匹配模塊進(jìn)一步用于響應(yīng)于沒有完全匹配的法律條文,則判斷是否存在部分匹配的法律條文,使得所述法律咨詢問題對(duì)應(yīng)的自然語義要素與所述部分匹配的法律條文對(duì)應(yīng)的法律法規(guī)要素的一部分相匹配;
所述輸出模塊進(jìn)一步用于響應(yīng)于所述法律知識(shí)庫中存在部分匹配的法律條文,則輸出所述部分匹配的法律條文。
在一優(yōu)選實(shí)施例中,裝置400還包括反問模塊404,當(dāng)匹配模塊402進(jìn)行匹配運(yùn)算的結(jié)果為部分匹配時(shí),反問模塊404則根據(jù)部分匹配的法律條文中沒有匹配到的法律法規(guī)要素,生成反問問題進(jìn)行反問。此實(shí)施例中,自然語義要素提取模塊401還用于對(duì)反問得到的答復(fù)進(jìn)行自然語義要素提取,以得到補(bǔ)充的自然語義要素,匹配模塊402進(jìn)一步用于判斷補(bǔ)充的自然語義要素與部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素是否完全匹配,若補(bǔ)充的自然語義要素與部分匹配的法律條文中沒有被匹配到的法律法規(guī)要素完全匹配,輸出模塊403輸出完全匹配的法律條文。
在另一實(shí)施例中,裝置400還包括組合模塊4041,用于將所述部分匹配的法律條文中沒有匹配到的法律法規(guī)要素組合成選擇性問題進(jìn)行反問,此處的選擇性問題的組合方法同前述方法。
在另一實(shí)施例中,裝置400還包括預(yù)處理模塊405,在自然語義要素提取模塊401之前,對(duì)法律咨詢問題進(jìn)行非法詞過濾、前后綴過濾、停詞過濾、拼音過濾等預(yù)處理操作,而后自然語義要素提取模塊401對(duì)經(jīng)過預(yù)處理的法律咨詢問題進(jìn)行自然語義要素提取。
更優(yōu)地,所述裝置還包括擴(kuò)展接口,用于接收用戶導(dǎo)入的其他法律數(shù)據(jù)庫。
此外,所述法律知識(shí)庫可以包括多個(gè)按照地域和/或法律類別進(jìn)行分類的子庫,所述裝置還包括分類模塊,用于識(shí)別所述法律咨詢問題的地域和/或法律類別,進(jìn)而可以根據(jù)法律咨詢問題的地域和/或法律類別,分別進(jìn)入不同的法律知識(shí)庫字庫進(jìn)行法條的查詢。
在一實(shí)施例中,所述裝置還包括語音轉(zhuǎn)換模塊,當(dāng)用戶輸入為語音信息時(shí),轉(zhuǎn)化為文字信息,為后續(xù)的自然語義提取提取、匹配等操作提供基礎(chǔ)。
更優(yōu)地,為了更好地獲取用戶問題,并提高用戶體驗(yàn)。所述裝置還包括:歷史咨詢問題庫、問題查找模塊和問題輸出模塊。歷史咨詢問題庫包含了用戶曾經(jīng)問過的歷史問題;問題查找模塊,用于實(shí)時(shí)查找用戶輸入的問題是否已經(jīng)存在于歷史問題庫中;若存在,則使用問題輸出模塊輸出該歷史問題。
法律咨詢問題的獲取方式涵蓋了現(xiàn)有技術(shù)中的多種渠道,例如微信、網(wǎng)頁、應(yīng)用軟件、電話、短信、實(shí)體機(jī)器人和自主咨詢終端等,所述設(shè)備還包括咨詢問題獲取模塊,用于在上述渠道中獲取法律咨詢問題。
本發(fā)明提取法律咨詢問題中的自然語義要素,并同法條的法律法規(guī)要素進(jìn)行匹配運(yùn)算,若匹配則給出相應(yīng)法條。本發(fā)明還提出了問題反問機(jī)制,能夠更加智能地獲取用戶的咨詢問題信息,進(jìn)而能夠更加準(zhǔn)確地給出相應(yīng)的法律條文。同時(shí),問句智能推薦的功能,大大提高了用戶體驗(yàn)。
提供對(duì)本公開的先前描述是為使得本領(lǐng)域任何技術(shù)人員皆能夠制作或使用本公開。對(duì)本公開的各種修改對(duì)本領(lǐng)域技術(shù)人員來說都將是顯而易見的,且本文中所定義的普適原理可被應(yīng)用到其他變體而不會(huì)脫離本公開的精神或范圍。由此,本公開并非旨在被限定于本文中所描述的示例和設(shè)計(jì),而是應(yīng)被授予與本文中所公開的原理和新穎性特征相一致的最廣范圍。