1.一種基于語義匹配的裁判文書檢索方法,其特征在于,包括:
步驟1,客戶端接收用戶輸入的檢索信息,將所述檢索信息發(fā)送至服務(wù)器端,所述檢索信息為待搜索的字段和/或篩選條件;
步驟2,服務(wù)器端接收所述檢索信息,將檢索信息進(jìn)行向量化,生成檢索信息向量;
步驟3,將得到的所述檢索信息向量于預(yù)存儲的裁判文書向量進(jìn)行對比,獲取最匹配的裁判文書向量,將所述最匹配的裁判文書向量對應(yīng)的裁判文書結(jié)果發(fā)送至客戶端。
2.根據(jù)權(quán)利要求1所述的一種基于語義匹配的裁判文書檢索方法,其特征在于,在所述步驟1之前還包括:
服務(wù)器端采集裁判文書;
將采集的裁判文書進(jìn)行數(shù)據(jù)清洗,解析成多個(gè)關(guān)鍵字段,每個(gè)關(guān)鍵字段設(shè)置不同的標(biāo)簽;
將所述多個(gè)關(guān)鍵字段進(jìn)行向量化處理,生成關(guān)鍵字段向量;
將生成的關(guān)鍵字段向量與裁判文書建立映射關(guān)系;
將所述關(guān)鍵字段向量、映射關(guān)系、裁判文書存儲在數(shù)據(jù)庫中。
3.根據(jù)權(quán)利要求1所述的一種基于語義匹配的裁判文書檢索方法,其特征在于,所述篩選條件包括:律師信息、事務(wù)所信息、地域信息、年份信息、案件類型信息中的一種或幾種。
4.根據(jù)權(quán)利要求3所述的一種基于語義匹配的裁判文書檢索方法,其特征在于,所述地域信息包括案件發(fā)生地、案件管轄地和/或其他案件涉及到的地理位置。
5.根據(jù)權(quán)利要求1所述的一種基于語義匹配的裁判文書檢索方法,其特征在于,所述將得到的所述檢索信息向量于預(yù)存儲的裁判文書向量進(jìn)行對比為采用距離測度法或相似性函數(shù)法進(jìn)行向量對比。
6.一種基于語義匹配的裁判文書檢索服務(wù)器,其特征在于,包括:
接收模塊,服務(wù)器端接收所述檢索信息,所述檢索信息為客戶端接收的用戶輸入的檢索信息;
向量生成模塊,用于將檢索信息進(jìn)行向量化,生成檢索信息向量;
對比分析模塊,將得到的所述檢索信息向量于預(yù)存儲的裁判文書向量進(jìn)行對比,獲取最匹配的裁判文書向量;
發(fā)送模塊,用于將所述最匹配的裁判文書向量對應(yīng)的裁判文書結(jié)果發(fā)送至客戶端;
所述檢索信息為待搜索的字段和/或篩選條件。
7.根據(jù)權(quán)利要求6所述的一種基于語義匹配的裁判文書檢索服務(wù)器,其特征在于,還包括:
數(shù)據(jù)清洗模塊,用于將采集的裁判文書進(jìn)行數(shù)據(jù)清洗,解析成多個(gè)關(guān)鍵字段,每個(gè)關(guān)鍵字段設(shè)置不同的標(biāo)簽;
映射模塊,將所述多個(gè)關(guān)鍵字段進(jìn)行向量化處理,生成關(guān)鍵字段向量,將生成的關(guān)鍵字段向量與裁判文書建立映射關(guān)系;
數(shù)據(jù)庫,用于存儲所述關(guān)鍵字段向量、映射關(guān)系、裁判文書。
8.根據(jù)權(quán)利要求6所述的一種基于語義匹配的裁判文書檢索服務(wù)器,其特征在于,所述篩選條件包括:律師信息、事務(wù)所信息、地域信息、年份信息、案件類型信息中的一種或幾種。
9.根據(jù)權(quán)利要求8所述的一種基于語義匹配的裁判文書檢索服務(wù)器,其特征在于,所述地域信息包括案件發(fā)生地、案件管轄地和/或其他案件涉及到的地理位置。
10.根據(jù)權(quán)利要求6所述的一種基于語義匹配的裁判文書檢索服務(wù)器,其特征在于,所述將得到的所述檢索信息向量于預(yù)存儲的裁判文書向量進(jìn)行對比為采用距離測度法或相似性函數(shù)法進(jìn)行向量對比。