本發(fā)明涉及機器學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種基于模糊深度信念網(wǎng)絡(luò)的刑事案件輔助決策方法,進一步涉及一種使用深度學(xué)習(xí)與模糊數(shù)學(xué)的結(jié)合的案件檢索方法。
背景技術(shù):
法院作為案件審理的主體,在多年的工作中已經(jīng)積累了大量豐富的成功經(jīng)驗,并以數(shù)字化的形式保存了大量案件情報信息。同時,隨著計算機技術(shù)應(yīng)用的逐步深入,對這些信息的管理和應(yīng)用策略也日漸成熟,特別是在各種管理信息系統(tǒng)投入應(yīng)用后,對案件情報信息的應(yīng)用力度和管理能力已經(jīng)大大提高。
在歷史案件信息的綜合挖掘利用方面,部分發(fā)達國家早在上世紀80年代后期就開始了研究。他們依靠其先進的計算機技術(shù)的發(fā)展,利用計算機系統(tǒng)強大的數(shù)據(jù)處理與數(shù)據(jù)分析能力,把案件處理工作中獲取的各類信息進行統(tǒng)一而規(guī)范的管理,以人工智能(如機器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、決策樹、案例推理等)的方法進行數(shù)據(jù)的綜合挖掘與綜合利用,從而得出相對可靠的、具有預(yù)警功能的情報信息或方案建議,以利于決策并指導(dǎo)行動。具有代表性的有英國情報核心分析系統(tǒng)(icas)、美國比較數(shù)據(jù)系統(tǒng)(compstat)、加拿大自動化犯罪情報信息系統(tǒng)(aciis)、澳大利亞執(zhí)法情報網(wǎng)絡(luò)(alein)以及我國香港的警隊刑事情報信息系統(tǒng)(fcis)等。
近年來,案例推理的提出,美國和歐洲相繼在各個行業(yè)結(jié)合自身的需求研制和開發(fā)許多系統(tǒng),使案例推理成為人工智能領(lǐng)域的研究熱點。cbr有兩種類型,即問題求解型和解釋型。問題求解型側(cè)重于對過去策略的匹配與修改,而解釋型強調(diào)以舊案例對新案例作出評價與解釋。無論哪一種,其推理過程均類似于人類經(jīng)驗類比推理,而且具有簡化知識獲取、通過直接獲得提高求解效率、求解質(zhì)量較高、適用于非計算推導(dǎo)的優(yōu)點。因此,它將是人工智能與專家系統(tǒng)設(shè)計的一種非常具有發(fā)展前景的方法。
作為人工智能的一種推理技術(shù)和學(xué)習(xí)機制,如今有很多學(xué)者和學(xué)術(shù)團體致力于cbr的理論與方法研究。比較知名的學(xué)者如rogershank、janetkolodner、brucepoter、davidwilsond等;學(xué)術(shù)團體主要有德國政府資助的kaiserslautern大學(xué)的michaelrichter與klausdieteralthoff等人組成的人工智能和知識系統(tǒng)研究小組,麻薩諸塞州立大學(xué)的edwinarissland研究小組,以及美國海軍人工智能實驗室的智能輔助決策研究小組等。自1987年以來,國際學(xué)術(shù)界每年都舉行cbr研討會,廣泛征集研究成果。如eccbr(europeanconferenceoncase-basedreasoning)、iccbr(internationalconferenceoncase-basedreasoning)、aaai(americanassociationforarti-ficialintelligence)等。還有些個人或政府資助建立的cbr專門網(wǎng)站和工作室,如ai-cbr.等。所有這些對cbr的研究和發(fā)展均做出了重要的貢獻。
深度學(xué)習(xí)的概念由hinton等人于2006年提出。基于深度置信網(wǎng)絡(luò)(dbn)提出非監(jiān)督貪心逐層訓(xùn)練算法,為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來希望,隨后提出多層自動編碼器深層結(jié)構(gòu)。此外lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法,它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。
模糊數(shù)學(xué)在模糊集合、模糊邏輯的基礎(chǔ)上發(fā)展起來的模糊拓撲、模糊測度論等數(shù)學(xué)領(lǐng)域的統(tǒng)稱。是研究現(xiàn)實世界中許多界限不分明甚至是很模糊的問題的數(shù)學(xué)工具。在模式識別、人工智能等方面有廣泛的應(yīng)用。在1965年美國控制論學(xué)者l.a.扎德發(fā)表論文《模糊集合》,標志著這門新學(xué)科的誕生?,F(xiàn)代數(shù)學(xué)建立在集合論的基礎(chǔ)上。一組對象確定一組屬性,人們可以通過指明屬性來說明概念,也可以通過指明對象來說明。符合概念的那些對象的全體叫做這個概念的外延,外延實際上就是集合。一切現(xiàn)實的理論系統(tǒng)都有可能納入集合描述的數(shù)學(xué)框架。經(jīng)典的集合論只把自己的表現(xiàn)力限制在那些有明確外延的概念和事物上,它明確地規(guī)定:每一個集合都必須由確定的元素所構(gòu)成,元素對集合的隸屬關(guān)系必須是明確的。對模糊性的數(shù)學(xué)處理是以將經(jīng)典的集合論擴展為模糊集合論為基礎(chǔ)的,乘積空間中的模糊子集就給出了一對元素間的模糊關(guān)系。對模糊現(xiàn)象的數(shù)學(xué)處理就是在這個基礎(chǔ)上展開的。
模糊神經(jīng)網(wǎng)絡(luò)結(jié)合了神經(jīng)網(wǎng)絡(luò)系統(tǒng)和模糊系統(tǒng)的長處,它在處理非線性、模糊性等問題上有很大的優(yōu)越性,在智能信息處理方面存在巨大的潛力;使得越來越多的專家學(xué)者投入到這個領(lǐng)域中來,并做出了卓有成效的研究成果。法律案例推理涉及到模糊推理,因此能夠使用模糊數(shù)學(xué)對推理過程進行建模,并同時借助深度學(xué)習(xí)的方法提高推理的精確性。但深度學(xué)習(xí)與模糊數(shù)學(xué)的結(jié)合還未在法律案例推理領(lǐng)域得到發(fā)揮。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是,提供一種基于模糊深度信念網(wǎng)絡(luò)的刑事案件輔助決策方法。
為實現(xiàn)上述目的,本發(fā)明采用如下的技術(shù)方案:
一種基于模糊深度信念網(wǎng)絡(luò)的刑事案件輔助決策方法包括以下步驟:
步驟s1、根據(jù)法律文書及量刑方法,建立描述案件的向量模型;
步驟s2、根據(jù)判決問題的復(fù)雜度,建立恰當?shù)纳疃壬窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu);
步驟s3、借助已知的正負判決關(guān)系,使用監(jiān)督和非監(jiān)督學(xué)習(xí)方法優(yōu)化模型參數(shù);
步驟s4、利用神經(jīng)網(wǎng)絡(luò)進行建模,預(yù)測出法官判決的結(jié)果。
作為優(yōu)選,步驟s1具體包括:
根據(jù)描述法律文書的詞袋模型,將描述案件的文本轉(zhuǎn)化成一維向量;
根據(jù)刑罰類型,將描述案件的判決結(jié)果轉(zhuǎn)化成一維向量。
作為優(yōu)選,步驟s2具體包括:
根據(jù)判決問題的復(fù)雜度,確定神經(jīng)網(wǎng)絡(luò)的層數(shù);
根據(jù)判決的劃分程度,確定神經(jīng)網(wǎng)絡(luò)中節(jié)點間的連接關(guān)系。
作為優(yōu)選,步驟s3具體包括:
使用非監(jiān)督學(xué)習(xí)法逐層地學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的參數(shù);
使用監(jiān)督學(xué)習(xí)法通過梯度下降法對神經(jīng)網(wǎng)絡(luò)的參數(shù)進行微調(diào)。
作為優(yōu)選,步驟s4具體包括:
根據(jù)神經(jīng)網(wǎng)絡(luò)的參數(shù)計算每個隱藏神經(jīng)元的活躍程度;
計算從屬函數(shù)的值;
利用隱藏神經(jīng)元的活躍程度及從屬函數(shù)的值獲取神經(jīng)網(wǎng)絡(luò)的最終輸出結(jié)果;
將輸出結(jié)果對應(yīng)于判決意義。
一種基于模糊深度信念網(wǎng)絡(luò)的刑事案件輔助決策方法包括以下步驟:
步驟1、根據(jù)法律文書及量刑方法,建立描述案件的向量模型:
假設(shè)已使用詞袋模型對案例文本庫中的文本進行了預(yù)處理,則將數(shù)據(jù)集表示成:
x=[x1,x2,...,xr+t](1)
其中
r是作為訓(xùn)練樣本的文本的數(shù)量,t是用于測試的文本的數(shù)量,d是法律案例的關(guān)鍵詞的數(shù)量。
選擇l篇法律文書進行判決標注,并把它們記作xl。相應(yīng)的標注集記作y。并表示成
y=[y1,y2,k,yl](3)
其中
c是刑罰類型的數(shù)量,在案件審判中常常在兩類判決中進行取舍,因此在這種情況下認為有兩類刑罰,分別記作正類和負類,如果一個案件xi的判決屬于正類,則yi=[1,0],否則,yi=[0,1];
步驟2、根據(jù)判決問題的復(fù)雜度,建立恰當?shù)纳疃壬窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu):
構(gòu)造一個具有一個輸入層、一個輸出層和n-1個隱藏層的深度信念網(wǎng)絡(luò)(dbn),該網(wǎng)絡(luò)的輸入層的節(jié)點個數(shù)等于法律文書的關(guān)鍵詞的個數(shù)d,該網(wǎng)絡(luò)的輸出層的節(jié)點個數(shù)等于刑罰類型的數(shù)量c,
步驟3、借助已知的正負判決關(guān)系,使用監(jiān)督和非監(jiān)督學(xué)習(xí)方法優(yōu)化模型參數(shù):
使用逐層的貪婪算法和梯度下降法通過解決以下優(yōu)化問題來訓(xùn)練這個神經(jīng)網(wǎng)絡(luò):
其中hn表示第n層神經(jīng)元的輸出,
設(shè)計兩種判決對應(yīng)的模糊函數(shù),對于正類和反類分別有:
a={(x,μa(x));x∈x}(8)
b={(x,μb(x));x∈x}(9)
對于每個案例,計算該函數(shù)值的過程如下
其中的參數(shù)β和γ的計算方法是
γ=max(d(xi))(13)
β=ξ×γ,ξ≥2(14)
步驟4、利用隱藏神經(jīng)元的活躍程度及從屬函數(shù)的值獲取神經(jīng)網(wǎng)絡(luò)的最終輸出結(jié)果:
獲取神經(jīng)網(wǎng)絡(luò)的最終輸出結(jié)果:
其中,
其中,
把輸入案例的判決類別確定成:
則該系統(tǒng)推薦的判決類型為第
本發(fā)明具有以下特點:
(1)目前有諸多關(guān)于案件推理相關(guān)研究,但是以深度學(xué)習(xí)和模糊數(shù)學(xué)為基礎(chǔ)的案件推理系統(tǒng)還鮮有研究和討論,本發(fā)明研究基于模糊深度信念網(wǎng)絡(luò)的案件智能分析及推理,研究內(nèi)容具有新穎性。
(2)本發(fā)明從案件的證據(jù)及過往因循案例出發(fā),實現(xiàn)案件智能分析及證據(jù)關(guān)聯(lián),有助于減輕法官的工作量,研究具有工程前瞻性。
(3)考慮到案件審理的具有一定的主觀性,同時當前對案件的處理依然不能擺脫人工密集型的特點,本發(fā)明將基于證據(jù)和案例的推理系統(tǒng)應(yīng)用到案件審理過程中,可以有效保障案件審理的客觀性;同時輔助決策系統(tǒng)可以有效保障案件審理的公平,提高審案效率,具有理論創(chuàng)新和應(yīng)用創(chuàng)新的價值。
附圖說明
圖1為本發(fā)明的基于模糊深度信念網(wǎng)絡(luò)的刑事案件輔助決策方法的流程示意圖。
具體實施方式
將案例的特征與法律領(lǐng)域本體案例庫中的本體信息進行比較、匹配,通過本體解析,在法律條例本體案例庫中找到與案例的特征相似的相關(guān)法條,并提取法條及相關(guān)審判推薦,整體架構(gòu)如圖1所示。
根據(jù)法律文書及量刑方法,建立描述案件的向量模型:
假設(shè)已使用詞袋模型對案例文本庫中的文本進行了預(yù)處理,則將數(shù)據(jù)集表示成:
x=[x1,x2,...,xr+t](1)
其中
r是作為訓(xùn)練樣本的文本的數(shù)量,t是用于測試的文本的數(shù)量,d是法律案例的關(guān)鍵詞的數(shù)量。
選擇l篇法律文書進行判決標注,并把它們記作xl。相應(yīng)的標注集記作y。并表示成
y=[y1,y2,k,yl](3)
其中
c是刑罰類型的數(shù)量。在案件審判中常常在兩類判決中進行取舍,因此在這種情況下認為有兩類刑罰,分別記作正類和負類。如果一個案件xi的判決屬于正類,則yi=[1,0]’;否則,yi=[0,1]’。
根據(jù)判決問題的復(fù)雜度,建立恰當?shù)纳疃壬窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu):
構(gòu)造一個具有一個輸入層、一個輸出層和n-1個隱藏層的深度信念網(wǎng)絡(luò)(dbn)。該網(wǎng)絡(luò)的輸入層的節(jié)點個數(shù)等于法律文書的關(guān)鍵詞的個數(shù)d。該網(wǎng)絡(luò)的輸出層的節(jié)點個數(shù)等于刑罰類型的數(shù)量c。
借助已知的正負判決關(guān)系,使用監(jiān)督和非監(jiān)督學(xué)習(xí)方法優(yōu)化模型參數(shù):
使用逐層的貪婪算法和梯度下降法通過解決以下優(yōu)化問題來訓(xùn)練這個神經(jīng)網(wǎng)絡(luò):
其中hn表示第n層神經(jīng)元的輸出。
設(shè)計兩種判決對應(yīng)的模糊函數(shù),對于正類和反類分別有:
a={(x,μa(x));x∈x}(8)
b={(x,μb(x));x∈x}(9)
對于每個案例,計算該函數(shù)值的過程如下
其中的參數(shù)β和γ的計算方法是
γ=max(d(xi))(13)
β=ξ×γ,ξ≥2(14)
利用隱藏神經(jīng)元的活躍程度及從屬函數(shù)的值獲取神經(jīng)網(wǎng)絡(luò)的最終輸出結(jié)果:
獲取神經(jīng)網(wǎng)絡(luò)的最終輸出結(jié)果:
其中
其中
把輸入案例的判決類別確定成:
則該系統(tǒng)推薦的判決類型為第