本發(fā)明涉及知識(shí)工程
技術(shù)領(lǐng)域:
,特別是指一種法律文書案由分類器的自動(dòng)構(gòu)建方法。
背景技術(shù):
:近幾年,我國(guó)最高人民法院為貫徹落實(shí)審判公開原則,設(shè)立了中國(guó)裁判文書網(wǎng),規(guī)定除涉及國(guó)家秘密、個(gè)人隱私的、未成年人違法犯罪的、以調(diào)解方式結(jié)案的和其他不宜在互聯(lián)網(wǎng)公布的裁判文書外,其余一律在網(wǎng)絡(luò)上公布。這一政策為面向法律文書的自然語(yǔ)言處理技術(shù)帶來(lái)了大量的研究資源。在法律信息公開化的大時(shí)代背景下,在已有的海量法律文書中,讓計(jì)算機(jī)獲得學(xué)習(xí)能力和較準(zhǔn)確的領(lǐng)域知識(shí),有效利用這些海量的文本資源克服文本自然語(yǔ)言理解過(guò)程中的復(fù)雜性問(wèn)題,實(shí)現(xiàn)文本分析,具有重要的理論價(jià)值和實(shí)際意義?,F(xiàn)有技術(shù)中,法律文書的案由提取,多為人工標(biāo)記,效率低下;或是利用正則表達(dá)式進(jìn)行匹配,準(zhǔn)確率低。技術(shù)實(shí)現(xiàn)要素:本發(fā)明要解決的技術(shù)問(wèn)題是提供一種法律文書案由分類器的自動(dòng)構(gòu)建方法,以解決現(xiàn)有技術(shù)所存在的案由提取效率低下、準(zhǔn)確率低的問(wèn)題。為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種法律文書案由分類器的自動(dòng)構(gòu)建方法,包括:獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料;對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞;根據(jù)分詞結(jié)果,確定每類案由的基本關(guān)鍵詞;根據(jù)分詞結(jié)果,對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表;輸入待分類法律文書,對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。進(jìn)一步地,所述法律文書包括:判決書和裁定書;所述獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料包括:獲取多類案由的法律文書,根據(jù)獲取的所述多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù);針對(duì)第i類案由,從構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù)中選取相應(yīng)的判決書和裁定書進(jìn)行合并,得到第i類案由的測(cè)試語(yǔ)料。進(jìn)一步地,在對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞之前,所述方法還包括:對(duì)每類測(cè)試語(yǔ)料進(jìn)行結(jié)構(gòu)劃分,去掉文書頭部、文書尾部以及當(dāng)事人信息。進(jìn)一步地,所述對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞包括:根據(jù)預(yù)先自定義的去停用詞詞典和分詞詞典,利用ansj分詞器對(duì)去掉文書頭部、文書尾部以及當(dāng)事人信息的每類測(cè)試語(yǔ)料去停用詞和分詞;對(duì)分詞后得到的結(jié)果進(jìn)行數(shù)據(jù)過(guò)濾。進(jìn)一步地,所述對(duì)分詞后得到的結(jié)果進(jìn)行數(shù)據(jù)過(guò)濾包括:過(guò)濾掉分詞后結(jié)果中的人名、地名、企業(yè)、法院。進(jìn)一步地,所述根據(jù)分詞結(jié)果,對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表包括:根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的第i類案由的基本關(guān)鍵詞,確定第i類案由的擴(kuò)充關(guān)鍵詞列表。進(jìn)一步地,所述根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的第i類案由的基本關(guān)鍵詞,確定第i類案由的擴(kuò)充關(guān)鍵詞列表包括:應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,將第i類測(cè)試語(yǔ)料分詞結(jié)果中的所有詞語(yǔ)投影到向量空間中,得到第i類測(cè)試語(yǔ)料的詞向量模型;加載第i類測(cè)試語(yǔ)料的詞向量模型,計(jì)算詞向量模型中每個(gè)詞語(yǔ)與第i類案由的基本關(guān)鍵詞的語(yǔ)義相似度;將計(jì)算得到的語(yǔ)義相似度由大到小進(jìn)行排序,選取語(yǔ)義相似度最高且語(yǔ)義相似度均大于門限值的前n個(gè)詞語(yǔ),與確定的第i類案由的基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表。進(jìn)一步地,所述根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表包括:應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,將第i類測(cè)試語(yǔ)料分詞結(jié)果中的所有詞語(yǔ)投影到向量空間中,得到第i類測(cè)試語(yǔ)料的詞向量模型;加載第i類測(cè)試語(yǔ)料的詞向量模型,計(jì)算詞向量模型中每個(gè)詞語(yǔ)與第i類案由的基本關(guān)鍵詞的語(yǔ)義相似度;將計(jì)算得到的語(yǔ)義相似度由小到大進(jìn)行排序,選取語(yǔ)義相似度最高且語(yǔ)義相似度均大于門限值的后n個(gè)詞語(yǔ),與確定的第i類案由的基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表。進(jìn)一步地,所述對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由包括:對(duì)輸入的所述待分類法律文書去停用詞和分詞;根據(jù)分詞結(jié)果,將所述待分類法律文書中的所有詞投影到向量空間中,得到所述待分類法律文書的詞向量模型,計(jì)算各類擴(kuò)充關(guān)鍵詞列表中的每個(gè)關(guān)鍵詞與所述待分類法律文書的詞向量模型中每個(gè)詞語(yǔ)的語(yǔ)義相似度;獲取與每個(gè)關(guān)鍵詞最接近的前m個(gè)詞語(yǔ)的語(yǔ)義相似度進(jìn)行求和,求和結(jié)果作為每個(gè)關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度;將每類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。進(jìn)一步地,所述將每類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由包括:將第i類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,得到所述待分類法律文書與第i類案由的擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和;將得到的多個(gè)語(yǔ)義相似度總和進(jìn)行比較,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。本發(fā)明的上述技術(shù)方案的有益效果如下:上述方案中,獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料;對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞;根據(jù)分詞結(jié)果,確定每類案由的基本關(guān)鍵詞;根據(jù)分詞結(jié)果,對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表;輸入待分類法律文書,對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。這樣,通過(guò)詞向量訓(xùn)練,完成對(duì)自然語(yǔ)言描述的法律文書的理解,從而高效、準(zhǔn)確地自動(dòng)確定待分類法律文書的案由,完成待分類法律文書的分類。附圖說(shuō)明圖1為本發(fā)明實(shí)施例提供的法律文書案由分類器的自動(dòng)構(gòu)建方法的流程示意圖。具體實(shí)施方式為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。本發(fā)明針對(duì)現(xiàn)有的案由提取效率低下、準(zhǔn)確率低的問(wèn)題,提供一種法律文書案由分類器的自動(dòng)構(gòu)建方法。如圖1所示,本發(fā)明實(shí)施例提供的法律文書案由分類器的自動(dòng)構(gòu)建方法,包括:s101,獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料;s102,對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞;s103,根據(jù)分詞結(jié)果,確定每類案由的基本關(guān)鍵詞;s104,根據(jù)分詞結(jié)果,對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表;s105,輸入待分類法律文書,對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。本發(fā)明實(shí)施例所述的法律文書案由分類器的自動(dòng)構(gòu)建方法,獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料;對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞;根據(jù)分詞結(jié)果,確定每類案由的基本關(guān)鍵詞;根據(jù)分詞結(jié)果,對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表;輸入待分類法律文書,對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。這樣,通過(guò)詞向量訓(xùn)練,完成對(duì)自然語(yǔ)言描述的法律文書的理解,從而高效、準(zhǔn)確地自動(dòng)確定待分類法律文書的案由,完成待分類法律文書的分類。在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述法律文書包括:判決書和裁定書;所述獲取多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù),根據(jù)構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù),確定每類案由的測(cè)試語(yǔ)料包括:獲取多類案由的法律文書,根據(jù)獲取的所述多類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù);針對(duì)第i類案由,從構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù)中選取相應(yīng)的判決書和裁定書進(jìn)行合并,得到第i類案由的測(cè)試語(yǔ)料。本實(shí)施例中,分析了《人民法院信息網(wǎng)絡(luò)系統(tǒng)建設(shè)技術(shù)規(guī)范——案由代碼》(2015年修訂本),《人民法院信息網(wǎng)絡(luò)系統(tǒng)建設(shè)技術(shù)規(guī)范——案由代碼》(2015年修訂本)中明確將所有案由劃分為民事、刑事、行政、賠償和執(zhí)行五大類型,經(jīng)分析判定其中民事和刑事兩類最為常見。因此,本實(shí)施例從民事和刑事這兩大類中選取了出現(xiàn)/發(fā)生頻率最高的11類案由,并從網(wǎng)絡(luò)中爬取這11類案由的法律文書,根據(jù)爬取的這11類案由的法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù);針對(duì)每類案由,從構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù)中選取判決書和裁定書輸出進(jìn)行合并,形成11類案由的測(cè)試語(yǔ)料,具體的,針對(duì)第i類案由,從構(gòu)建的所述案由基礎(chǔ)語(yǔ)料庫(kù)中選取相應(yīng)的判決書和裁定書輸出到同一文檔中,得到第i類案由的測(cè)試語(yǔ)料。本實(shí)施例中,所述案由基礎(chǔ)語(yǔ)料庫(kù)包括11類案由的所有形式的法律文書(判決書、裁定書、通知書等等),每篇文書為一條語(yǔ)料,所述案由基礎(chǔ)語(yǔ)料庫(kù)存儲(chǔ)了每篇文書的全文、案由和文書形式。每類案由的測(cè)試語(yǔ)料包括:判決書、裁定書。本實(shí)施例中,例如,分別從網(wǎng)上對(duì)每類案由爬取5000份法律文書,構(gòu)建案由基礎(chǔ)語(yǔ)料庫(kù)。針對(duì)每類案由,從構(gòu)建的案由基礎(chǔ)語(yǔ)料庫(kù)中選取判決書和裁定書合并為一份文檔,形成11類案由的測(cè)試語(yǔ)料,形成的11類案由包括:財(cái)產(chǎn)保險(xiǎn)合同糾紛、房屋買賣合同糾紛、交通事故責(zé)任糾紛、金融借款合同糾紛、民間借貸糾紛、勞動(dòng)合同糾紛、信用卡糾紛、離婚糾紛、盜竊罪、故意傷害罪、危險(xiǎn)駕駛罪;如表1所示。表111類案由序號(hào)類型案由名稱/內(nèi)容1民事財(cái)產(chǎn)保險(xiǎn)合同糾紛2民事房屋買賣合同糾紛3民事交通事故責(zé)任糾紛4民事金融借款合同糾紛5民事民間借貸糾紛6民事勞動(dòng)合同糾紛7民事信用卡糾紛8民事離婚糾紛9刑事盜竊罪10刑事故意傷害罪11刑事危險(xiǎn)駕駛罪在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,在對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞之前,所述方法還包括:對(duì)每類測(cè)試語(yǔ)料進(jìn)行結(jié)構(gòu)劃分,去掉文書頭部、文書尾部以及當(dāng)事人信息。本實(shí)施例中,在對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞之前,可以對(duì)每類測(cè)試語(yǔ)料進(jìn)行結(jié)構(gòu)劃分,去掉文書頭部、文書尾部以及當(dāng)事人信息,只保留文書的案情陳述部分。本實(shí)施例中,例如,對(duì)交通事故責(zé)任糾紛判決書進(jìn)行結(jié)構(gòu)劃分后,得到的結(jié)構(gòu)如下:1.文書頭部審理法院、審理程序、案件類型、案由、案號(hào)、年份2.當(dāng)事人信息原告、原告委托代理人、被告、被告委托代理人3.審理經(jīng)過(guò)案由、受理日期、主要審判人員、適用程序、開庭方式等4.原告訴稱事故發(fā)生時(shí)間、地點(diǎn)、主要交通工具、傷亡情況等5.被告辯稱被告墊付費(fèi)用、是否承認(rèn)事實(shí)、被告請(qǐng)求6.法院查明事故認(rèn)定時(shí)間、認(rèn)定單編號(hào)、司法鑒定單位、日期等7.法院觀點(diǎn)認(rèn)定事實(shí)情況、受害人年齡、認(rèn)定費(fèi)用情況、依據(jù)法條等8.判決結(jié)果基本情況、被告賠償情況、案件受理費(fèi)、原告承擔(dān)情況等9.文書尾部審判人員情況、裁判日期、書記員去掉文書頭部、文書尾部以及當(dāng)事人信息后,得到的結(jié)果為:3.審理經(jīng)過(guò)案由、受理日期、主要審判人員、適用程序、開庭方式等4.原告訴稱事故發(fā)生時(shí)間、地點(diǎn)、主要交通工具、傷亡情況等5.被告辯稱被告墊付費(fèi)用、是否承認(rèn)事實(shí)、被告請(qǐng)求6.法院查明事故認(rèn)定時(shí)間、認(rèn)定單編號(hào)、司法鑒定單位、日期等7.法院觀點(diǎn)認(rèn)定事實(shí)情況、受害人年齡、認(rèn)定費(fèi)用情況、依據(jù)法條等8.判決結(jié)果基本情況、被告賠償情況、案件受理費(fèi)、原告承擔(dān)情況等在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述對(duì)每類測(cè)試語(yǔ)料去停用詞和分詞包括:根據(jù)預(yù)先自定義的去停用詞詞典和分詞詞典,利用ansj分詞器對(duì)去掉文書頭部、文書尾部以及當(dāng)事人信息的每類測(cè)試語(yǔ)料去停用詞和分詞;對(duì)分詞后得到的結(jié)果進(jìn)行數(shù)據(jù)過(guò)濾。本實(shí)施例中,根據(jù)預(yù)先自定義的去停用詞詞典stopwords.dic和分詞詞典lawdictionary.dic,利用ansj分詞器對(duì)去掉文書頭部、文書尾部以及當(dāng)事人信息的每類測(cè)試語(yǔ)料去停用詞和分詞。本實(shí)施例中,由于分詞結(jié)果中的人名、地名、企業(yè)、法院對(duì)于之后的詞向量訓(xùn)練擴(kuò)充關(guān)鍵詞,會(huì)產(chǎn)生較大誤差,因此需過(guò)濾掉分詞結(jié)果中的人名、地名、企業(yè)、法院,具體的步驟包括:識(shí)別分詞結(jié)果中的人名、地名、企業(yè)、法院,并將識(shí)別出的人名、地名、企業(yè)、法院過(guò)濾掉,從而獲得高質(zhì)量的測(cè)試語(yǔ)料,為下一步詞向量訓(xùn)練做準(zhǔn)備。本實(shí)施例中,經(jīng)過(guò)數(shù)據(jù)過(guò)濾得到的部分結(jié)果包括:上訴人機(jī)動(dòng)車交通事故責(zé)任糾紛一案不服梅興法民事判決本院提起上訴本院受理依法組成合議庭公開開庭進(jìn)行審理上訴人被上訴人委托代理人到庭參加訴訟被上訴人本院傳票傳喚正當(dāng)理由不到參加訴訟缺席審理本案現(xiàn)已審理終結(jié)原審法院審理認(rèn)為本案機(jī)動(dòng)車交通事故引起賠償糾紛事故公安局交通警察大隊(duì)作出交通事故認(rèn)定書認(rèn)定被告過(guò)錯(cuò)行為應(yīng)當(dāng)承擔(dān)此次事故全部責(zé)任原告事故承擔(dān)責(zé)任交警部門認(rèn)定事實(shí)清楚定責(zé)準(zhǔn)確被告沒(méi)有異議予以確認(rèn)對(duì)于交通事故賠償協(xié)議交警部門調(diào)取證據(jù)交通事故賠償協(xié)議委托書可以證實(shí)原告當(dāng)時(shí)確實(shí)委托被告進(jìn)行協(xié)商簽訂交通事故賠償協(xié)議原審認(rèn)為本案沒(méi)有獨(dú)立請(qǐng)求權(quán)該案處理結(jié)果沒(méi)有法律利害關(guān)系需要本案承擔(dān)民事責(zé)任被告委托代理人請(qǐng)求追加本案第三中華人民共和國(guó)民事訴訟法第五十六條關(guān)于第三規(guī)定不符依法不予支持認(rèn)定交通事故賠償協(xié)議是否有效兩個(gè)方面進(jìn)行判斷第一委托人委托權(quán)限進(jìn)行審查如果代理權(quán)限認(rèn)定協(xié)議具有法律效力如果沒(méi)有認(rèn)定沒(méi)有法律效力本案原告委托委托書寫明代理人代理事項(xiàng)權(quán)限交通事故賠償權(quán)委托書寫明授權(quán)事項(xiàng)明確一般理解交通事故賠償事項(xiàng)協(xié)商請(qǐng)求權(quán)不應(yīng)理解能夠被代理人權(quán)利作出放棄交通事故賠償協(xié)議達(dá)成內(nèi)容委托行為原告很多賠償權(quán)利作出放棄委托行為明顯沒(méi)有代理權(quán)超越代理權(quán)依據(jù)中華人民共和國(guó)民法通則第六十六條規(guī)定沒(méi)有代理權(quán)超越代理權(quán)或者代理權(quán)終止行為經(jīng)過(guò)被代理人追認(rèn)被代理人承擔(dān)民事責(zé)任交通事故賠償協(xié)議只有代理人簽名原告簽名表明原告當(dāng)時(shí)協(xié)議認(rèn)可庭審不予認(rèn)可上述角度分析協(xié)議認(rèn)定原告無(wú)效第二原審認(rèn)為公民從事民事活動(dòng)始終遵循公平原則交通事故賠償協(xié)議書日期協(xié)議簽訂簽訂協(xié)議依據(jù)前提交警部門初次作出事故認(rèn)定書當(dāng)時(shí)認(rèn)定原告主要責(zé)任被告次要責(zé)任事故認(rèn)定書交警部門撤銷作出重新認(rèn)定改變認(rèn)定責(zé)任劃分。本實(shí)施例中,數(shù)據(jù)過(guò)濾后,根據(jù)分詞結(jié)果,對(duì)不同案由的核心詞匯進(jìn)行分析,根據(jù)分析結(jié)果,確定每類案由的基本關(guān)鍵詞,各類案由及其基本關(guān)鍵詞對(duì)應(yīng)關(guān)系為:財(cái)產(chǎn)保險(xiǎn)合同糾紛:財(cái)產(chǎn);房屋買賣合同糾紛:房屋買賣;交通事故責(zé)任糾紛:交通;金融借款合同糾紛:金融;民間借貸糾紛:借貸;勞動(dòng)合同糾紛:勞動(dòng);信用卡糾紛:信用卡;離婚糾紛:離婚;盜竊罪:盜竊;故意傷害罪:故意傷害;危險(xiǎn)駕駛罪:危險(xiǎn)駕駛。本實(shí)施例中,根據(jù)分詞結(jié)果,可以應(yīng)用詞向量(word2vec)模型對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的每案由的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表,具體的步驟包括:根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的第i類案由的基本關(guān)鍵詞,確定第i類案由的擴(kuò)充關(guān)鍵詞列表。在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的第i類案由的基本關(guān)鍵詞,確定第i類案由的擴(kuò)充關(guān)鍵詞列表包括:應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,將第i類測(cè)試語(yǔ)料分詞結(jié)果中的所有詞語(yǔ)投影到向量空間中,得到第i類測(cè)試語(yǔ)料的詞向量模型;加載第i類測(cè)試語(yǔ)料的詞向量模型,計(jì)算詞向量模型中每個(gè)詞語(yǔ)與第i類案由的基本關(guān)鍵詞的語(yǔ)義相似度;將計(jì)算得到的語(yǔ)義相似度由大到小進(jìn)行排序,選取語(yǔ)義相似度最高且語(yǔ)義相似度均大于門限值的前n個(gè)詞語(yǔ),與確定的第i類案由的基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表。本實(shí)施例中,可以采用詞向量模型中的跳躍式詞共現(xiàn)(skip-gram)模型第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,將第i類測(cè)試語(yǔ)料分詞結(jié)果中的每個(gè)詞語(yǔ)投影到200維空間中,考慮一個(gè)詞上下文的5個(gè)詞語(yǔ)。采樣的閾值為1e-3。學(xué)習(xí)速率alpha為0.025,設(shè)置若一個(gè)詞語(yǔ)在文檔中出現(xiàn)的次數(shù)小于5,就會(huì)丟棄。調(diào)用learnfile()和savemodel()方法對(duì)每一類測(cè)試語(yǔ)料進(jìn)行學(xué)習(xí),得到第i類測(cè)試語(yǔ)料的詞向量模型。所述詞向量是指根據(jù)詞頻、語(yǔ)義、上下文,將詞語(yǔ)投影到向量空間中。語(yǔ)義越相似,上下文越相關(guān),詞語(yǔ)之間的距離越小。本實(shí)施例中,再調(diào)用方法loadjavamodel(),加載第i類測(cè)試語(yǔ)料的詞向量模型,利用distance(queryword)方法,計(jì)算詞向量模型中每個(gè)詞語(yǔ)與第i類案由的基本關(guān)鍵詞的語(yǔ)義相似度,并由大到小排序,選取相似度最高且大小均大于門限值(例如,0.8)的前n(例如,n=4)個(gè)關(guān)鍵詞,與確定的第i類案由的基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表。按照上述方法,得到的11類案由的擴(kuò)充關(guān)鍵詞以及其與相應(yīng)的基本關(guān)鍵詞的語(yǔ)義相似度值如下:財(cái)產(chǎn)保險(xiǎn)合同糾紛:投保0.89881,房屋0.87934,項(xiàng)目0.85115,保單0.80163房屋買賣合同糾紛:合同糾紛0.88907,購(gòu)買價(jià)0.87294,查詢費(fèi)0.85092,房產(chǎn)局0.84104交通事故責(zé)任糾紛:病歷0.83821,傷0.82867,交警部門0.82586,時(shí)限0.81145金融借款合同糾紛:融資0.85911,簽訂0.84167,買賣合同0.84166,約定0.83492民間借貸糾紛:民間0.96597,約束力0.93308,鑒定中心0.88921,關(guān)系0.85373勞動(dòng)合同糾紛:辭退0.91625,作為0.89294,普通0.86403,拒絕接受0.86290信用卡糾紛:中銀0.90783,分期付款0.88978,家裝0.88137,業(yè)務(wù)0.84064離婚糾紛:結(jié)婚0.95378,終結(jié)0.95196,破裂0.94161,愿意0.92451盜竊罪:多次0.90784,參與0.85958,數(shù)額0.83954,犯罪0.82755故意傷害罪:共同犯罪0.92732,毆斗0.92485,情節(jié)0.92474,結(jié)論書0.91245危險(xiǎn)駕駛罪:指控0.95676,罪名0.95616,證人0.94833,機(jī)關(guān)0.94215本實(shí)施例中,將確定的第i類案由的擴(kuò)充關(guān)鍵詞和基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表,最終得到的擴(kuò)充關(guān)鍵詞列表為基本關(guān)鍵詞與擴(kuò)充關(guān)鍵詞的集合,顯示如下:財(cái)產(chǎn)保險(xiǎn)合同糾紛:[財(cái)產(chǎn),投保,房屋,項(xiàng)目,保單]房屋買賣合同糾紛:[房屋買賣,合同糾紛,購(gòu)買價(jià),查詢費(fèi),房產(chǎn)局]交通事故責(zé)任糾紛:[交通,病歷,傷,交警部門,時(shí)限]金融借款合同糾紛:[金融,融資,簽訂,買賣合同,約定]民間借貸糾紛:[借貸,民間,約束力,鑒定中心,關(guān)系]勞動(dòng)合同糾紛:[勞動(dòng),辭退,作為,普通,拒絕接受]信用卡糾紛:[信用卡,中銀,分期付款,家裝,業(yè)務(wù)]離婚糾紛:[離婚,結(jié)婚,終結(jié),破裂,愿意]盜竊罪:[盜竊,多次,參與,數(shù)額,犯罪]故意傷害罪:[故意傷害,共同犯罪,毆斗,情節(jié),結(jié)論書]危險(xiǎn)駕駛罪:[危險(xiǎn)駕駛,指控,罪名,證人,機(jī)關(guān)]。在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述根據(jù)分詞結(jié)果,應(yīng)用詞向量模型對(duì)每類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,擴(kuò)充關(guān)鍵詞,根據(jù)擴(kuò)充的關(guān)鍵詞和確定的基本關(guān)鍵詞,確定每類案由的擴(kuò)充關(guān)鍵詞列表包括:應(yīng)用詞向量模型對(duì)第i類測(cè)試語(yǔ)料進(jìn)行詞向量訓(xùn)練,將第i類測(cè)試語(yǔ)料分詞結(jié)果中的所有詞語(yǔ)投影到向量空間中,得到第i類測(cè)試語(yǔ)料的詞向量模型;加載第i類測(cè)試語(yǔ)料的詞向量模型,計(jì)算詞向量模型中每個(gè)詞語(yǔ)與第i類案由的基本關(guān)鍵詞的語(yǔ)義相似度;將計(jì)算得到的語(yǔ)義相似度由小到大進(jìn)行排序,選取語(yǔ)義相似度最高且語(yǔ)義相似度均大于門限值的后n個(gè)詞語(yǔ),與確定的第i類案由的基本關(guān)鍵詞,共同構(gòu)成第i類案由的擴(kuò)充關(guān)鍵詞列表。在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述對(duì)輸入的所述待分類法律文書去停用詞和分詞、并進(jìn)行詞向量訓(xùn)練,根據(jù)所述待分類法律文書的詞向量訓(xùn)練結(jié)果,計(jì)算所述待分類法律文書與每類擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由包括:對(duì)輸入的所述待分類法律文書去停用詞和分詞;根據(jù)分詞結(jié)果,將所述待分類法律文書中的所有詞投影到向量空間中,得到所述待分類法律文書的詞向量模型,計(jì)算各類擴(kuò)充關(guān)鍵詞列表中的每個(gè)關(guān)鍵詞與所述待分類法律文書的詞向量模型中每個(gè)詞語(yǔ)的語(yǔ)義相似度;獲取與每個(gè)關(guān)鍵詞最接近的前m個(gè)詞語(yǔ)的語(yǔ)義相似度進(jìn)行求和,求和結(jié)果作為每個(gè)關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度;將每類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。在前述法律文書案由分類器的自動(dòng)構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述將每類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由包括:將第i類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,得到所述待分類法律文書與第i類案由的擴(kuò)充關(guān)鍵詞列表的語(yǔ)義相似度總和;將得到的多個(gè)語(yǔ)義相似度總和進(jìn)行比較,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由。本實(shí)施例中,m的取值可以為4,所述待分類法律文書的詞向量模型中每個(gè)詞語(yǔ)與各個(gè)擴(kuò)充關(guān)鍵詞列表中每個(gè)關(guān)鍵詞的語(yǔ)義相似度如下:a1,財(cái)產(chǎn)保險(xiǎn)合同糾紛擴(kuò)充關(guān)鍵詞列表(keylist)財(cái)產(chǎn):[出院0.88594,強(qiáng)行0.88548,不怕困難0.88543,抵賴0.88541,兩年0.88404,上訴人0.88395,基礎(chǔ)0.88391,手臂0.8836765,狡詐0.8836632,期間0.883564,歪曲事實(shí)0.8835521,打擊0.8834512]本實(shí)施例中,以出院0.88594為例,其中,出院是待分類法律文書的分詞結(jié)果,也是所述待分類法律文書的詞向量模型中的詞語(yǔ),088594是財(cái)產(chǎn)這個(gè)關(guān)鍵詞與出院的語(yǔ)義相似度。投保:[被上訴人0.99694,上訴人0.99684,兒子0.99674,一路0.99668,自己0.99648,方向0.99636,經(jīng)人介紹0.99633,支公司0.99633,人為0.99627,照顧0.99624,自己0.99604]房屋:[]項(xiàng)目:[]保單:[]a2,房屋買賣合同糾紛keylist房屋買賣:[]合同糾紛:[]購(gòu)買價(jià):[]查詢費(fèi):[]房產(chǎn)局:[]a3,交通事故責(zé)任糾紛keylist交通:[行業(yè)0.89651,下降0.89627,百貨大樓0.89616,沒(méi)見0.89558,狡詐0.89505,醫(yī)治0.89494,雇傭0.89494,南方0.89482,焦點(diǎn)0.89473,父親0.89470,視力0.89455,陪護(hù)0.89435]病歷:[]傷:[震蕩0.99832,鑒定0.99825,視網(wǎng)膜0.99812,證據(jù)0.99728,鑒定中心0.99696,法醫(yī)0.99547,事實(shí)0.99539,收入0.99538,相關(guān)0.99477,中山大學(xué)0.99474,資料0.99472,計(jì)算0.99427]交警部門:[年度0.98927,家庭0.98920,實(shí)際0.98910,包括0.98910,南方0.98892,增加0.98884,上訴人0.98879,發(fā)生0.98879,司法0.98866,費(fèi)用0.98855,護(hù)理人員0.98854,醫(yī)療機(jī)構(gòu)0.98854]時(shí)限:[]a4,金融借款合同糾紛keylist金融:[]融資:[]簽訂:[十日0.50968,幾乎0.50120,身份證0.50087,交通事故0.50014,兩家0.49854,根據(jù)0.49818,起至0.49788,合理0.49745,撫養(yǎng)人0.49714,爭(zhēng)議0.49664,本次0.49652,情況0.49642,請(qǐng)求0.49517,住宿費(fèi)0.49503,交警隊(duì)0.49499,手臂0.49488]買賣合同:[]約定:[]a5,民間借貸糾紛keylist借貸:[]民間:[]約束力:[]鑒定中心:[法醫(yī)0.99852,震蕩0.99818,證據(jù)0.99813,中山大學(xué)0.99787,視網(wǎng)膜0.99776,相關(guān)0.99763,南方0.99756,委托0.99749,資料0.99748,事實(shí)0.99748,有關(guān)0.99731,法院0.99713]關(guān)系:[影響0.95669,意見0.95625,司法0.95621,客觀0.95617,為由0.95614,法醫(yī)0.95592,所有0.95590,有關(guān)0.95589,提出0.95573,原審0.95569,受理0.95565,身體0.95556,自己0.95555]a6,勞動(dòng)合同糾紛keylist勞動(dòng):[上訴人0.99778,被上訴人0.99757,自己0.99725,要求0.99717,不道德0.99707,能力0.99701,支公司0.99689,一路0.99668,生活0.99667,興田0.99661,強(qiáng)制保險(xiǎn)0.99661]辭退:[]作為:[]普通:[判決0.83883,十月0.83643,代理0.83337,一三年0.83286]拒絕接受:[]a7,信用卡糾紛keylist信用卡:[]中銀:[]分期付款:[]家裝:[]業(yè)務(wù):[]a8,離婚糾紛keylist離婚:[]結(jié)婚:[]終結(jié):[不符0.30762,給付0.28182,第十七條0.26850,路費(fèi)0.25692,兩家0.25602,單據(jù)0.25397,大樓0.24847,提起0.24735,財(cái)產(chǎn)損失0.24725,查明0.24640,勞務(wù)0.24548,本次0.24535,傳喚0.24525]破裂:[]愿意:[]a9,盜竊罪keylist盜竊:[]多次:[當(dāng)事人0.99034,舉證責(zé)任0.99032,被上訴人0.99013,上訴人0.98981,自己0.98981,訴訟請(qǐng)求0.98967,費(fèi)用0.98961,負(fù)有0.98955,爸爸0.98954,申請(qǐng)0.98944,挫傷0.98942,實(shí)際0.98933]參與:[]數(shù)額:[法律責(zé)任0.97552,部分0.97510,不予0.97415,法律0.97396,交通費(fèi)0.97342,情況0.97339,依法0.97331,受害人0.97284,合理0.97252,中華人民共和國(guó)0.97160,超過(guò)0.97124,當(dāng)事人0.97116]犯罪:[]a10,故意傷害罪keylist故意傷害:[]共同犯罪:[]毆斗:[]情節(jié):[]結(jié)論書:[]a11,危險(xiǎn)駕駛罪keylist危險(xiǎn)駕駛:[]指控:[]罪名:[]證人:[]機(jī)關(guān):[]取每個(gè)擴(kuò)充關(guān)鍵詞最相近的前四個(gè)關(guān)鍵詞的分?jǐn)?shù),求總和,結(jié)果如下:財(cái)產(chǎn)保險(xiǎn)合同糾紛:總分為7.52946財(cái)產(chǎn):3.54226投保:3.98720房屋:0項(xiàng)目:0保單:0房屋買賣合同糾紛:總分為0房屋買賣:0合同糾紛:0購(gòu)買價(jià):0查詢費(fèi):0房產(chǎn)局:0交通事故責(zé)任糾紛:總分為11.53263交通:3.58399病歷:0傷:3.99197交警部門:3.95667時(shí)限:0金融借款合同糾紛:總分為2.01189金融:0融資:0簽訂:2.01189買賣合同:0約定:0民間借貸糾紛,總分為7.81802借貸:0民間:0約束力:0鑒定中心:3.9927關(guān)系:3.83532勞動(dòng)合同糾紛:總分為7.33126勞動(dòng):3.98977辭退:0作為:0普通:3.34149拒絕接受:0信用卡糾紛:總分為0信用卡:0中銀:0分期付款:0家裝:0業(yè)務(wù):0離婚糾紛:總分為1.11486離婚:0結(jié)婚:0終結(jié):1.11486破裂:0愿意:0盜竊罪:總分為7.85933盜竊:0多次:3.9606參與:0數(shù)額:3.89873犯罪:0故意傷害罪:總分為0故意傷害:0共同犯罪:0毆斗:0情節(jié):0結(jié)論書:0危險(xiǎn)駕駛罪:總分為0危險(xiǎn)駕駛:0指控:0罪名:0證人:0機(jī)關(guān):0本實(shí)施例中,假設(shè)m=4,以a1中的財(cái)產(chǎn)為例,因?yàn)槌鲈?,?qiáng)行,不怕困難,抵賴這四個(gè)詞語(yǔ)與財(cái)產(chǎn)的語(yǔ)義相似度值最大,因此,取出院,強(qiáng)行,不怕困難,抵賴這四個(gè)詞語(yǔ)與財(cái)產(chǎn)的語(yǔ)義相似度進(jìn)行相加,得到財(cái)產(chǎn)與所述待分類法律文書的語(yǔ)義相似度(3.54226)。本實(shí)施例中,將每類案由擴(kuò)充關(guān)鍵詞列表中所有關(guān)鍵詞與所述待分類法律文書的語(yǔ)義相似度相加,取語(yǔ)義相似度總和最大值對(duì)應(yīng)的案由為所述待分類法律文書對(duì)應(yīng)的案由;以財(cái)產(chǎn)保險(xiǎn)合同糾紛為例,財(cái)產(chǎn):3.54226;投保:3.98720;房屋:0;項(xiàng)目:0;保單:0;語(yǔ)義相似度相加后,得到的財(cái)產(chǎn)保險(xiǎn)合同糾紛的語(yǔ)義相似度總分為7.52946。本實(shí)施例中,按照上述方法,計(jì)算每類案由的語(yǔ)義相似度總分,對(duì)計(jì)算得到的各類語(yǔ)義相似度總和進(jìn)行比較,比較結(jié)果如下:交通事故責(zé)任糾紛>盜竊罪>民間借貸糾紛>財(cái)產(chǎn)保險(xiǎn)合同糾紛>勞動(dòng)合同糾紛>金融借款合同糾紛>離婚糾紛>房屋買賣合同糾紛=信用卡糾紛=故意傷害罪=危險(xiǎn)駕駛罪所以,可以將所述待分類法律文書的案由判定為“交通事故責(zé)任糾紛”,完成了對(duì)所述待分類法律文書的分類,實(shí)現(xiàn)法律文書案由分類器的自動(dòng)構(gòu)建。需要說(shuō)明的是,在本文中,諸如第i和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁(yè)12