亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于憑證摘要文本的孤立點檢測方法及系統(tǒng)的制作方法

文檔序號:8943044閱讀:365來源:國知局
一種基于憑證摘要文本的孤立點檢測方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及審計數(shù)據(jù)分析領(lǐng)域,尤其涉及一種基于憑證摘要文本的孤立點檢測方法及系統(tǒng)。
【背景技術(shù)】
[0002]審計數(shù)據(jù)的挖掘和分析對審計審計工作有著重要意義,在海量的審計數(shù)據(jù)當(dāng)中往往隱藏著一些有價值的信息,通過對這些信息的挖掘和分析,從中發(fā)現(xiàn)一些異常的數(shù)據(jù)或異常的行為,這些數(shù)據(jù)或行為稱之為孤立點或異常點。孤立點的存在往往會揭示一些審計線索,根據(jù)這些線索的提示,我們就可以快速確定問題所在,達(dá)到審計的目的。
[0003]但是,如今審計數(shù)據(jù)的挖掘和分析全憑審計人員的經(jīng)驗和專業(yè)技術(shù)結(jié)合查詢分析工具的輔助來做的,以審計人員為主,計算機(jī)輔助的數(shù)據(jù)分析方式有明顯的缺點:
[0004]—是對審計人員的審計經(jīng)驗、專業(yè)技能的依賴程度高,審計周期長,效率低。由于不同領(lǐng)域的審計數(shù)據(jù)存在一定差異,數(shù)據(jù)的檢索和分析具有專業(yè)性,因此在傳統(tǒng)的審計工作中,審計人員只能審計與自己相同或相近的業(yè)務(wù)。
[0005]二是審計數(shù)據(jù)量大、邏輯結(jié)構(gòu)復(fù)雜、關(guān)聯(lián)性強(qiáng),以人為主的審計方式效率低。在審計分析中,審計人員經(jīng)常需要對數(shù)據(jù)的某些屬性進(jìn)行分組,并對各分組進(jìn)行統(tǒng)計分析,但隨著數(shù)據(jù)維數(shù)增多,審計人員處理起來就變得異常復(fù)雜,而且還需要從多維數(shù)的海量數(shù)據(jù)當(dāng)中發(fā)現(xiàn)審計疑點就更難了。
[0006]三是對于非結(jié)構(gòu)化文本數(shù)據(jù),審計人員無法全部處理,因此審計線索的遺漏風(fēng)險大。對于結(jié)構(gòu)化數(shù)據(jù)的孤立點檢測可以使用檢測算法來挖掘,從而找到審計線索,但對非機(jī)構(gòu)化數(shù)據(jù),孤立點的檢測就顯得異常艱難,審計人員需要根據(jù)自身的審計經(jīng)驗,結(jié)合專業(yè)知識從文本數(shù)據(jù)當(dāng)中找出孤立點,而這些文本數(shù)據(jù)所占比例往往很大,審計人員由于時間精力有限,并不能全都審計。因此未被審計的文本數(shù)據(jù)可能存在孤立點,導(dǎo)致審計線索丟失,帶來了很大的審計風(fēng)險。
[0007]因此現(xiàn)有的審計數(shù)據(jù)孤立點挖掘和分析方法需要進(jìn)一步改進(jìn)和完善。

【發(fā)明內(nèi)容】

[0008]本發(fā)明的目的在于提供一種基于憑證摘要文本的孤立點檢測方法及系統(tǒng),旨在解決現(xiàn)有審計數(shù)據(jù)的孤立點挖掘、分析方法存在的審計效率低、工作量大、遺漏風(fēng)險大、十分依賴審計人員的經(jīng)驗和技能的技術(shù)問題。
[0009]本發(fā)明所設(shè)計的技術(shù)方案如下:
[0010]—種基于憑證摘要文本的孤立點檢測方法,其中,包括如下步驟:
[0011]步驟S1:審計財務(wù)數(shù)據(jù)的采集和整理;
[0012]步驟S2:憑證摘要文本的挖掘和分析;
[0013]步驟S3:孤立點檢測規(guī)則的定義與檢測模型的建立;
[0014]步驟S4:孤立點的檢測、分析和審計延伸。
[0015]所述的基于憑證摘要文本的孤立點檢測方法,其中,所述步驟SI包括如下步驟:
[0016]步驟Sll:建立財務(wù)數(shù)據(jù)源,所述財務(wù)數(shù)據(jù)源包括結(jié)構(gòu)化的財務(wù)數(shù)據(jù)和非結(jié)構(gòu)化的憑證文本數(shù)據(jù),所述憑證文本數(shù)據(jù)包括憑證摘要文本;
[0017]步驟S12:對憑證摘要文本進(jìn)行數(shù)據(jù)析取、轉(zhuǎn)換和清洗操作。
[0018]所述的基于憑證摘要文本的孤立點檢測方法,其中,所述步驟S2包括如下步驟:
[0019]步驟S21:對憑證摘要文本進(jìn)行特征抽取;
[0020]步驟S22:將抽出的特征按出現(xiàn)的頻率和權(quán)重排序;
[0021]步驟S23:選取若干個關(guān)鍵特征用于表示該憑證文本;
[0022]步驟S24:依據(jù)特征所代表的憑證文本類型進(jìn)行分類,形成一級分類表。
[0023]所述的基于憑證摘要文本的孤立點檢測方法,其中,所述步驟S3包括如下步驟:
[0024]步驟S31:根據(jù)一級分類表和憑證摘要文本的非關(guān)鍵特征建立二級分類表,所述二級分類表是對一級分類表的細(xì)分;
[0025]步驟S32:定義非結(jié)構(gòu)化數(shù)據(jù)的檢測規(guī)則,并設(shè)定相應(yīng)閾值;
[0026]步驟S33:定義結(jié)構(gòu)化數(shù)據(jù)的檢測規(guī)則,并設(shè)定相應(yīng)閾值;
[0027]所述的基于憑證摘要文本的孤立點檢測方法,其中,所述步驟S4包括如下步驟:
[0028]步驟S41:根據(jù)結(jié)構(gòu)化數(shù)據(jù)檢測規(guī)則和非結(jié)構(gòu)化數(shù)據(jù)檢測規(guī)則對數(shù)據(jù)源進(jìn)行檢測,判斷是否滿足檢測規(guī)則,若滿足則對下一個文件進(jìn)行檢測,否則即產(chǎn)生異常點,執(zhí)行步驟 S42 ;
[0029]步驟S42:產(chǎn)生孤立點,對孤立點前后相關(guān)的數(shù)據(jù)進(jìn)一步審查,判斷孤立點是否可疑,若可疑則執(zhí)行步驟S43,否則對下一個文件進(jìn)行檢測;
[0030]步驟S43:經(jīng)過核實判斷,確定為可疑孤立點,需要進(jìn)行延伸審計。
[0031]—種使用所述的基于憑證摘要文本的孤立點檢測方法的檢測系統(tǒng),其中,所述檢測系統(tǒng)包括數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊和孤立點檢測模塊;所述數(shù)據(jù)采集模塊用于采集審計項目的財務(wù)數(shù)據(jù),并對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行預(yù)先處理;所述數(shù)據(jù)分析模塊用于對數(shù)據(jù)的處理、挖掘和分析;所述孤立點檢測模塊用于定義孤立點的檢測規(guī)則,并對數(shù)據(jù)源進(jìn)行檢測、分析和處理。
[0032]所述的基于憑證摘要文本的孤立點檢測系統(tǒng),其中,所述數(shù)據(jù)分析模塊包括文本分析模塊、特征分類模塊;所述文本分析模塊用于憑證摘要文本的挖掘和分析;所述特征分類模塊用于用于抽取文本數(shù)據(jù)的特征,并建立一級分類表和二級分類表。
[0033]所述的基于憑證摘要文本的孤立點檢測系統(tǒng),其中,所述孤立點檢測模塊包括規(guī)則定義模塊和檢測分析模塊;所述規(guī)則定義模塊用于定義檢測規(guī)則和檢測模型;所述檢測分析模塊用于根據(jù)定義好的檢測規(guī)則調(diào)用檢測模型對數(shù)據(jù)源進(jìn)行檢測,并對產(chǎn)生的孤立點進(jìn)行分析和處理。
[0034]綜上所述,本發(fā)明所提供的一種基于憑證摘要文本的孤立點檢測方法及系統(tǒng),通過對財務(wù)數(shù)據(jù)源,尤其是憑證摘要文本數(shù)據(jù)的挖掘和分析,形成兩級分類表,在檢測規(guī)則的指導(dǎo)下進(jìn)行孤立點檢測,并對產(chǎn)生的孤立點進(jìn)行分析和處理。這種檢測方法高效,而且能持續(xù)有效地檢測出孤立點,使審計人員獲得更多審計線索,有利于審計工作的順利進(jìn)行。旨在解決現(xiàn)有審計數(shù)據(jù)的孤立點挖掘、分析方法存在的審計效率低、工作量大、遺漏風(fēng)險大、十分依賴審計人員的經(jīng)驗和技能的技術(shù)問題。
【附圖說明】
[0035]圖1是本發(fā)明所提供的孤立點檢測方法的總體流程圖。
[0036]圖2是本發(fā)明所提供的孤立點檢測方法中步驟SI的處理流程圖。
[0037]圖3是本發(fā)明所提供的孤立點檢測方法中步驟S2的處理流程圖。
[0038]圖4是本發(fā)明所提供的孤立點檢測方法中步驟S3的處理流程圖。
[0039]圖5是本發(fā)明所提供的孤立點檢測方法中步驟S4的處理流程圖。
[0040]圖6是本發(fā)明所提供的孤立點檢測系統(tǒng)的構(gòu)示意圖。
[0041]圖7是本發(fā)明所提供的孤立點檢測系統(tǒng)的總體結(jié)構(gòu)示意圖。
【具體實施方式】
[0042]為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚、明確,以下參照附圖并舉實施例對本發(fā)明作進(jìn)一步說明。
[0043]如圖1所示,本發(fā)明公開了一種基于憑證摘要文本的孤立點檢測方法,用于檢測審計項目中的異常點(孤立點),揭示審計項目的問題所在,其中,包括如下步驟:
[0044]步驟S1:審計財務(wù)數(shù)據(jù)的采集和整理;
[0045]步驟S2:憑證摘要文本的挖掘和分析;
[0046]步驟S3:孤立點檢測規(guī)則的定義與檢測模型的建立;
[0047]步驟S4:孤立點的檢測、分析和審計延伸。
[0048]現(xiàn)結(jié)合圖1至圖5詳細(xì)說明上述步驟的具體實施過程,內(nèi)容如下:
[0049]步驟S1:審計財務(wù)數(shù)據(jù)的采集和整理。財務(wù)數(shù)據(jù)能直接反映審計項目的真實情況,可以從中發(fā)現(xiàn)有重要價值的審計線索。它包括結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的憑證文本數(shù)據(jù)。其中,結(jié)合圖1和圖2所示,步驟SI還包括如下步驟:
[0050]步驟Sll:建立財務(wù)數(shù)據(jù)源,所述財務(wù)數(shù)據(jù)源包括結(jié)構(gòu)化的財務(wù)數(shù)據(jù)和非結(jié)構(gòu)化的憑證文本數(shù)據(jù),所述憑證文本數(shù)據(jù)包括憑證摘要文本。憑證文本是用于記錄經(jīng)濟(jì)業(yè)務(wù)交易的書面證明,由摘要、科目和金額等基本內(nèi)容構(gòu)成,通過經(jīng)濟(jì)行為的主體、對象和內(nèi)容三個基本要素,并采用“主語+謂語+賓語”的常用結(jié)構(gòu)形式表現(xiàn)出來,在格式和措辭上具有高度統(tǒng)一性。
[0051]步驟S12:對憑證摘要文本進(jìn)行數(shù)據(jù)析取、轉(zhuǎn)換和清洗操作。憑證文本的摘要部分的內(nèi)容是記錄經(jīng)濟(jì)事項的重要描述,通過對憑證摘要文本的析取、轉(zhuǎn)換和清洗操作,提煉出簡潔的邏輯結(jié)構(gòu),并對其進(jìn)行分析,可以獲得重要的審計信息。
[0052]步驟S2:憑證摘要文本的挖掘和分析。由于憑證文本數(shù)據(jù)的量很大,而且內(nèi)部聯(lián)系復(fù)雜,因此對憑證摘要文本進(jìn)行析取、轉(zhuǎn)換和清洗后,還需要做進(jìn)一步的挖掘和分析。其中,結(jié)合圖1和圖3所示,所述步驟S2還包括如下內(nèi)容:
[0053]步驟S21:對憑證摘要文本進(jìn)行特征抽取。對憑證文本的摘要部分進(jìn)行語義分析,把關(guān)鍵的特征提取出來。
[0054]步驟S22:將抽出的特征按出
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1