一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng),該方法包括:獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引;遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器;遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù)報(bào)表讀取信息從該清算報(bào)告電子檔中相應(yīng)的報(bào)表中提取相應(yīng)的內(nèi)容;對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體,并保存至數(shù)據(jù)庫(kù),通過(guò)本發(fā)明,可提高審核人員的審核效率及準(zhǔn)確率。
【專(zhuān)利說(shuō)明】
一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及企業(yè)稅務(wù)領(lǐng)域,特別是涉及一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng)?!颈尘凹夹g(shù)】
[0002]隨著企業(yè)多元化、國(guó)際化經(jīng)營(yíng)成為常態(tài),企業(yè)納稅事宜日趨復(fù)雜,涉稅成本日益增加,涉稅風(fēng)險(xiǎn)逐漸加大。企業(yè)稅務(wù)風(fēng)險(xiǎn)主要包括兩方面:一方面是企業(yè)的納稅行為不符合稅收法律法規(guī)的規(guī)定,應(yīng)納稅而未納稅、少納稅,從而面臨補(bǔ)稅、罰款、加收滯納金、刑罰處罰以及聲譽(yù)損害等風(fēng)險(xiǎn);另一方面是企業(yè)經(jīng)營(yíng)行為適用稅法不準(zhǔn)確,沒(méi)有用足有關(guān)優(yōu)惠政策, 多繳納了稅款,承擔(dān)了不必要的稅收負(fù)擔(dān),因此,及時(shí)而合法的納稅對(duì)企業(yè)來(lái)說(shuō)至關(guān)重要。
[0003]目前,企業(yè)在申報(bào)土地增值稅清算的時(shí)候,需要提交稅務(wù)局規(guī)定格式的一整套清算報(bào)告電子檔,該報(bào)告中包含項(xiàng)目基本情況、項(xiàng)目規(guī)劃情況、與房地產(chǎn)有關(guān)的收入和面積信息,還有與土地增值稅有關(guān)的幾大扣除項(xiàng)的明細(xì)報(bào)表,當(dāng)稅務(wù)局獲得這份清算報(bào)告的時(shí)候, 需要對(duì)報(bào)告里面的數(shù)據(jù)進(jìn)行提取、整理,然后錄入系統(tǒng),最后針對(duì)各項(xiàng)明細(xì)進(jìn)行歸納、審核、 計(jì)算。
[0004]在稅務(wù)審核當(dāng)中,現(xiàn)有的做法是:稅務(wù)局在獲得企業(yè)提交的清算報(bào)告后,需要審核人員手動(dòng)分門(mén)別類(lèi)整理出收入、成本、面積等數(shù)據(jù),然后手工填寫(xiě)到EXCEL文檔,最后導(dǎo)入到系統(tǒng)中。在上述過(guò)程中,審核人員需要手動(dòng)提取憑證發(fā)票和當(dāng)前項(xiàng)目開(kāi)發(fā)的各產(chǎn)品類(lèi)型的面積信息,提取這些信息主要進(jìn)行三大審核,一個(gè)是對(duì)憑證發(fā)票的明細(xì)項(xiàng)進(jìn)行真?zhèn)闻袛嗪彤惓E袛?一個(gè)是根據(jù)項(xiàng)目基本信息和規(guī)劃情況,結(jié)合企業(yè)自報(bào)數(shù),逐項(xiàng)審核后最終計(jì)算出企業(yè)應(yīng)繳稅額;再一個(gè)是針對(duì)成本合計(jì)數(shù)和面積合計(jì)數(shù),計(jì)算各產(chǎn)品類(lèi)型的分?jǐn)偨Y(jié)果,目前,上述過(guò)程全程由審核人員人工梳理,提取數(shù)據(jù)。
[0005]上述現(xiàn)有做法存在以下弊端:
[0006]1)在數(shù)據(jù)的分門(mén)別類(lèi)整理過(guò)程中,需要人工根據(jù)經(jīng)驗(yàn)判斷,再逐個(gè)整理,耗時(shí)且準(zhǔn)確性不高。
[0007]2) 土地增值稅涉及到的七大成本扣除項(xiàng)中,憑證發(fā)票是明細(xì)數(shù)據(jù),數(shù)據(jù)量大,需要手工提取再填寫(xiě)到系統(tǒng)的EXCEL模板中,人工工作量太大,費(fèi)時(shí)費(fèi)力。
[0008]3)針對(duì)土地增值稅各大審核點(diǎn)進(jìn)行審核的時(shí)候,審核人員需要手工判斷審核點(diǎn)涉及到的數(shù)據(jù)合計(jì)數(shù),人工歸納后再參照審核指南,線(xiàn)上線(xiàn)下對(duì)比,存在繁重的統(tǒng)計(jì)計(jì)算工作和線(xiàn)上線(xiàn)下的頻繁切換。
【發(fā)明內(nèi)容】
[0009]為克服上述現(xiàn)有技術(shù)存在的不足,本發(fā)明之目的在于提供一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng),以提高稅務(wù)局審核人員的審核效率及準(zhǔn)確率。
[0010]為達(dá)上述及其它目的,本發(fā)明提出一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,包括如下步驟:
[0011]步驟一,獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引,該清算報(bào)告報(bào)表指引至少包括該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引、各成本扣除項(xiàng)中憑證明細(xì)內(nèi)容行所在的行開(kāi)始索引以及各成本扣除項(xiàng)中關(guān)鍵字段所在的關(guān)鍵字段列索引;
[0012]步驟二,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器;[0〇13]步驟三,遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù)報(bào)表讀取信息從該清算報(bào)告電子檔中相應(yīng)的報(bào)表中提取相應(yīng)的內(nèi)容;
[0014]步驟四,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體,并保存至數(shù)據(jù)庫(kù)。[0〇15] 進(jìn)一步地,步驟二進(jìn)一步包括:
[0016]讀取各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;
[0017]讀取各成本扣除項(xiàng)的內(nèi)容行和關(guān)鍵字段列索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;
[0018]根據(jù)讀取結(jié)果,生成清算報(bào)告EXCEL讀取器。[〇〇19] 進(jìn)一步地,步驟三進(jìn)一步包括:[〇〇2〇] 步驟3.1,遍歷該清算報(bào)告EXCEL讀取器;[0021 ]步驟3.2,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息包括報(bào)表類(lèi)型、 內(nèi)容行開(kāi)始索引以及關(guān)鍵字段列索引;
[0022]步驟3.3,根據(jù)當(dāng)前報(bào)表讀取信息找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從內(nèi)容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行。
[0023]步驟3.4,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列, 找到相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。
[0024]進(jìn)一步地,于步驟3.4后還包括根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò)濾的步驟。
[0025]進(jìn)一步地,該智能過(guò)濾條件包括:面積信息中,過(guò)濾產(chǎn)品類(lèi)型名稱(chēng)中包含“合計(jì)”、 “其中”字樣的行數(shù)據(jù),用來(lái)過(guò)濾統(tǒng)計(jì)行的數(shù)據(jù);自動(dòng)辨別產(chǎn)品類(lèi)型的屬性,將產(chǎn)品類(lèi)型名稱(chēng)中包含“普通”字樣并且不包含“非”字樣的視為普通住宅,其余視為非普通住宅;成本扣除項(xiàng)信息中,過(guò)濾“內(nèi)容摘要”和“發(fā)票號(hào)碼”均為空的數(shù)據(jù)行。[〇〇26] 進(jìn)一步地,于步驟四后,還包括:
[0027]接收查詢(xún)請(qǐng)求,該查詢(xún)請(qǐng)求中包含查詢(xún)條件,根據(jù)查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng)的明細(xì)信息。
[0028]為達(dá)到上述目的,本發(fā)明還提供一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),包括:
[0029]獲取單元,用于獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引,該清算報(bào)告報(bào)表指引至少包括該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引、各成本扣除項(xiàng)中憑證明細(xì)內(nèi)容行所在的行開(kāi)始索引以及各成本扣除項(xiàng)中關(guān)鍵字段所在的關(guān)鍵字段列索引;
[0030]清算報(bào)告EXCEL讀取器生成單元,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器;[0031 ]提取單元,遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息, 根據(jù)該報(bào)表讀取信息從清算報(bào)告電子檔中提取相應(yīng)的內(nèi)容;
[0032]實(shí)體構(gòu)建單元,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體并保存進(jìn)數(shù)據(jù)庫(kù)。[0〇33]進(jìn)一步地,該提取單元包括:
[0034]第二遍歷單元,用于遍歷清算報(bào)告EXCEL讀取器;
[0035]報(bào)表讀取信息獲取單元,獲取遍歷循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息包括報(bào)表類(lèi)型,內(nèi)容行開(kāi)始索引以及關(guān)鍵字段列索引;
[0036]索引單元,根據(jù)當(dāng)前報(bào)表讀取信息找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從內(nèi)容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行;
[0037]內(nèi)容提取單元,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列,找到相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。
[0038]進(jìn)一步地,該提取單元還包括過(guò)濾單元,該過(guò)濾單元根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò)濾。
[0039]進(jìn)一步地,該系統(tǒng)還包括查詢(xún)單元,用于接收查詢(xún)請(qǐng)求,根據(jù)該查詢(xún)請(qǐng)求中的查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng)的明細(xì)信息。
[0040]與現(xiàn)有技術(shù)相比,本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng),通過(guò)自動(dòng)讀取企業(yè)提交的清算報(bào)告報(bào)表指引文件,自動(dòng)按數(shù)據(jù)類(lèi)型分門(mén)別類(lèi)的提取相關(guān)明細(xì)數(shù)據(jù),并于提取出不同類(lèi)型數(shù)據(jù)后,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體并存入數(shù)據(jù)庫(kù)以便審核人員及進(jìn)行查詢(xún),提高了審核人員的審核效率及準(zhǔn)確率?!靖綀D說(shuō)明】[0041 ]圖1為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法的步驟流程圖;
[0042]圖2為本發(fā)明之較佳實(shí)施例中步驟102的細(xì)部流程圖;
[0043]圖3為本發(fā)明之較佳實(shí)施例中步驟103的細(xì)部流程圖;
[0044]圖4為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法之具體實(shí)施例的流程圖;
[0045]圖5為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng)的系統(tǒng)架構(gòu)圖;
[0046]圖6為本發(fā)明較佳實(shí)施例中清算報(bào)告EXCEL讀取器生成單元51的細(xì)部結(jié)構(gòu)圖;
[0047]圖7為本發(fā)明較佳實(shí)施例中提取單元52的細(xì)部結(jié)構(gòu)圖。【具體實(shí)施方式】
[0048]以下通過(guò)特定的具體實(shí)例并結(jié)合【附圖說(shuō)明】本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說(shuō)明書(shū)所揭示的內(nèi)容輕易地了解本發(fā)明的其它優(yōu)點(diǎn)與功效。本發(fā)明亦可通過(guò)其它不同的具體實(shí)例加以施行或應(yīng)用,本說(shuō)明書(shū)中的各項(xiàng)細(xì)節(jié)亦可基于不同觀點(diǎn)與應(yīng)用,在不背離本發(fā)明的精神下進(jìn)行各種修飾與變更。
[0049]圖1為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法的步驟流程圖。如圖1所示,本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,包括如下步驟:
[0050]步驟101,獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引。該清算報(bào)告報(bào)表索引由企業(yè)根據(jù)本次提交的清算報(bào)告電子檔填寫(xiě),至少包括以下三部分:[〇〇511 一、該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,這里各關(guān)鍵報(bào)表包括項(xiàng)目基本信息表、與收入有關(guān)的面積信息表、取得土地所支付的金額明細(xì)表、土地征用及拆迀補(bǔ)償費(fèi)明細(xì)表、前期工程費(fèi)明細(xì)表、建筑安裝工程費(fèi)明細(xì)表、基礎(chǔ)設(shè)施費(fèi)明細(xì)表、公共配套費(fèi)明細(xì)表、開(kāi)發(fā)間接費(fèi)明細(xì)表;
[0052]二、各成本扣除項(xiàng)中,憑證明細(xì)內(nèi)容行所在的行開(kāi)始索引;[〇〇53]三、各成本扣除項(xiàng)中,幾大關(guān)鍵字段所在的關(guān)鍵字段列索引,這里的關(guān)鍵字段包括內(nèi)容摘要、發(fā)票號(hào)碼、發(fā)票密碼、發(fā)票金額。
[0054]步驟102,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器。
[0055]圖2為本發(fā)明之較佳實(shí)施例中步驟102的細(xì)部流程圖。具體地說(shuō),步驟102包括: [〇〇56]步驟2.1,讀取各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;
[0057]步驟2.2,讀取各成本扣除項(xiàng)的內(nèi)容行和關(guān)鍵字段列索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;[〇〇58] 步驟2.3,生成清算報(bào)告EXCEL讀取器。[〇〇59]步驟103,遍歷清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù)報(bào)表讀取信息從清算報(bào)告電子檔中提取相應(yīng)的內(nèi)容。
[0060]圖3為本發(fā)明之較佳實(shí)施例中步驟103的細(xì)部流程圖。具體地說(shuō),步驟103進(jìn)一步包括:[0061 ] 步驟3.1,遍歷清算報(bào)告EXCEL讀取器;
[0062]步驟3.2,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息包括報(bào)表類(lèi)型, 內(nèi)容行開(kāi)始索引以及關(guān)鍵字段列索引;
[0063]步驟3.3,根據(jù)當(dāng)前報(bào)表讀取信息(工作簿索引)找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從內(nèi)容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行。
[0064]步驟3.4,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列, 找到相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。[〇〇65] 較佳地,于步驟3.4后還包括如下步驟:
[0066]根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò)濾。具體地說(shuō),面積信息中,過(guò)濾產(chǎn)品類(lèi)型名稱(chēng)中包含“合計(jì)”、“其中”字樣的行數(shù)據(jù),用來(lái)過(guò)濾統(tǒng)計(jì)行的數(shù)據(jù)(避免多次統(tǒng)計(jì)),自動(dòng)辨別產(chǎn)品類(lèi)型的屬性(“普通住宅”,“非普通住宅”),產(chǎn)品類(lèi)型名稱(chēng)中包含“普通”字樣并且不包含“非”字樣的,視為普通住宅,其余視為非普通住宅;成本扣除項(xiàng)信息中,過(guò)濾“內(nèi)容摘要”和“發(fā)票號(hào)碼”均為空的數(shù)據(jù)行(系統(tǒng)跳過(guò)補(bǔ)充說(shuō)明行的提取)。
[0067]步驟104,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體,把項(xiàng)目基本信息、面積明細(xì)、成本扣除項(xiàng)目明細(xì)存入實(shí)體,并把清算報(bào)告實(shí)體保存至數(shù)據(jù)庫(kù)。[〇〇68] 較佳地,于步驟104后,還包括如下步驟:
[0069]接收查詢(xún)請(qǐng)求,該查詢(xún)請(qǐng)求中包含查詢(xún)條件,根據(jù)查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng)的明細(xì)信息。也就是說(shuō),審核人員可以根據(jù)需要利用系統(tǒng)查詢(xún)條件進(jìn)行查詢(xún),查詢(xún)提取到的明細(xì)信息。
[0070]圖4為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法之具體實(shí)施例的流程圖。以下將通過(guò)一具體實(shí)施例進(jìn)一步說(shuō)明本發(fā)明:
[0071]企業(yè)整理清算報(bào)告電子檔,并通過(guò)清算報(bào)告指引模板,填寫(xiě)針對(duì)本次提交的清算報(bào)告電子檔的清算報(bào)告報(bào)表指引,并將清算報(bào)告電子檔與清算報(bào)告報(bào)表指引一并發(fā)送至稅務(wù)局。
[0072]于接收到企業(yè)提交的清算報(bào)告電子檔與清算報(bào)告報(bào)表指引后,由稅務(wù)局審核人員上傳該清算報(bào)告電子檔和當(dāng)前報(bào)告的清算報(bào)告報(bào)表指引文件,然后系統(tǒng)解析該清算報(bào)告報(bào)表指引,遍歷該清算報(bào)告報(bào)表指引文件,讀取該清算報(bào)告報(bào)表指引文件中各關(guān)鍵報(bào)告(即所有報(bào)表)所在的EXCEL工作簿索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量,讀取所有報(bào)表的各成本扣除項(xiàng)的內(nèi)容行索引和關(guān)鍵字段列索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量,生成清算報(bào)告 EXCEL讀取器。[〇〇73]當(dāng)生成清算報(bào)告EXCEL讀取器后,掃描清算報(bào)告,遍歷該清算報(bào)告EXCEL讀取器,讀取當(dāng)前報(bào)表類(lèi)型和內(nèi)容開(kāi)始行索引,遍歷從內(nèi)容行開(kāi)始索引到當(dāng)前工作簿的最后內(nèi)容行, 讀取當(dāng)前清算報(bào)告EXCEL讀取器的關(guān)鍵字段列索引,根據(jù)當(dāng)前的行和列坐標(biāo)提取當(dāng)前單元格內(nèi)容,根據(jù)預(yù)設(shè)的智能過(guò)濾條件,針對(duì)單元格內(nèi)容過(guò)濾統(tǒng)計(jì)行和一些說(shuō)明行數(shù)據(jù),例如, 面積信息中,過(guò)濾產(chǎn)品類(lèi)型名稱(chēng)中包含“合計(jì)”、“其中”字樣的行數(shù)據(jù),用來(lái)過(guò)濾統(tǒng)計(jì)行的數(shù)據(jù)(避免多次統(tǒng)計(jì)),自動(dòng)辨別產(chǎn)品類(lèi)型的屬性(“普通住宅”,“非普通住宅”),產(chǎn)品類(lèi)型名稱(chēng)中包含“普通”字樣并且不包含“非”字樣的,視為普通住宅,其余視為非普通住宅;成本扣除項(xiàng)信息中,過(guò)濾“內(nèi)容摘要”和“發(fā)票號(hào)碼”均為空的數(shù)據(jù)行。
[0074]構(gòu)建清算報(bào)告主實(shí)體,把項(xiàng)目、面積、成本信息存入實(shí)體,把清算報(bào)告實(shí)體保存進(jìn)數(shù)據(jù)庫(kù);當(dāng)審核人員需要查詢(xún)時(shí),可根據(jù)系統(tǒng)查詢(xún)工具查詢(xún)和提取想要的入庫(kù)信息。
[0075]圖5為本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng)的系統(tǒng)架構(gòu)圖。如圖5所示,本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),包括:獲取單元50、清算報(bào)告EXCEL讀取器生成單元51、提取單元52以及實(shí)體構(gòu)建單元53。
[0076]其中,獲取單元50,用于獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引。 該清算報(bào)告報(bào)表索引由企業(yè)根據(jù)本次提交的清算報(bào)告電子檔填寫(xiě),至少包括以下三部分: [〇〇77] 一、該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,這里各關(guān)鍵報(bào)表包括項(xiàng)目基本信息表、與收入有關(guān)的面積信息表、取得土地所支付的金額明細(xì)表、土地征用及拆迀補(bǔ)償費(fèi)明細(xì)表、前期工程費(fèi)明細(xì)表、建筑安裝工程費(fèi)明細(xì)表、基礎(chǔ)設(shè)施費(fèi)明細(xì)表、公共配套費(fèi)明細(xì)表、開(kāi)發(fā)間接費(fèi)明細(xì)表;
[0078]二、各成本扣除項(xiàng)中,憑證明細(xì)內(nèi)容行所在的行開(kāi)始索引;[〇〇79]三、各成本扣除項(xiàng)中,幾大關(guān)鍵字段所在的關(guān)鍵字段列索引,這里的關(guān)鍵字段包括內(nèi)容摘要、發(fā)票號(hào)碼、發(fā)票密碼、發(fā)票金額。
[0080]清算報(bào)告EXCEL讀取器生成單元51,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器。
[0081]圖6為本發(fā)明較佳實(shí)施例中清算報(bào)告EXCEL讀取器生成單元51的細(xì)部結(jié)構(gòu)圖。該清算報(bào)告EXCEL讀取器生成單元51進(jìn)一步包括:第一遍歷單元510、工作簿索引獲取單元511、 內(nèi)容行索引及關(guān)鍵字段列索引獲取單元512以及生成單元513,第一遍歷單元510,用于遍歷該清算報(bào)告報(bào)表指引,工作簿索引獲取單元511根據(jù)第一遍歷單元510的遍歷順序讀取各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;內(nèi)容行索引及關(guān)鍵字段列索引獲取單元512根據(jù)第一遍歷單元510的遍歷順序讀取各成本扣除項(xiàng)的內(nèi)容行和關(guān)鍵字段列索弓丨,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;生成單元513根據(jù)讀取的結(jié)果生成清算報(bào)告EXCEL讀取器。[〇〇82]提取單元52,遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù)該報(bào)表讀取信息從清算報(bào)告電子檔中提取相應(yīng)的內(nèi)容。[〇〇83]圖7為本發(fā)明較佳實(shí)施例中提取單元52的細(xì)部結(jié)構(gòu)圖。如圖7所示,提取單元52進(jìn)一步包括:第二遍歷單元520、報(bào)表讀取信息獲取單元521、索引單元522以及內(nèi)容提取單元 523,其中,第二遍歷單元520,用于遍歷清算報(bào)告EXCEL讀取器;報(bào)表讀取信息獲取單元521, 獲取遍歷循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息包括報(bào)表類(lèi)型,內(nèi)容行開(kāi)始索引以及關(guān)鍵字段列索引;索引單元522,根據(jù)當(dāng)前報(bào)表讀取信息(工作簿索引)找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從內(nèi)容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行;內(nèi)容提取單元523,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列,找到相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。
[0084]較佳地,提取單元52還包括過(guò)濾單元524,該過(guò)濾單元524根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò)濾。具體地說(shuō),面積信息中,過(guò)濾產(chǎn)品類(lèi)型名稱(chēng)中包含“合計(jì)”、“其中”字樣的行數(shù)據(jù),用來(lái)過(guò)濾統(tǒng)計(jì)行的數(shù)據(jù)(避免多次統(tǒng)計(jì)),自動(dòng)辨別產(chǎn)品類(lèi)型的屬性(“普通住宅”,“非普通住宅”),產(chǎn)品類(lèi)型名稱(chēng)中包含“普通”字樣并且不包含 “非”字樣的,視為普通住宅,其余視為非普通住宅;成本扣除項(xiàng)信息中,過(guò)濾“內(nèi)容摘要”和 “發(fā)票號(hào)碼”均為空的數(shù)據(jù)行(系統(tǒng)跳過(guò)補(bǔ)充說(shuō)明行的提取)。
[0085]實(shí)體構(gòu)建單元53,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體,把項(xiàng)目、面積、成本信息存入實(shí)體,把清算報(bào)告實(shí)體保存進(jìn)數(shù)據(jù)庫(kù)。
[0086]較佳地,本發(fā)明之財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng)還包括查詢(xún)單元54,用于接收查詢(xún)請(qǐng)求,該查詢(xún)請(qǐng)求中包含查詢(xún)條件,根據(jù)查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng)的明細(xì)信息。
[0087]綜上所述,本發(fā)明一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法及系統(tǒng),通過(guò)自動(dòng)讀取企業(yè)提交的清算報(bào)告報(bào)表指引文件,自動(dòng)按數(shù)據(jù)類(lèi)型分門(mén)別類(lèi)的提取相關(guān)明細(xì)數(shù)據(jù),并于提取出不同類(lèi)型數(shù)據(jù)后,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體并存入數(shù)據(jù)庫(kù)以便審核人員及進(jìn)行查詢(xún),提高了審核人員的審核效率及準(zhǔn)確率。
[0088]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):
[0089](1)通過(guò)本發(fā)明,可一鍵抽取并過(guò)濾清算報(bào)告中的財(cái)稅數(shù)據(jù),無(wú)需稅務(wù)局審核人員對(duì)成千上萬(wàn)條明細(xì)記錄的提取,填寫(xiě)到新的EXCEL模板再導(dǎo)入進(jìn)系統(tǒng)的轉(zhuǎn)換過(guò)程,減輕了審核人員的工作量,提高了效率。
[0090](2)針對(duì)抽取到的財(cái)稅數(shù)據(jù),本發(fā)明自動(dòng)按照面積,成本信息歸納,存儲(chǔ)至數(shù)據(jù)庫(kù), 無(wú)需稅務(wù)局審核人員再對(duì)數(shù)據(jù)進(jìn)行整理,高效并且準(zhǔn)確。
[0091](3)本發(fā)明提供組合查詢(xún)工具,針對(duì)已經(jīng)提取和歸納的數(shù)據(jù),稅務(wù)局審核人員再逐個(gè)審核各大審核點(diǎn)的時(shí)候,根據(jù)需要獲取企業(yè)上報(bào)的不同明細(xì)或者統(tǒng)計(jì)數(shù),只要通過(guò)設(shè)定的查詢(xún)工具,自由組合條件和抽查權(quán)重,即可獲取想要看到的數(shù)據(jù),快捷并且直觀。[〇〇92]上述實(shí)施例僅例示性說(shuō)明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何本領(lǐng)域技術(shù)人員均可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾與改變。因此, 本發(fā)明的權(quán)利保護(hù)范圍,應(yīng)如權(quán)利要求書(shū)所列。
【主權(quán)項(xiàng)】
1.一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,包括如下步驟:步驟一,獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引,該清算報(bào)告報(bào)表指 引至少包括該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引、各成本扣除項(xiàng)中憑 證明細(xì)內(nèi)容行所在的行開(kāi)始索引以及各成本扣除項(xiàng)中關(guān)鍵字段所在的關(guān)鍵字段列索引;步驟二,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引中所有報(bào)表的工作簿索 弓丨、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器;步驟三,遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù)報(bào) 表讀取信息從該清算報(bào)告電子檔中相應(yīng)的報(bào)表中提取相應(yīng)的內(nèi)容;步驟四,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體,并保存至數(shù)據(jù)庫(kù)。2.如權(quán)利要求1所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,其特征在于,步驟二進(jìn)一步包 括:讀取各關(guān)鍵報(bào)表所在的EXCEL工作簿索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;讀取各成本扣除項(xiàng)的內(nèi)容行和關(guān)鍵字段列索引,并按報(bào)表類(lèi)型記錄進(jìn)內(nèi)存變量;根據(jù)讀取結(jié)果,生成清算報(bào)告EXCEL讀取器。3.如權(quán)利要求1所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,其特征在于:步驟三進(jìn)一步包 括:步驟3.1,遍歷該清算報(bào)告EXCEL讀取器;步驟3.2,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息包括報(bào)表類(lèi)型、內(nèi)容 行開(kāi)始索引以及關(guān)鍵字段列索引;步驟3.3,根據(jù)當(dāng)前報(bào)表讀取信息找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從內(nèi) 容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行;步驟3.4,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列,找到 相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。4.如權(quán)利要求3所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,其特征在于:于步驟3.4后還包 括根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò)濾的步驟。5.如權(quán)利要求4所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,其特征在于,該智能過(guò)濾條件包 括:面積信息中,過(guò)濾產(chǎn)品類(lèi)型名稱(chēng)中包含“合計(jì)”、“其中”字樣的行數(shù)據(jù),用來(lái)過(guò)濾統(tǒng)計(jì)行 的數(shù)據(jù);自動(dòng)辨別產(chǎn)品類(lèi)型的屬性,將產(chǎn)品類(lèi)型名稱(chēng)中包含“普通”字樣并且不包含“非”字 樣的視為普通住宅,其余視為非普通住宅;成本扣除項(xiàng)信息中,過(guò)濾“內(nèi)容摘要”和“發(fā)票號(hào) 碼”均為空的數(shù)據(jù)行。6.如權(quán)利要求1所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取方法,其特征在于,于步驟四后,還包 括:接收查詢(xún)請(qǐng)求,該查詢(xún)請(qǐng)求中包含查詢(xún)條件,根據(jù)查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng) 的明細(xì)信息。7.—種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),包括:獲取單元,用于獲取企業(yè)提交的清算報(bào)告電子檔以及清算報(bào)告報(bào)表指引,該清算報(bào)告 報(bào)表指引至少包括該清算報(bào)告電子檔中各關(guān)鍵報(bào)表所在的EXCEL工作簿索引、各成本扣除 項(xiàng)中憑證明細(xì)內(nèi)容行所在的行開(kāi)始索引以及各成本扣除項(xiàng)中關(guān)鍵字段所在的關(guān)鍵字段列 索引;清算報(bào)告EXCEL讀取器生成單元,遍歷該清算報(bào)告報(bào)表指引,讀取該清算報(bào)告報(bào)表指引 中所有報(bào)表的工作簿索引、內(nèi)容行索引及關(guān)鍵字段列索引,生成清算報(bào)告EXCEL讀取器;提取單元,遍歷該清算報(bào)告EXCEL讀取器,獲取循環(huán)中當(dāng)前索引的報(bào)表讀取信息,根據(jù) 該報(bào)表讀取信息從清算報(bào)告電子檔中提取相應(yīng)的內(nèi)容;實(shí)體構(gòu)建單元,對(duì)提取的內(nèi)容構(gòu)建清算報(bào)告主實(shí)體并保存進(jìn)數(shù)據(jù)庫(kù)。8.如權(quán)利要求7所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),其特征在于,該提取單元包括: 第二遍歷單元,用于遍歷清算報(bào)告EXCEL讀取器;報(bào)表讀取信息獲取單元,獲取遍歷循環(huán)中當(dāng)前索引的報(bào)表讀取信息,該報(bào)表讀取信息 包括報(bào)表類(lèi)型,內(nèi)容行開(kāi)始索引以及關(guān)鍵字段列索引;索引單元,根據(jù)當(dāng)前報(bào)表讀取信息找到當(dāng)前報(bào)表所在的工作簿,在找到的工作簿中從 內(nèi)容開(kāi)始行循環(huán)讀取到當(dāng)前工作簿的內(nèi)容結(jié)束行;內(nèi)容提取單元,根據(jù)當(dāng)前的報(bào)表讀取信息中的關(guān)鍵字段列索引,遍歷當(dāng)前行的所有列, 找到相應(yīng)位置,通過(guò)行號(hào)和列號(hào)坐標(biāo)提取到當(dāng)前單元格的內(nèi)容。9.如權(quán)利要求8所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),其特征在于:該提取單元還包括 過(guò)濾單元,該過(guò)濾單元根據(jù)單元格內(nèi)容對(duì)提取的內(nèi)容根據(jù)預(yù)設(shè)的智能過(guò)濾條件進(jìn)行自動(dòng)過(guò) 濾。10.如權(quán)利要求7所述的一種財(cái)稅數(shù)據(jù)的自動(dòng)抽取系統(tǒng),其特征在于:該系統(tǒng)還包括查 詢(xún)單元,用于接收查詢(xún)請(qǐng)求,根據(jù)該查詢(xún)請(qǐng)求中的查詢(xún)條件于數(shù)據(jù)庫(kù)中查詢(xún)提取相應(yīng)的明 細(xì)信息。
【文檔編號(hào)】G06F17/24GK106021215SQ201610333349
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月18日
【發(fā)明人】程君, 沈期彬
【申請(qǐng)人】廣東源恒軟件科技有限公司