本發(fā)明涉及稅控技術(shù)領(lǐng)域,尤其涉及一種稅務(wù)數(shù)據(jù)異常分析方法及系統(tǒng)。
背景技術(shù):
稅收是國家財(cái)政收入的重要來源之一,對(duì)國家的發(fā)展起著舉足輕重的作用。然而,近些年來,一些貪污受賄、企業(yè)偷稅漏稅等不誠信行為的出現(xiàn),大大減少了國家財(cái)政收入,破壞了國家經(jīng)濟(jì)秩序。偷稅漏稅的存在,使稅收固有的調(diào)節(jié)收入分配作用無法發(fā)揮,不利于實(shí)現(xiàn)公平;偷稅漏稅會(huì)增加偷漏稅企業(yè)的稅后凈利潤,高額的利潤會(huì)吸引更多的資源流入,造成資源配置的扭曲,影響人們的經(jīng)濟(jì)決策和投資決策,造成經(jīng)濟(jì)損失。因此,對(duì)偷稅漏稅行為進(jìn)行遏制已刻不容緩。
但是,納稅企業(yè)的財(cái)務(wù)狀況千差萬別,目前只能通過人工操作來對(duì)企業(yè)是否偷稅漏稅進(jìn)行甄別,不僅效率低下,而且管理成本極高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種稅務(wù)數(shù)據(jù)異常分析方法及系統(tǒng),以解決現(xiàn)有甄別偷稅漏稅行為的方式效率低下,成本高的問題。
為了解決上述問題,本發(fā)明實(shí)施例公開了一種稅務(wù)數(shù)據(jù)異常分析方法,包括:訪問根據(jù)稅務(wù)信息生成的商品信息樹,其中,所述商品信息樹中至少保存有商品名稱和商品所屬分類;根據(jù)所述稅務(wù)信息和所述商品信息樹,對(duì)目標(biāo)企業(yè)對(duì)象設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù),以及所述目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì);根據(jù)統(tǒng)計(jì)結(jié)果分析所述目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)是否異常。
為了解決上述問題,本發(fā)明實(shí)施例還公開了一種稅務(wù)數(shù)據(jù)異常分析系統(tǒng),包括:訪問模塊,用于訪問根據(jù)稅務(wù)信息生成的商品信息樹,其中,所述商品信息樹中至少保存有商品名稱和商品所屬分類;統(tǒng)計(jì)模塊,用于根據(jù)所述稅務(wù)信息和所述商品信息樹,對(duì)目標(biāo)企業(yè)對(duì)象設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù),以及所述目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì);分析模塊,用于根據(jù)統(tǒng)計(jì)結(jié)果分析所述目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)是否異常。
本發(fā)明具有如下有益效果:
本發(fā)明實(shí)施例提供的稅務(wù)數(shù)據(jù)異常分析方案,通過現(xiàn)代化的計(jì)算機(jī)手段,基于構(gòu)建的商品信息樹和企業(yè)對(duì)象分類,當(dāng)需要確定目標(biāo)企業(yè)對(duì)象是否偷稅漏稅時(shí),針對(duì)該目標(biāo)企業(yè)對(duì)象在一定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),并將統(tǒng)計(jì)結(jié)果與其所屬分類內(nèi)的企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果進(jìn)行比對(duì)分析,以根據(jù)結(jié)果判斷該企業(yè)是否正常納稅。因?yàn)槟繕?biāo)企業(yè)對(duì)象所屬分類內(nèi)的其它企業(yè)對(duì)象的數(shù)據(jù)更具有參考些,能夠較好地提供參照,較為準(zhǔn)確地對(duì)企業(yè)的納稅情況進(jìn)行鑒別。通過本發(fā)明的方案,有效實(shí)現(xiàn)了偷稅漏稅行為的甄別,效率高,且大大節(jié)約了甄別成本。
附圖說明
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1為根據(jù)本發(fā)明實(shí)施例一的一種稅務(wù)數(shù)據(jù)異常分析方法的步驟流程圖;
圖2為根據(jù)本發(fā)明實(shí)施例二的一種稅務(wù)數(shù)據(jù)異常分析方法的步驟流程圖;
圖3為根據(jù)本發(fā)明實(shí)施例三的一種稅務(wù)數(shù)據(jù)異常分析系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施方式
下文中將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。需要說明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。
實(shí)施例一
參照?qǐng)D1,示出了根據(jù)本發(fā)明實(shí)施例一的一種稅務(wù)數(shù)據(jù)異常分析方法的步驟流程圖。
本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析方法包括以下步驟:
步驟s101:根據(jù)稅務(wù)信息生成商品信息樹。
其中,商品信息樹是以樹狀數(shù)據(jù)結(jié)構(gòu)保存的商品信息,商品信息樹中至少保存有商品名稱和商品所屬分類。但不限于此,與商品有關(guān)的信息均可保存,如價(jià)格,產(chǎn)地,生產(chǎn)廠商等等。
一種可行的根據(jù)稅務(wù)信息生成商品信息樹的方式包括:從稅務(wù)數(shù)據(jù)信息庫中獲取元稅務(wù)數(shù)據(jù),根據(jù)元稅務(wù)數(shù)據(jù)獲取商品明細(xì)信息,其中,商品明細(xì)信息包括商品名稱;爬取商品名稱對(duì)應(yīng)的網(wǎng)頁;對(duì)網(wǎng)頁進(jìn)行解析,獲取商品名稱對(duì)應(yīng)的商品的所屬分類;根據(jù)商品名稱和其對(duì)應(yīng)的所屬分類生成商品信息樹。
稅務(wù)數(shù)據(jù)信息庫中預(yù)存有商品發(fā)票對(duì)應(yīng)的數(shù)據(jù)信息,可以認(rèn)為是元稅務(wù)數(shù)據(jù),該元稅務(wù)數(shù)據(jù)中包括商品明細(xì)信息,而商品明細(xì)信息中又包括商品名稱;根據(jù)商品名稱可以去相應(yīng)的電商平臺(tái)爬取商品名稱對(duì)應(yīng)的網(wǎng)頁;進(jìn)而,對(duì)網(wǎng)頁進(jìn)行解析后,可獲得商品所屬分類;根據(jù)商品名稱和商品對(duì)應(yīng)的分類可生成商品信息樹。采用這種方式存儲(chǔ)商品信息,使得商品信息更易于查找,提高查找和處理速度。
但在某些情況下,商品名稱可能不夠規(guī)范,因此,需要對(duì)商品名稱進(jìn)行處理后進(jìn)行進(jìn)一步網(wǎng)頁爬取和所屬分類確定。因此,可選地,在爬取商品名稱對(duì)應(yīng)的網(wǎng)頁時(shí),可以判斷是否成功爬取到商品名稱對(duì)應(yīng)的網(wǎng)頁;若是,則對(duì)網(wǎng)頁進(jìn)行解析,獲取商品名稱對(duì)應(yīng)的商品的所屬分類;若否,則對(duì)商品名稱進(jìn)行分詞后重新爬取網(wǎng)頁,然后,再對(duì)網(wǎng)頁進(jìn)行解析,獲取商品名稱對(duì)應(yīng)的商品的所屬分類。
需要說明的是,本步驟為可選步驟,僅需在初始時(shí)構(gòu)建相應(yīng)數(shù)據(jù)庫,生成商品信息樹,后續(xù)可長期使用,在需要時(shí)進(jìn)行更新即可。
步驟s102:對(duì)企業(yè)對(duì)象進(jìn)行分類。
一種可行的方式包括:從稅務(wù)數(shù)據(jù)信息庫中獲取企業(yè)對(duì)象信息,其中,企業(yè)對(duì)象信息包括以下至少之一:注冊(cè)地址信息、注冊(cè)資本信息、主營項(xiàng)目信息;根據(jù)企業(yè)對(duì)象信息,確定企業(yè)對(duì)象的相似度;根據(jù)企業(yè)對(duì)象的相似度,對(duì)企業(yè)對(duì)象進(jìn)行聚類,生成多個(gè)企業(yè)對(duì)象分類,其中,每個(gè)企業(yè)對(duì)象分類包括至少一個(gè)企業(yè)對(duì)象。
其中,確定不同企業(yè)對(duì)象之間相似度的方式可以采用相關(guān)任意適當(dāng)?shù)南嗨贫扔?jì)算方式實(shí)現(xiàn),本發(fā)明實(shí)施例對(duì)此不作限制。同親,對(duì)企業(yè)對(duì)象進(jìn)行聚類的方式也可以采用相關(guān)任意適當(dāng)?shù)木垲惙椒▽?shí)現(xiàn),本發(fā)明實(shí)施例對(duì)此也不作限制。
需要說明的,在實(shí)際應(yīng)用中,本領(lǐng)域技術(shù)人員也可以采用其它對(duì)企業(yè)對(duì)象分類的方式,使相類似企業(yè)能夠歸屬在相同類別下即可。
此外,還需要說明的是,本步驟也為可選步驟,僅需在初始時(shí)對(duì)企業(yè)對(duì)象進(jìn)行分類即可,后續(xù)可長期使用,在需要時(shí)進(jìn)行更新。而且,步驟101和步驟s102之間可以不分先后順序,也可以并行執(zhí)行。
步驟s103:訪問根據(jù)稅務(wù)信息生成的商品信息樹。
其中,商品信息樹中至少保存有商品名稱和商品所屬分類。
步驟s104:根據(jù)稅務(wù)信息和商品信息樹,對(duì)目標(biāo)企業(yè)對(duì)象設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù),以及目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。
例如,對(duì)于a企業(yè)在一個(gè)月內(nèi)開具的發(fā)票信息,從中提取出商品信息,包括商品名稱和商品所屬分類,根據(jù)這兩個(gè)信息在商品信息樹中查找,確定商品價(jià)格,進(jìn)而統(tǒng)計(jì)出a企業(yè)在這一個(gè)月內(nèi)開具的發(fā)票總額。
另外,假設(shè)a企業(yè)屬于x類,如電器類企業(yè),該x類企業(yè)下還有5家類似企業(yè),則同時(shí)對(duì)該5家企業(yè)在這一個(gè)月內(nèi)開具的發(fā)票總額進(jìn)行統(tǒng)計(jì)。
最終根據(jù)統(tǒng)計(jì)結(jié)果,按照預(yù)設(shè)規(guī)則判斷a企業(yè)是否正常納稅。如,a企業(yè)的發(fā)票總額與x類企業(yè)發(fā)票總額的差別是否在一定范圍內(nèi),或者,a企業(yè)的發(fā)票總額占有的x類企業(yè)發(fā)票總額的份額是否在一定范圍內(nèi)等。
步驟s105:根據(jù)統(tǒng)計(jì)結(jié)果分析目標(biāo)企業(yè)對(duì)象在設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)是否異常。
例如,將目標(biāo)企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果,與,目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果的平均值進(jìn)行比較;若比較結(jié)果大于或等于設(shè)定閾值,則確定目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)異常;否則,則確定目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)正常。
本實(shí)施例提供的稅務(wù)數(shù)據(jù)異常分析方法,通過現(xiàn)代化的計(jì)算機(jī)手段,基于構(gòu)建的商品信息樹和企業(yè)對(duì)象分類,當(dāng)需要確定目標(biāo)企業(yè)對(duì)象是否偷稅漏稅時(shí),針對(duì)該目標(biāo)企業(yè)對(duì)象在一定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),并將統(tǒng)計(jì)結(jié)果與其所屬分類內(nèi)的企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果進(jìn)行比對(duì)分析,以根據(jù)結(jié)果判斷該企業(yè)是否正常納稅。因?yàn)槟繕?biāo)企業(yè)對(duì)象所屬分類內(nèi)的其它企業(yè)對(duì)象的數(shù)據(jù)更具有參考些,能夠較好地提供參照,較為準(zhǔn)確地對(duì)企業(yè)的納稅情況進(jìn)行鑒別。通過本實(shí)施例,有效實(shí)現(xiàn)了偷稅漏稅行為的甄別,效率高,且大大節(jié)約了甄別成本。
實(shí)施例二
參照?qǐng)D2,示出了根據(jù)本發(fā)明實(shí)施例二的一種稅務(wù)數(shù)據(jù)異常分析方法的步驟流程圖。本實(shí)施例以一個(gè)具體實(shí)例的形式對(duì)本發(fā)明的稅務(wù)數(shù)據(jù)異常分析方法進(jìn)行說明,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了,本實(shí)施例僅為示例性說明,本領(lǐng)域技術(shù)人員在實(shí)際應(yīng)用中,可以參照本實(shí)施例,采用其它適當(dāng)方式對(duì)本實(shí)施例中的技術(shù)手段進(jìn)行替換或修改,均在本發(fā)明的保護(hù)范圍內(nèi)。
本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析方法包括以下步驟:
步驟s201:構(gòu)建商品信息樹。
可以通過稅務(wù)信息數(shù)據(jù)庫(包括有發(fā)票信息)中的開具的發(fā)票的商品明細(xì)信息,提取其中發(fā)票中所有商品的明細(xì)(包括但不限于商品頭、商品行、發(fā)票代碼、時(shí)間、金額,單位名稱、稅號(hào)。單位信息,信用度等),對(duì)每件商品進(jìn)行分類。
具體地,本步驟可以包括:
步驟a1:提取商品明細(xì)字段中的商品明細(xì)信息,并將商品明細(xì)信息的商品名稱在電商商品搜索框進(jìn)行搜索,將搜索的結(jié)果網(wǎng)頁爬取到本地,對(duì)結(jié)果網(wǎng)頁進(jìn)行解析,在所有類目一欄中獲得該商品的所屬分類。
步驟a2:由于商品明細(xì)信息中的商品名稱有時(shí)并不十分規(guī)范,因此部分商品無法一次找到所屬分類。此時(shí),可以對(duì)不規(guī)范的商品名稱進(jìn)行分詞功能,并返還相關(guān)的可能商品。將分詞后的返回結(jié)果重新組合,并重復(fù)步驟a1,繼續(xù)進(jìn)行搜索,來獲得商品的所屬分類。
步驟a3:將所有可以獲得到商品所屬分類的商品名稱,及其所屬分類進(jìn)行整合,并用樹的數(shù)據(jù)結(jié)構(gòu)對(duì)其進(jìn)行組織,優(yōu)選為二叉樹,構(gòu)建商品信息樹。
通過本步驟構(gòu)建的商品信息樹,可以對(duì)稅務(wù)信息數(shù)據(jù)庫中的開具的發(fā)票的商品明細(xì)信息的覆蓋率達(dá)到70%以上,分類的準(zhǔn)確率達(dá)到65%。
步驟s202:對(duì)企業(yè)對(duì)象進(jìn)行分類。
本步驟對(duì)企業(yè)對(duì)象進(jìn)行相似度計(jì)算,并進(jìn)行排序,將企業(yè)對(duì)象進(jìn)行分類,相似的企業(yè)聚為一類。
具體地,本步驟包括:
步驟b1:根據(jù)納稅人信息擴(kuò)展表中企業(yè)對(duì)象的注冊(cè)地址字段進(jìn)行分類,將在同一市(縣)的企業(yè)對(duì)象分為一類。
步驟b2:根據(jù)納稅人信息擴(kuò)展表中企業(yè)對(duì)象的注冊(cè)資本字段進(jìn)行分類,按注冊(cè)資本多少分為多個(gè)等級(jí)如5個(gè)等級(jí),將企業(yè)對(duì)象按此等級(jí)進(jìn)行歸類。
步驟b3:根據(jù)納稅人信息擴(kuò)展表中企業(yè)對(duì)象的主營字段進(jìn)行分類,求出不同企業(yè)對(duì)象的主營項(xiàng)目的相似度,將相似的企業(yè)對(duì)象分為一類。
需要說明的是,上述步驟之間沒有必然的先后順序,也可以并行執(zhí)行,還可以擇一或擇多執(zhí)行。
以上述三個(gè)步驟均執(zhí)行為例,依次按照以上3個(gè)標(biāo)準(zhǔn),即地區(qū)、規(guī)模、經(jīng)營范圍,對(duì)所有企業(yè)對(duì)象整合分類或進(jìn)行聚類,構(gòu)成最終的企業(yè)對(duì)象分類。
步驟s203:對(duì)企業(yè)對(duì)象的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)及比對(duì),確定是否正常納稅。
本步驟根據(jù)稅務(wù)信息、商品信息樹和企業(yè)對(duì)象分類,對(duì)目標(biāo)企業(yè)對(duì)象的稅務(wù)數(shù)據(jù)進(jìn)行整合統(tǒng)計(jì)分析,對(duì)相似的企業(yè)對(duì)象根據(jù)一些指標(biāo)進(jìn)行比較,找出異常稅務(wù)數(shù)據(jù)。
具體地,本步驟包括:
步驟c1:根據(jù)稅務(wù)信息數(shù)據(jù)庫中的稅務(wù)信息和商品信息樹中的商品信息,查詢出某一目標(biāo)企業(yè)對(duì)象開出的所有發(fā)票,再根據(jù)開具發(fā)票的開具金額按月(或季度)進(jìn)行統(tǒng)計(jì),形成一張?jiān)撃繕?biāo)企業(yè)對(duì)象的稅務(wù)數(shù)據(jù)統(tǒng)計(jì)表。
步驟c2:對(duì)相該目標(biāo)企業(yè)對(duì)象所屬分類中的所有企業(yè)對(duì)象整合進(jìn)行統(tǒng)計(jì),計(jì)算該類企業(yè)對(duì)象每月或每季度交易金額的平均值,將目標(biāo)企業(yè)對(duì)象的交易金額與平均值進(jìn)行比較,確定目標(biāo)企業(yè)對(duì)象是否正常納稅。
以此類推,將目標(biāo)企業(yè)對(duì)象所屬分類中的每個(gè)企業(yè)對(duì)象的交易情況均與平均值進(jìn)行比較,即可找出異常值,根據(jù)大數(shù)據(jù)分析結(jié)果進(jìn)再進(jìn)行分析,確定出異常值大于或等于設(shè)定閾值的企業(yè)對(duì)象。其中,設(shè)定閾值可以由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際情況適當(dāng)設(shè)定,本發(fā)明實(shí)施例對(duì)此不作限制。
通過本實(shí)施例,針對(duì)基于網(wǎng)票發(fā)票的企業(yè)交易行為中目前頻頻出現(xiàn)的企業(yè)偷稅漏稅行為,而稅務(wù)人員人工進(jìn)行偷稅漏稅檢測(cè)又猶如“大海里撈針”的現(xiàn)象,對(duì)企業(yè)進(jìn)行自動(dòng)歸類,自動(dòng)篩選出同類企業(yè),并提供一定范圍的統(tǒng)計(jì)分析,方便稅務(wù)人員進(jìn)行同類企業(yè)的稅務(wù)比較,加快偷稅漏稅的人工檢測(cè)。
需要說明的是,對(duì)于前述的方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明所必需的。
實(shí)施例三
參照?qǐng)D3,示出了根據(jù)本發(fā)明實(shí)施例三的一種稅務(wù)數(shù)據(jù)異常分析系統(tǒng)的結(jié)構(gòu)框圖。
本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析系統(tǒng)包括:訪問模塊301,用于訪問根據(jù)稅務(wù)信息生成的商品信息樹,其中,商品信息樹中至少保存有商品名稱和商品所屬分類;統(tǒng)計(jì)模塊302,用于根據(jù)所述稅務(wù)信息和所述商品信息樹,對(duì)目標(biāo)企業(yè)對(duì)象設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù),以及目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì);分析模塊303,用于根據(jù)統(tǒng)計(jì)結(jié)果分析目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)是否異常。
優(yōu)選地,本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析系統(tǒng)還包括:本體構(gòu)建模塊304,用于在訪問模塊301訪問稅務(wù)數(shù)據(jù)信息庫之前,根據(jù)稅務(wù)信息生成商品信息樹;本體構(gòu)建模塊304具體包括:第一獲取模塊,用于從稅務(wù)數(shù)據(jù)信息庫中獲取元稅務(wù)數(shù)據(jù),根據(jù)元稅務(wù)數(shù)據(jù)獲取商品明細(xì)信息,其中,商品明細(xì)信息包括商品名稱;爬取模塊,用于爬取所述商品名稱對(duì)應(yīng)的網(wǎng)頁;第二獲取模塊,用于對(duì)網(wǎng)頁進(jìn)行解析,獲取所述商品名稱對(duì)應(yīng)的商品的所屬分類;生成模塊,用于根據(jù)所述商品名稱和其對(duì)應(yīng)的所屬分類生成商品信息樹。
優(yōu)選地,爬取模塊包括:判斷單元,用于判斷是否成功爬取到所述商品名稱對(duì)應(yīng)的網(wǎng)頁;執(zhí)行單元,用于若判斷單元的判斷結(jié)果為是,則執(zhí)行第二獲取模塊;若判斷單元的判斷結(jié)果為否,則對(duì)所述商品名稱進(jìn)行分詞后重新爬取網(wǎng)頁。
優(yōu)選地,本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析系統(tǒng)還包括:企業(yè)對(duì)象分類模塊305,用于在訪問模塊301訪問稅務(wù)數(shù)據(jù)信息庫之前,從稅務(wù)數(shù)據(jù)信息庫中獲取企業(yè)對(duì)象信息,其中,企業(yè)對(duì)象信息包括以下至少之一:注冊(cè)地址信息、注冊(cè)資本信息、主營項(xiàng)目信息;根據(jù)企業(yè)對(duì)象信息,確定企業(yè)對(duì)象的相似度;根據(jù)企業(yè)對(duì)象的相似度,對(duì)企業(yè)對(duì)象進(jìn)行聚類,生成多個(gè)企業(yè)對(duì)象分類,其中,每個(gè)企業(yè)對(duì)象分類包括至少一個(gè)企業(yè)對(duì)象。
優(yōu)選地,分析模塊303包括:對(duì)比模塊,用于將目標(biāo)企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果,與,目標(biāo)企業(yè)對(duì)象所屬分類內(nèi)的所有企業(yè)對(duì)象的統(tǒng)計(jì)結(jié)果的平均值進(jìn)行比較;確定模塊,用于若對(duì)比模塊的比較結(jié)果為大于或等于設(shè)定閾值,則確定目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)異常;否則,則確定目標(biāo)企業(yè)對(duì)象在所述設(shè)定時(shí)間段內(nèi)的稅務(wù)數(shù)據(jù)正常。
本實(shí)施例的稅務(wù)數(shù)據(jù)異常分析系統(tǒng)用于實(shí)現(xiàn)前述多個(gè)方法實(shí)施例中相應(yīng)的稅務(wù)數(shù)據(jù)異常分析方法,并具有相應(yīng)的方法實(shí)施例的有益效果,在此不再贅述。
最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。