本發(fā)明涉及一種基于納稅人利益關聯(lián)網(wǎng)絡(Taxpayer Profit Interactive Network,TPIN)價格錯配偷漏稅行為識別方法,用于解決目前關聯(lián)企業(yè)間的偷漏稅行為識別困難,稅務稽查效率低下、稽查方式單一的問題。
背景技術:
:
隨著稅務信息平臺的建立,稅務數(shù)據(jù)量呈現(xiàn)快速增長的趨勢。但是稅收監(jiān)管的智能化卻仍然存在不足,我國傳統(tǒng)稅務審計和稽查以獨立納稅人為分析對象,依靠人工選案、計算機選案、舉報等途徑,效率低、深度和廣度嚴重受限,難以識別利益關聯(lián)團體中以利益輸送為特征的偷漏稅行為。其中利用交易稅率不同通過價格錯配進行利潤轉移以達到偷漏稅的方式非常常見,這種存在直接或間接關聯(lián)關系的兩個納稅人同時與第三方進行不同類型的銷售或購進交易時,通過調(diào)整不同交易類型之間的轉讓價格,實現(xiàn)整體稅負的降低,從而達到偷漏稅目的行為是我國稅務稽查的難題。因此,通過稅務數(shù)據(jù)挖掘識別和分析價格錯配偷漏稅行為已經(jīng)成為稅務機構現(xiàn)階段研究的重點和亟待解決的難題。
針對如何有效地識別價格錯配偷漏稅行為,以下專利和論文提供了技術方案:
中國專利文獻201310293435.5公開了一種基于納稅人利益關聯(lián)網(wǎng)絡模型的偷漏稅關聯(lián)企業(yè)識別方法,提供了一種基于最大介數(shù)約束的有向閉環(huán)集的納稅人利益關聯(lián)集團辨識方法,同時根據(jù)企業(yè)之間的交易行為權重判定納稅人利益關聯(lián)集團中是否存在偷漏稅嫌疑;
文獻《關聯(lián)規(guī)則數(shù)據(jù)挖掘在稅務稽查系統(tǒng)中的應用》(徐慎剛,經(jīng)濟監(jiān)督2011,13,pp:43-44)采用關聯(lián)規(guī)則挖掘偷漏稅案例中潛在的企業(yè)關聯(lián)特征,為稅務稽查人員提供決策支持。
然而以上文獻所述方法主要存在以下問題:1、文獻1中有關企業(yè)屬性和企業(yè)關聯(lián)關系的資料存在失真現(xiàn)象,不能適用于價格錯配模式的納稅人利益關聯(lián)網(wǎng)絡建模;基于最大環(huán)介數(shù)算法并沒有與實際業(yè)務相關聯(lián),無法應用于價格錯配模式的偷漏稅行為識別。2、文獻2中基于關聯(lián)規(guī)則挖掘,僅能識別偷漏稅違法違紀手段之間存在的關聯(lián)關系,不能應用于納稅人利益關聯(lián)網(wǎng)絡的模式挖掘。
技術實現(xiàn)要素:
:
本發(fā)明的目的在于基于納稅人利益關聯(lián)網(wǎng)絡的價格錯配偷漏稅行為識別方法,該方法利用稅務局數(shù)據(jù),結合稽查案例,提出價格錯配偷漏稅行為,通過消息傳遞機制和靜態(tài)關聯(lián)關系鏈抽取價格錯配群組,基于關聯(lián)稅務指標定位偷漏稅關聯(lián)企業(yè)。最終解決了關聯(lián)企業(yè)間偷漏稅行為難以發(fā)現(xiàn)的問題。
為達到上述目的,本發(fā)明是采取如下技術方案予以實現(xiàn)的:
基于納稅人利益關聯(lián)網(wǎng)絡的價格錯配偷漏稅行為識別方法,該方法利用稅務局數(shù)據(jù),結合稽查案例,提出價格錯配偷漏稅行為,并抽取價格錯配群組,最終定位偷漏稅關聯(lián)企業(yè)。
本發(fā)明進一步的改進在于,具體包括如下步驟:
1)首先,構建納稅人利益關聯(lián)網(wǎng)絡;
2)其次,基于稽查案例抽取價格錯配偷漏稅行為模式;
3)最后,基于1)中納稅人利益關聯(lián)網(wǎng)絡和2)中價格錯配偷漏稅行為模式識別價格錯配偷漏稅行為。
本發(fā)明進一步的改進在于,構建納稅人利益關聯(lián)網(wǎng)絡,具體如下:
納稅人利益關聯(lián)網(wǎng)絡表示企業(yè)和企業(yè)、投資方以及法人代表之間的聯(lián)系,由實體、實體間的關系、實體屬性以及關系屬性四要素夠成的網(wǎng)絡;其中,實體包括企業(yè)、投資方、法人代表,實體間的關系包括交易關系、投資關系、控制關系,實體屬性包括企業(yè)名稱、行業(yè)類別,關系屬性包括投資比例、交易金額;
將納稅人利益關聯(lián)網(wǎng)絡表示為兩元組:
TPIN={(V,VD),(E,ED)}
其中V={vp|p=1,2,...,Np}表示節(jié)點集合,其中Np表示網(wǎng)絡中的節(jié)點個數(shù),每個節(jié)點由1到p的數(shù)字唯一標識,E表示圖中所有存在邊的集合,且令E={epq}={(vp,vq)|0<p,q<Np},其中epq=(vp,vq)表示從標號為p的節(jié)點到標號為q的節(jié)點的有向連線,VD表示為節(jié)點屬性,將其表示為:
VD={Type,ID,Name}
其中表示節(jié)點的類型,Vnsr表示納稅人,Vfddbr表示法定代表人,Vtzf表示投資方,分別用三位二進制數(shù)表示,二進制數(shù)001,十進制數(shù)1表示納稅人;二進制數(shù)010,十進制數(shù)2表示法定代表人;二進制數(shù)100,十進制數(shù)4表示投資方,如果節(jié)點具有多重類型則進行二進制或運算;ID={sfzh,nsrsbh}表示節(jié)點的標識號,是企業(yè)和法人代表的唯一標識號,其中企業(yè)用納稅人識別號nsrsbh唯一標識,法人代表由身份證號sfzh唯一標識;Name表示節(jié)點的中文名稱,邊的屬性表示為:
ED={CT,IV,TD}
其中CT={wpq|0<p,q<Np}表示法人與納稅人間邊的控制權重,只包含兩種控制關系{控制,不控制},IV={wpq|0<p,q<Np}∈(0,1]表示邊(vp,vq)的投資權重,為投資方vp所在企業(yè)vq控制比例的大小,TD={wpq|0<p,q<Np}∈(0,1]表示邊(vp,vq)的交易權重,為企業(yè)vp和企業(yè)vq交易額占企業(yè)vq的比例。
本發(fā)明進一步的改進在于,基于稽查案例的價格錯配偷漏稅行為模式抽取,具體如下:
在從業(yè)務案例中抽象出具有偷稅漏稅嫌疑的群組模型,得到不含具體業(yè)務的點和邊的拓撲結構圖,使對偷漏稅模式的挖掘轉化為TPIN中關聯(lián)關系鏈的搜索。
本發(fā)明進一步的改進在于,價格錯配偷漏稅行為模式識別,具體方法如下:
基于TPIN和價格錯配偷漏稅行為模式識別偷漏稅企業(yè),分為四部分,首先,建立圖消息傳播模型RHSF,其次基于RHSF抽取靜態(tài)關聯(lián)關系鏈,之后基于靜態(tài)關聯(lián)關系鏈挖掘價格錯配嫌疑群組,最后對嫌疑企業(yè)進行稅務指標計算和分析,并輸出偷漏稅企業(yè),具體如下:
(1)RHSF消息傳播機制構建
基于RHSF圖消息傳播模型,RHSF模型采用以節(jié)點為中心的圖計算模型,節(jié)點更新函數(shù)劃分為四個連續(xù)的處理階段:信息收集階段Receive、信息處理階段Handle、信息分發(fā)階段Send、和過濾階段Filter,其中Receive/Send,簡稱RS,函數(shù)是以單條邊為操作粒度,Handle/Filter函數(shù)是以單節(jié)點為操作粒度,以節(jié)點i為例,來說明RHSF模型的步驟:
Step1:信息收集階段,將i節(jié)點的所有鄰接節(jié)點和相連的邊上的信息通過一個通用自定義函數(shù)收集起來:
其中Attri、Attrv、Attr(i,v)分別是節(jié)點i、節(jié)點v、和從節(jié)點i到節(jié)點v的邊上的信息,v∈b[i]表示所有與節(jié)點i相連的節(jié)點,R()表示消息的接收過程,用戶自定義函數(shù)來定義對消息初步處理的過程;Σ就表示節(jié)點接收鄰接節(jié)點和邊上的信息并初步預處理的結果;
Step2:信息應用階段,將在Step1中接收和計算出的Σ應用到節(jié)點i,更改節(jié)點自身的屬性:
其中為節(jié)點i更新后的屬性值,H()表示消息的處理過程;
Step3:信息分發(fā)階段,將i節(jié)點上新的信息以及所有與節(jié)點i相連邊上的初始信息通過用戶自定義函數(shù)分發(fā)到其他相鄰節(jié)點:
其中表示遍歷每一個與節(jié)點i相連的節(jié)點,S()表示消息的分發(fā)過程;
Step 4:過濾階段,通過用戶自定義規(guī)則篩選下一輪迭代所需要的節(jié)點和邊,刪除本輪迭代中沒有收到消息的節(jié)點以及其相連的邊,對整個圖結構進行更新,若圖中仍有剩余節(jié)點,返回Step1:
Graphnew←F(vertices,edges)
其中vertices表示Step3中點集,edges表示Step3中的邊集,F(xiàn)()表示過濾過程,Graphnew表示更新后的圖結構;
(2)靜態(tài)關聯(lián)關系鏈抽取
首先對兩個概念進行定義:
1)靜態(tài)關聯(lián)關系網(wǎng)絡
靜態(tài)關聯(lián)關系網(wǎng)絡是納稅人利益關聯(lián)網(wǎng)絡中僅包含投資和控制關系的子網(wǎng)絡;
2)靜態(tài)關聯(lián)關系鏈
靜態(tài)關聯(lián)關系鏈是在靜態(tài)關聯(lián)關系網(wǎng)絡中控制、投資邊首尾相連的路徑鏈的集合,這里的路徑鏈定義為若投資企業(yè)C1,這里Ci代表企業(yè),通過一家或多家企業(yè)間接控制或投資企業(yè)Cn+1,則稱C1和Cn+1之間首尾相連的路徑為路徑鏈,且用表示一條靜態(tài)關聯(lián)關系鏈;
靜態(tài)關聯(lián)關系鏈是所提偷漏稅行為模式拓撲模型的最為重要組成部分,因此,通過定期構建離線靜態(tài)關聯(lián)關系鏈庫避免重復遍歷靜態(tài)關聯(lián)關系網(wǎng)絡,其構建過程如下:
Step1:從TPIN中基于靜態(tài)關聯(lián)關系抽取靜態(tài)關聯(lián)關系網(wǎng)絡;
Step2:為網(wǎng)絡中各節(jié)點vp添加局部路徑集合屬性LPp,其中,p=1,...,NP,vp表示節(jié)點,LPp表示節(jié)點vp中的局部路徑屬性,其結構為Set[Seq[P]],其中Set表示集合,用符號{}表示,Seq表示序列,用符號<>表示,P表示序列的元素類型為節(jié)點編號類型;
Step3:為各節(jié)點vp局部路徑集合添加一條僅包含自身節(jié)點編號的路徑序列<vp>,即各節(jié)點vp局部路徑集合初始化為{<vp>},同時,初始化網(wǎng)絡中全局路徑集合GP為空;
Step4:基于RHSF消息分發(fā)機制,網(wǎng)絡中每個節(jié)點vp沿靜態(tài)關聯(lián)關系邊方向,將vp的當前局部路徑集合發(fā)送給其鄰接節(jié)點vps(1),vps(2),...,vps(m),其中m表示以vp為起始節(jié)點的鄰接節(jié)點的數(shù)量,vps(i)表示vp節(jié)點通過靜態(tài)關聯(lián)關系鏈相連的所有鄰接節(jié)點,其中,0<i≤m;
Step5:基于RHSF消息收集和處理機制,網(wǎng)絡中每個節(jié)點vp對接收到的局部路徑集合LPpr(1),LPpr(2),...,LPpr(n)做并集,其中n為以vp為終止節(jié)點的鄰接節(jié)點的數(shù)量,得到路徑集合LPpr,遍歷LPpr中各條路徑,若路徑中包含當前頂點自身編號p,則刪除該路徑;否則,在該路徑末尾追加當前頂點自身編號p,最終得到的路徑集合記為LP′pr;
Step6:將每個節(jié)點vp的局部路徑集合重新定義為LP′pr,并將LP′pr添加到全局路徑集合GP中;
Step7:基于RHSF過濾機制,刪除沒有接收到消息的節(jié)點及以其為源點的邊,判斷當前靜態(tài)關聯(lián)關系網(wǎng)絡中節(jié)點數(shù)量,若節(jié)點數(shù)量為零,則結束,
上述步驟結束后,輸出全局路徑集合即為靜態(tài)關聯(lián)關系鏈庫;
(3)價格錯配模式抽取
首先對相關概念進行定義:
1)動態(tài)關聯(lián)關系網(wǎng)絡
動態(tài)關聯(lián)關系網(wǎng)絡是指納稅人利益關聯(lián)網(wǎng)絡中僅包含交易關系的子網(wǎng)絡;
2)動態(tài)關聯(lián)關系鏈
動態(tài)關聯(lián)關系鏈是指動態(tài)關聯(lián)關系網(wǎng)絡中的交易邊,且節(jié)點屬性中包含靜態(tài)關聯(lián)關系鏈集合;
3)反向雙邊動態(tài)關聯(lián)關系鏈
反向雙邊動態(tài)關聯(lián)關系鏈是由指向同一節(jié)點或由同一節(jié)點指出的兩條動態(tài)關聯(lián)關系鏈的集合;
價格錯配行為模式的主要特點是包含一條反向雙邊動態(tài)關聯(lián)關系鏈,其模式識別的核心是挖掘兩條反向連接的動態(tài)關聯(lián)關系邊,并識別相連邊的兩端是否存在“靜態(tài)關聯(lián)關系鏈或雙向靜態(tài)關聯(lián)關系鏈”;
價格錯配行為模式挖掘的步驟如下:
Step1:從TPIN中基于動態(tài)關聯(lián)關系抽取提取動態(tài)關聯(lián)關系網(wǎng)絡,其節(jié)點編號集合為Q;
Step2:對全局路徑集合GP,其中GP是靜態(tài)關聯(lián)關系庫,按照集合中各路徑終點編號q進行聚合,得到終點編號和路徑集合組成的鍵值對(q,pathq),其中q∈Q,pathq為終點q對應的路徑集合;
Step3:為網(wǎng)絡中各節(jié)點vq添加局部路徑屬性LPq,其值置為pathq;
Step4:基于RHSF消息發(fā)送機制,網(wǎng)絡中各節(jié)點vq通過動態(tài)關聯(lián)關系邊將其局部路徑信息LPq結合表示邊方向的標志位flagq,組合成消息Msgq傳遞給鄰接節(jié)點,flagq表示兩條動態(tài)關聯(lián)關系鏈之間的方向異同標志位,若傳遞方向和邊方向相同,則flagq置為1;反之,置為-1;
Step5:網(wǎng)絡中各節(jié)點vq按照flagq進行聚合,得到兩個消息集合MsgSet1和MsgSet2:
MsgSet1={Msgi|flagi=1,i∈Q}
MsgSet2={Msgj|flagj=-1,j∈Q}
Step6:任意的Msgi∈MsgSet1,Msgj∈MsgSet1,假設Msgi和Msgj對應的路徑集合分別為MPi和MPj,其中MPi和MPj都是MsgSet1中所有路徑的集合,表示以p為起始節(jié)點,r為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,表示以t為起始節(jié)點,s為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,若存在p=t,則靜態(tài)關聯(lián)關系鏈和結合動態(tài)關聯(lián)關系邊和構成一個價格錯配交易的嫌疑群組;
Step7:任意的Msgi∈MsgSet2,Msgj∈MsgSet2,假設Msgi和Msgj對應的路徑集合分別為MPi和MPj,其中MPi和MPj都是MsgSet2中所有路徑的集合,表示以p為起始節(jié)點,r為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,表示以t為起始節(jié)點,s為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,若存在p=t,則靜態(tài)關聯(lián)關系鏈和結合動態(tài)關聯(lián)關系邊和構成一個價格錯配交易的嫌疑群組;
(4)基于稅務指標的偷漏稅關聯(lián)企業(yè)識別
對步驟③得到的價格錯配嫌疑群組進行如下操作:
Step1:從所有的價格錯配嫌疑群組中抽取類型type為納稅人nsr的節(jié)點,其節(jié)點集合為M;
Step2:對每個節(jié)點i(i∈M),計算與價格錯配模式相關的三個特定稅務指標,分別為納稅人存貨周轉率與銷售收入變動率彈性系數(shù),記為ISEC、企業(yè)期末應收賬款變動率與銷售收入變動率彈性系數(shù),記為ASEC、納稅人期間費用變動率與主營業(yè)務收入變動率彈性系數(shù),記為PMEC;
其中ISEC、ASEC、PMEC的公式分別為:
Step 3:對計算出的指標進行分析,利用下述取值范圍評價這些企業(yè)指標,并對每個企業(yè)i形成相應的判定結果,若指標值在“存在偷漏稅行為”范圍內(nèi),則該企業(yè)存在偷漏稅行為,若指標值在“屬于警告范圍內(nèi)”范圍內(nèi),則該企業(yè)有偷漏稅嫌疑,若指標值在“屬于正常范圍內(nèi)”范圍內(nèi),則該企業(yè)無偷漏稅嫌疑:
其中,IT表示存貨周轉率,ST表示銷售收入變動率,AR表示期末應收賬款變動率,SI表示銷售收入變動率,PC表示期間費用變動率,MB表示主營業(yè)務收入變動率;
Step4:根據(jù)公式裁定如果有偷稅漏稅行為,則輸出企業(yè)i以及i關聯(lián)的靜態(tài)關聯(lián)關系鏈和動態(tài)關聯(lián)關系邊和中的所有企業(yè),它們之間存在偷漏稅的利益關聯(lián),稅法部門按照稅法原則進行重點稽查。
與現(xiàn)有技術相比,本發(fā)明方法具有以下優(yōu)點:
1、使用三位二進制編碼的方式表示法定代表人、投資方、納稅人節(jié)點類型的組合情況,簡化了節(jié)點類型的表示。
2、可遷移性好,從真實稽查案例中抽取出價格錯配模式,使用去業(yè)務化的方法抽象出靜態(tài)關聯(lián)關系鏈和動態(tài)關聯(lián)關系鏈,該方法能廣泛應用于其他關聯(lián)交易模式抽取中;
3、效率高,RHSF圖消息傳遞機制具有速度快、精簡計算量的特點,該方法加入了圖中點集和邊集的更新,使每下一次的迭代計算量更少;靜態(tài)關聯(lián)關系鏈的定義,解決了對每筆交易遍歷關聯(lián)關系網(wǎng)絡導致高時間復雜度的問題。價格錯配群組挖掘中通過節(jié)點消息聚合的方式,提升了節(jié)點并行計算速度,提升了挖掘的效率;
4、識別準確度高,本方法篩選出與價格錯配模式相關的特定稅務指標定位偷漏稅企業(yè),通過三個彈性系數(shù)的篩選,能精準有效的定位通過價格錯配行為偷漏稅的企業(yè)。
附圖說明:
以下結合附圖及具體實施方式對本發(fā)明作進一步的詳細說明。
圖1是本發(fā)明方法涉及基于納稅人利益關聯(lián)網(wǎng)絡的價格錯配偷漏稅行為識別的整體流程示意圖。
圖2是納稅人利益關聯(lián)網(wǎng)絡圖例及一個例子。
圖3是價格錯配模式稽查案件圖例。
圖4是價格錯配模型圖例。
圖5是靜態(tài)關聯(lián)關系鏈抽取的圖例;其中,圖5-1是納稅人利益關聯(lián)網(wǎng)絡案例圖,圖5-2是靜態(tài)關聯(lián)網(wǎng)絡圖,圖5-3是靜態(tài)關聯(lián)關系鏈抽取過程圖,圖5-4是靜態(tài)關聯(lián)關系鏈抽取結果圖。
圖6是價格錯配嫌疑群組挖掘的圖例;其中,圖6-1是動態(tài)關聯(lián)網(wǎng)絡圖,圖6-2是動態(tài)關聯(lián)關系鏈計算過程圖,圖6-3是價格錯配嫌疑群組結果圖。
具體實施方式:
以下結合附圖,對本發(fā)明基于納稅人利益關聯(lián)網(wǎng)絡的價格錯配偷漏稅行為識別的具體內(nèi)容做細致描述。本發(fā)明涉及的一種價格錯配偷漏稅行為模式識別過程如圖1所示,具體過程如下:
(1)納稅人利益關聯(lián)網(wǎng)絡的構建
納稅人利益關聯(lián)網(wǎng)絡表示企業(yè)和企業(yè)、投資方以及法人代表之間的聯(lián)系,它由實體(包括企業(yè),投資方,法人代表)、實體間的關系(交易關系、投資關系、控制關系)、實體屬性(企業(yè)名稱、行業(yè)類別等)和關系屬性(投資比例、交易金額等)四要素夠成的網(wǎng)絡。
本方法將納稅人利益關聯(lián)網(wǎng)絡表示為兩元組:
TPIN={(V,VD),(E,ED)}
其中V={vp|p=1,2,...,Np}表示節(jié)點集合,其中Np表示網(wǎng)絡中的節(jié)點個數(shù),每個節(jié)點由1到p的數(shù)字唯一標識,E表示圖中所有存在邊的集合,且令E={epq}={(vp,vq)|0<p,q<Np},其中epq=(vp,vq)表示從標號為p的節(jié)點到標號為q的節(jié)點的有向連線,VD表示為節(jié)點屬性,本方法將其表示為:
VD={Type,ID,Name}
其中表示節(jié)點的類型,Vnsr表示納稅人,Vfddbr表示法定代表人,Vtzf表示投資方,它們分別用三位二進制數(shù)表示,二進制數(shù)001(即1)表示納稅人;二進制數(shù)010(即2)表示法定代表人;二進制數(shù)100(即4)表示投資方。如果節(jié)點具有多重類型則進行或運算,例如既是納稅人又是投資則二進制數(shù)001|100=101(即5);ID={sfzh,nsrsbh}表示節(jié)點的標識號,它是企業(yè)和法人代表的唯一標識號,其中企業(yè)用納稅人識別號nsrsbh唯一標識,法人代表由身份證號sfzh唯一標識;Name表示節(jié)點的中文名稱。邊的屬性表示為:
ED={CT,IV,TD}
其中CT={wpq|0<p,q<Np}表示法人與納稅人間邊的控制權重,只包含兩種控制關系{控制,不控制},IV={wpq|0<p,q<Np}∈(0,1]表示邊(vp,vq)的投資權重,為投資方vp所在企業(yè)vq控制比例的大小,TD={wpq|0<p,q<Np}∈(0,1]表示邊(vp,vq)的交易權重,為企業(yè)vp和企業(yè)vq交易額占企業(yè)vq的比例。
如圖2所示,描述的是企業(yè)家L1分別通過51%和80%的控股比例控制采礦企業(yè)C1和房地產(chǎn)企業(yè)C2,企業(yè)C1以20%的投資比例投資了水泥加工企業(yè)C3,C3占有C2的20%的交易份額。
(2)基于稽查案例的價格錯配偷漏稅行為模式抽取
現(xiàn)有偷稅漏稅案例很多來源于關聯(lián)企業(yè)的運作,例如投資企業(yè)與被投資企業(yè)間,有共同控股人的企業(yè)之間等,本方法在從業(yè)務案例中抽象出具有偷稅漏稅嫌疑的群組模型,得到不含具體業(yè)務的點和邊的拓撲結構圖,使對偷漏稅模式的挖掘轉化為TPIN中關聯(lián)關系鏈的搜索。
1)價格錯配模式業(yè)務示例如圖3所示,某家從事打印機生產(chǎn)的公司A,為占領市場而實施低價營銷策略,并由其設立的子公司B生產(chǎn)并直接向第三方經(jīng)銷商低價銷售打印機。由于B公司生產(chǎn)的打印機有其專用的打印機耗材,因此A公司通過其另一家從事打印機耗材生產(chǎn)的子公司C,向該第三方經(jīng)銷商高價銷售墨盒等打印機耗材。通過定價策略,實現(xiàn)公司B和C整體稅負低于實際。例如B公司適用33%的稅率,C公司適用15%的稅率,D公司須向B支付60萬以購買打印機,而且須向C公司購買10萬的專用打印機額耗材,而通過A與D之間的協(xié)商,可以使向B支付打印機費用中的60萬取50萬轉移到打印機耗材費用中,而實際交易量不變,最終使D公司支付B公司10萬元,支付C公司60萬。各公司稅額計算如下:
B公司應納所得稅=60×33%=19.98(萬元)
C公司應納所得稅=10×15%=1.5(萬元)
B、C兩公司總共繳納所得稅=19.98+1.5=21.48(萬元)
然而出于避稅目的,可以通過價格錯配將稅率高的B公司的部分利潤轉移到C公司。價格錯配后的稅額計算為:
B公司應納所得稅=10×33%=3.3(萬元)
C公司應納所得稅=60×15%=9(萬元)
B、C兩公司一共繳納所得稅=3.3+9=12.3(萬元)
由此可看出,B、C兩家公司交易價格錯配前,利潤總和為:60+10=70(萬元),利潤轉移后,總利潤為:10+60=70(萬元)。即利潤轉移前后,兩家公司的總利潤是相等的,只是在采用轉移定價后,兩家公司他們應該繳納的所得稅減少了21.48-12.3=9.18(萬元),成功偷稅。因此,一家公司有兩家稅率不同的子公司,可以通過須向兩個子公司同時購貨的第三方公司達到偷稅漏稅的目的。
2)價格錯配模式抽取結果如圖4所示,上述案例可以總結為企業(yè)A控制其子公司B、C,存在第三方企業(yè)D,企業(yè)B、C同時作為D的購方,或是企業(yè)B、C同時作為D的銷方,在這種情況下,B、C、D之間就可能存在價格錯配的行為,本方法把符合上述模式的點集{A,B,C,D}和邊集組成的群組定義為價格錯配嫌疑群組。
a.C1通過控制/投資鏈控制Cn,Cm+n企業(yè),Cn,Cm+n通過交易邊與C0交易;
b.C1通過控制/投資鏈控制Cn企業(yè),C1,Cn通過交易邊與C0交易;
c.C1通過控制/投資鏈控制Cn,Cm+n企業(yè),Cn,Cm+n通過交易邊與C0交易;
d.C1通過控制/投資鏈控制Cn企業(yè),C1,Cn通過交易邊與C0交易。
(3)價格錯配偷漏稅行為模式識別
本節(jié)基于TPIN和價格錯配偷漏稅行為模式識別偷漏稅企業(yè),主要分為四部分。首先,建立圖消息傳播模型RHSF,其次基于RHSF抽取靜態(tài)關聯(lián)關系鏈,之后基于靜態(tài)關聯(lián)關系鏈挖掘價格錯配嫌疑群組,最后對嫌疑企業(yè)進行稅務指標計算和分析,并輸出偷漏稅企業(yè)。
①RHSF消息傳播機制構建
本方法提出RHSF圖消息傳播模型,RHSF模型采用以節(jié)點為中心的圖計算模型,節(jié)點更新函數(shù)劃分為四個連續(xù)的處理階段:信息收集階段(Receive)、信息處理階段(Handle)、信息分發(fā)階段(Send)、和過濾階段(Filter),其中Receive/Send(簡稱RS)函數(shù)是以單條邊為操作粒度,Handle/Filter函數(shù)是以單節(jié)點為操作粒度。以節(jié)點i為例,來說明RHSF模型的步驟:
Step1:信息收集階段,將i節(jié)點的所有鄰接節(jié)點和相連的邊上的信息通過一個通用自定義函數(shù)收集起來:
其中Attri、Attrv、Attr(i,v)分別是節(jié)點i、節(jié)點v、和從節(jié)點i到節(jié)點v的邊上的信息,v∈b[i]表示所有與節(jié)點i相連的節(jié)點,R()表示消息的接收過程,用戶可以自定義函數(shù)來定義對消息初步處理的過程;Σ就表示節(jié)點接收鄰接節(jié)點和邊上的信息并初步預處理的結果。
Step2:信息應用階段,將在Step1中接收和計算出的Σ應用到節(jié)點i,更改節(jié)點自身的屬性:
其中為節(jié)點i更新后的屬性值,H()表示消息的處理過程。
Step3:信息分發(fā)階段,將i節(jié)點上新的信息以及所有與節(jié)點i相連邊上的初始信息通過用戶自定義函數(shù)分發(fā)到其他相鄰節(jié)點:
其中表示遍歷每一個與節(jié)點i相連的節(jié)點,S()表示消息的分發(fā)過程。
Step 4:過濾階段,通過用戶自定義規(guī)則篩選下一輪迭代所需要的節(jié)點和邊,刪除本輪迭代中沒有收到消息的節(jié)點以及其相連的邊,對整個圖結構進行更新,若圖中仍有剩余節(jié)點,返回Step1:
Graphnew←F(vertices,edges)
其中vertices表示Step3中點集,edges表示Step3中的邊集,F(xiàn)()表示過濾過程,Graphnew表示更新后的圖結構。
②靜態(tài)關聯(lián)關系鏈抽取
首先對兩個概念進行定義:
1)靜態(tài)關聯(lián)關系網(wǎng)絡
靜態(tài)關聯(lián)關系網(wǎng)絡是納稅人利益關聯(lián)網(wǎng)絡中僅包含投資和控制關系的子網(wǎng)絡。
2)靜態(tài)關聯(lián)關系鏈
靜態(tài)關聯(lián)關系鏈是在靜態(tài)關聯(lián)關系網(wǎng)絡中控制、投資邊首尾相連的路徑鏈的集合。這里的路徑鏈定義為若投資企業(yè)C1(這里Ci代表企業(yè))通過一家或多家企業(yè)間接控制或投資企業(yè)Cn+1,則稱C1和Cn+1之間首尾相連的路徑為路徑鏈,且用表示一條靜態(tài)關聯(lián)關系鏈。
靜態(tài)關聯(lián)關系鏈是所提偷漏稅行為模式拓撲模型的最為重要組成部分,因此,可以通過定期構建離線靜態(tài)關聯(lián)關系鏈庫避免重復遍歷靜態(tài)關聯(lián)關系網(wǎng)絡,其構建過程如下:
Step1:從TPIN中基于靜態(tài)關聯(lián)關系抽取靜態(tài)關聯(lián)關系網(wǎng)絡;
Step2:為網(wǎng)絡中各節(jié)點vp(p=1,...,NP)添加局部路徑集合屬性LPp,其中vp表示節(jié)點,LPp表示節(jié)點vp中的局部路徑屬性,其結構為Set[Seq[P]],其中Set表示集合,用符號{}表示,Seq表示序列,用符號<>表示,P表示序列的元素類型為節(jié)點編號類型;
Step3:為各節(jié)點vp局部路徑集合添加一條僅包含自身節(jié)點編號的路徑序列<vp>,即各節(jié)點vp局部路徑集合初始化為{<vp>}。同時,初始化網(wǎng)絡中全局路徑集合GP為空;
Step4:基于RHSF消息分發(fā)機制,網(wǎng)絡中每個節(jié)點vp沿靜態(tài)關聯(lián)關系邊方向,將vp的當前局部路徑集合發(fā)送給其鄰接節(jié)點vps(1),vps(2),...,vps(m),其中m表示以vp為起始節(jié)點的鄰接節(jié)點的數(shù)量,vps(i)(0<i≤m)表示vp節(jié)點通過靜態(tài)關聯(lián)關系鏈相連的所有鄰接節(jié)點;
Step 5:基于RHSF消息收集和處理機制,網(wǎng)絡中每個節(jié)點vp對接收到的局部路徑集合LPpr(1),LPpr(2),...,LPpr(n)做并集,其中n為以vp為終止節(jié)點的鄰接節(jié)點的數(shù)量,得到路徑集合LPpr,遍歷LPpr中各條路徑,若路徑中包含當前頂點自身編號p,則刪除該路徑;否則,在該路徑末尾追加當前頂點自身編號p。最終得到的路徑集合記為LP′pr;
Step6:將每個節(jié)點vp的局部路徑集合重新定義為LP′pr,并將LP′pr添加到全局路徑集合GP中;
Step7:基于RHSF過濾機制,刪除沒有接收到消息的節(jié)點及以其為源點的邊,判斷當前靜態(tài)關聯(lián)關系網(wǎng)絡中節(jié)點數(shù)量,若節(jié)點數(shù)量為零,則結束。
上述步驟結束后,輸出全局路徑集合即為靜態(tài)關聯(lián)關系鏈庫。
靜態(tài)關聯(lián)關系庫的構建實例如圖5所示。
Step1:構建TPIN。圖5-1為TPIN的一個示例,其中A、B既是投資方又是企業(yè),C、D為企業(yè),A企業(yè)投資B企業(yè),B企業(yè)投資C企業(yè),A與D,D與C,B與D之間有交易關系,方向為前者指向后者。
Step2:提取前件網(wǎng)絡。圖5-2為TPIN中提取的前件網(wǎng)絡,僅含投資關系和控制關系,不含交易關系。如圖提取出AB,BC兩條投資邊。
Step3:第一輪迭代:迭代一次前件網(wǎng)絡,生成前件路徑。第一次迭代中,每個節(jié)點將自身的ID沿前件網(wǎng)絡邊發(fā)送至鄰接節(jié)點,接收到編號信息的節(jié)點將收到的編號加上自身編號存入屬性中,如圖5-3(左)中,節(jié)點A將編號A發(fā)送至節(jié)點B,B將作為一條前件路徑存入自身屬性,同時節(jié)點B將編號B發(fā)送至節(jié)點C,C將作為一條前件路徑存入自身屬性。這時,為了防止收到重復消息,剔除沒有收到信息的節(jié)點A,剩下的圖進入之后的迭代。
Step4:第2~n輪迭代:在Step3的圖的基礎上,循環(huán)迭代前件網(wǎng)絡,直至生成最終的前件路徑。在2~n輪迭代中,每個節(jié)點將自身的路徑屬性沿前件網(wǎng)絡邊發(fā)送至鄰接節(jié)點,接收到信息的節(jié)點將收到的信息加上自身節(jié)點編號和自身原有的屬性聚合,例如圖5-3(中),節(jié)點B將屬性(A,B)發(fā)送至節(jié)點C,C將剔除本輪迭代中沒有收到信息的節(jié)點B,剩下的圖繼續(xù)執(zhí)行Step4,若圖中的點已經(jīng)全部剔除或者圖中已經(jīng)沒有可剔除的店,退出循環(huán),例如圖5-3(右),第三輪迭代中C節(jié)點沒有收到來自鄰接節(jié)點的信息,剔除C節(jié)點,圖中已經(jīng)沒有剩下的節(jié)點,此時退出循環(huán)。
Step5:得出結果。如圖5-4,此時每個節(jié)點屬性中都帶有以該節(jié)點為終止節(jié)點的前件路徑,此時,為了后續(xù)的模式發(fā)現(xiàn),在每個點的屬性上加入自身節(jié)點編號,如A節(jié)點屬性{(A)},B節(jié)點屬性{(B),(A,B)},C節(jié)點屬性{(C),(B,C),(A,B,C)}。
③價格錯配模式抽取
首先對相關概念進行定義:
1)動態(tài)關聯(lián)關系網(wǎng)絡
動態(tài)關聯(lián)關系網(wǎng)絡是指納稅人利益關聯(lián)網(wǎng)絡中僅包含交易關系的子網(wǎng)絡
2)動態(tài)關聯(lián)關系鏈
動態(tài)關聯(lián)關系鏈是指動態(tài)關聯(lián)關系網(wǎng)絡中的交易邊,且節(jié)點屬性中包含靜態(tài)關聯(lián)關系鏈集合。
3)反向雙邊動態(tài)關聯(lián)關系鏈
反向雙邊動態(tài)關聯(lián)關系鏈是由指向同一節(jié)點或由同一節(jié)點指出的兩條動態(tài)關聯(lián)關系鏈的集合。
價格錯配行為模式的主要特點是包含一條反向雙邊動態(tài)關聯(lián)關系鏈,其模式識別的核心是挖掘兩條反向連接的動態(tài)關聯(lián)關系邊,并識別相連邊的兩端是否存在“靜態(tài)關聯(lián)關系鏈或雙向靜態(tài)關聯(lián)關系鏈”。
價格錯配行為模式挖掘的步驟如下:
Step1:從TPIN中基于動態(tài)關聯(lián)關系抽取提取動態(tài)關聯(lián)關系網(wǎng)絡,其節(jié)點編號集合為Q;
Step2:對全局路徑集合GP,其中GP是靜態(tài)關聯(lián)關系庫,按照集合中各路徑終點編號q(q∈Q)進行聚合,得到終點編號和路徑集合組成的鍵值對(q,pathq),其中pathq為終點q對應的路徑集合;
Step3:為網(wǎng)絡中各節(jié)點vq添加局部路徑屬性LPq,其值置為pathq;
Step4:基于RHSF消息發(fā)送機制,網(wǎng)絡中各節(jié)點vq通過動態(tài)關聯(lián)關系邊將其局部路徑信息LPq結合表示邊方向的標志位flagq,組合成消息Msgq傳遞給鄰接節(jié)點。flagq表示兩條動態(tài)關聯(lián)關系鏈之間的方向異同標志位,若傳遞方向和邊方向相同,則flagq置為1;反之,置為-1。
Step5:網(wǎng)絡中各節(jié)點vq按照flagq進行聚合,得到兩個消息集合MsgSet1和MsgSet2:
MsgSet1={Msgi|flagi=1,i∈Q}
MsgSet2={Msgj|flagj=-1,j∈Q}
Step 6:任意的Msgi∈MsgSet1,Msgj∈MsgSet1,假設Msgi和Msgj對應的路徑集合分別為MPi和MPj,其中MPi和MPj都是MsgSet1中所有路徑的集合,表示以p為起始節(jié)點,r為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,表示以t為起始節(jié)點,s為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,若存在p=t,則靜態(tài)關聯(lián)關系鏈和結合動態(tài)關聯(lián)關系邊和構成一個價格錯配交易的嫌疑群組。
Step 7:任意的Msgi∈MsgSet2,Msgj∈MsgSet2,假設Msgi和Msgj對應的路徑集合分別為MPi和MPj,其中MPi和MPj都是MsgSet2中所有路徑的集合,表示以p為起始節(jié)點,r為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,表示以t為起始節(jié)點,s為終止節(jié)點的靜態(tài)關聯(lián)關系鏈,若存在p=t,則靜態(tài)關聯(lián)關系鏈和結合動態(tài)關聯(lián)關系邊和構成一個價格錯配交易的嫌疑群組。
價格錯配模式構建示例如圖6所示。步驟如下:
Step1:提取交易網(wǎng)絡。圖6-1為TPIN的一個示例,其中A、B既是投資方又是企業(yè),C、D為企業(yè),A企業(yè)投資B企業(yè),B企業(yè)投資C企業(yè),A與D,D與C,B與D之間有交易關系,方向為前者指向后者,在TPIN示例圖中去除兩條投資邊(灰)后,剩下只含交易邊的圖便是交易網(wǎng)絡。
Step2:交易網(wǎng)絡、前件路徑屬性聚合。為了在交易網(wǎng)絡中計算出有共同控制人或共同投資方的嫌疑群組,需要將之前前件網(wǎng)絡中計算出的路徑屬性添加至交易網(wǎng)絡,形成如圖6-2(左)的網(wǎng)絡,其中沒有前件路徑屬性的點賦為空,如圖6-2(左)中節(jié)點D的屬性為空。
Step3:交易網(wǎng)絡圖節(jié)點屬性傳遞。每個節(jié)點將自身的屬性通過交易邊傳遞至鄰接節(jié)點,傳播的時候添加標志位,順交易邊傳遞時在消息中添加flag=1,逆交易邊傳遞時在消息中添加flag=-1,例如圖6-2(右),A節(jié)點將{(A),1}傳遞至D節(jié)點,B節(jié)點將{(B),(A,B),1}傳遞至D節(jié)點,C節(jié)點將{(C),(B,C),(A,B,C),-1}傳遞至D節(jié)點。
Step4:節(jié)點消息計算。Step3之后,每個點都帶有鄰接交易節(jié)點的前件路徑,所以在Step4中并行的在每個節(jié)點內(nèi)部計算嫌疑群組,首先每個節(jié)點將所有收到的消息分解成兩個隊列:
List1={Msgi|flag=1}
List2={Msgi|flag=-1}
其中Msgi表示從節(jié)點i傳遞過來的一條消息,例如Step3中B節(jié)點傳遞給D節(jié)點的{(B),(A,B),1}就表示為一條消息;List1為所有標志位為1的消息的集合,表示List1中的所有消息來源于節(jié)點的銷貨方;List2為所有標志位為-1的消息的集合,表示List2中的所有消息來源于節(jié)點的購貨方,例如圖6-2(右)中D節(jié)點將接收的三條消息分類為
List1={{(A),1},{(B),(A,B),1}}
List2={{(C),(B,C),(A,B,C),-1}}
由于價格錯配模式中的兩條交易邊是方向相同的兩條交易邊,所以分別遍歷Msgm∈List1,Msgn∈List1,Msgp∈List2,Msgq∈List2,
例如{(A),1}與{(B),(A,B),1}組合。
Step5:嫌疑模式挖掘。提取Step4中每個組合中的前件路徑,如{(A),1}與{(B),(A,B),1}組合中提取出Part1={(A)},Part2={(B),(A,B)},遍歷所有的Routem∈Part1,Routen∈Part2,若Routem.head=Routen.head,(head表示路徑中的第一個節(jié)點),則代表Routem、Routen有同一法人控制源或同一投資方投資源,例如Part1中路徑(A)與Part2中路徑(A,B)起始節(jié)點都為A,提取這兩條前件路徑,和自身節(jié)點ID組成一個價格錯配嫌疑群組,如圖6-3的嫌疑群組,每個嫌疑群組表示為{id,vertex={V1,V2,...Vn},edge={E1,E2,...En}},其中vertex是嫌疑群組中所有節(jié)點的集合,edge是嫌疑群組中所有邊的集合。
④基于稅務指標的偷漏稅關聯(lián)企業(yè)識別
對步驟③得到的價格錯配嫌疑群組進行如下操作:
Step1:從所有的價格錯配嫌疑群組中抽取類型(type)為納稅人(nsr)的節(jié)點,其節(jié)點集合為M;
Step2:對每個節(jié)點i(i∈M),計算與價格錯配模式相關的三個特定稅務指標,分別為納稅人存貨周轉率與銷售收入變動率彈性系數(shù)(記為ISEC)、企業(yè)期末應收賬款變動率與銷售收入變動率彈性系數(shù)(記為ASEC)、納稅人期間費用變動率與主營業(yè)務收入變動率彈性系數(shù)(記為PMEC)。
其中ISEC、ASEC、PMEC的公式分別為:
Step 3:對計算出的指標進行分析,利用下述取值范圍評價這些企業(yè)指標,并對每個企業(yè)i形成相應的判定結果,若指標值在“存在偷漏稅行為”范圍內(nèi),則該企業(yè)存在偷漏稅行為,若指標值在“屬于警告范圍內(nèi)”范圍內(nèi),則該企業(yè)有偷漏稅嫌疑,若指標值在“屬于正常范圍內(nèi)”范圍內(nèi),則該企業(yè)無偷漏稅嫌疑:
其中,IT表示存貨周轉率,ST表示銷售收入變動率,AR表示期末應收賬款變動率,SI表示銷售收入變動率,PC表示期間費用變動率,MB表示主營業(yè)務收入變動率;
Step4:根據(jù)公式裁定如果有偷稅漏稅行為,則輸出企業(yè)i以及企業(yè)i相關的靜態(tài)關聯(lián)關系鏈和動態(tài)關聯(lián)關系邊和中的所有企業(yè),它們之間存在偷漏稅的利益關聯(lián),稅法部門可按照稅法原則進行重點稽查。