本發(fā)明涉及資產(chǎn)評級技術(shù)領(lǐng)域,更具體地說,特別涉及一種基于生存模型對資產(chǎn)證券化資產(chǎn)池進行評級的方法。
背景技術(shù):
1、資產(chǎn)證券化,例如以民用住房貸款為抵押的資產(chǎn)證券化;2、資產(chǎn)抵押,譬如汽車貸款、設(shè)備貸款為主的資產(chǎn)證券化;3、抵押貸款債權(quán),為目前主要的三大規(guī)模性融資手段,上述三種融資方式可以幫助銀行來管理銀行的資產(chǎn)負債表,也可以使金融企業(yè)將不可能流動性資產(chǎn)轉(zhuǎn)化為流動性資產(chǎn)。資產(chǎn)證券化可以使金融機構(gòu)獲得更為廉價的資金,能夠使金融機構(gòu)的融資手段更為豐富。
發(fā)行機構(gòu)在進行資產(chǎn)池評級的時候,往往需要根據(jù)資產(chǎn)池的歷史數(shù)據(jù)和特性決定資產(chǎn)池的違約率來對證券化產(chǎn)品進行評級。那么,如何提供一個能對資產(chǎn)池,特別是包含海量資產(chǎn)數(shù)據(jù)的資產(chǎn)池(幾百條到百萬條)進行準確的、有效的評級,就顯得尤為重要。
技術(shù)實現(xiàn)要素:
(一)技術(shù)問題
在資產(chǎn)池評級過程中面臨如下挑戰(zhàn):
1、目前普遍使用的log-normal分布模型的局限性:
log-normal分布不能完善的描述損失率的分布,以及在方差的選擇上缺乏可信度。另外,該模型在信息量較低時是相對高效的,但是難以在此基礎(chǔ)上延伸。Log-normal分布模型具有較強的參數(shù)化假設(shè),不 能完善的描述真實損失率的分布,特別是在多峰和厚尾的情形下會偏離真實情況較多,應(yīng)用于損失率預(yù)測的場景時會造成對風險的估計不足。另外,該模型適用于在歷史數(shù)據(jù)較少時相對高效的進行模擬,但難以推廣用于更加豐富的數(shù)據(jù)。
2、違約率分析、評級過程的速度不能勝任海量數(shù)據(jù)計算:
金融機構(gòu)的資產(chǎn)池往往是海量數(shù)據(jù)。數(shù)據(jù)級別在百萬、千萬條記錄。如何在非常短的時間內(nèi)進行海量數(shù)據(jù)的評級也是一個巨大的挑戰(zhàn)。
(二)技術(shù)方案
本發(fā)明提供了一種基于生存模型對資產(chǎn)證券化資產(chǎn)池進行評級的方法,該方法具體包括:
步驟一、構(gòu)建生存模型:
貸款到違約距離時間為T;
擁有累積概率密度函數(shù)為:
FT(t)=P(T≤t):R→[0,1]
概率密度函數(shù)為:
貸款到t時刻不違約概率計算的生存函數(shù)為:
S(t)=1-FT(t)
在時刻t處一段極小的時間內(nèi)發(fā)生違約概率密度計算的危險函數(shù)為:
由上述函數(shù)可得:
即:
步驟二、進行違約模擬:
在獲得S(t)函數(shù)之后,使用蒙特卡洛模擬方法對資產(chǎn)池在時間序列上進行逐筆的違約模擬并獲得評級,其中S(t)為蒙特卡洛抽樣提供概率基準。
優(yōu)選地,通過歷史數(shù)據(jù)擬合h(t)來獲得S(t);
以擬合方法獲得h(t)函數(shù):
在生存模型中的觀察時間和違約記錄,并確定函數(shù):
其中Ti是生存時間,Ci是觀察時間(貸款到期時間);
如果發(fā)生違約,記Δi=1,否則記Δi=0;
對于存續(xù)期內(nèi)未發(fā)生違約的貸款樣本i,在時間軸t上滿足聯(lián)合概率為:
P(Ci=ti)P(Ti>ti)
對于存續(xù)期內(nèi)發(fā)生違約的樣本i,在時間軸上滿足聯(lián)合概率為:
P(Ci>ti)P(Ti=ti)
靜態(tài)池中的所有資產(chǎn),似然函數(shù)為:
其中P(Ti=ti)=f(ti)=h(ti)S(ti),因此得出如下函數(shù):
其中G(ti)和g(ti)為觀測時間Ci的CDF和PDF,對G(ti)和g(ti)進 行常數(shù)化,因此得出如下函數(shù):
其中對數(shù)似然函數(shù)為:
通過極大似然估計取得h(t)的估算值,確定在極短時間內(nèi)發(fā)生違約的概率不因觀測時間點而改變,即h(t)=λ即S(t)=e-λt。
優(yōu)選地,通過歷史數(shù)據(jù)擬合h(t)來獲得S(t);
通過總違約數(shù)量除以總暴露時間來估計h(t),結(jié)合Weibull模型得到如下函數(shù):
h(t)=λα(λt)α-1,其中α,λ>0;
通過分段求得h(t)模擬值,并采取MCMC方法擬合其曲線。
(三)有益效果
本發(fā)明提供了一種基于生存模型的信貸資產(chǎn)證券化資產(chǎn)池評級的方法,該方法可以利用生存模型,更為準確、有效的對海量資產(chǎn)的資產(chǎn)池進行評級。與現(xiàn)有技術(shù)相比,本發(fā)明利用了一種新的生存模型來對資產(chǎn)池進行評級,該生存模型旨在探尋違約事件的(無條件的)發(fā)生概率,在數(shù)據(jù)缺乏,結(jié)構(gòu)不完整的情況下構(gòu)建可能的模擬方法。生存模型在進行時間序列分析時(比如在希望了解時間對違約率的影響)以及用于蒙特卡洛模擬時表現(xiàn)非常優(yōu)秀?;谠撃P停景l(fā)明還提供了一種與其對應(yīng)的硬件設(shè)備,該硬件設(shè)備對數(shù)據(jù)的存儲方式、訪問效率以及算法都進行了極大程度的優(yōu)化,使得評級過程中對海量數(shù)據(jù)的處理、訪問和存儲性功能都極大的提高。
附圖說明
圖1為本發(fā)明中危險函數(shù)的估算和非線性曲線的擬合對比圖;
圖2為本發(fā)明中10000次一年期債券損失率(Loss Rate)估算與log-normal分布的對比圖;
圖3為本發(fā)明的基于生存模型的信貸資產(chǎn)證券化資產(chǎn)池評級模型的流程圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明的實施方式作進一步詳細描述。以下實施例用于說明本發(fā)明,但不能用來限制本發(fā)明的范圍。
在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上;術(shù)語“上”、“下”、“左”、“右”、“內(nèi)”、“外”、“前端”、“后端”、“頭部”、“尾部”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。此外,術(shù)語“第一”、“第二”、“第三”等僅用于描述目的,而不能理解為指示或暗示相對重要性。
在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連。對于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
請參考圖1至圖3,其中,圖1為本發(fā)明中危險函數(shù)的估算和非線性曲線的擬合對比圖;圖2為本發(fā)明中10000次一年期債券損失率(Loss Rate)估算與log-normal分布的對比圖;圖3為本發(fā)明的基于生存模型的信貸資產(chǎn)證券化資產(chǎn)池評級模型的流程圖。
在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
生存模型
本發(fā)明提供了一種基于生存模型對大數(shù)據(jù)容量的資產(chǎn)池進行評級的方法,在本發(fā)明在生存模型中,如果需要研究一筆資產(chǎn)何時違約,那么首先設(shè)定貸款到違約距離時間為T,T為一個隨機變量。
擁有累積概率密度函數(shù)(CDF)為:
FT(t)=P(T≤t):R→[0,1]
概率密度函數(shù)(PDF)為:
定義生存函數(shù)(survival function):S(t)=1-FT(t)
即該貸款到t時刻不違約的概率。
定義危險函數(shù)(hazard function),危險函數(shù)為在時刻t處一段極小的時間內(nèi)發(fā)生違約的概率密度。
因此結(jié)合上述生存函數(shù)以及危險函數(shù)
由上述公式可得:
在實際操作中,由于觀測時間的限制,一般無法獲得完整的違約分布fT(t),因此,本發(fā)明通過歷史數(shù)據(jù)擬合h(t)來獲得S(t)。在獲得S(t) 之后本發(fā)明使用蒙特卡洛模擬的方法來對一個資產(chǎn)池在時間序列上進行逐筆的違約模擬,S(t)將為蒙特卡洛抽樣提供概率基準。
利用歷史數(shù)據(jù)對h(t)的擬合方法如下:
對于生存模型為了估計h(t),首先要得到該模型的似然函數(shù),即資產(chǎn)池內(nèi)樣本生存時間的聯(lián)合概率分布。在生存模型中對于一筆資產(chǎn)需要如下數(shù)據(jù):觀察時間以及違約記錄,并將其記為:
上述公式中,Ti是生存時間,Ci是觀察時間(貸款到期時間)。如果發(fā)生違約,記Δi=1,否則記Δi=0。對于存續(xù)期內(nèi)未發(fā)生違約的貸款樣本i,在時間軸t上滿足聯(lián)合概率:
P(Ci=ti)P(Ti>ti)
而在存續(xù)期內(nèi)發(fā)生違約的樣本i,在時間軸上滿足聯(lián)合概率:
P(Ci>ti)P(Ti=ti)
因此,對于靜態(tài)池中的所有資產(chǎn),似然函數(shù)為:
其中P(Ti=ti)=f(ti)=h(ti)S(ti),因此得到如下公式:
其中G(ti)和g(ti)是觀測時間Ci的CDF和PDF,在對h(ti)極大似然值不產(chǎn)生影響時可以簡化為常數(shù),得到如下函數(shù):
其對數(shù)似然函數(shù)為:
對參數(shù)進行假設(shè)
對h(t)進行假設(shè),并通過極大似然估計取得h(t)最可能的值。最簡單的參數(shù)模型指數(shù)模型(exponential),該模型中我們假設(shè)在極短時間內(nèi)發(fā)生違約的概率不因觀測時間點而改變,即h(t)=λ,因此S(t)=e-λt。
此時似然函數(shù)演變?yōu)椋?/p>
為取得λ的最大可能值,對λ求導并令結(jié)果等于0:
等式化簡為:
從上式可以看出,我們可通過總違約數(shù)量除以總暴露時間來估計h(t),其中總暴露時間為月未償還筆數(shù)乘以每月觀測時間累加得到。
指數(shù)模型的優(yōu)勢在于易于獲得數(shù)據(jù),所需計算量較小,但指數(shù)模型也因此受到許多因素限制:缺乏調(diào)控風險率與貸款時間的杠桿。因此,本發(fā)明可以進一步考慮采用Weibull模型,即:h(t)=λα(λt)α-1,其中α,λ>0。
Weibull模型增加了變量α可以調(diào)控風險函數(shù)隨時間(單調(diào)地)增長/減少,當α=1時該模型為指數(shù)模型,當α>1時,風險函數(shù)隨時間的增長而增長。實際操作中Weibull分布的似然函數(shù)難以求最大 似然估計值。通過分段求得h(t)模擬值,并采取MCMC或其他方法擬合其曲線。
由圖1可以看到Weibull獲取的數(shù)值分布對該靜態(tài)池的數(shù)據(jù)的擬合具有較高的合理程度(后幾個月由于樣本較少偏離曲線)。
實現(xiàn)步驟
如果需要評估一筆組合資產(chǎn)(X,W),其中X∈Rn為到期時間,W∈Rn是權(quán)重,可以使用蒙特卡洛模擬算法來采樣:
u~U(0,1),Amount~LN(μ,σ2),
其中μ,σ2是靜態(tài)池中每筆貸款的均值與方差。t~U(0,1),這里t為還貸時間除以貸款到期時間的分布,規(guī)定還款分布均勻,因此可以將其替換為其他分布。
對i=1,2,...,n,如果ui>S(Xi×ti),則記Δi=1,否則記Δi=0,于是獲得損失率:
重復以上步驟10000次,得到損失率的經(jīng)驗分布。這里假設(shè)資產(chǎn)池中的資產(chǎn)沒有相關(guān)性。如果已知資產(chǎn)池中的資產(chǎn)具有具有某種相關(guān)性(設(shè)相關(guān)矩陣為∑),則將第一步可改為采樣u0~MN(0,∑),取u=Φ(u0),其中Φ(.)為正態(tài)分布的CDF。對于指數(shù)分布,對于Weibull分布,
以最簡化的例子而言,假設(shè)有10筆貸款資料(上限均為12個月)
根據(jù)上述表格,使用危險函數(shù)測得總未償數(shù)量4,總暴露時間是
3+5+11+8+12*6=99,因此h(t)=4/99
那么貸款生存時間-概率的分布為e-(4/99)t,t為時間。
損失暴露的經(jīng)驗分布為X=800,1300,2000,5000(各1/4)。
回收率的經(jīng)驗分布為R=0(p=3/4),3/4(p=1/4)
圖2顯示上述模型使用蒙特卡洛模擬的結(jié)果與log-normal方法得到的結(jié)果相比較。由此驗證:在資產(chǎn)池足夠大的時候,log-normal分布與本發(fā)明模擬的結(jié)果非常符合。
本申請可以對海量資產(chǎn)的資產(chǎn)池進行評級,快速的進行計算,一般在5分鐘內(nèi),能完成百萬條數(shù)據(jù)級別的評級。
本發(fā)明的實施例是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯而易見的。選擇和描述實施例是為了更好說明本發(fā)明的原理和實際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計適于特定用途的帶有各種修改的各種實施例。