本發(fā)明涉及信用風(fēng)險(xiǎn)評(píng)估
技術(shù)領(lǐng)域:
,具體涉及一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法。
背景技術(shù):
:自從2014年以來,國(guó)內(nèi)債券市場(chǎng)已經(jīng)出現(xiàn)多家發(fā)行人債券違約的情況,并且在2016年上半年有愈演愈烈的跡象。出現(xiàn)信用風(fēng)險(xiǎn)的債券發(fā)行人的類型已經(jīng)擴(kuò)散到了包含央企、國(guó)企、民企等各大類企業(yè),并給債券投資人造成了經(jīng)濟(jì)上的損失以及情緒上的打擊。因此,急需一種能夠通過市場(chǎng)中的公開信息提前分析判斷出哪些發(fā)行人有可能會(huì)出現(xiàn)信用風(fēng)險(xiǎn)的方法,保護(hù)投資者利益、避免財(cái)產(chǎn)損失。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)中的不足,提供一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法,保護(hù)投資者利益。為實(shí)現(xiàn)上述目的,本發(fā)明公開了如下技術(shù)方案:一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法,包括如下步驟:S1獲取財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)數(shù)據(jù):從公開渠道獲得企業(yè)的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),并進(jìn)行儲(chǔ)存,如果存在空值,則也將其儲(chǔ)存為空值;其中,財(cái)務(wù)數(shù)據(jù)包括企業(yè)經(jīng)營(yíng)情況、企業(yè)償債能力、企業(yè)負(fù)債情況,企業(yè)經(jīng)營(yíng)情況進(jìn)一步包括銷售毛利率、營(yíng)業(yè)凈利率,企業(yè)償債能力進(jìn)一步包括EBIT/短期負(fù)債、速動(dòng)比率、經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債,企業(yè)負(fù)債情況進(jìn)一步包括資產(chǎn)負(fù)債率、合并報(bào)表經(jīng)調(diào)整的資產(chǎn)負(fù)債率、母公司經(jīng)調(diào)整的資產(chǎn)負(fù)債率;評(píng)級(jí)機(jī)構(gòu)數(shù)據(jù)包括評(píng)級(jí)機(jī)構(gòu)當(dāng)期評(píng)級(jí)、評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)展望;合并報(bào)表經(jīng)調(diào)整的資產(chǎn)負(fù)債率=合并報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì);母公司經(jīng)調(diào)整的資產(chǎn)負(fù)債率=母公司報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì);S2模型訓(xùn)練樣本的選取和清洗:選取已發(fā)生信用風(fēng)險(xiǎn)事件的企業(yè),獲得該企業(yè)在違約事件發(fā)生之前最近一期直到該期向前推M期的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),其中,M≥3;選取已知截至某一時(shí)點(diǎn)還未出現(xiàn)信用風(fēng)險(xiǎn)事件的企業(yè),獲得該企業(yè)距離該時(shí)點(diǎn)最近一期直到該期向前推N期的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),其中,N≥3;對(duì)于數(shù)據(jù)中存在空值的,保留空值,待所有輸入數(shù)據(jù)都處理準(zhǔn)備完成,如果某家企業(yè)數(shù)據(jù)的某個(gè)唯獨(dú)的時(shí)間序列數(shù)據(jù)中出現(xiàn)全部為空或者有且僅有1個(gè)有效數(shù)值的情況,則去掉該企業(yè),否則,運(yùn)用插值或外推法填補(bǔ)空白數(shù)據(jù)位置;S3模型的建立和訓(xùn)練:以支持向量機(jī)為基礎(chǔ)的模型:由于經(jīng)過S1、S2所形成的輸入數(shù)據(jù)為多維時(shí)間序列數(shù)據(jù),無法用傳統(tǒng)的支持向量機(jī)訓(xùn)練,本步驟中采用由Cuturi提出的GlobalAlignmentKernel核函數(shù),將兩個(gè)多維時(shí)間序列數(shù)據(jù)進(jìn)行相似性比較,并輸出一個(gè)數(shù)字結(jié)果,利用核函數(shù)的特性,將其作為支持向量機(jī)的核函數(shù),進(jìn)而針對(duì)多維時(shí)間序列數(shù)據(jù)進(jìn)行訓(xùn)練模型;以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型:將經(jīng)過S1、S2所形成的多維時(shí)間序列數(shù)據(jù),輸入到以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的分析模型中,模型的設(shè)計(jì)參數(shù)為:隱藏層個(gè)數(shù)=輸入數(shù)據(jù)維度;每個(gè)隱藏層中神經(jīng)元的個(gè)數(shù)=輸入數(shù)據(jù)對(duì)應(yīng)維度的樣本數(shù);S4利用訓(xùn)練好的模型進(jìn)行分析預(yù)測(cè):選取好待進(jìn)行信用分析的企業(yè),按照步驟S1、S2進(jìn)行輸入數(shù)據(jù)的準(zhǔn)備,然后輸入步驟S3中訓(xùn)練好的分析模型,即可獲得企業(yè)或發(fā)行人是否會(huì)在近期內(nèi)出現(xiàn)信用風(fēng)險(xiǎn)事件的預(yù)測(cè)分析結(jié)果。進(jìn)一步的,所述評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù)來源為季報(bào)、半年報(bào)或年報(bào)數(shù)據(jù)中的一種或幾種。進(jìn)一步的,銷售毛利率=(主營(yíng)業(yè)務(wù)收入-主營(yíng)業(yè)務(wù)成本)/主營(yíng)業(yè)務(wù)收入;營(yíng)業(yè)凈利率=凈利潤(rùn)/營(yíng)業(yè)總收入;EBIT/短期負(fù)債=息稅前利潤(rùn)/短期負(fù)債總額;速動(dòng)比率=速動(dòng)資產(chǎn)/流動(dòng)負(fù)債;經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債=經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債總額;評(píng)級(jí)機(jī)構(gòu)當(dāng)期評(píng)級(jí)=在報(bào)表日當(dāng)期評(píng)級(jí)機(jī)構(gòu)對(duì)該公司的評(píng)級(jí)情況,“AAA”為1,“AA+”為0.5,“AA”為0,其他為-1,如果有多個(gè)評(píng)級(jí),則選取距離財(cái)務(wù)報(bào)表時(shí)點(diǎn)最近的一個(gè);評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)展望=在報(bào)表日當(dāng)期評(píng)級(jí)機(jī)構(gòu)對(duì)該公司的評(píng)級(jí)展望情況,“正面”為1,“穩(wěn)定”為0,“負(fù)面”為-1,如果有多個(gè)評(píng)級(jí)展望,則選取距離財(cái)務(wù)報(bào)表時(shí)點(diǎn)最近的一個(gè);資產(chǎn)負(fù)債率=負(fù)債總額/資產(chǎn)總額。進(jìn)一步的,所述步驟S2完成后,根據(jù)數(shù)據(jù)的特性,選擇是否將整理好的原始數(shù)據(jù)進(jìn)行歸一化操作,如果歸一化后預(yù)測(cè)效果好,則采用歸一化,反之則不用。進(jìn)一步的,所述步驟S3中,以支持向量機(jī)為基礎(chǔ)的模型,具體的預(yù)測(cè)模型的訓(xùn)練步驟如下:S301采用由Cuturi提出的GlobalAlignmentKernel核函數(shù);S302采用交叉驗(yàn)證的方法,將輸入數(shù)據(jù)分為訓(xùn)練樣本和交叉驗(yàn)證樣本,輸入以GAK為核函數(shù)的支持向量機(jī)進(jìn)行訓(xùn)練;S303獲得訓(xùn)練完成后的模型。進(jìn)一步的,所述步驟S3中,以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型,具體的預(yù)測(cè)模型的訓(xùn)練步驟如下:S311初始化網(wǎng)絡(luò)權(quán)重和神經(jīng)元的閾值;S312前向傳播:將輸入數(shù)據(jù)帶入神經(jīng)網(wǎng)絡(luò),按照公式一層一層的計(jì)算隱層神經(jīng)元的輸出層神經(jīng)元的輸入和輸出;S313后向傳播:根據(jù)誤差計(jì)算公式修正神經(jīng)網(wǎng)絡(luò)中的權(quán)重和閾值;S314一直持續(xù)S311-S313直到滿足訓(xùn)練終止條件,獲得訓(xùn)練完成后的模型。本發(fā)明公開的一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法,具有以下有益效果:本發(fā)明利用市場(chǎng)中公開的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)數(shù)據(jù)作為支撐,建立模型并進(jìn)行訓(xùn)練,能夠提前分析判斷出哪些發(fā)行人有可能會(huì)出現(xiàn)信用風(fēng)險(xiǎn),保護(hù)投資者利益,避免財(cái)產(chǎn)出現(xiàn)損失。附圖說明圖1是本方法的整體流程示意圖。圖2是以支持向量機(jī)為基礎(chǔ)的預(yù)測(cè)分析方法流程示意圖。圖3是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的預(yù)測(cè)分析方法流程示意圖。圖4是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的分析模型結(jié)構(gòu)示意圖。具體實(shí)施方式下面將對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明的核心是提供一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法,保護(hù)投資者利益。見圖1,一種基于機(jī)器學(xué)習(xí)的債券發(fā)行人違約分析方法,包括如下步驟:S1獲取財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)數(shù)據(jù):從公開渠道獲得企業(yè)的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),并進(jìn)行儲(chǔ)存,如果存在空值,則也將其儲(chǔ)存為空值;其中,財(cái)務(wù)數(shù)據(jù)包括企業(yè)經(jīng)營(yíng)情況、企業(yè)償債能力、企業(yè)負(fù)債情況,企業(yè)經(jīng)營(yíng)情況進(jìn)一步包括銷售毛利率、營(yíng)業(yè)凈利率,企業(yè)償債能力進(jìn)一步包括EBIT/短期負(fù)債、速動(dòng)比率、經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債,企業(yè)負(fù)債情況進(jìn)一步包括資產(chǎn)負(fù)債率、合并報(bào)表經(jīng)調(diào)整的資產(chǎn)負(fù)債率、母公司經(jīng)調(diào)整的資產(chǎn)負(fù)債率;評(píng)級(jí)機(jī)構(gòu)數(shù)據(jù)包括評(píng)級(jí)機(jī)構(gòu)當(dāng)期評(píng)級(jí)、評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)展望;合并報(bào)表經(jīng)調(diào)整的資產(chǎn)負(fù)債率(合并報(bào)表)=合并報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì);母公司經(jīng)調(diào)整的資產(chǎn)負(fù)債率(母公司)=母公司報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì);計(jì)算經(jīng)調(diào)整的資產(chǎn)負(fù)債率的是為了盡量去除企業(yè)財(cái)務(wù)報(bào)表中的水分信息,考慮到有些企業(yè)會(huì)在某些會(huì)計(jì)科目中虛報(bào)數(shù)額以達(dá)到美化財(cái)務(wù)報(bào)表的目的;S2模型訓(xùn)練樣本的選取和清洗:選取已發(fā)生信用風(fēng)險(xiǎn)事件的企業(yè),獲得該企業(yè)在違約事件發(fā)生之前最近一期直到該期向前推M期的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),其中,M≥3;選取已知截至某一時(shí)點(diǎn)還未出現(xiàn)信用風(fēng)險(xiǎn)事件的企業(yè),獲得該企業(yè)距離該時(shí)點(diǎn)最近一期直到該期向前推N期的財(cái)務(wù)數(shù)據(jù)和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù),其中,N≥3;對(duì)于數(shù)據(jù)中存在空值的,保留空值,待所有輸入數(shù)據(jù)都處理準(zhǔn)備完成,如果某家企業(yè)數(shù)據(jù)的某個(gè)唯獨(dú)的時(shí)間序列數(shù)據(jù)中出現(xiàn)全部為空或者有且僅有1個(gè)有效數(shù)值的情況,則去掉該企業(yè),否則,運(yùn)用插值或外推法填補(bǔ)空白數(shù)據(jù)位置;S3模型的建立和訓(xùn)練:見圖2,以支持向量機(jī)為基礎(chǔ)的模型:由于經(jīng)過S1、S2所形成的輸入數(shù)據(jù)為多維時(shí)間序列數(shù)據(jù),無法用傳統(tǒng)的支持向量機(jī)訓(xùn)練,本步驟中采用由Cuturi(2011)提出的GlobalAlignmentKernel核函數(shù),將兩個(gè)多維時(shí)間序列數(shù)據(jù)進(jìn)行相似性比較,并輸出一個(gè)數(shù)字結(jié)果,利用核函數(shù)的特性,將其作為支持向量機(jī)的核函數(shù),進(jìn)而針對(duì)多維時(shí)間序列數(shù)據(jù)進(jìn)行訓(xùn)練模型;見圖3、圖4,以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型:將經(jīng)過S1、S2所形成的多維時(shí)間序列數(shù)據(jù),輸入到以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的分析模型中,模型的設(shè)計(jì)參數(shù)為:隱藏層個(gè)數(shù)=輸入數(shù)據(jù)維度;每個(gè)隱藏層中神經(jīng)元的個(gè)數(shù)=輸入數(shù)據(jù)對(duì)應(yīng)維度的樣本數(shù);S4利用訓(xùn)練好的模型進(jìn)行分析預(yù)測(cè):選取好待進(jìn)行信用分析的企業(yè),按照步驟S1、S2進(jìn)行輸入數(shù)據(jù)的準(zhǔn)備,然后輸入步驟S3中訓(xùn)練好的分析模型,即可獲得企業(yè)或發(fā)行人是否會(huì)在近期內(nèi)出現(xiàn)信用風(fēng)險(xiǎn)事件的預(yù)測(cè)分析結(jié)果。在本發(fā)明的一種實(shí)施例中,所述評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)數(shù)據(jù)來源為季報(bào)、半年報(bào)或年報(bào)數(shù)據(jù)中的一種或幾種。在本發(fā)明的一種實(shí)施例中,銷售毛利率=(主營(yíng)業(yè)務(wù)收入-主營(yíng)業(yè)務(wù)成本)/主營(yíng)業(yè)務(wù)收入;營(yíng)業(yè)凈利率=凈利潤(rùn)/營(yíng)業(yè)總收入;EBIT/短期負(fù)債=息稅前利潤(rùn)/短期負(fù)債總額;速動(dòng)比率=速動(dòng)資產(chǎn)/流動(dòng)負(fù)債;經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債=經(jīng)營(yíng)性現(xiàn)金流/有息負(fù)債總額;評(píng)級(jí)機(jī)構(gòu)當(dāng)期評(píng)級(jí)=在報(bào)表日當(dāng)期評(píng)級(jí)機(jī)構(gòu)對(duì)該公司的評(píng)級(jí)情況,“AAA”為1,“AA+”為0.5,“AA”為0,其他為-1,如果有多個(gè)評(píng)級(jí),則選取距離現(xiàn)在時(shí)間最近的一個(gè);評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)展望=在報(bào)表日當(dāng)期評(píng)級(jí)機(jī)構(gòu)對(duì)該公司的評(píng)級(jí)展望情況,“正面”為1,“穩(wěn)定”為0,“負(fù)面”為-1,如果有多個(gè)評(píng)級(jí)展望,則選取距離現(xiàn)在時(shí)間最近的一個(gè);資產(chǎn)負(fù)債率=負(fù)債總額/資產(chǎn)總額。進(jìn)一步的,本發(fā)明創(chuàng)設(shè)了一套對(duì)公司財(cái)務(wù)報(bào)表相關(guān)科目進(jìn)行調(diào)整后重新計(jì)算基于合并報(bào)表及母公司報(bào)表的資產(chǎn)負(fù)債率的方法,用以增加違約預(yù)測(cè)的準(zhǔn)確率。其中:經(jīng)調(diào)整的資產(chǎn)負(fù)債率(合并報(bào)表)=合并報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì)(具體會(huì)計(jì)科目調(diào)整方法如下表所示);經(jīng)調(diào)整的資產(chǎn)負(fù)債率(母公司)=母公司報(bào)表中的經(jīng)調(diào)整的負(fù)債合計(jì)/經(jīng)調(diào)整的資產(chǎn)合計(jì)(具體會(huì)計(jì)科目調(diào)整方法如下表所示)。表一:資產(chǎn)負(fù)債表會(huì)計(jì)科目的權(quán)重調(diào)整說明表請(qǐng)參見表一,表一為資產(chǎn)負(fù)債表會(huì)計(jì)科目的權(quán)重調(diào)整說明表,表一中,無形資產(chǎn)科目權(quán)重X的調(diào)整方法依照表二,表二為不同行業(yè)的無形資產(chǎn)科目權(quán)重調(diào)整說明表。這是考慮企業(yè)所在行業(yè)不同,其無形資產(chǎn)的價(jià)值也千差萬別,因此需要差別調(diào)整。表二:不同行業(yè)的無形資產(chǎn)科目權(quán)重調(diào)整說明表在本發(fā)明的一種實(shí)施例中,所述步驟S2完成后,根據(jù)數(shù)據(jù)的特性,選擇是否將整理好的原始數(shù)據(jù)進(jìn)行歸一化操作,如果歸一化后預(yù)測(cè)效果好,則采用歸一化,反之則不用。在本發(fā)明的一種實(shí)施例中,所述步驟S3中,以支持向量機(jī)為基礎(chǔ)的模型,具體的預(yù)測(cè)模型的訓(xùn)練步驟如下:S301采用由Cuturi提出的GlobalAlignmentKernel核函數(shù);S302采用交叉驗(yàn)證的方法,將輸入數(shù)據(jù)分為訓(xùn)練樣本和交叉驗(yàn)證樣本,輸入以GAK為核函數(shù)的支持向量機(jī)進(jìn)行訓(xùn)練;S303獲得訓(xùn)練完成后的模型。在本發(fā)明的一種實(shí)施例中,所述步驟S3中,以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型,具體的預(yù)測(cè)模型的訓(xùn)練步驟如下:S311初始化網(wǎng)絡(luò)權(quán)重和神經(jīng)元的閾值;S312前向傳播:將輸入數(shù)據(jù)帶入神經(jīng)網(wǎng)絡(luò),按照公式一層一層的計(jì)算隱層神經(jīng)元的輸出層神經(jīng)元的輸入和輸出;S313后向傳播:根據(jù)誤差計(jì)算公式修正神經(jīng)網(wǎng)絡(luò)中的權(quán)重和閾值;S314一直持續(xù)S311-S313直到滿足訓(xùn)練終止條件,獲得訓(xùn)練完成后的模型。本發(fā)明提供的方法在具體執(zhí)行過程中:一、讀取數(shù)據(jù):a)讀取過去已發(fā)生信用風(fēng)險(xiǎn)事件的發(fā)行人的數(shù)據(jù);b)讀取截至上一個(gè)報(bào)表期時(shí)未發(fā)生信用風(fēng)險(xiǎn)事件的發(fā)行人的數(shù)據(jù);c)讀取待預(yù)測(cè)分析的發(fā)行人的數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)要與a)、b)中的保持一致。二、對(duì)數(shù)據(jù)進(jìn)行清洗、預(yù)處理:a)對(duì)于數(shù)據(jù)中存在空值的,保留空值,待所有輸入數(shù)據(jù)都處理準(zhǔn)備完成,如果某家企業(yè)數(shù)據(jù)的某個(gè)唯獨(dú)的時(shí)間序列數(shù)據(jù)中出現(xiàn)全部為空或者有且僅有1個(gè)有效數(shù)值的情況,則去掉該企業(yè),否則,運(yùn)用插值或外推法填補(bǔ)空白數(shù)據(jù)位置;b)根據(jù)用戶的實(shí)際需要,可選擇是否將清洗好的數(shù)據(jù)進(jìn)行歸一化操作。三、預(yù)測(cè)模型的訓(xùn)練:a)如果建立以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型,則模型結(jié)構(gòu)如圖4所示。然后進(jìn)行以下步驟:1.初始化網(wǎng)絡(luò)權(quán)重和神經(jīng)元的閾值;2.前向傳播:將輸入數(shù)據(jù)帶入神經(jīng)網(wǎng)絡(luò),按照神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一層一層的計(jì)算隱層神經(jīng)元和輸出層神經(jīng)元的輸入和輸出;3.后向傳播:根據(jù)誤差計(jì)算公式修正神經(jīng)網(wǎng)絡(luò)中的權(quán)重和閾值。4.一直持續(xù)1-3直到滿足訓(xùn)練終止條件,獲得訓(xùn)練完成后的模型。b)如果建立以支持向量機(jī)為基礎(chǔ)的模型,則進(jìn)行以下步驟:1.采用由Cuturi(2011)提出的GlobalAlignmentKernel(GAK)核函數(shù);2.采用交叉驗(yàn)證(Cross-Validation)的方法,將輸入數(shù)據(jù)分為訓(xùn)練樣本和交叉驗(yàn)證樣本,輸入以GAK為核函數(shù)的支持向量機(jī)進(jìn)行訓(xùn)練;3.獲得訓(xùn)練完成后的模型。四、使用預(yù)測(cè)好的模型進(jìn)行預(yù)測(cè):將待預(yù)測(cè)分析的發(fā)行人的數(shù)據(jù)輸入第三步中獲得的訓(xùn)練好的模型,即可獲得該發(fā)行人是否會(huì)在近期內(nèi)出現(xiàn)信用風(fēng)險(xiǎn)事件的預(yù)測(cè)結(jié)果。本發(fā)明通過公開渠道獲得企業(yè)的財(cái)務(wù)信息和評(píng)級(jí)機(jī)構(gòu)評(píng)級(jí)信息,形成多維時(shí)間序列數(shù)據(jù),采用機(jī)器學(xué)習(xí)的方法,設(shè)計(jì)以支持向量機(jī)或人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的信用分析模型,通過訓(xùn)練,即可用于分析預(yù)測(cè)企業(yè)是否會(huì)出現(xiàn)信用風(fēng)險(xiǎn)事件。以下是本發(fā)明的一種具體實(shí)例:2016年8月31日,利用本方法進(jìn)行發(fā)行人信用風(fēng)險(xiǎn)預(yù)測(cè)分析。首先,選取在2016年8月31日前,已經(jīng)發(fā)生實(shí)質(zhì)性違約或信用風(fēng)險(xiǎn)事件的發(fā)行人,從公開渠道獲得他們的財(cái)務(wù)報(bào)表。本實(shí)例共選取了27家出現(xiàn)信用風(fēng)險(xiǎn)的發(fā)行人,按照本發(fā)明中所示的數(shù)據(jù)處理方法進(jìn)行處理,形成模型的輸入數(shù)據(jù)。其中較有代表性的兩家公司的輸入數(shù)據(jù)如以下兩表所示。表三:已出現(xiàn)信用風(fēng)險(xiǎn)事件的發(fā)行人的輸入數(shù)據(jù)示例1(江蘇舜天)表四:已出現(xiàn)信用風(fēng)險(xiǎn)事件的發(fā)行人的輸入數(shù)據(jù)示例2(中城建)之后,選取截至2016年8月31日,尚未發(fā)生實(shí)質(zhì)性違約或信用風(fēng)險(xiǎn)事件的發(fā)行人,從公開渠道獲得他們的財(cái)務(wù)報(bào)表。本實(shí)例共選取了85家未出現(xiàn)信用風(fēng)險(xiǎn)的發(fā)行人,按照本發(fā)明中所示的數(shù)據(jù)處理方法進(jìn)行處理,形成模型的輸入數(shù)據(jù)。其中較有代表性的兩家公司的輸入數(shù)據(jù)如以下兩表所示。表五:未出現(xiàn)信用風(fēng)險(xiǎn)事件的發(fā)行人的輸入數(shù)據(jù)示例1(鐵龍物流)表六:未出現(xiàn)信用風(fēng)險(xiǎn)事件的發(fā)行人的輸入數(shù)據(jù)示例2(南方報(bào)業(yè))從以上4個(gè)示例可以看出,出現(xiàn)信用風(fēng)險(xiǎn)事件的企業(yè)一般經(jīng)營(yíng)情況較差(利潤(rùn)率較低)、償債能力較低(經(jīng)營(yíng)利潤(rùn)/現(xiàn)金流無法補(bǔ)償企業(yè)負(fù)債成本)、負(fù)債情況較嚴(yán)重(資產(chǎn)負(fù)債率較高,經(jīng)調(diào)整的資產(chǎn)負(fù)債率更高),或者以上多個(gè)指標(biāo)出現(xiàn)了惡化的趨勢(shì);而未出現(xiàn)信用風(fēng)險(xiǎn)事件的企業(yè)一般經(jīng)營(yíng)情況正常(利潤(rùn)率正常)、償債能力正常(經(jīng)營(yíng)利潤(rùn)/現(xiàn)金流可以補(bǔ)償企業(yè)負(fù)債成本)、負(fù)債情況正常(資產(chǎn)負(fù)債率適中、經(jīng)調(diào)整的資產(chǎn)負(fù)債率適中)。此外,外部評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)往往難以對(duì)哪些發(fā)行人將很快出現(xiàn)信用風(fēng)險(xiǎn)進(jìn)行預(yù)示。比如,中國(guó)城市建設(shè)控股集團(tuán)有限公司在2016年4月份發(fā)生信用風(fēng)險(xiǎn)事件之前,外部信用評(píng)級(jí)機(jī)構(gòu)對(duì)其的信用評(píng)級(jí)保持在較高的AA+,評(píng)級(jí)展望也為穩(wěn)定,未能提前預(yù)警該公司的信用風(fēng)險(xiǎn)。單純依靠外部評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)信息而進(jìn)行債券投資的投資人面臨著相當(dāng)高的本金損失風(fēng)險(xiǎn)。但由于輸入數(shù)據(jù)維度較多,數(shù)據(jù)量也較大,傳統(tǒng)的線性模型很難捕捉到輸入數(shù)據(jù)與最終結(jié)果之間的對(duì)應(yīng)關(guān)系,故采用機(jī)器學(xué)習(xí)的方法對(duì)以上輸入數(shù)據(jù)進(jìn)行模型的訓(xùn)練,并運(yùn)用訓(xùn)練好的模型,代入新的輸入數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。訓(xùn)練完成的模型參數(shù)如下兩表所示。表七:訓(xùn)練完成的基于支持向量機(jī)的預(yù)測(cè)模型模型指標(biāo)參數(shù)輸入數(shù)據(jù)維數(shù)10是否歸一化否總支持向量個(gè)數(shù)20違約類支持向量個(gè)數(shù)9非違約類支持向量個(gè)數(shù)11表八:訓(xùn)練完成的基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型模型指標(biāo)參數(shù)輸入數(shù)據(jù)維數(shù)10是否歸一化否隱藏層個(gè)數(shù)10單個(gè)隱藏層神經(jīng)元個(gè)數(shù)6誤差函數(shù)均方誤差(MSE)選取待預(yù)測(cè)分析的發(fā)行人,從公開渠道獲得他們的財(cái)務(wù)報(bào)表。本實(shí)例共選取了151家待預(yù)測(cè)發(fā)行人,按照本發(fā)明中所示的數(shù)據(jù)處理方法進(jìn)行處理,形成模型的輸入數(shù)據(jù)。其中較有代表性的兩家公司的輸入數(shù)據(jù)如以下兩表所示。表九:待預(yù)測(cè)發(fā)行人的輸入數(shù)據(jù)示例1(博源控股)表十:待預(yù)測(cè)發(fā)行人的輸入數(shù)據(jù)示例2(山西焦煤)表十一:待預(yù)測(cè)發(fā)行人的輸入數(shù)據(jù)示例3(大連機(jī)床)將待預(yù)測(cè)發(fā)行人的輸入數(shù)據(jù)代入到在上一步已經(jīng)訓(xùn)練完成的預(yù)測(cè)模型中,就可以得到待預(yù)測(cè)發(fā)行人是否會(huì)出現(xiàn)信用風(fēng)險(xiǎn)的預(yù)測(cè)結(jié)果。表十二:待預(yù)測(cè)發(fā)行人示例1、2、3的預(yù)測(cè)結(jié)果待預(yù)測(cè)發(fā)行人是否會(huì)出現(xiàn)信用風(fēng)險(xiǎn)預(yù)測(cè)是否準(zhǔn)確示例1(博源控股)是準(zhǔn)確示例2(山西焦煤)否準(zhǔn)確示例3(大連機(jī)床)是準(zhǔn)確其中,博源控股和大連機(jī)床分別已于2016/12/5和2016/11/21發(fā)生實(shí)質(zhì)性違約,而山西焦煤截至本說明書完成時(shí)還未出現(xiàn)信用風(fēng)險(xiǎn)事件。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,而非對(duì)其限制;應(yīng)當(dāng)指出,盡管參照上述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,其依然可以對(duì)上述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或?qū)ζ渲胁糠只蛘呷考夹g(shù)特征進(jìn)行等同替換;而這些修改和替換,并不使相應(yīng)的技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。當(dāng)前第1頁1 2 3