本公開涉及大數(shù)據(jù)技術(shù)領(lǐng)域,具體而言,涉及一種保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法以及保險業(yè)務(wù)風險評分系統(tǒng)。
背景技術(shù):
隨著社會經(jīng)濟的不斷發(fā)展,人們越來越意識到保險的重要性。保險是指投保人根據(jù)合同約定,向保險人支付保險費,保險人對于合同約定的可能發(fā)生的風險所造成的損失承擔賠償保險金的行為。因此,保險人對于保險業(yè)務(wù)的風險評估極為重要。
現(xiàn)有技術(shù)中的核保核賠等保險業(yè)務(wù)審核及風險控制,通常是利用既往經(jīng)驗,通過設(shè)定包括地區(qū)、人群、客戶年齡、保險金額、保險費等維度的組合判斷標準與規(guī)則,進行日常投保、理賠業(yè)務(wù)的自動審核和人工審核的篩選。
然而,現(xiàn)有技術(shù)的技術(shù)方案,在風險評估的精準程度和對經(jīng)驗數(shù)據(jù)的深度挖掘方面仍有較大的改善空間。
需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實現(xiàn)要素:
本公開的目的在于提供一種保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法以及保險業(yè)務(wù)風險評分系統(tǒng),用于至少在一定程度上克服由于相關(guān)技術(shù)的限制和缺陷而導(dǎo)致的一個或者多個問題。
本公開的其他特性和優(yōu)點將通過下面的詳細描述變得清晰,或者部分地通過本公開的實踐而習(xí)得。
根據(jù)本公開實施例的第一方面,提供一種保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法,包括:
s10.以是否出險作為待構(gòu)建的保險業(yè)務(wù)風險評分系統(tǒng)的因變量;
s20.通過數(shù)據(jù)挖掘方法獲取與所述因變量相關(guān)的多個自變量;
s30.通過logistic回歸方法利用一數(shù)據(jù)庫中存儲的第一部分所述自變量以及因變量生成所述保險業(yè)務(wù)風險評分系統(tǒng);
s40.利用所述數(shù)據(jù)庫中存儲的第二部分所述自變量以及因變量對所述保險業(yè)務(wù)風險評分系統(tǒng)進行驗證。
在本公開的一種示例性實施例中,所述步驟s20包括:
s21.計算一第一變量集合中各變量的auc系數(shù),并獲取所述第一變量集合中所述auc系數(shù)最高的預(yù)設(shè)數(shù)量的變量為第二變量集合;
s22.基于sas統(tǒng)計系統(tǒng)中的procglmselect過程并采用sl篩選規(guī)則從所述第二變量集合中篩選出所述多個自變量。
在本公開的一種示例性實施例中,所述步驟s22中采用的是逐步回歸算法。
在本公開的一種示例性實施例中,其中:
所述步驟s21之前還包括,對所述數(shù)據(jù)庫中的所有變量進行初步篩選,獲取所述第一變量集合;
所述步驟s21還包括,對所述第二變量集合進行人工校正。
在本公開的一種示例性實施例中,其中:
所述因變量為保險單在第一預(yù)設(shè)時間內(nèi)是否出險;
所述自變量為所述保險單在第二預(yù)設(shè)時間內(nèi)的信息參數(shù)。
在本公開的一種示例性實施例中,所述步驟s40包括:
s41.對所述保險業(yè)務(wù)風險評分系統(tǒng)進行系統(tǒng)驗證樣本驗證;
s42.對所述保險業(yè)務(wù)風險評分系統(tǒng)進行跨時間驗證樣本驗證。
在本公開的一種示例性實施例中,所述構(gòu)建方法還包括:
劃分多個細分群體;
對于各所述細分群體利用所述保險業(yè)務(wù)風險評分系統(tǒng)進行評分并獲取評分準確性最高的細分群體進行群體分隔。
根據(jù)本公開實施例的第二方面,提供一種通過上述任意一種構(gòu)建方法構(gòu)建的保險業(yè)務(wù)風險評分系統(tǒng);所述保險業(yè)務(wù)風險評分系統(tǒng)接收輸入的自變量參數(shù),并根據(jù)所述自變量參數(shù)獲取出險的概率值以及與所述出險的概率值對應(yīng)的評分分數(shù)。
在本公開的一種示例性實施例中,所述保險業(yè)務(wù)風險評分系統(tǒng)根據(jù)下述公式計算所述出險的概率值:
其中,β0為截距,{βi}是各個所述自變量對應(yīng)的估計值。
在本公開的一種示例性實施例中,所述出險的概率值被劃分為連續(xù)的預(yù)設(shè)數(shù)量的區(qū)間,每一所述區(qū)間對應(yīng)一個所述評分。
在本公開的一種示例性實施例中,所述保險業(yè)務(wù)風險評分系統(tǒng)還包括:
色譜輸出模塊,用于將所述評分分數(shù)劃分為多個評分范圍,不同的所述評分范圍對應(yīng)不同的風險級別;每一所述風險級別通過一種預(yù)設(shè)的顏色進行標識。
在本公開的一種示例性實施例中,所述色譜輸出模塊還用于,輸出指定的所述自變量與風險級別之間的定量關(guān)系,并采用色譜進行風險級別標記。
在本公開的一種示例性實施例中,所述的保險業(yè)務(wù)風險評分系統(tǒng)還用于分別獲取保險單中多個險種的評分分數(shù),并以其中的最高評分為所述保險單的評分分數(shù)。
在本公開的一種示例性實施例中,所述保險業(yè)務(wù)風險評分系統(tǒng)包括核保風險評分系統(tǒng)以及核賠風險評分系統(tǒng)。
本公開的一種實施例中的技術(shù)方案,利用既往保險單與客戶數(shù)據(jù),采取大數(shù)據(jù)統(tǒng)計分析和回歸構(gòu)建方法,完成保險業(yè)務(wù)評分系統(tǒng)的構(gòu)建,從而可以對風險進行量化評分,發(fā)現(xiàn)更多當前在業(yè)務(wù)經(jīng)驗上比較模糊或未知的規(guī)律并為業(yè)務(wù)帶來例如以下提升:更準確的在核保/核賠等業(yè)務(wù)識別風險,有效降低核保/核賠的成本;通過與目前系統(tǒng)的規(guī)則相結(jié)合,可以逐漸提高自動核保率,減少人工成本;有助于改善客戶服務(wù)水平,提升客戶滿意度,有力支持銷售,促進業(yè)務(wù)發(fā)展等。
應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。顯而易見地,下面描述中的附圖僅僅是本公開的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示意性示出本公開示例性實施例中一種保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法的流程圖。
圖2示意性示出本公開示例性實施例中觀察期及表現(xiàn)期的劃分圖。
圖3示意性示出本公開示例性實施例中自變量的篩選流程圖。
圖4示意性示出本公開示例性實施例中相對分數(shù)與絕對概率的映射表。
圖5示意性示出本公開示例性實施例中相對分數(shù)的色譜輸出圖。
圖6示意性示出本公開示例性實施例中自變量風險色譜輸出圖。
圖7示意性示出本公開示例性實施例中一種保險業(yè)務(wù)風險評分系統(tǒng)的方框圖。
具體實施方式
現(xiàn)在將參考附圖更全面地描述示例實施方式。然而,示例實施方式能夠以多種形式實施,且不應(yīng)被理解為限于在此闡述的范例;相反,提供這些實施方式使得本公開將更加全面和完整,并將示例實施方式的構(gòu)思全面地傳達給本領(lǐng)域的技術(shù)人員。所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個或更多實施方式中。在下面的描述中,提供許多具體細節(jié)從而給出對本公開的實施方式的充分理解。然而,本領(lǐng)域技術(shù)人員將意識到,可以實踐本公開的技術(shù)方案而省略所述特定細節(jié)中的一個或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細示出或描述公知技術(shù)方案以避免喧賓奪主而使得本公開的各方面變得模糊。
此外,附圖僅為本公開的示意性圖解,并非一定是按比例繪制。圖中相同的附圖標記表示相同或類似的部分,因而將省略對它們的重復(fù)描述。附圖中所示的一些方框圖是功能實體,不一定必須與物理或邏輯上獨立的實體相對應(yīng)。可以采用軟件形式來實現(xiàn)這些功能實體,或在一個或多個硬件模塊或集成電路中實現(xiàn)這些功能實體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實現(xiàn)這些功能實體。
本示例實施方式中首先提供了一種保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法,可以用于構(gòu)建核保風險評分系統(tǒng),例如構(gòu)建個人長期壽險、重疾險、年金險、意外險的核保風險評分系統(tǒng)等;也可以用于構(gòu)建核賠風險評分系統(tǒng),例如個人醫(yī)療險的欺詐風險評分系統(tǒng)和個人醫(yī)療險中津貼險的掛床風險評分系統(tǒng)等,即本示例實施方式中并不特別限定所述保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法的應(yīng)用范圍。
參考圖1中所示,本示例實施方式中的所述保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法可以包括以下步驟:
步驟s10.以是否出險作為待構(gòu)建的保險業(yè)務(wù)風險評分系統(tǒng)的因變量。
步驟s20.通過數(shù)據(jù)挖掘方法獲取與所述因變量相關(guān)的多個自變量。
步驟s30.通過logistic回歸方法利用一數(shù)據(jù)庫中存儲的第一部分所述自變量以及因變量生成所述保險業(yè)務(wù)風險評分系統(tǒng)。
步驟s40.利用所述數(shù)據(jù)庫中存儲的第二部分所述自變量以及因變量對所述保險業(yè)務(wù)風險評分系統(tǒng)進行驗證。
此外,本示例實施方式中的保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法是基于大數(shù)據(jù)技術(shù),因此在構(gòu)建保險業(yè)務(wù)風險評分系統(tǒng)之前,還可以包括:
步驟s01.準備存儲有保險單信息的數(shù)據(jù)庫,并對其中已有數(shù)據(jù)及其環(huán)境進行分析。
下面以構(gòu)建核保風險評分系統(tǒng)為例,對本示例實施方式中的所述保險業(yè)務(wù)風險評分系統(tǒng)構(gòu)建方法的各個步驟進行詳細的說明。
步驟s01.準備存儲有保險單信息的數(shù)據(jù)庫,并對現(xiàn)有的數(shù)據(jù)及其環(huán)境進行研究和分析,理解數(shù)據(jù),分析其是否能滿足構(gòu)建所述保險業(yè)務(wù)風險評分系統(tǒng)的數(shù)據(jù)需求,以及評估數(shù)據(jù)的質(zhì)量。
舉例而言,發(fā)明人準備了歷史上大量保險單的每個保險合同,在投保當天,保險單的投保人、代理人、保險單的每個合同的被保人的所有歷史情況,整合了多業(yè)務(wù)渠道進行匯總,并對于2013年7月1日之前所有保險合同(總共1億條左右),每一單都進行了歷史回顧。
例如,對于保險單z,代理人為a,投保人為b,涉及3個保險合同,合同z01和z02的被保人為m,合同z03的被保人為n,申請于2013年1月1日,則這張保險單分為3條記錄,z01,z02,z03各一條。為了便于索引,本示例實施方式中還利用數(shù)據(jù)庫技術(shù),通過代理人a的身份證號關(guān)聯(lián)其在2013年1月1日之前的其他信息,從而得到代理人a在公司之前的所有數(shù)據(jù),例如代理人a在2013年1月1日之前總共賣過多少保險單,代理人a的賣的保險單在2013年1月1日之前有多少已經(jīng)出險等信息。
進一步的,如果逐條去關(guān)聯(lián)各條歷史數(shù)據(jù),相當于1億條數(shù)據(jù)每一條都要去關(guān)聯(lián)這1億條數(shù)據(jù)中代理人是a的數(shù)據(jù),按照平均每個代理人5000條記錄算,相當于數(shù)據(jù)庫一共要讀取5000億條,數(shù)據(jù)庫的性能可能無法支撐。發(fā)明人發(fā)現(xiàn),一個代理人在同一天存在賣很多保險單的情況,這天該代理人的歷史信息是一樣的,沒有必要全部計算,只需計算一次即可,因此可以生成一個各代理人及其都在哪天賣過保險單的中間表,再去關(guān)聯(lián)到總的數(shù)據(jù)表,等待后續(xù)使用。
步驟s10.以是否出險作為待構(gòu)建的保險業(yè)務(wù)風險評分系統(tǒng)的因變量。所述保險業(yè)務(wù)風險評分系統(tǒng)需要同時考慮欺詐風險及自然狀態(tài)(非欺詐)下的出險風險。本示例實施方式中,保險業(yè)務(wù)風險評分系統(tǒng)的表現(xiàn)定義可以包括“好定義”以及“壞定義”,其中,“好定義”即保險單在第一預(yù)設(shè)時間內(nèi)沒有出險,“壞定義”即保險單在第一預(yù)設(shè)時間內(nèi)出險。參考圖2中所示,本示例實施方式中,可以將保險單歷史數(shù)據(jù)分成觀察期和表現(xiàn)期兩個時間段的數(shù)據(jù),其中所述第一預(yù)設(shè)時間即為所述表現(xiàn)期。
所述觀察期是用于收集保險單申請信息和歷史信息等以及獲取保險單申請或歷史特征變量的時間段,觀察期代表的是評估時已知的信息,觀察期的長短因評分系統(tǒng)和管理需要而異。觀察期的起始點可以是提取保險單的申請或歷史數(shù)據(jù)的最早和最晚時點。所述表現(xiàn)期是收集所要預(yù)測的行為的表現(xiàn)信息,獲取風險表現(xiàn)、收益表現(xiàn)等目標變量的時間段,表現(xiàn)期代表的是評估時未知的但對評估效果非常重要而需要預(yù)測的信息,表現(xiàn)期的長短也因評分系統(tǒng)和管理需要而異。觀察期和表現(xiàn)期的選取,一般需要保證窗口內(nèi)有充足的樣本供評分系統(tǒng)構(gòu)建,同時樣本窗口的業(yè)務(wù)情況不能與應(yīng)用評分系統(tǒng)的時間點差距太大。
步驟s20.通過數(shù)據(jù)挖掘方法獲取與所述因變量相關(guān)的多個自變量;本示例實施方式中,所述自變量為所述保險單在第二預(yù)設(shè)時間內(nèi)的信息參數(shù),所述第二預(yù)設(shè)時間即為上述觀察期。自變量選擇在整個保險業(yè)務(wù)風險評分系統(tǒng)的構(gòu)建過程中起到至關(guān)重要的作用。通過數(shù)據(jù)挖掘方法篩選出得自變量也可以在一定程度上作為業(yè)務(wù)人員的參考,起到行業(yè)經(jīng)驗的補充和支持作用,從而幫助審核過程更高效的執(zhí)行。如圖3中所示,本示例實施方式中,所述步驟s20可以包括:
s21.計算一第一變量集合中各變量的auc系數(shù),并獲取所述第一變量集合中所述auc系數(shù)最高的預(yù)設(shè)數(shù)量的變量為第二變量集合。
在所述步驟s21之前,可以對所述數(shù)據(jù)庫中的所有變量進行初步篩選,獲取所述第一變量集合。初步篩選可以為手工篩選,例如包括:
去除缺失值占比高(如大于95%)的變量;例如,是否吸煙。
去除無意義編碼型變量;例如,代理人員工代碼。
去除拆分過細的變量;例如,分公司名稱。
在初步篩選之后,可以通過單變量的logsitic回歸,基于現(xiàn)有樣本計算單維度情況下每個變量的好壞區(qū)分指標—auc(areaundercurve)系數(shù),并根據(jù)auc系數(shù)對各變量進行排序,選取排名前50(當然也可以為其他數(shù)值)的變量為第二變量集合。
此外,本示例實施方式中所述步驟s21還可以包括,對所述第二變量集合進行人工校正。通過人工校正,可以結(jié)合本領(lǐng)域技術(shù)人員的業(yè)務(wù)經(jīng)驗,在自動選出的前50個變量的基礎(chǔ)上補充一些業(yè)內(nèi)上認為重要或值得進一步檢測的變量。
s22.基于上述步驟s21篩選出的變量,可以從多維角度進一步精選重要的變量組合。本示例實施方式中,可以基于sas統(tǒng)計系統(tǒng)中的procglmselect過程并采用sl(significancelevel)篩選規(guī)則(criteria)從所述第二變量集合中篩選出所述多個自變量。
本示例實施方式中,所述步驟s22不同于互聯(lián)網(wǎng)技術(shù)領(lǐng)域通常所用到的降維方法(如因子分析,主成分分析等)是純粹的變量分析,而是考慮變量對預(yù)測能力的影響,采用逐步回歸(stepwise)算法。這主要是考慮到,在保險公司的核保業(yè)務(wù)中,通常采集投保人和被投保人相關(guān)信息的變量來計算核保的風險性。而發(fā)明人發(fā)現(xiàn)保險單的風險很大程度上還與保險銷售人員相關(guān),因此創(chuàng)造性地增加了保險銷售人員相關(guān)信息的變量,但由于保險銷售人員與投保人、被投保人之間毫無關(guān)系,因此不再使用降維方法進行分析。通過采用業(yè)內(nèi)不太普遍使用的逐步回歸算法(stepwise)進行分析,進而適合本示例實施方式中變量相關(guān)性弱的數(shù)據(jù)分析。
此外,本示例實施方式中所述步驟s22還可以包括,對篩選出的所述多個自變量進行人工校正。通過人工校正,可以以最大程度改進現(xiàn)有審核流程為宗旨,并結(jié)合本領(lǐng)域技術(shù)人員的業(yè)務(wù)經(jīng)驗一同驗證自變量是否選取恰當并進行微調(diào)。
步驟s30.通過logistic回歸方法利用一數(shù)據(jù)庫中存儲的第一部分所述自變量以及因變量生成所述保險業(yè)務(wù)風險評分系統(tǒng)。
本示例實施方式中,可以從全部數(shù)據(jù)中選擇兩部分數(shù)據(jù):第一部分所述自變量以及因變量,即開發(fā)樣本;以及第二部分所述自變量以及因變量,即驗證樣本。開發(fā)樣本是構(gòu)建保險業(yè)務(wù)風險評分系統(tǒng)的的實際數(shù)據(jù)集。驗證樣本用于檢查估計建立的保險業(yè)務(wù)風險評分系統(tǒng)的穩(wěn)健性。保險業(yè)務(wù)風險評分系統(tǒng)應(yīng)足夠穩(wěn)健從而可以在完全不同的賬戶集中具有同樣的預(yù)測能力,驗證樣本是一種用于確定結(jié)果的樣本。
以核保風險評分系統(tǒng)為例,其主要針對長險中的壽險,年金險,重疾險和意外險等。為了保證一定出險樣本數(shù),可以截取5年的歷史數(shù)據(jù)(如2010/1/1到2015/7/31),提取該時間段生效的所有保險單。由于四種目標責任的保障范疇有所不同,可以針對每個責任分別搭建四個風險評分系統(tǒng)以提高風險預(yù)測的精準度。一個數(shù)據(jù)篩選規(guī)則是剔除特定附加責任限制相關(guān)的數(shù)據(jù),另一個數(shù)據(jù)篩選規(guī)則是表現(xiàn)期滿2年,所有近期進入的保險單(如2013年7月31號之后生效的保險單)都將排除在外。篩選出的數(shù)據(jù)可以進一步按例如6:4的比例隨機截成兩部分,其中60%的部分可以作為評分系統(tǒng)訓(xùn)練樣本,另外的40%可以作為系統(tǒng)驗證樣本。
其中,上述數(shù)據(jù)中近兩年內(nèi)的保險單可以作為跨時間驗證樣本在評分系統(tǒng)開發(fā)完成后對最終評分系統(tǒng)進行跨時間驗證。由于這部分保險單的表現(xiàn)期不滿2年,無法確定“好”樣本,因為暫時還未出險的保險單無法確定在接下來是否會出險。但是可以確定已經(jīng)出險的保險單為“壞”樣本。因此,可以只選擇跨時間驗證樣本中的出險保險單來驗證最終評分系統(tǒng)結(jié)果。
步驟s40.利用所述數(shù)據(jù)庫中存儲的第二部分所述自變量以及因變量,即上述驗證樣本對所述保險業(yè)務(wù)風險評分系統(tǒng)進行驗證。如上所述,本示例實施方式中,所述驗證樣本包括系統(tǒng)驗證樣本和跨時間驗證樣本,因此所述步驟s40可以包括,對所述保險業(yè)務(wù)風險評分系統(tǒng)進行系統(tǒng)驗證樣本驗證;以及,對所述保險業(yè)務(wù)風險評分系統(tǒng)進行跨時間驗證樣本驗證。
此外,本示例實施方式中所述構(gòu)建方法還可以包括細分分析,通過細分分析可以找出最佳的群體分隔,使得以此為基礎(chǔ)建立的一組評分系統(tǒng)可使整個評分系統(tǒng)的預(yù)測能力最大化。本示例實施方式中,所述細分分析可以包括:劃分多個細分群體,對于各所述細分群體利用所述保險業(yè)務(wù)風險評分系統(tǒng)進行評分并獲取評分準確性最高的細分群體進行群體分隔。但需要說明的是,細分分析并非本示例實施方式中所述構(gòu)建方法的必需步驟,本領(lǐng)域技術(shù)人員可根據(jù)需要選擇是否必要進行。
進一步的,本示例實施方式中還提供了一種通過上述構(gòu)建方法構(gòu)建的保險業(yè)務(wù)風險評分系統(tǒng);所述保險業(yè)務(wù)風險評分系統(tǒng)可以接收輸入的自變量參數(shù),并根據(jù)所述自變量參數(shù)獲取出險的概率值(絕對風險概率)以及與所述出險的概率值對應(yīng)的評分分數(shù)(相對風險分位數(shù))。
為了更全面的展示風險,本示例實施方式中提供了兩版分數(shù):絕對風險概率和相對風險分位數(shù)。絕對風險概率定量的定義風險高低,而相對分數(shù)定性的給出相對風險分層。相對分數(shù)是絕對概率在歷史數(shù)據(jù)上的百分位數(shù),所以不同的責任無論平均風險的高低都將被統(tǒng)一到同樣的尺度上(例如,1到100分),方遍后續(xù)的比較分析。相對分數(shù)的可比較性即可幫助核保人員綜合各個分數(shù)從而做出合理的判斷,所以保險單審核過成中可以主要參照相對分數(shù)。而絕對概率可以結(jié)合保額和其他信息用于損失金額的預(yù)測等方面。對于核賠審核流程,可以與核保類似使用相對分數(shù)幫助審核人員理解風險級別。本示例實施方式中,引入相對風險的概念,一個保險單里不同責任險種的分數(shù)統(tǒng)一到保險單層面同樣的尺度之上,最后不僅得到每個險種的評分,還可以得到整個保險單的評分。
以壽險(其它險種計算公式和評分示意圖雷同)為例,壽險風險評分系統(tǒng)有多個自變量,例如客戶等級(x1)、被保人學(xué)歷(x2)、繳費金額(x3)……繳費期限(xn-1)以及等待期(xn),預(yù)先計算各自變量的各個取值區(qū)間內(nèi)對應(yīng)的參數(shù)估計值,并保存至一查詢表中;例如,變量x1具有5個取值區(qū)間,每個取值區(qū)間對應(yīng)的參數(shù)估計值為y11、y12、y13、y14以及y15;變量xn具有4個取值區(qū)間,每個取值區(qū)間對應(yīng)的參數(shù)估計值為yn1、yn2、yn3以及yn4等。
當一份受理壽險保險單的信息進入評分系統(tǒng)后,評分系統(tǒng)將會采集接收輸入評分系統(tǒng)的上述多個自變量(x1~xn)以及對應(yīng)的取值,并從上述查詢表中查詢所述自變量的取值對應(yīng)的參數(shù)估計值(簡稱β),例如,變量xn的取值在所述查詢表中的第二區(qū)間,則可以得知xn對應(yīng)的參數(shù)估計值為yn2;然后將所述多個自變量的估計值以及截距進行加總,最后通過邏輯變換逆變換計算出出險的概率值。本示例實施方式中,所述保險業(yè)務(wù)風險評分系統(tǒng)根據(jù)下述公式計算所述出險的概率值:
其中,β0為截距(intercept),{βi}是各個所述自變量對應(yīng)的估計值。
利用上述參數(shù)估計值表,評分系統(tǒng)的可以計算所有數(shù)據(jù)的絕對概率,之后計算絕對分數(shù)的對應(yīng)的百分位數(shù)。這樣我們就生成了絕對概率轉(zhuǎn)相對分數(shù)(1-100分)的映射表。例如,樣本為1000萬個,那么按壽險風險p值從低到高將其分為100份10萬個數(shù)據(jù),其中最低的10萬個數(shù)據(jù)中的最高p值為p1,因此將相對分數(shù)值1對應(yīng)于絕對概率p1,后面依次。舉例而言,絕對概率與相對分數(shù)對照表可以如圖4中所示。
在上述示例性實施例中,所述出險的概率值被劃分為連續(xù)的100個區(qū)間,每一所述區(qū)間對應(yīng)一個所述評分,因此可以進行百分位數(shù)評分。但在本公開的其他示例性實施例中,所述出險的概率值例如也可以被劃分為連續(xù)的10個或50個或1000個區(qū)間,每一所述區(qū)間對應(yīng)一個所述評分,因此可以進行其他精度的評分,本示例實施方式中對此不做特殊限定。
進一步的,在評分系統(tǒng)生成評分結(jié)果的時候,可以不僅只顯示出分數(shù),還可以將分數(shù)通過色譜的形式展現(xiàn)出來,以方便核保人員快速準確的識別處保險單風險。舉例而言,本示例實施方式中,評分系統(tǒng)可以包括一色譜輸出模塊,色譜輸出模塊可以用于將所述評分分數(shù)劃分為多個評分范圍,不同的所述評分范圍對應(yīng)不同的風險級別;每一所述風險級別通過一種預(yù)設(shè)的顏色進行標識。例如,參考圖5中所示,1-50分為較低風險,51-75分為中等風險,76-90分為較高風險,91-100分為很高風險;其中,較低風險通過顏色a標識,中等風險通過顏色b標識,較高風險通過顏色c標識,較高風險通過顏色d標識。
此外,本示例實施方式中,所述色譜輸出模塊還可以用于輸出指定的所述自變量與風險級別之間的定量關(guān)系,并采用色譜進行風險級別標記。通過根據(jù)各個自變量與風險的定量關(guān)系,采取四分位色譜(如顏色a、b、c、d)標記風險等級(例如圖6中所示),可以給出每個評分系統(tǒng)的自變量的風險等級,方便核保人員準確的找到保險單的風險點在哪里,方便核保人員根據(jù)評分結(jié)果對保險單進行相應(yīng)的調(diào)整,降低保險單風險。
進一步的,所述的保險業(yè)務(wù)風險評分系統(tǒng)還可以用于分別獲取保險單中多個險種的評分分數(shù),并以其中的最高評分為所述保險單的評分分數(shù)。舉例而言,某保險單里中包含壽險、重疾險、意外險以及年金四個險種,對應(yīng)的風險相對分數(shù)為壽險70分、重疾險80分、意外險85分以及年金90分,則保險單整體的風險分數(shù)為max(70,80,85,90)=90分。但容易理解的是,對于包含多個險種的保險單的風險評估也可以通過其他方式進行計算,均同樣屬于本公開的保護范圍。
以實際應(yīng)用為例,上述數(shù)據(jù)庫每天批量獲取當前所有代理人、客戶截止到昨天的歷史信息,存在表t_agt(以代理人身份證為主鍵,存儲該代理人截止至昨天的歷史信息,如賣過幾張保險單,賣過幾張壞保險單等),t_cust(以客戶身份證號為主鍵,存儲該客戶截止至昨天的歷史信息,如作為投保人買過幾張保險單,作為被保人出險過幾次等)中等待使用。例如有一張保險單z,代理人a,投保人b,其下有四個保險合同,z01是壽險,被保人是m,z02是重疾險,被保人是m,z03是壽險,被保人是n,z04是年金險,被保人是n。
前端電投微投收到保險單z的申請之后,將json格式的報文推送給數(shù)據(jù)庫,可以通過java技術(shù)解析json報文,將z的保險合同拆解,得到z01,z02,z03,z04四個保險合同,并得到這四個保險合同的基本信息(如險種、被保人年齡、性別,代理人身份證號、投被保人身份證號等),存在數(shù)據(jù)庫中,然后從csc取這四個合同的保費保額等信息到數(shù)據(jù)庫,再根據(jù)代理人的身份證號、投被保人身份證號關(guān)聯(lián)t_agt、t_cust兩張表的主鍵,得到歷史信息,最后在數(shù)據(jù)庫中形成一張寬表t_detail(z01,z02,z03,z04各一條記錄),涵蓋保險合同所有評分的變量,然后調(diào)用評分系統(tǒng),根據(jù)不同的險種類型進行評分,比如z01是壽險,就進入壽險評分系統(tǒng),得到20分,z02是重疾險,就進入重疾險評分系統(tǒng),得到30分,同理z03進入壽險評分系統(tǒng)得到40分,z04進入年金評分系統(tǒng)得到50分。
之后會根據(jù)保險單號+被保人進行匯總,每張保險單號的每個被保人得到四個評分,保險單z的m被保人會顯示“壽險20分”,“重疾險30分”,“無意外險種”,“無年金險種”,n被保人會顯示“壽險40分”,“無重疾險種”,“無意外險種”,“年金險50分”。供核保員參考。同時,數(shù)據(jù)庫也會把所有保險單評分的明細數(shù)據(jù)(包括輸入評分系統(tǒng)的變量,每個變量的具體評分等)保存下來供分析使用。
綜上所述,本示例實施方式中,利用既往保險單與客戶數(shù)據(jù),采取大數(shù)據(jù)統(tǒng)計分析和回歸構(gòu)建方法,完成保險業(yè)務(wù)評分系統(tǒng)的構(gòu)建,從而可以對風險進行量化評分,發(fā)現(xiàn)更多當前在業(yè)務(wù)經(jīng)驗上比較模糊或未知的規(guī)律并為業(yè)務(wù)帶來例如以下提升:更準確的在核保/核賠等業(yè)務(wù)識別風險,有效降低核保/核賠的成本;通過與目前系統(tǒng)的規(guī)則相結(jié)合,可以逐漸提高自動核保率,減少人工成本;有助于改善客戶服務(wù)水平,提升客戶滿意度,有力支持銷售,促進業(yè)務(wù)發(fā)展等。
應(yīng)當注意,盡管在附圖中以特定順序描述了本公開中方法的各個步驟,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些步驟,或是必須執(zhí)行全部所示的步驟才能實現(xiàn)期望的結(jié)果。附加的或備選的,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,以及/或者將一個步驟分解為多個步驟執(zhí)行等。
圖7中示出根據(jù)本公開示例實施方式中上述保險業(yè)務(wù)風險評分系統(tǒng)400的一種示意圖。參照圖7,保險業(yè)務(wù)風險評分系統(tǒng)400包括處理組件422,其進一步包括一個或多個處理器,以及由存儲器432所代表的存儲器資源,用于存儲可由處理組件422的執(zhí)行的指令,例如應(yīng)用程序。存儲器432中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件422被配置為執(zhí)行指令,以執(zhí)行上述方法。
保險業(yè)務(wù)風險評分系統(tǒng)400還可以包括一個電源組件426被配置為執(zhí)行保險業(yè)務(wù)風險評分系統(tǒng)400的電源管理,一個有線或無線網(wǎng)絡(luò)接口450被配置為將保險業(yè)務(wù)風險評分系統(tǒng)400連接到網(wǎng)絡(luò),和一個輸入輸出(i/o)接口458。保險業(yè)務(wù)風險評分系統(tǒng)400可以操作基于存儲在存儲器432的操作系統(tǒng),例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或類似。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由所附的權(quán)利要求指出。