本公開(kāi)涉及交通管理技術(shù)領(lǐng)域,尤其涉及一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法及系統(tǒng)。
背景技術(shù):
在眾多交通運(yùn)輸方式中,水路運(yùn)輸以其成本低、運(yùn)輸量大等特點(diǎn)被普遍認(rèn)可和接受,水上交通運(yùn)輸發(fā)展迅速,但是由于船舶運(yùn)輸易受自然環(huán)境影響、靈活性差等特點(diǎn),船舶碰撞事故時(shí)有發(fā)生,造成不同程度的財(cái)產(chǎn)損失、人員傷亡和環(huán)境污染。
由于導(dǎo)致船舶碰撞事故的因素眾多:包括船舶的因素、環(huán)境因素以及人為因素等,這些致因因素由于存在不確定性而很難完全量化碰撞風(fēng)險(xiǎn)。目前通常使用定性或者半定量方法對(duì)船舶碰撞的風(fēng)險(xiǎn)進(jìn)行評(píng)估,從而根據(jù)評(píng)估結(jié)果采取相應(yīng)的船舶管理措施,防止船舶碰撞的發(fā)生,降低船舶碰撞引起的損失。然而,發(fā)明人通過(guò)研究發(fā)現(xiàn),傳統(tǒng)風(fēng)險(xiǎn)評(píng)估方法,由于加入了大量主觀判斷,影響船舶碰撞風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確性;而且,在發(fā)生船舶碰撞后,原有的風(fēng)險(xiǎn)評(píng)估方式不能定量計(jì)算碰撞后果,從而無(wú)法為制定應(yīng)急預(yù)案提供客觀依據(jù)。因此,如何定量計(jì)算船舶碰撞后果,以提高風(fēng)險(xiǎn)評(píng)估的精度,進(jìn)而根據(jù)風(fēng)險(xiǎn)評(píng)估結(jié)果,采取有效的應(yīng)急措施,降低船舶碰撞風(fēng)險(xiǎn)和事故引起的損失,是本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例中提供了一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法及其系統(tǒng),以解決現(xiàn)有技術(shù)中的風(fēng)險(xiǎn)評(píng)估精度差、無(wú)法降低船舶碰撞風(fēng)險(xiǎn)的問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了如下技術(shù)方案:
根據(jù)本發(fā)明的第一方面,本發(fā)明實(shí)施例提供了一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法,該方法包括:
根據(jù)船舶碰撞歷史數(shù)據(jù),計(jì)算歷史碰撞概率,其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合;
根據(jù)所述船舶碰撞歷史數(shù)據(jù)和歷史碰撞概率,預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù);
對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分;
根據(jù)主成分分析的結(jié)果對(duì)預(yù)測(cè)的事故致因因素進(jìn)行降維計(jì)算,并將降維計(jì)算的結(jié)果作為第一神經(jīng)網(wǎng)絡(luò)的輸入,得到碰撞概率的預(yù)測(cè)值;
對(duì)船舶屬性進(jìn)行等級(jí)劃分,采用事故序列的方法尋找頻繁項(xiàng)集,通過(guò)決策樹(shù)分析,尋找置信度高的事故序列,對(duì)頻繁發(fā)生且置信度高的事故序列的所有情況進(jìn)行排列組合;
將船舶屬性作為第二神經(jīng)網(wǎng)絡(luò)模型的輸入層,將決策樹(shù)分析得到的排列組合后的事故序列輸入到所述第二神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到對(duì)應(yīng)的碰撞后果;
根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。
可選地,所述事故致因因素包括人為因素、船舶和設(shè)備因素、環(huán)境因素和管理因素的一種或多種的組合;所述船舶工具屬性包括船舶噸位、使用時(shí)間、配員數(shù)、行駛速度、船舶類(lèi)型、船舶尺寸、碰撞夾角和碰撞位置的一種或多種的組合。
可選地,所述預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù),包括:
根據(jù)累積式自回歸移動(dòng)平均模型,對(duì)事故致因因素的發(fā)生次數(shù)進(jìn)行預(yù)測(cè)。
可選地,所述對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分,包括:
對(duì)船舶碰撞歷史數(shù)據(jù)中的所有事故致因因素采用主成分分析方法進(jìn)行簡(jiǎn)化降維;
提取貢獻(xiàn)率大于或等于貢獻(xiàn)率閾值的主成分,其中,所述貢獻(xiàn)率閾值的取值介于75%至85%之間。
可選地,根據(jù)主成分分析的結(jié)果對(duì)預(yù)測(cè)的事故致因因素進(jìn)行降維計(jì)算,并將降維計(jì)算的結(jié)果作為第一神經(jīng)網(wǎng)絡(luò)的輸入,得到碰撞概率的預(yù)測(cè)值,包括:
第一神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)包括輸入層、隱藏層和輸出層;
將提取出的主成分作為第一神經(jīng)網(wǎng)絡(luò)輸入層的參數(shù),將碰撞概率作為輸出層的參數(shù),根據(jù)主成分分析的結(jié)果,對(duì)預(yù)測(cè)的事故致因因素采用主成分分析法進(jìn)行降維計(jì)算,將計(jì)算得到的主成分作為第一神經(jīng)網(wǎng)絡(luò)的輸入,根據(jù)輸入輸出模型、作用函數(shù)模型、誤差計(jì)算模型和自學(xué)習(xí)模型,計(jì)算得到碰撞概率的預(yù)測(cè)值。
可選地,所述碰撞后果包括受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失。
可選地,根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)之前,還包括:
對(duì)所述碰撞后果進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,用于消除量級(jí)和量綱的影響;
通過(guò)專(zhuān)家系統(tǒng)和模糊層次分析法,確定碰撞后果中受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失權(quán)重;
根據(jù)標(biāo)準(zhǔn)化和歸一化后的碰撞后果,以及受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失權(quán)重,計(jì)算得到新的碰撞后果;
根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn),包括:
將碰撞概率的預(yù)測(cè)值和所述新的碰撞后果進(jìn)行乘積運(yùn)算,得到所述船舶碰撞風(fēng)險(xiǎn)。
可選地,對(duì)所述碰撞后果進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,包括:
根據(jù)特別重大事故受傷人數(shù)下限、特別重大事故死亡人數(shù)下限和經(jīng)濟(jì)損失下限,分別對(duì)受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,消除量級(jí)和量綱的影響。
可選地,通過(guò)專(zhuān)家系統(tǒng)和模糊層次分析法,確定碰撞后果中受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的權(quán)重,包括:
采用專(zhuān)家系統(tǒng)確定受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的相對(duì)重要度,分別對(duì)其進(jìn)行模糊化,得到專(zhuān)家打分矩陣;
對(duì)專(zhuān)家打分矩陣求平均值,得到模糊因素判斷矩陣;
使用Buckley方法計(jì)算模糊權(quán)重矩陣;
去模糊化得到受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的權(quán)重。
根據(jù)本發(fā)明的第二方面,本發(fā)明實(shí)施例提供了一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估系統(tǒng),該系統(tǒng)包括:
統(tǒng)計(jì)模塊,用于根據(jù)船舶碰撞歷史數(shù)據(jù),計(jì)算歷史碰撞概率,其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合;
預(yù)測(cè)模塊,用于根據(jù)所述船舶碰撞歷史數(shù)據(jù)和歷史碰撞概率,預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù);
主成分分析模塊,用于對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分;
概率計(jì)算模塊,用于根據(jù)主成分分析的結(jié)果對(duì)預(yù)測(cè)的事故致因因素進(jìn)行降維計(jì)算,并將降維計(jì)算的結(jié)果作為第一神經(jīng)網(wǎng)絡(luò)的輸入,得到碰撞概率的預(yù)測(cè)值;
組合模塊,用于對(duì)船舶屬性進(jìn)行等級(jí)劃分,采用事故序列的方法尋找頻繁項(xiàng)集,通過(guò)決策樹(shù)分析,尋找置信度高的事故序列,對(duì)頻繁發(fā)生且置信度高的事故序列的所有情況進(jìn)行排列組合;
后果計(jì)算模塊,用于將船舶屬性作為第二神經(jīng)網(wǎng)絡(luò)模型的輸入層,將決策樹(shù)分析得到的排列組合后的事故序列輸入到所述第二神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到對(duì)應(yīng)的碰撞后果;
風(fēng)險(xiǎn)評(píng)估模塊,用于根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。
本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:本發(fā)明實(shí)施例提供了一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法及系統(tǒng),根據(jù)統(tǒng)計(jì)的歷史數(shù)據(jù),通過(guò)累積式自回歸移動(dòng)平均模型預(yù)測(cè)致因因素發(fā)生次數(shù),對(duì)預(yù)測(cè)的致因因素采用主成分分析法進(jìn)行降維計(jì)算,將降維計(jì)算得到的主成分作為第一神經(jīng)網(wǎng)絡(luò)的輸入,預(yù)測(cè)船舶碰撞發(fā)生的概率;采用事故序列和決策樹(shù)分析找到置信度較高且頻繁發(fā)生的事故序列,對(duì)其可能的情況進(jìn)行排列組合,使用神經(jīng)網(wǎng)絡(luò)模型計(jì)算其可能導(dǎo)致的受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失,對(duì)受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,消除量級(jí)和量綱的影響;用專(zhuān)家系統(tǒng)和模糊層次分析法,賦予這三項(xiàng)指標(biāo)不同權(quán)重以量化碰撞后果最終計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。其有益效果如下:
(1)為船舶碰撞后的搜尋救助提供指導(dǎo)。
根據(jù)本申請(qǐng)對(duì)碰撞結(jié)果的分析,確定碰撞所屬的等級(jí),指導(dǎo)制定應(yīng)急預(yù)案,從而在搜救開(kāi)始階段針對(duì)可能的情況提前準(zhǔn)備救助設(shè)備,做好救助計(jì)劃,盡可能地減小碰撞損失。
(2)可成為碰撞當(dāng)事船舶應(yīng)急反應(yīng)和事故現(xiàn)場(chǎng)處置的客觀依據(jù)。
由于在碰撞事故發(fā)生后的短時(shí)間內(nèi),碰撞當(dāng)事船舶將無(wú)法掌握詳盡的碰撞損失情況,無(wú)法做出及時(shí)準(zhǔn)確的海事應(yīng)急處置措施,可能會(huì)導(dǎo)致人員傷亡、船舶沉沒(méi)、海洋環(huán)境遭到嚴(yán)重破壞。應(yīng)用該碰撞結(jié)果預(yù)測(cè)模型有利于在短時(shí)間內(nèi)對(duì)碰撞情況有全面客觀的認(rèn)識(shí),結(jié)合碰撞后的應(yīng)急部署做出及時(shí)、準(zhǔn)確的應(yīng)急反應(yīng)和事故現(xiàn)場(chǎng)處置措施,采取科學(xué)、合理的自救方案,降低碰撞損失。
(3)為船舶駕引人員安全操縱船舶提供指導(dǎo)。
在對(duì)各碰撞因素和碰撞損失量化的基礎(chǔ)上,確定各碰撞要素對(duì)碰撞損失的影響程度。有利于船舶駕引人員在實(shí)際操船的過(guò)程中,根據(jù)不同碰撞要素對(duì)碰撞損失程度的不同影響,結(jié)合本船實(shí)際操縱性能,盡可能提前得考慮可能發(fā)生碰撞危險(xiǎn),客觀的做出正確的操船決策,降低碰撞損失程度,保障海上人命、環(huán)境、財(cái)產(chǎn)的安全。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本發(fā)明的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本發(fā)明的原理。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種船舶碰撞風(fēng)險(xiǎn)評(píng)估方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的一種神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實(shí)施例提供的一種基于后果量化的船舶碰撞風(fēng)險(xiǎn)計(jì)算方法的詳細(xì)流程示意圖;
圖4為本發(fā)明實(shí)施例提供的一種船舶碰撞風(fēng)險(xiǎn)評(píng)估系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
在眾多交通運(yùn)輸方式中,水路運(yùn)輸以其成本低、運(yùn)輸量大等特點(diǎn)被普遍認(rèn)可和接受,水上交通運(yùn)輸發(fā)展迅速,但是由于船舶運(yùn)輸易受自然環(huán)境影響、靈活性差等特點(diǎn),船舶碰撞事故時(shí)有發(fā)生,造成不同程度的財(cái)產(chǎn)損失、人員傷亡和環(huán)境污染。因此,有必要對(duì)船舶碰撞事故進(jìn)行分析研究,依據(jù)歷史經(jīng)驗(yàn)數(shù)據(jù),定量預(yù)測(cè)船舶碰撞風(fēng)險(xiǎn),降低船舶碰撞后果,預(yù)防類(lèi)似事故的再次發(fā)生。
參見(jiàn)圖1,為本發(fā)明實(shí)施例提供的一種船舶碰撞風(fēng)險(xiǎn)評(píng)估方法的流程示意圖,如圖1所示,該方法包括:
步驟S101:根據(jù)船舶碰撞歷史數(shù)據(jù),計(jì)算歷史碰撞概率,其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合。
通過(guò)搜集船舶碰撞的資料構(gòu)建歷史數(shù)據(jù)庫(kù),該歷史數(shù)據(jù)庫(kù)中包括有船舶碰撞歷史數(shù)據(jù),其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合;所述事故致因因素包括人為因素、船舶和設(shè)備因素、環(huán)境因素和管理因素的一種或多種的組合;所述船舶屬性包括船舶噸位、使用時(shí)間、配員數(shù)、行駛速度、船舶類(lèi)型、船舶尺寸、碰撞夾角和碰撞位置的一種或多種的組合。對(duì)歷史數(shù)據(jù)庫(kù)以及相關(guān)文獻(xiàn)資料、事故調(diào)查報(bào)告中船舶碰撞事故的事故致因因素(人、環(huán)境、設(shè)備等因素)、船舶碰撞次數(shù)碰撞船舶各屬性(碰撞兩船的噸位、船齡、配員數(shù)、航行速度、船舶類(lèi)型、碰撞夾角、船舶尺寸、船舶碰撞時(shí)排水量和碰撞位置等因素)、船舶流量、船舶碰撞次數(shù)和概率等,按照年份,進(jìn)行統(tǒng)計(jì)歸納和分析整理,計(jì)算船舶歷史碰撞概率。經(jīng)標(biāo)準(zhǔn)化和歸一化處理后,系統(tǒng)研究碰撞要素對(duì)船舶碰撞后果的影響。
步驟S102:根據(jù)所述船舶碰撞歷史數(shù)據(jù)和歷史碰撞概率,預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù)。
對(duì)每一年的事故原因等因素,用累積式自回歸移動(dòng)平均模型(英文:Autoregressive Integrated Moving Average Model,簡(jiǎn)稱(chēng):ARIMA)預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù),具體公式如下:
E(εsεt)=0,任意s<t,
其中xt為時(shí)間序列數(shù)據(jù),xt與xt-i(i=1,2,…p)相關(guān);εt為殘差,εt與εt-j(j=1,2,…q)相關(guān);B為延遲算子,滿(mǎn)足Bnxt-n=xt-n;p是自回歸階數(shù),q是移動(dòng)平均階數(shù),d為差分階數(shù),為差分算子,
Φ(B)表示自回歸系數(shù)多項(xiàng)式,其表達(dá)式為:
Φ(B)=1-φ1B-φ2B2-……-φpBp
Θ(B)表示移動(dòng)平均系數(shù)多項(xiàng)式,其表達(dá)式為:
Θ(B)=1-θ1B-θ2B2-…-θqBq
εt表示獨(dú)立于xt-i和εt-j的白噪聲序列,滿(mǎn)足條件:
ε=θ1εt-1+θ2εt-2+…+θqεt-q-φ0-φ1xt-1-φ2xt-2-…-φpxt-p-xt
該模型集合AMRA(p,q)模型與差分運(yùn)算兩種方法,預(yù)測(cè)精度較高,對(duì)數(shù)據(jù)本身結(jié)構(gòu)性沒(méi)有太高要求,只需從數(shù)據(jù)本身尋找規(guī)律,擬合效果較好。
步驟S103:對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分。
對(duì)所統(tǒng)計(jì)的原因進(jìn)行相關(guān)性分析,查看各因素之間的相關(guān)性,如果各因素的相關(guān)性比較大,則可以通過(guò)主成分分析對(duì)相關(guān)性較大的因素進(jìn)行合并,提取總貢獻(xiàn)率大于貢獻(xiàn)率閾值的前n個(gè)主成分以及他們包含的影響因素,其中,所述貢獻(xiàn)率閾值的取值范圍可以為75%至85%之間,優(yōu)選地,所述貢獻(xiàn)率閾值可以為85%。主成分分析的公式如下:
當(dāng)一個(gè)待解決問(wèn)題有n個(gè)樣本,且每個(gè)樣本有p個(gè)因素時(shí),可得到如下矩陣:
式中,
對(duì)矩陣X進(jìn)行線(xiàn)性變換,得p個(gè)新生成的綜合變量F1……Fp
F1,F2,……Fp分別為原變量x1,x2,……xp的第1,2……p個(gè)主成分。
系數(shù)aij需要滿(mǎn)足3個(gè)條件,其中Var表示方差:
①Fi、Fj(i≠j;i,j=1,2,…,p)相互無(wú)關(guān)
②Var(F1)>Var(F2)>…>Var(Fp);
③
第i個(gè)主成分yi的方差與總方差的比值表示這個(gè)主成份的貢獻(xiàn)率。
步驟S104:根據(jù)主成分分析的結(jié)果對(duì)預(yù)測(cè)的事故致因因素進(jìn)行降維計(jì)算,并將降維計(jì)算的結(jié)果作為第一神經(jīng)網(wǎng)絡(luò)的輸入,得到碰撞概率的預(yù)測(cè)值。
參見(jiàn)圖2,為本發(fā)明實(shí)施例提供的一種神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)示意圖,本發(fā)明實(shí)施例中的第一神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)包括輸入層、隱藏層和輸出層。當(dāng)然需要說(shuō)明的是,在后續(xù)步驟中使用的第二神經(jīng)網(wǎng)絡(luò)模型與第一神經(jīng)網(wǎng)絡(luò)模型具有相似的結(jié)構(gòu)和模型函數(shù),在此僅以第一神經(jīng)網(wǎng)絡(luò)模型為例進(jìn)行詳細(xì)說(shuō)明,第二神經(jīng)網(wǎng)絡(luò)模型可以參見(jiàn)第一神經(jīng)網(wǎng)絡(luò)模型的描述,在此不再贅述。
第一神經(jīng)網(wǎng)絡(luò)模型包括輸入輸出模型、作用函數(shù)模型、誤差計(jì)算模型和自學(xué)習(xí)模型。
(1)節(jié)點(diǎn)輸出模型
隱藏節(jié)點(diǎn)的輸出模型:
Oj=f(∑Wij×Xi-θj)
輸出節(jié)點(diǎn)的輸出模型:
Yk=f(∑Tjk×Oj-θk)
其中,f表示非線(xiàn)形作用函數(shù),θ表示神經(jīng)單元閾值。
(2)作用函數(shù)模型
作用函數(shù)反映了下層輸入對(duì)上層節(jié)點(diǎn)刺激脈沖強(qiáng)度,又叫刺激函數(shù),一般為(0,1)范圍內(nèi)連續(xù)取值的Sigmoid函數(shù):
(3)誤差計(jì)算模型
誤差計(jì)算模型反映了神經(jīng)網(wǎng)絡(luò)期望輸出與計(jì)算輸出之間誤差大?。?/p>
其中,tpi表示i節(jié)點(diǎn)的期望輸出值,Opi表示i節(jié)點(diǎn)的計(jì)算輸出值。
(4)自學(xué)習(xí)模型
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程,是確定下層節(jié)點(diǎn)和上層節(jié)點(diǎn)之間的權(quán)重矩陣Wij和修正誤差過(guò)程。神經(jīng)網(wǎng)絡(luò)有的需要設(shè)定期望值,有的只需輸入模式。在本發(fā)明實(shí)施例中,自學(xué)習(xí)模型的表達(dá)式如下:
ΔWij(n+1)=η×φi×Oj+a×ΔWij(n)
其中,η表示學(xué)習(xí)因子,Фi表示輸出節(jié)點(diǎn)i的計(jì)算誤差,Oj表示輸出節(jié)點(diǎn)j的計(jì)算輸出,a表示動(dòng)量因子。
在計(jì)算過(guò)程中,將主成分分析得到的n個(gè)主成分作為神經(jīng)網(wǎng)絡(luò)的輸入層的n個(gè)節(jié)點(diǎn),將碰撞事故發(fā)生的概率作為輸出層的節(jié)點(diǎn),隱藏節(jié)點(diǎn)個(gè)數(shù)k的一般經(jīng)驗(yàn)公式為:
式中,n表示輸入層節(jié)點(diǎn)數(shù)量,m表示輸出層幾點(diǎn)數(shù)量,a為常數(shù),取值范圍為1-10。
選取前80%的樣本作為訓(xùn)練集,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行建模訓(xùn)練,后20%的樣本作為檢驗(yàn)。隱藏層初始權(quán)值為主成分公式中的各個(gè)單因子的系數(shù)值,調(diào)整神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)精度、訓(xùn)練次數(shù)、訓(xùn)練函數(shù)和隱層數(shù),其余參數(shù)采用系統(tǒng)默認(rèn)值。將ARIMA時(shí)間序列預(yù)測(cè)得到的影響因素輸入該模型,計(jì)算得到船舶碰撞概率的預(yù)測(cè)值。
為了保證第一神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性,進(jìn)而提高碰撞概率預(yù)測(cè)的精度,本發(fā)明實(shí)施例還可以包括使用后20%樣本對(duì)第一神經(jīng)網(wǎng)絡(luò)模型校驗(yàn)、調(diào)整的步驟:
步驟S1041:根據(jù)提取到的主成分和預(yù)測(cè)得到的事故致因因素發(fā)生次數(shù),通過(guò)第一神經(jīng)網(wǎng)絡(luò)模型計(jì)算得到參考碰撞概率。
根據(jù)上述實(shí)施例描述的計(jì)算過(guò)程,計(jì)算得到碰撞概率的預(yù)測(cè)值。
步驟S1042:計(jì)算所述參考碰撞概率與預(yù)測(cè)得到的事故概率的差值。
通過(guò)使用步驟S102的計(jì)算方法,還可以對(duì)事故概率進(jìn)行預(yù)測(cè),進(jìn)而通過(guò)計(jì)算參考碰撞概率與預(yù)測(cè)得到的事故概率的差值,評(píng)估該參考碰撞概率的預(yù)測(cè)精度。如果所述差值較大,則表示所使用的第一神經(jīng)網(wǎng)絡(luò)模型的精度較差,如果所述差值較小,則表示所使用的第一神經(jīng)網(wǎng)絡(luò)模型的精度較高,可以用于碰撞概率的計(jì)算。
步驟S1043:如果所述差值大于差值閾值,對(duì)第一神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)精度、訓(xùn)練次數(shù)、訓(xùn)練函數(shù)和隱層數(shù)中的一種或多種進(jìn)行調(diào)整,得到新的第一神經(jīng)網(wǎng)絡(luò)模型。
在得到新的第一神經(jīng)網(wǎng)絡(luò)模型后,重新回到步驟S1041進(jìn)行新的迭代。
步驟S1044:如果所述差值小于或等于差值閾值,將所述參考碰撞概率作為碰撞概率的預(yù)測(cè)值。
如果差值小于或等于差值閾值,則使用當(dāng)前的第一神經(jīng)網(wǎng)絡(luò)模型計(jì)算得到的參考碰撞概率誤差在可接受的范圍內(nèi),將由此計(jì)算得到的參考碰撞概率作為最終的碰撞概率的預(yù)測(cè)值。
步驟S105:對(duì)船舶屬性進(jìn)行等級(jí)劃分,采用事故序列的方法尋找頻繁項(xiàng)集,通過(guò)決策樹(shù)分析,尋找置信度高的事故序列,對(duì)頻繁發(fā)生且置信度高的事故序列的所有情況進(jìn)行排列組合。
根據(jù)各個(gè)船舶屬性將其分別劃分為不同等級(jí),用數(shù)字1,2,3……表征各個(gè)屬性的實(shí)際情況,從統(tǒng)計(jì)數(shù)據(jù)中找到發(fā)生事故次數(shù)最多的船舶屬性組合,再對(duì)其進(jìn)行決策樹(shù)分析,設(shè)置決策樹(shù)層數(shù)為a層,船舶屬性共有b個(gè),選取置信度85%以上的序列,控制這a個(gè)屬性不變,將剩下(b-a)個(gè)所有可能情況進(jìn)行排列組合,得到P種組合。
步驟S106:將船舶屬性作為第二神經(jīng)網(wǎng)絡(luò)模型的輸入層,將決策樹(shù)分析得到的排列組合后的事故序列輸入到所述第二神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到對(duì)應(yīng)的碰撞后果。
設(shè)置一個(gè)新的神經(jīng)網(wǎng)絡(luò)模型,即第二神經(jīng)網(wǎng)絡(luò)模型,選取b個(gè)船舶屬性為輸入層,輸出層為船舶碰撞的受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失三個(gè)數(shù)值,選取船舶屬性和事故后果相關(guān)數(shù)據(jù)的前80%作為訓(xùn)練集,后20%進(jìn)行檢驗(yàn)。當(dāng)誤差在可接受范圍內(nèi)時(shí),將步驟S105得到的P個(gè)組合輸入該模型,計(jì)算10次,得到十組不同的碰撞后果。
步驟S107:根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。
為了提高船舶碰撞風(fēng)險(xiǎn)的計(jì)算精度,在本發(fā)明實(shí)施例中對(duì)碰撞后果進(jìn)行了標(biāo)準(zhǔn)化和歸一化處理,并根據(jù)處理后的碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。參見(jiàn)圖3,為本發(fā)明實(shí)施例提供的一種基于后果量化的船舶碰撞風(fēng)險(xiǎn)計(jì)算方法的詳細(xì)流程示意圖,該方法包括:
步驟S1071:對(duì)所述碰撞后果進(jìn)行標(biāo)準(zhǔn)化和歸一化處理。
根據(jù)上述神經(jīng)網(wǎng)絡(luò)計(jì)算的結(jié)果,對(duì)其進(jìn)行標(biāo)準(zhǔn)化和歸一化處理如下:
Ai=max Aij
Bi=maxBij
Gi=max Gij
其中,i表示第i次計(jì)算,j表示排列組合的第j種情況,C表示死亡人數(shù),單位(人),D表示財(cái)產(chǎn)損失,單位(萬(wàn)元),H表示受傷人數(shù),單位(人),A、B、G分別表示無(wú)量綱化之后的死亡人數(shù)、財(cái)產(chǎn)損失和受傷人數(shù),F(xiàn)表示事故后果,ω1、ω2、ω3分別表示死亡人數(shù)、經(jīng)濟(jì)損失和受傷人數(shù)的權(quán)重,M是特別重大事故死亡人數(shù)下限,N是對(duì)應(yīng)的經(jīng)濟(jì)損失下限,Q是特別重大事故受傷人數(shù)下限。在本發(fā)明實(shí)施例中,M可以取值為30,N可以取值為10000萬(wàn),Q可以取值為100。
步驟S1072:通過(guò)專(zhuān)家系統(tǒng)和模糊層次分析法,確定碰撞后果中受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的權(quán)重。
對(duì)于每一次得到的P組受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失,采用專(zhuān)家系統(tǒng)確定三項(xiàng)指標(biāo)的相對(duì)重要度,分別對(duì)其進(jìn)行模糊化,具體方法見(jiàn)表1,對(duì)n個(gè)專(zhuān)家打分矩陣求平均值,得到模糊因素判斷矩陣A。
專(zhuān)家系統(tǒng)模糊化指標(biāo)范圍,如表1所示:
表1:
使用Buckley方法計(jì)算模糊權(quán)重矩陣,的值是模糊比較值的幾何平均數(shù)。
表示第n個(gè)專(zhuān)家給第i個(gè)因素相對(duì)第j個(gè)的重要度打分
令
定義
則
對(duì)去模糊化,可以得到對(duì)應(yīng)的ω1,ω2,ω3分別表示死亡人數(shù)、財(cái)產(chǎn)損失和受傷人數(shù)的權(quán)重。
步驟S1073:根據(jù)處理后的碰撞后果,以及受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的權(quán)重,計(jì)算得到新的碰撞后果。
根據(jù)步驟S1071處理后的碰撞后果,以及受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失的權(quán)重,計(jì)算得到新的碰撞后果,公式如下:
其中,F(xiàn)為碰撞后果,ω1,ω2,ω3分別表示死亡人數(shù)、財(cái)產(chǎn)損失和受傷人數(shù)的權(quán)重,A、B、G分別表示標(biāo)準(zhǔn)化和歸一化處理后的死亡人數(shù)、財(cái)產(chǎn)損失和受傷人數(shù)。對(duì)每一組計(jì)算結(jié)果取其經(jīng)過(guò)上述處理后的后果F的最大值,然后對(duì)10次計(jì)算后果的最大值求平均值,用來(lái)表征船舶的碰撞后果。
步驟S1074:將碰撞概率的預(yù)測(cè)值和所述新的碰撞后果進(jìn)行乘積運(yùn)算,得到所述船舶碰撞風(fēng)險(xiǎn)。
將上述實(shí)施例中步驟S104計(jì)算得到的碰撞概率的預(yù)測(cè)值和步驟S1073計(jì)算得到的所述新的碰撞后果進(jìn)行乘積運(yùn)算,得到船舶碰撞風(fēng)險(xiǎn),即船舶碰撞風(fēng)險(xiǎn)=碰撞概率的預(yù)測(cè)值×碰撞后果,并用F-N曲線(xiàn)表示風(fēng)險(xiǎn)大小。
由上述實(shí)施例的描述可見(jiàn),本發(fā)明實(shí)施例提供的一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法,根據(jù)船舶碰撞歷史數(shù)據(jù),計(jì)算歷史碰撞概率,其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合;根據(jù)所述船舶碰撞歷史數(shù)據(jù)和歷史碰撞概率,預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù);對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分;根據(jù)主成分分析的結(jié)果,對(duì)預(yù)測(cè)的事故致因因素采用主成分分析法進(jìn)行降維計(jì)算,將降維計(jì)算得到的主成分作為第一神經(jīng)網(wǎng)絡(luò)的輸入,計(jì)算得到碰撞概率的預(yù)測(cè)值;對(duì)船舶屬性進(jìn)行等級(jí)劃分,采用事故序列的方法尋找頻繁項(xiàng)集,通過(guò)決策樹(shù)分析,尋找置信度高的事故序列,對(duì)頻繁發(fā)生且置信度高的事故序列的所有情況進(jìn)行排列組合;將船舶屬性作為第二神經(jīng)網(wǎng)絡(luò)模型的輸入層,將決策樹(shù)分析得到的排列組合后的事故序列輸入到所述第二神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到對(duì)應(yīng)的碰撞后果;根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。本發(fā)明通過(guò)基于數(shù)據(jù)挖掘技術(shù)對(duì)船舶碰撞風(fēng)險(xiǎn)進(jìn)行分析,并用時(shí)間序列對(duì)未來(lái)可能導(dǎo)致事故的因素進(jìn)行預(yù)測(cè),用主成分分析對(duì)事故因素進(jìn)行降維,用神經(jīng)網(wǎng)絡(luò)對(duì)事故發(fā)生的概率進(jìn)行預(yù)測(cè),分析不同事故序列可能導(dǎo)致的受傷人數(shù)、死亡人數(shù)和財(cái)產(chǎn)損失,并用其表征和量化后果,結(jié)合船舶碰撞概率計(jì)算船舶碰撞風(fēng)險(xiǎn),具有很高的評(píng)估精度,從而為船舶碰撞救助和船舶操縱提供指導(dǎo),為應(yīng)急決策和事故現(xiàn)場(chǎng)處置提供客觀依據(jù),有效降低船舶碰撞風(fēng)險(xiǎn)。
通過(guò)以上的方法實(shí)施例的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
與本發(fā)明提供的一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估方法實(shí)施例相對(duì)應(yīng),本發(fā)明還提供了一種基于數(shù)據(jù)挖掘的船舶碰撞風(fēng)險(xiǎn)評(píng)估系統(tǒng)。
參見(jiàn)圖4,為本發(fā)明實(shí)施例提供的一種船舶碰撞風(fēng)險(xiǎn)評(píng)估系統(tǒng)的結(jié)構(gòu)示意圖,該系統(tǒng)包括:
統(tǒng)計(jì)模塊11,用于根據(jù)船舶碰撞歷史數(shù)據(jù),計(jì)算歷史碰撞概率,其中,所述船舶碰撞歷史數(shù)據(jù)包括事故致因因素、船舶屬性、船舶流量、碰撞次數(shù)、歷史受傷人數(shù)、歷史死亡人數(shù)以及歷史財(cái)產(chǎn)損失的一種或多種的組合;
預(yù)測(cè)模塊12,用于根據(jù)所述船舶碰撞歷史數(shù)據(jù)和歷史碰撞概率,預(yù)測(cè)每一事故致因因素的發(fā)生次數(shù);
主成分分析模塊13,用于對(duì)船舶碰撞歷史數(shù)據(jù)中的事故致因因素進(jìn)行主成分分析,并優(yōu)先提取貢獻(xiàn)率大的主成分;
概率計(jì)算模塊14,用于根據(jù)主成分分析的結(jié)果對(duì)預(yù)測(cè)的事故致因因素進(jìn)行降維計(jì)算,并將降維計(jì)算的結(jié)果作為第一神經(jīng)網(wǎng)絡(luò)的輸入,得到碰撞概率的預(yù)測(cè)值;
組合模塊15,用于對(duì)船舶屬性進(jìn)行等級(jí)劃分,采用事故序列的方法尋找頻繁項(xiàng)集,通過(guò)決策樹(shù)分析,尋找置信度高的事故序列,對(duì)頻繁發(fā)生且置信度高的事故序列的所有情況進(jìn)行排列組合;
后果計(jì)算模塊16,用于將船舶屬性作為第二神經(jīng)網(wǎng)絡(luò)模型的輸入層,將決策樹(shù)分析得到的排列組合后的事故序列輸入到所述第二神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到對(duì)應(yīng)的碰撞后果;
風(fēng)險(xiǎn)評(píng)估模塊17,用于根據(jù)碰撞概率的預(yù)測(cè)值和所述碰撞后果,計(jì)算得到船舶碰撞風(fēng)險(xiǎn)。
本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類(lèi)型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
以上所述僅是本發(fā)明的具體實(shí)施方式,使本領(lǐng)域技術(shù)人員能夠理解或?qū)崿F(xiàn)本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。