本發(fā)明涉及輿情預(yù)測,具體涉及一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測及系統(tǒng)。
背景技術(shù):
1、隨著城市化進(jìn)程的不斷推進(jìn)和經(jīng)濟(jì)的發(fā)展,國民交通需求不斷增加,居民出行品質(zhì)的需求也不斷提高。近年來,交通與互聯(lián)網(wǎng)、大數(shù)據(jù)的進(jìn)一步融合,交通類重大突發(fā)事件通過網(wǎng)絡(luò)曝光與傳播越來越頻繁,社交媒體等新媒體平臺又成為交通輿情快速擴(kuò)散的首要平臺,交通輿情分析與監(jiān)測成為解決交通問題的重要內(nèi)容,也是未來交通運(yùn)輸、社會輿情和城市治理緊密結(jié)合的重要發(fā)展方向。
2、交通輿情是對現(xiàn)狀交通問題的暴露,是對現(xiàn)狀交通系統(tǒng)性能的反饋,富含重要的交通相關(guān)信息。目前,對于城市交通輿情的分析尚處于起步階段,缺乏對城市交通輿情數(shù)據(jù)的深入分析,未能有效利用交通輿情信息,助力城市交通治理。另一方面,人工智能的迅速發(fā)展為交通問題的剖析與解決提供新的思路。合理利用交通大數(shù)據(jù)并結(jié)合智能方法以發(fā)現(xiàn)城市交通隱患,進(jìn)行主動式干預(yù),提高城市交通服務(wù)質(zhì)量至關(guān)重要?,F(xiàn)階段,相關(guān)學(xué)者多采用樸素貝葉斯方法開展輿情預(yù)測,但模型精確的不足,影響因素考慮不夠。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測及系統(tǒng),所述方法主要采用半樸素貝葉斯算法、邏輯回歸算法和分類決策樹作為基學(xué)習(xí)器的集成算法預(yù)測模型,并將其通過加權(quán)組合成一個強(qiáng)分類器,通過強(qiáng)分類器對城市信號交叉口的輿情分析預(yù)測,可以通過提高模型的泛化能力和性能,以此來準(zhǔn)確提升輿情預(yù)測結(jié)果。
2、為解決上述技術(shù)問題,本發(fā)明采用了以下方案:
3、一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,所述方法具體包括以下步驟:
4、s1:獲得所有信號交叉口的特征數(shù)據(jù)以及與信號交叉口相關(guān)的輿情信息;
5、s2:對信號交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理,根據(jù)預(yù)處理后的信號交叉口的特征數(shù)據(jù)以及輿情信息建立信號交叉口輿情數(shù)據(jù)集;
6、所述信號交叉口輿情數(shù)據(jù)集包括若干個樣本子集,每個樣本子集以一個輿情信息為樣本,并收集相關(guān)信號交叉口的特征數(shù)據(jù)作為該樣本的樣本特征;
7、s3:將樣本子集中的樣本特征代入到集成算法預(yù)測模型中以迭代的方式進(jìn)行樣本加權(quán)預(yù)測,等待迭代結(jié)束后得到最佳預(yù)測樣本。
8、進(jìn)一步的,在s3中,所述集成算法預(yù)測模型包括第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器;第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均用于根據(jù)當(dāng)前樣本特征的權(quán)重對當(dāng)前樣本特征進(jìn)行樣本預(yù)測。
9、進(jìn)一步的,在s3中,在每一次迭代過程中,依次將樣本子集中的樣本特征通過第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行樣本預(yù)測,得到樣本預(yù)測結(jié)果,將通過第三基學(xué)習(xí)器得到的樣本預(yù)測結(jié)果中的預(yù)測樣本作為最佳預(yù)測樣本。
10、進(jìn)一步的,在s3中,所述樣本加權(quán)預(yù)測的過程具體為:
11、在第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行迭代的過程中,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重,使當(dāng)前基學(xué)習(xí)器以當(dāng)前樣本特征的權(quán)重對樣本特征進(jìn)行樣本預(yù)測,從而,得到當(dāng)前基學(xué)習(xí)器的樣本預(yù)測結(jié)果,再根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測結(jié)果對下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理,使下一基學(xué)習(xí)器以加權(quán)處理后的樣本特征的權(quán)重對樣本特征進(jìn)行樣本預(yù)測,依次類推。
12、進(jìn)一步的,所述樣本預(yù)測結(jié)果中包括預(yù)測樣本,根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測結(jié)果對下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理的過程具體為:
13、將通過當(dāng)前基學(xué)習(xí)器得到的預(yù)測樣本與對應(yīng)的樣本進(jìn)行比較,根據(jù)比較結(jié)果判斷該預(yù)測樣本是否為預(yù)測錯誤的樣本,若是,則對當(dāng)前基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行提高,得到提高后的權(quán)重,根據(jù)提高后的權(quán)重更新下一基學(xué)習(xí)器中樣本特征的權(quán)重。
14、進(jìn)一步的,所述第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均具有基學(xué)習(xí)器權(quán)重,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重的過程具體為:
15、根據(jù)當(dāng)前基學(xué)習(xí)器自身的基學(xué)習(xí)器權(quán)重以及根據(jù)上一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行提高后的權(quán)重進(jìn)行權(quán)重更新,得到當(dāng)前基學(xué)習(xí)器中樣本特征的權(quán)重。
16、進(jìn)一步的,在s2中,對信號交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理的過程包括以下步驟:
17、sa1:對信號交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)行數(shù)據(jù)清洗與數(shù)據(jù)脫敏處理,針對輿情信息中個人信息以及交叉口信息剔除不屬實(shí)的輿情信息;
18、sa2:根據(jù)輿情類別確定每個輿情信息的輿情類別并標(biāo)記;
19、sa3:根據(jù)交叉口特征確定每個輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)。
20、進(jìn)一步的,在s2中,每個樣本子集以一個輿情信息為樣本,通過輿情信息標(biāo)記該樣本的輿情類別,并將輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)作為該樣本的樣本特征。
21、進(jìn)一步的,所述第一基學(xué)習(xí)器以超父獨(dú)依賴估計(jì)模型作為基學(xué)習(xí)器,所述第二基學(xué)習(xí)器以邏輯回歸模型作為基學(xué)習(xí)器,所述第三基學(xué)習(xí)器以決策樹模型作為基學(xué)習(xí)器。
22、一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測系統(tǒng),包括:
23、數(shù)據(jù)收集模塊:獲得所有信號交叉口的特征數(shù)據(jù)以及與信號交叉口相關(guān)的輿情信息;
24、數(shù)據(jù)處理模塊:對信號交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理,根據(jù)預(yù)處理后的信號交叉口的特征數(shù)據(jù)以及輿情信息建立信號交叉口輿情數(shù)據(jù)集;
25、所述信號交叉口輿情數(shù)據(jù)集包括若干個樣本子集,每個樣本子集以一個輿情信息為樣本,并收集相關(guān)信號交叉口的特征數(shù)據(jù)作為該樣本的樣本特征;
26、樣本加權(quán)預(yù)測模塊:將樣本子集中的樣本特征代入到集成算法預(yù)測模型中以迭代的方式進(jìn)行樣本加權(quán)預(yù)測,等待迭代結(jié)束后得到最佳預(yù)測樣本。
27、本發(fā)明的有益效果:
28、本發(fā)明提供了一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測及系統(tǒng),所述方法主要采用半樸素貝葉斯算法、邏輯回歸算法和分類決策樹作為基學(xué)習(xí)器的集成算法預(yù)測模型,并將其通過加權(quán)組合成一個強(qiáng)分類器,通過強(qiáng)分類器對城市信號交叉口的輿情分析預(yù)測,可以通過提高模型的泛化能力和性能,以此來準(zhǔn)確提升輿情預(yù)測結(jié)果。
1.一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,所述方法具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,在s3中,所述集成算法預(yù)測模型包括第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器;第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均用于根據(jù)當(dāng)前樣本特征的權(quán)重對當(dāng)前樣本特征進(jìn)行樣本預(yù)測。
3.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,在s3中,在每一次迭代過程中,依次將樣本子集中的樣本特征通過第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器進(jìn)行樣本預(yù)測,得到樣本預(yù)測結(jié)果,將通過第三基學(xué)習(xí)器得到的樣本預(yù)測結(jié)果中的預(yù)測樣本作為最佳預(yù)測樣本。
4.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,在s3中,所述樣本加權(quán)預(yù)測的過程具體為:
5.根據(jù)權(quán)利要求4所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,所述樣本預(yù)測結(jié)果中包括預(yù)測樣本,根據(jù)當(dāng)前基學(xué)習(xí)器的樣本預(yù)測結(jié)果對下一基學(xué)習(xí)器中樣本特征的權(quán)重進(jìn)行加權(quán)處理的過程具體為:
6.根據(jù)權(quán)利要求5所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,所述第一基學(xué)習(xí)器、第二基學(xué)習(xí)器、第三基學(xué)習(xí)器均具有基學(xué)習(xí)器權(quán)重,獲得當(dāng)前基學(xué)習(xí)器中當(dāng)前樣本特征的權(quán)重的過程具體為:
7.根據(jù)權(quán)利要求1所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,在s2中,對信號交叉口的特征數(shù)據(jù)以及輿情信息進(jìn)預(yù)處理的過程包括以下步驟:
8.根據(jù)權(quán)利要求7所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,在s2中,每個樣本子集以一個輿情信息為樣本,通過輿情信息標(biāo)記該樣本的輿情類別,并將輿情信息中交叉口信息含有的交叉口特征數(shù)據(jù)作為該樣本的樣本特征。
9.根據(jù)權(quán)利要求2所述的一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測,其特征在于,所述第一基學(xué)習(xí)器以超父獨(dú)依賴估計(jì)模型作為基學(xué)習(xí)器,所述第二基學(xué)習(xí)器以邏輯回歸模型作為基學(xué)習(xí)器,所述第三基學(xué)習(xí)器以決策樹模型作為基學(xué)習(xí)器。
10.一種基于集成算法預(yù)測模型的信號交叉口輿情預(yù)測系統(tǒng),其特征在于,包括: