本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種利用卷積神經(jīng)網(wǎng)絡(luò)(cnn)分析表格數(shù)據(jù)的創(chuàng)新方法。
背景技術(shù):
1、卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域表現(xiàn)優(yōu)異,能夠自動(dòng)提取并識(shí)別復(fù)雜特征關(guān)系。然而,在傳統(tǒng)表格數(shù)據(jù)分析中,往往采用線性回歸、決策樹等方法,這些方法難以有效捕捉數(shù)據(jù)中存在的復(fù)雜非線性關(guān)系。為了充分發(fā)揮cnn在表格數(shù)據(jù)分析中的潛力,亟需一種將表格數(shù)據(jù)轉(zhuǎn)換為cnn可處理形式的有效方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種創(chuàng)新的方法,通過(guò)將表格數(shù)據(jù)轉(zhuǎn)化為類似圖像的矩陣形式,使得cnn能夠?qū)Ρ砀駭?shù)據(jù)進(jìn)行深度分析。具體步驟包括:
2、(1)特征擴(kuò)展:將具有多個(gè)特征的表格數(shù)據(jù)擴(kuò)展至目標(biāo)矩陣,矩陣的元素?cái)?shù)目大于原始特征數(shù)。擴(kuò)展方式包括添加零值或重復(fù)原始特征。
3、(2)隨機(jī)排列:對(duì)擴(kuò)展后的特征數(shù)據(jù)進(jìn)行隨機(jī)排列,生成多個(gè)排列組合,以確保特征之間形成多樣的鄰接關(guān)系。
4、(3)矩陣轉(zhuǎn)換:將隨機(jī)排列后的數(shù)據(jù)重新組織成固定大小的矩陣(如8x8、64x64等),該矩陣將作為cnn的輸入。
5、(4)模型訓(xùn)練:通過(guò)輸入生成的矩陣到cnn中,進(jìn)行模型訓(xùn)練,利用cnn的特征提取能力,捕捉表格數(shù)據(jù)中的潛在復(fù)雜模式。
6、有益效果
7、該方法有效利用了cnn的特征提取能力,能夠識(shí)別傳統(tǒng)方法難以捕捉的復(fù)雜非線性關(guān)系。通過(guò)隨機(jī)排列和特征擴(kuò)展,增加了數(shù)據(jù)多樣性,提升了模型的泛化能力。此外,本方法可根據(jù)實(shí)際應(yīng)用需求,靈活調(diào)整矩陣規(guī)模,確保資源利用的最優(yōu)化。
1.一種用于分析表格數(shù)據(jù)的系統(tǒng),包括以下步驟:
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中特征排列的隨機(jī)性確保了特征鄰近關(guān)系的多樣性,從而提高了cnn的特征提取能力。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中矩陣的規(guī)模根據(jù)特征數(shù)目和任務(wù)需求進(jìn)行調(diào)整,以確保資源利用的最優(yōu)化。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),進(jìn)一步包括一種數(shù)據(jù)增強(qiáng)技術(shù),基于初始特征的組合和排列生成多個(gè)矩陣,以提高模型的泛化能力。
5.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,用于通過(guò)卷積神經(jīng)網(wǎng)絡(luò)分析表格數(shù)據(jù),該方法包括:
6.根據(jù)權(quán)利要求5所述的方法,其中所述的特征擴(kuò)展包括將原始特征隨機(jī)排列多次,以便形成多個(gè)可能的近鄰關(guān)系組合。
7.根據(jù)權(quán)利要求5所述的方法,其中所述的矩陣生成步驟包括通過(guò)重復(fù)選定特征來(lái)增加某些關(guān)鍵特征的權(quán)重。
8.一種計(jì)算機(jī)程序產(chǎn)品,其包括一個(gè)或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,所述指令在被計(jì)算設(shè)備執(zhí)行時(shí),使得所述計(jì)算設(shè)備執(zhí)行權(quán)利要求1至7中任一項(xiàng)的方法。
9.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)程序產(chǎn)品,其中所述指令進(jìn)一步配置用于調(diào)整輸入矩陣的大小和形狀,以適應(yīng)不同規(guī)模的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。