本發(fā)明涉及圖像識(shí)別處理,特別是一種基于圖像識(shí)別生成3d柜體的方法。
背景技術(shù):
1、隨著計(jì)算機(jī)視覺和人工智能技術(shù)的迅猛發(fā)展,圖像識(shí)別在各個(gè)領(lǐng)域得到了廣泛應(yīng)用,尤其是在三維建模和設(shè)計(jì)領(lǐng)域。傳統(tǒng)的三維建模技術(shù)通常依賴于專業(yè)軟件和設(shè)計(jì)師的經(jīng)驗(yàn),這些方法不僅耗時(shí),而且需要較高的技術(shù)門檻。近年來,基于圖像識(shí)別的三維模型生成方法逐漸興起,通過分析二維圖像中的信息,自動(dòng)生成三維模型。特別是在家具設(shè)計(jì)、建筑設(shè)計(jì)等領(lǐng)域,手繪草圖的數(shù)字化轉(zhuǎn)型極大地提升了設(shè)計(jì)效率,并為設(shè)計(jì)師提供了更加直觀的創(chuàng)作手段,但現(xiàn)有技術(shù)仍存在不足,傳統(tǒng)的去噪和圖像增強(qiáng)方法往往依賴于簡(jiǎn)單的圖像處理算法,無法有效處理手繪草圖中常見的噪聲和模糊問題,且缺乏針對(duì)模型幾何結(jié)構(gòu)的優(yōu)化方法,導(dǎo)致生成的模型在設(shè)計(jì)的準(zhǔn)確性和可操作性上不足。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述現(xiàn)有的基于圖像識(shí)別生成3d柜體的方法中存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明所要解決的問題在于傳統(tǒng)的去噪和圖像增強(qiáng)方法往往依賴于簡(jiǎn)單的圖像處理算法,無法有效處理手繪草圖中常見的噪聲和模糊問題,且缺乏針對(duì)模型幾何結(jié)構(gòu)的優(yōu)化方法,導(dǎo)致生成的模型在設(shè)計(jì)的準(zhǔn)確性和可操作性上不足。
3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種基于圖像識(shí)別生成3d柜體的方法,其包括,獲取柜體設(shè)計(jì)手繪草圖進(jìn)行灰度處理,并使用稀疏矩陣分解進(jìn)行手繪草圖去噪增強(qiáng)處理;提取草圖設(shè)計(jì)線條和尺寸,利用三維卷積神經(jīng)網(wǎng)絡(luò)建立初始三維柜體模型;基于空間幾何推理優(yōu)化初始三維柜體模型并輸出設(shè)計(jì)三維柜體模型;展示設(shè)計(jì)三維柜體模型并存儲(chǔ)至數(shù)據(jù)庫。
4、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述獲取柜體設(shè)計(jì)手繪草圖進(jìn)行灰度處理指使用掃描設(shè)備掃描柜體設(shè)計(jì)紙質(zhì)文件獲取柜體設(shè)計(jì)手繪草圖的正視圖、側(cè)視圖、俯視圖以及剖視圖,對(duì)柜體設(shè)計(jì)手繪草圖中每個(gè)像素進(jìn)行灰度處理,形成單通道的灰度圖像,同步獲取設(shè)計(jì)人員身份標(biāo)識(shí)作為水印添加至設(shè)計(jì)手繪草圖中。
5、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述使用稀疏矩陣分解進(jìn)行手繪草圖去噪增強(qiáng)處理包括,
6、從獨(dú)立高斯分布生成隨機(jī)高斯矩陣a,維度為m*n,將灰度圖像通過隨機(jī)高斯矩陣a投影至低維空間得到壓縮信號(hào)y;
7、定義生成冗余字典的gabor函數(shù)如下:
8、;
9、其中,為冗余字典的原子,為尺度參數(shù),為時(shí)間平移,為頻率參數(shù),為相位偏移,為時(shí)頻參數(shù);
10、對(duì)gabor函數(shù)的時(shí)頻參數(shù)進(jìn)行離散化,生成不同原子組成冗余字典d:
11、;
12、其中k為冗余字典中原子數(shù)量;
13、根據(jù)冗余字典對(duì)壓縮信號(hào)y進(jìn)行分解:
14、,
15、其中為稀疏系數(shù)向量;
16、設(shè)定初始?xì)埐睿蛹蠟榭占?,開始進(jìn)行迭代,在每次迭代中基于nsga-ⅲ多目標(biāo)優(yōu)化算法定義優(yōu)化目標(biāo)函數(shù)為:
17、;
18、其中為第i次迭代的殘差,為第i次迭代的原子集合,為冗余字典中第j個(gè)原子,為原子與殘差的內(nèi)積,為原子與原子集合中原子的內(nèi)積;
19、在每次迭代中,使用遺傳算法進(jìn)行交叉和變異操作生成下一代候選原子,基于非支配排序機(jī)制選擇最優(yōu)原子,將最優(yōu)原子添加入原子集合,基于原子集合組成冗余字典子集,并更新稀疏系數(shù)向量和殘差;
20、達(dá)到預(yù)設(shè)的最大稀疏度后停止迭代,輸出迭代后的冗余字典子集和稀疏系數(shù)向量;
21、使用迭代后的稀疏系數(shù)向量重構(gòu)壓縮信號(hào),通過隨機(jī)高斯矩陣a的逆矩陣將重構(gòu)壓縮信號(hào)重新轉(zhuǎn)換為去噪增強(qiáng)的灰度圖像。
22、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述提取草圖設(shè)計(jì)線條和尺寸指使用canny算法對(duì)去噪增強(qiáng)的灰度圖像進(jìn)行邊緣檢測(cè)提取邊緣圖像,使用hough變換檢測(cè)識(shí)別邊緣圖像中的設(shè)計(jì)線條,并使用ocr技術(shù)對(duì)去噪增強(qiáng)的灰度圖像進(jìn)行字符識(shí)別提取尺寸數(shù)據(jù),并將提取后的尺寸信息與設(shè)計(jì)線條進(jìn)行對(duì)應(yīng)標(biāo)記。
23、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述利用三維卷積神經(jīng)網(wǎng)絡(luò)建立初始三維柜體模型指對(duì)手繪草圖中的正視圖、側(cè)視圖、俯視圖以及剖視圖進(jìn)行灰度處理和去噪處理,并提取設(shè)計(jì)線條和尺寸信息;
24、構(gòu)建三維卷積神經(jīng)網(wǎng)絡(luò),設(shè)定輸入為正視圖、側(cè)視圖、俯視圖以及剖視圖的設(shè)計(jì)線條和尺寸信息,輸出為三維點(diǎn)云數(shù)據(jù),定義均方誤差為損失函數(shù),使用adam優(yōu)化器對(duì)三維卷積神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化;
25、將提取出的設(shè)計(jì)線條和尺寸信息輸入訓(xùn)練好的三維卷積神經(jīng)網(wǎng)絡(luò),得到設(shè)計(jì)方案的三維點(diǎn)云數(shù)據(jù);
26、使用泊松表面重建算法根據(jù)設(shè)計(jì)方案三維點(diǎn)云數(shù)據(jù)生成初始三維柜體模型,并應(yīng)用簡(jiǎn)化算法對(duì)初始三維柜體模型進(jìn)行簡(jiǎn)化。
27、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述基于空間幾何推理優(yōu)化初始三維柜體模型并輸出設(shè)計(jì)三維柜體模型指將初始三維柜體模型導(dǎo)入處理環(huán)境中,對(duì)模型的每個(gè)面計(jì)算法向量:
28、;
29、其中為法向量,以及為面上的三個(gè)頂點(diǎn);
30、定義幾何約束條件,將法向量和模型頂點(diǎn)作為初始粒子,使用粒子群優(yōu)化算法調(diào)整模型頂點(diǎn)和法向量直至滿足幾何約束條件后停止;
31、使用更新后的模型頂點(diǎn)和法向量重構(gòu)形成設(shè)計(jì)三維柜體模型進(jìn)行輸出。
32、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述展示設(shè)計(jì)三維柜體模型指根據(jù)設(shè)計(jì)手繪草圖中的水印識(shí)別設(shè)計(jì)人員,將初始三維柜體模型和設(shè)計(jì)三維柜體模型進(jìn)行輸出,并收集設(shè)計(jì)人員反饋意見進(jìn)行設(shè)計(jì)三維柜體模型細(xì)節(jié)優(yōu)化直至完全滿足設(shè)計(jì)人員要求。
33、作為本發(fā)明所述基于圖像識(shí)別生成3d柜體的方法的一種優(yōu)選方案,其中:所述存儲(chǔ)至數(shù)據(jù)庫指獲取設(shè)計(jì)人員身份標(biāo)識(shí)、設(shè)計(jì)手繪草圖以及設(shè)計(jì)三維柜體模型形成數(shù)據(jù)集合存儲(chǔ)至數(shù)據(jù)庫中,并按照設(shè)計(jì)人員身份和時(shí)間進(jìn)行分類標(biāo)記,定期對(duì)數(shù)據(jù)庫中存儲(chǔ)數(shù)據(jù)進(jìn)行完整性檢測(cè),在檢測(cè)完畢后同步將存儲(chǔ)數(shù)據(jù)上傳至云端進(jìn)行備份。
34、一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述基于圖像識(shí)別生成3d柜體的方法的步驟。
35、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述基于圖像識(shí)別生成3d柜體的方法的步驟。
36、本發(fā)明有益效果為:本發(fā)明通過獲取設(shè)計(jì)手繪草圖多視角視圖進(jìn)行灰度處理,并使用稀疏分解和遺傳算法進(jìn)行去噪增強(qiáng)處理后提取設(shè)計(jì)線條和尺寸信息,大幅提升了設(shè)計(jì)方案識(shí)別的精準(zhǔn)性和正確率,通過使用三維卷積神經(jīng)網(wǎng)絡(luò)生成初始三維模型并使用空間幾何推理進(jìn)行優(yōu)化,有效提高了三維模型的精度和生成速度。
1.一種基于圖像識(shí)別生成3d柜體的方法,其特征在于:包括,
2.如權(quán)利要求1所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述獲取柜體設(shè)計(jì)手繪草圖進(jìn)行灰度處理指使用掃描設(shè)備掃描柜體設(shè)計(jì)紙質(zhì)文件獲取柜體設(shè)計(jì)手繪草圖的正視圖、側(cè)視圖、俯視圖以及剖視圖,對(duì)柜體設(shè)計(jì)手繪草圖中每個(gè)像素進(jìn)行灰度處理,形成單通道的灰度圖像,同步獲取設(shè)計(jì)人員身份標(biāo)識(shí)作為水印添加至設(shè)計(jì)手繪草圖中。
3.如權(quán)利要求2所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述使用稀疏矩陣分解進(jìn)行手繪草圖去噪增強(qiáng)處理包括,
4.如權(quán)利要求3所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述提取草圖設(shè)計(jì)線條和尺寸指使用canny算法對(duì)去噪增強(qiáng)的灰度圖像進(jìn)行邊緣檢測(cè)提取邊緣圖像,使用hough變換檢測(cè)識(shí)別邊緣圖像中的設(shè)計(jì)線條,并使用ocr技術(shù)對(duì)去噪增強(qiáng)的灰度圖像進(jìn)行字符識(shí)別提取尺寸數(shù)據(jù),并將提取后的尺寸信息與設(shè)計(jì)線條進(jìn)行對(duì)應(yīng)標(biāo)記。
5.如權(quán)利要求4所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述利用三維卷積神經(jīng)網(wǎng)絡(luò)建立初始三維柜體模型指對(duì)手繪草圖中的正視圖、側(cè)視圖、俯視圖以及剖視圖進(jìn)行灰度處理和去噪處理,并提取設(shè)計(jì)線條和尺寸信息;
6.如權(quán)利要求5所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述展示設(shè)計(jì)三維柜體模型指根據(jù)設(shè)計(jì)手繪草圖中的水印識(shí)別設(shè)計(jì)人員,將初始三維柜體模型和設(shè)計(jì)三維柜體模型進(jìn)行輸出,并收集設(shè)計(jì)人員反饋意見進(jìn)行設(shè)計(jì)三維柜體模型細(xì)節(jié)優(yōu)化直至完全滿足設(shè)計(jì)人員要求。
7.如權(quán)利要求6所述的基于圖像識(shí)別生成3d柜體的方法,其特征在于:所述存儲(chǔ)至數(shù)據(jù)庫指獲取設(shè)計(jì)人員身份標(biāo)識(shí)、設(shè)計(jì)手繪草圖以及設(shè)計(jì)三維柜體模型形成數(shù)據(jù)集合存儲(chǔ)至數(shù)據(jù)庫中,并按照設(shè)計(jì)人員身份和時(shí)間進(jìn)行分類標(biāo)記,定期對(duì)數(shù)據(jù)庫中存儲(chǔ)數(shù)據(jù)進(jìn)行完整性檢測(cè),在檢測(cè)完畢后同步將存儲(chǔ)數(shù)據(jù)上傳至云端進(jìn)行備份。
8.一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于:所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的基于圖像識(shí)別生成3d柜體的方法的步驟。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于:所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的基于圖像識(shí)別生成3d柜體的方法的步驟。