用于生成圖像的初始超像素標(biāo)簽圖的方法和裝置與流程

文檔序號(hào)：11288939閱讀：463來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本原理涉及一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法和裝置。特別地，本原理涉及一種用于使用快速標(biāo)簽傳播方案從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法和裝置。
背景技術(shù)：
：超像素算法代表用于廣泛的計(jì)算機(jī)視覺應(yīng)用(分割、圖像解析、分類等)的非常有用的和越來越流行的預(yù)處理步驟。將相似的像素分組成所謂的超像素導(dǎo)致圖像基元的較大減少，即允許對(duì)圖像進(jìn)行完整描述的特征的較大減少，其為后續(xù)處理步驟帶來增加的計(jì)算效率或者考慮到更復(fù)雜的算法，這在像素級(jí)上會(huì)是計(jì)算上不可行的，并且為基于區(qū)域的特征創(chuàng)建空間支持。超像素算法將像素分組成超像素，“它們是局部的、連貫的，并且以感興趣的規(guī)模保留大部分分割所需的結(jié)構(gòu)”[1]。超像素應(yīng)該“在大小和形狀上大致均勻”[1]。用于視頻內(nèi)容的許多近來的超像素算法依賴于密集光流向量來將分割結(jié)果從一幀傳播到下一幀。對(duì)光流質(zhì)量對(duì)于過分割質(zhì)量的影響的評(píng)估表明，對(duì)于具有大的物體位移和相機(jī)運(yùn)動(dòng)的視頻來說，其為不可或缺的。然而，歸因于高計(jì)算成本，高質(zhì)量的、密集光流的計(jì)算不適用于實(shí)時(shí)應(yīng)用。技術(shù)實(shí)現(xiàn)要素：本發(fā)明的目的是提出一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的改進(jìn)的解決方案。根據(jù)本原理的一個(gè)方面，一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法包括：-確定當(dāng)前圖像中的特征；-追蹤所確定的特征回到先前圖像中；以及-基于所追蹤的特征，將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。因此，一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，具有其中存儲(chǔ)的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的指令，當(dāng)所述指令由計(jì)算機(jī)執(zhí)行時(shí)，使得計(jì)算機(jī)：-確定當(dāng)前圖像中的特征；-追蹤所確定的特征回到先前圖像中；以及-基于所追蹤的特征，將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)是非臨時(shí)性的易失性或非易失性存儲(chǔ)介質(zhì)，諸如例如硬盤、光盤或磁盤或磁帶、固態(tài)存儲(chǔ)設(shè)備等。因此存儲(chǔ)介質(zhì)有形地體現(xiàn)可由計(jì)算機(jī)或處理設(shè)備執(zhí)行的指令的程序，以執(zhí)行如在此描述的程序步驟。此外，在一個(gè)實(shí)施例中，一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置包括：-特征檢測(cè)器，其被配置為確定當(dāng)前圖像中的特征；-特征追蹤器，其被配置為追蹤所確定的特征回到先前圖像中；以及-變換器，其被配置為基于所追蹤的特征，將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。在另一實(shí)施例中，一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置包括處理設(shè)備和存儲(chǔ)設(shè)備，所述存儲(chǔ)設(shè)備具有其中存儲(chǔ)的指令，當(dāng)所述指令由處理設(shè)備執(zhí)行時(shí)，使得所述裝置：-確定當(dāng)前圖像中的特征；-追蹤所確定的特征回到先前圖像中；以及-基于所追蹤的特征，將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。為了對(duì)超像素標(biāo)簽圖進(jìn)行變換，對(duì)于當(dāng)前圖像和先前圖像從所確定的特征生成由三角形組成的網(wǎng)格。然后將當(dāng)前圖像的網(wǎng)格向后變形到先前圖像的網(wǎng)格上。為此目的，針對(duì)當(dāng)前圖像中的每個(gè)三角形，確定用于將該三角形變換成先前圖像中的對(duì)應(yīng)三角形的仿射變換的變換矩陣。使用所確定的變換矩陣，將當(dāng)前圖像中的每個(gè)像素的坐標(biāo)變換成先前圖像中的經(jīng)變換的坐標(biāo)。然后，在每個(gè)像素位置處，利用在對(duì)應(yīng)的經(jīng)變換的像素位置處關(guān)聯(lián)到先前圖像的標(biāo)簽圖的標(biāo)簽，對(duì)當(dāng)前圖像的超像素標(biāo)簽圖進(jìn)行初始化。所提出的解決方案使用在稀疏特征追蹤和基于網(wǎng)格的圖像變形的基礎(chǔ)上的快速標(biāo)簽傳播方案。歸因于處理成本的大幅降低，該方法顯著加快了傳播處理。同時(shí)，最終的超像素分割質(zhì)量與使用高質(zhì)量的、密集光流的方法相當(dāng)。在一個(gè)實(shí)施例中，將經(jīng)變換的坐標(biāo)剪裁到最近的有效像素位置。以這種方式，確保對(duì)于當(dāng)前圖像的超像素標(biāo)簽圖中的每個(gè)像素位置，從關(guān)聯(lián)到先前圖像的標(biāo)簽圖中分配的標(biāo)簽是明確的。在一個(gè)實(shí)施例中，在當(dāng)前圖像和先前圖像的每個(gè)角落處和每個(gè)邊界的中心處添加特征。這確保每個(gè)像素被三角形覆蓋。在一個(gè)實(shí)施例中，將與初始超像素標(biāo)簽圖中的主要大量超像素分離的像素分配給相鄰超像素。這保證了超像素的空間一致性。所描述的方法不僅適用于時(shí)間圖像序列。它同樣可以用于多視圖圖像的各個(gè)圖像并且甚至用于多視圖圖像的序列。附圖說明圖1a)-b)示出了兩個(gè)原始剪裁幀k和k+1；圖2a)-b)示出了在幀k+1中找到并且追蹤回到幀k中的稀疏特征；圖3a)-b)描繪了從特征點(diǎn)的三角測(cè)量中獲得并且通過所追蹤的特征的移動(dòng)而形變的網(wǎng)格；圖4a)-b)圖示了通過根據(jù)用于幀k+1的初始化的網(wǎng)格的形變的仿射變換進(jìn)行的幀k的超像素標(biāo)簽圖的變形；圖5圖示了從幀k到幀k+1的被三角形覆蓋的標(biāo)簽信息的變形；圖6示出了作為每幀分割質(zhì)量的度量的2d邊界回憶；圖7描繪了關(guān)于超體素的數(shù)量繪制的3d欠分割誤差；圖8示出了關(guān)于每幀超像素的數(shù)量的3d欠分割誤差；圖9描繪了關(guān)于每幀超像素的數(shù)量的平均時(shí)間長度；圖10示意性地圖示了用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法的實(shí)施例；圖11示意性地描繪了根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置的一個(gè)實(shí)施例；以及圖12示意性地圖示了根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置的另一實(shí)施例。具體實(shí)施方式為了更好地理解，現(xiàn)在將參照附圖在下面的描述中更詳細(xì)地解釋一些實(shí)施例的原理。應(yīng)當(dāng)理解，所提出的解決方案不限于這些示例性實(shí)施例，并且在不脫離如所附權(quán)利要求中限定的本原理的范圍的情況下，也可以方便地組合和/或修改特定特征。針對(duì)兩個(gè)采樣視頻幀k(圖1a)中示出)和k+1(圖1b)中示出)，用于快速標(biāo)簽傳播的當(dāng)前方法在圖1至圖4中可視化。在圖1中，原始幀被剪裁。在時(shí)間圖像序列的情況下，幀k和k+1是時(shí)間上連續(xù)的幀，盡管不一定是緊接連續(xù)的幀。在多視圖圖像的情況下，幀k和k+1是空間上相鄰的幀，盡管不一定是直接相鄰的幀。例如，在[3]和[4]中，代替如所進(jìn)行的計(jì)算密集光流，在當(dāng)前幀k與下一幀k+1之間僅追蹤一組稀疏特征，下一幀k+1的超像素標(biāo)簽圖需要被初始化。使用例如哈里斯角檢測(cè)器來針對(duì)幀k+1計(jì)算特征。在一個(gè)實(shí)施例中，使用[5]中描述的方法來選擇所謂的“良好”特征。使用例如kanade-lucas-tomasi(klt)特征追蹤器，這些特征被追蹤回到幀k。圖2示出了在幀k+1中找到的稀疏特征，在圖2b)中描繪，并被追蹤回到幀k，在圖2a)中描繪。如在[2]中提出的那樣，聚類過濾器消除可能的異常值。例如，使用delaunay三角測(cè)量，從幀k+1的特征生成網(wǎng)格，如圖3b)中所示。隨后，使用由klt特征追蹤器提供的信息，將網(wǎng)格(向后)變形到幀k的超像素標(biāo)簽圖上，如圖3a)中所示。在每個(gè)三角形中假設(shè)分段平面的情況下，使用仿射變換(具有變換矩陣)將每個(gè)三角形內(nèi)的標(biāo)簽從幀k(向前)變形到幀k+1上，如圖5中可見。使用三角形的三個(gè)追蹤特征點(diǎn)來確定幀k+1與k之間的每個(gè)三角形i的均勻坐標(biāo)中的變換矩陣ti，k+1：矩陣元素t1,i至t4,i確定旋轉(zhuǎn)、剪切和縮放，而元素t5,i至t6,i確定平移。使用該三角形的變換矩陣，可以將幀k+1中每個(gè)像素的均勻坐標(biāo)變換成幀k的坐標(biāo)將坐標(biāo)剪裁到最近的有效像素位置。這些用于查找?guī)琸的超像素標(biāo)簽圖中的標(biāo)簽，其在圖4a)中示出。針對(duì)幀k+1的生成的標(biāo)簽圖在圖4b)中示出。為了確保每個(gè)像素被三角形覆蓋，幀的四角處的特征和每個(gè)幀邊界的中間處的特征被插入和追蹤。有時(shí)在變形之后，由于變換，一些像素與主要大量的超像素分離。由于必須確保超像素的空間一致性，所以這些小部分被識(shí)別并分配給直接相鄰的超像素。由于在使用密集光流的情況下該步驟也是必需的，所以它不會(huì)產(chǎn)生額外的計(jì)算開銷。為了分析所提出的方法的性能，已經(jīng)執(zhí)行了一些基準(zhǔn)測(cè)量。結(jié)果呈現(xiàn)在圖6至圖9中。圖6示出了作為每幀分割質(zhì)量的度量的2d邊界回憶。圖7描繪了關(guān)于超體素的數(shù)量繪制的3d欠分割誤差。圖8示出了關(guān)于每幀超像素的數(shù)量的3d欠分割誤差。最后，圖9描繪了關(guān)于每幀超像素的數(shù)量的平均時(shí)間長度。為了比較而包括以下方法：·streamgbh(基于圖形的流式分層視頻分割)，作為超體素算法的類別的代表[6]；·四個(gè)版本的tsp(時(shí)間超像素)：原始版本[3]，利用horn&schunck[8]作為密集光流(w/hs)，無光流(w/o光流)，以及利用在此提出的方法(w/網(wǎng)格)；·四個(gè)版本的tcs(時(shí)間一致超像素)：原始版本[4]，利用horn&schunck作為密集光流(w/hs)，無光流(w/o光流)，以及利用在此提出的方法(w/網(wǎng)格)；·onlinevideoseeds，作為最先進(jìn)的方法，沒有利用光流信息[7]。從圖可以看出，所提出的基于網(wǎng)格的傳播方法產(chǎn)生相當(dāng)?shù)姆指钫`差，而平均時(shí)間長度僅略微降低。雖然2d邊界回憶對(duì)于方法tspw/網(wǎng)格而言保持不變，但是對(duì)于方法tcsw/網(wǎng)格而言它甚至是改進(jìn)的。為了在計(jì)算成本方面評(píng)估運(yùn)行時(shí)間性能改進(jìn)，測(cè)量了基于密集光流的標(biāo)簽傳播和基于網(wǎng)格的傳播的平均運(yùn)行時(shí)間。因此，在原始版本的tsp和tcs以及horn&schunck實(shí)現(xiàn)方式中使用的標(biāo)簽傳播方法被用作參考。在具有32gb的ram的因特爾i7-3770k@3.50ghz上完成了性能基準(zhǔn)。結(jié)果總結(jié)在表1中。從表1可以看出，所提出的方法執(zhí)行超像素標(biāo)簽傳播任務(wù)比原始提出的方法快100倍以上，同時(shí)創(chuàng)建幾乎相同的分割質(zhì)量，如圖6至圖9中可見。標(biāo)簽傳播方法平均時(shí)間/幀tsp和tcs中使用的方法814.9毫秒horn&schunck114.3毫秒所提出的方法6.1毫秒表1-將超像素標(biāo)簽圖傳播到新的幀上所需的平均運(yùn)行時(shí)間圖10示意性地圖示了用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法的一個(gè)實(shí)施例。在第一步驟中，確定10當(dāng)前圖像中的特征。然后追蹤11所確定的特征回到先前圖像中?；谒粉櫟奶卣鳎瑢⑴c先前圖像相關(guān)聯(lián)的超像素標(biāo)簽圖變換12成當(dāng)前圖像的初始超像素標(biāo)簽圖。在圖11中示意性地描繪根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置20的一個(gè)實(shí)施例。裝置20具有輸入端21，用于例如從網(wǎng)絡(luò)或外部存儲(chǔ)系統(tǒng)接收?qǐng)D像序列。替選地，從本地存儲(chǔ)單元22取回圖像序列。特征檢測(cè)器23確定10當(dāng)前圖像中的特征。然后，特征追蹤器24追蹤11所確定的特征回到先前圖像中?；谒粉櫟奶卣鳎儞Q器25將與先前圖像相關(guān)聯(lián)的超像素標(biāo)簽圖變換12成當(dāng)前圖像的初始超像素標(biāo)簽圖。所得到的初始超像素標(biāo)簽圖優(yōu)選地經(jīng)由輸出端26成為可用。其也可以存儲(chǔ)在本地存儲(chǔ)單元22上。輸出端26還可以與輸入端21組合成單個(gè)雙向接口。不同的單元23、24、25中的每一個(gè)可以被實(shí)現(xiàn)為不同的處理器。當(dāng)然，不同的單元23、24、25同樣可以完全或部分地組合成單個(gè)單元或者實(shí)現(xiàn)為在處理器上運(yùn)行的軟件。在圖12中示意性地示出根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置30的另一個(gè)實(shí)施例。裝置30包括處理設(shè)備31和存儲(chǔ)設(shè)備32，存儲(chǔ)設(shè)備32存儲(chǔ)指令，當(dāng)指令被執(zhí)行時(shí)，使裝置執(zhí)行根據(jù)所描述的方法之一的步驟。例如，處理設(shè)備31可以是適應(yīng)于執(zhí)行根據(jù)所描述的方法之一的步驟的處理器。在實(shí)施例中，所述適應(yīng)包括：處理器被配置例如編程為以執(zhí)行根據(jù)所描述的方法之一的步驟。在此使用的處理器可以包括一個(gè)或多個(gè)處理單元，諸如微處理器、數(shù)字信號(hào)處理器或其組合。本地存儲(chǔ)單元22和存儲(chǔ)設(shè)備32可以包括易失性和/或非易失性存儲(chǔ)器區(qū)域，以及諸如硬盤驅(qū)動(dòng)器和dvd驅(qū)動(dòng)器的存儲(chǔ)設(shè)備。存儲(chǔ)器的一部分是可由處理設(shè)備31讀取的非臨時(shí)性程序存儲(chǔ)設(shè)備，其有形地體現(xiàn)可由處理設(shè)備31執(zhí)行的指令的程序，以執(zhí)行根據(jù)本原理在此描述的程序步驟。參考文獻(xiàn)[1]ren等人:“l(fā)earningaclassificationmodelforsegmentation”,ieeeinternationalconferenceoncomputervision(iccv)(2003),第10–17頁。[2]munderloh等人:“mesh-basedglobalmotioncompensationforrobustmosaickinganddetectionofmovingobjectsinaerialsurveillance”,ieeecomputersocietyconferenceoncomputervisionandpatternrecognition(cvpr)(2011),1stworkshopofaerialvideoprocessing(wavp),第1–6頁。[3]chang等人:“avideorepresentationusingtemporalsuperpixels”,ieeeconferenceoncomputervisionandpatternrecognition(cvpr)(2013),第2051–2058頁。[4]reso等人:“superpixelsforvideocontentusingacontour-basedemoptimization”,asianconferenceoncomputervision(accv)(2014),第1–16頁。[5]shi等人:“goodfeaturestotrack”,ieeeconferenceoncomputervisionandpatternrecognition(cvpr)(1994),第593-600頁。[6]xu等人:“streaminghierarchicalvideosegmentation”,europeanconferenceoncomputervision(eccv)(2012),第1-14頁。[7]vandenbergh等人:“onlinevideoseedsfortemporalwindowobjectness”,ieeeinternationalconferenceoncomputervision(iccv)(2013),第377–384頁。[8]horn等人:“determiningopticalflow”,artificialintelligence,vol.17(1981),第185–203頁。當(dāng)前第1頁12

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：J.雅查爾斯基;B.羅森哈恩;M.雷索
技術(shù)所有人：湯姆遜許可公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像像素相關(guān)技術(shù)

opencv遍歷圖像像素相關(guān)技術(shù)

matlab提取圖像像素點(diǎn)相關(guān)技術(shù)

opencv讀取圖像像素值相關(guān)技術(shù)

matlab遍歷圖像像素相關(guān)技術(shù)

opencv訪問圖像像素相關(guān)技術(shù)

matlab獲取圖像像素值相關(guān)技術(shù)

重定圖像像素相關(guān)技術(shù)

matlab讀取圖像像素值相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于生成圖像的初始超像素標(biāo)簽圖的方法和裝置與流程