亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖像檢測(cè)方法和裝置與流程

文檔序號(hào):12675179閱讀:175來源:國知局
本發(fā)明涉及圖像處理
技術(shù)領(lǐng)域
:,尤其涉及一種圖像檢測(cè)方法和裝置。
背景技術(shù)
::隨著數(shù)碼攝像設(shè)備的成熟和普及,人們已經(jīng)能夠非常方便快捷地記錄現(xiàn)實(shí)世界在不同視角下的方方面面。而作為人類語言的可視化文本,在人類活動(dòng)中具有特殊而不可替代的地位。自然場(chǎng)景文字檢測(cè)是計(jì)算機(jī)視覺與模式識(shí)別技術(shù)在目標(biāo)檢測(cè)與識(shí)別領(lǐng)域中的重要研究課題之一。該技術(shù)目的在于在所拍攝的自然場(chǎng)景圖像中準(zhǔn)確地檢測(cè)出文字信息,其在自然場(chǎng)景理解與分析、機(jī)器人輔助導(dǎo)航、視頻檢索、盲人輔助閱讀及文字翻譯等方面有廣泛的應(yīng)用前景。目前,自然場(chǎng)景文本檢測(cè)方法分為兩種:基于滑動(dòng)窗口的方法和基于連通區(qū)域的方法?;诨瑒?dòng)窗口的方法,是指將多尺度的窗口在圖像中從左到右、從上到下進(jìn)行滑動(dòng),并對(duì)滑動(dòng)窗口內(nèi)的圖像進(jìn)行分類,判斷其是否為文字區(qū)域,為了能夠檢測(cè)所有的文本區(qū)域,該方法通常需要大量的滑動(dòng)窗口,導(dǎo)致計(jì)算復(fù)雜度增高,并不能達(dá)到實(shí)時(shí)的要求。基于連通區(qū)域的方法,是指根據(jù)文本固有的屬性,如顏色、紋理、筆劃寬度等,對(duì)像素進(jìn)行相似性聚類,生成大量的連通區(qū)域,并對(duì)連通區(qū)域進(jìn)行特征(如文字高度、寬度和間距等)提取,過濾非文本區(qū)域,從而完成文本檢測(cè),相對(duì)于基于滑動(dòng)窗口的方法,該方法的計(jì)算量相對(duì)減少,但是對(duì)要求連通區(qū)域的提取有很高的要求,即所提取的連通區(qū)域要包括所有的文字區(qū)域,并且很難有效地應(yīng)對(duì)復(fù)雜背景的情況。技術(shù)實(shí)現(xiàn)要素:為解決相關(guān)技術(shù)問題,本發(fā)明提供一種圖像檢測(cè)方法和裝置,可實(shí)現(xiàn)快速、準(zhǔn)確地在復(fù)雜自然場(chǎng)景中提檢測(cè)出文字區(qū)域。為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例采用如下技術(shù)方案:第一方面,本發(fā)明實(shí)施例提供了一種圖像檢測(cè)方法,包括:獲取待檢測(cè)圖像;從所述待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,所述MSER區(qū)域?yàn)檫B通區(qū)域;過濾所述MSER區(qū)域,得到所述待檢測(cè)圖像中的文本區(qū)域。第二方面,本發(fā)明實(shí)施例還對(duì)應(yīng)地提供了一種圖像檢測(cè)裝置,包括:待檢測(cè)圖像獲取模塊,用于獲取待檢測(cè)圖像;MSER區(qū)域提取模塊,用于從所述待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,所述MSER區(qū)域?yàn)檫B通區(qū)域;MSER區(qū)域過濾模塊,用于過濾所述MSER區(qū)域,得到所述待檢測(cè)圖像中的文本區(qū)域。本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果:本技術(shù)方案中,獲取待檢測(cè)圖像,從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,最大穩(wěn)定極值區(qū)域?yàn)檫B通區(qū)域,過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。通過從待檢測(cè)圖像中提取MSER區(qū)域,以劃分連通區(qū)域的方式提取MSER區(qū)域作為候選區(qū)域,再對(duì)提取到的MSER區(qū)域進(jìn)行過濾篩選,最終得到待檢測(cè)圖像中的文本區(qū)域,區(qū)域劃分有利于減少計(jì)算量、提高檢測(cè)效率,同時(shí)提取MSER區(qū)域可減少圖像背景的干擾,可提高在檢測(cè)背景復(fù)雜的待檢測(cè)圖像時(shí)的準(zhǔn)確率。附圖說明為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)本發(fā)明實(shí)施例的內(nèi)容和這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例一提供的一種圖像檢測(cè)方法的流程示意圖;圖2A是本發(fā)明實(shí)施例二提供的一種圖像檢測(cè)方法的流程示意圖;圖2B是圖2A中S250的可選實(shí)施方式的流程示意圖;圖2C是本發(fā)明實(shí)施例二中使用的卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)示意圖;圖3是本發(fā)明實(shí)施例三提供的一種圖像檢測(cè)裝置的架構(gòu)示意圖;圖4A是本發(fā)明實(shí)施例四提供的一種圖像檢測(cè)裝置的架構(gòu)示意圖;圖4B是圖4A中MSER區(qū)域過濾模塊450的可選實(shí)施方式的架構(gòu)示意圖。具體實(shí)施方式為使本發(fā)明解決的技術(shù)問題、采用的技術(shù)方案和達(dá)到的技術(shù)效果更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施例的技術(shù)方案作進(jìn)一步的詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。實(shí)施例一請(qǐng)參考圖1,其是本發(fā)明實(shí)施例一提供的一種圖像檢測(cè)方法的流程示意圖。本實(shí)施例的方法可以由配置有攝像頭的智能手機(jī)、平板電腦或筆記本電腦等移動(dòng)設(shè)備來執(zhí)行,可適用于檢測(cè)識(shí)別自然場(chǎng)景圖像中文本區(qū)域的情況。本實(shí)施例提供的一種圖像檢測(cè)方法,可以包括以下步驟:S110:獲取待檢測(cè)圖像。示例性的,在本發(fā)明實(shí)施例中,待檢測(cè)圖像可以為原始圖像,也可以為對(duì)原始圖像經(jīng)過預(yù)處理的得到的圖像。在本發(fā)明的一個(gè)實(shí)施例中,優(yōu)選將原始圖像進(jìn)行預(yù)處理得到待檢測(cè)圖像。S120:從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域。示例性的,最大穩(wěn)定極值(MaximallyStableExtrernalRegions,MSER)區(qū)域是指待檢測(cè)圖像經(jīng)過一定的閾值變化后形成的連通區(qū)域,可以從待檢測(cè)圖像中提取出多個(gè)MSER區(qū)域,可以連通區(qū)域的最小外接矩形來表示MSER區(qū)域。其中,同一個(gè)連通區(qū)域內(nèi)的顏色、紋理、字符筆畫寬度等特征基本相同。在待檢測(cè)圖像中所顯示的每個(gè)矩形框均代表一個(gè)MSER區(qū)域,可以從待檢測(cè)圖像中提取出多個(gè)MSER區(qū)域,也可能提取不出MSER區(qū)域,即待檢測(cè)圖像中沒有文本區(qū)域。S130:過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。示例性的,過濾MSER區(qū)域的方法有很多,例如根據(jù)MSER區(qū)域的區(qū)域特征來過濾。在本發(fā)明的實(shí)施例二提供了一種過濾MSER區(qū)域的可選實(shí)施方式,在此不加以贅述。綜上,在本技術(shù)方案中,獲取待檢測(cè)圖像,從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,最大穩(wěn)定極值區(qū)域?yàn)檫B通區(qū)域,過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。通過從待檢測(cè)圖像中提取MSER區(qū)域,以劃分連通區(qū)域的方式提取MSER區(qū)域作為候選區(qū)域,再對(duì)提取到的MSER區(qū)域進(jìn)行過濾篩選,最終得到待檢測(cè)圖像中的文本區(qū)域,區(qū)域劃分有利于減少計(jì)算量、提高檢測(cè)效率,同時(shí)提取MSER區(qū)域可減少圖像背景的干擾,可提高在檢測(cè)背景復(fù)雜的圖像時(shí)的準(zhǔn)確率。實(shí)施例二請(qǐng)參考圖2A、圖2B和圖2C,其中,圖2A是本發(fā)明實(shí)施例二提供的一種圖像檢測(cè)方法的流程示意圖,圖2B是圖2A中S250的可選實(shí)施方式的流程示意圖,圖2C是本發(fā)明實(shí)施例二中使用的卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)示意圖。本實(shí)施例與實(shí)施例一的主要區(qū)別在于,在實(shí)施例一的基礎(chǔ)上增加了S210、S220、S260和S270的內(nèi)容,并進(jìn)一步提供了S250的可選實(shí)施方式。本實(shí)施例提供的一種圖像檢測(cè)方法,可以包括如下步驟:S210:接收初始圖像。示例性的,初始圖像可以是通過攝像頭拍攝自然場(chǎng)景得到的圖像,通常是RGB圖像。S220:對(duì)初始圖像進(jìn)行顏色空間轉(zhuǎn)換,以獲得待檢測(cè)圖像。示例性的,通過對(duì)初始圖像進(jìn)行顏色空間轉(zhuǎn)換,得到R、G、B、Grayscale、H、S、V共7個(gè)通道的圖像,作為待檢測(cè)圖像,后續(xù)步驟中均是對(duì)這7個(gè)圖像進(jìn)行操作。S230:獲取待檢測(cè)圖像。S240:從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域。示例性的,可以通過MSER算法從待檢測(cè)圖像中提取MSER區(qū)域,主要過程為:對(duì)待檢測(cè)圖像進(jìn)行二值化處理,調(diào)節(jié)二值化閾值在[0,255]范圍內(nèi)變化,當(dāng)連通區(qū)域的面積變化幅度V(i)小于設(shè)定的變化幅度值時(shí),確定連通區(qū)域?yàn)镸SER區(qū)域;舉例來說,對(duì)檢測(cè)圖像的灰度圖二值化處理時(shí),將像素值小于二值化閾值的像素點(diǎn)均設(shè)置像素值為0,將像素值不小于二值化閾值的像素點(diǎn)均設(shè)置像素值為255,則對(duì)應(yīng)的二值化圖像就經(jīng)歷一個(gè)從全黑到全白的過程(就像水位不斷上升的俯瞰圖),在這個(gè)過程中,有些連通區(qū)域的面積隨著二值化閾值的變化而變化很小,即V(i)小于設(shè)定的變化幅度值(如0.25),這種連通區(qū)域就是MSER區(qū)域。其中,Qi表示二值化閾值為i時(shí)連通區(qū)域的面積;Δ表示二值化閾值的微小變化;面積變化幅度V(i)表示當(dāng)二值化閾值為i發(fā)生微小變化時(shí),連通區(qū)域的面積變化程度。S250:過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。可選的,如圖2B所示,過濾MSER區(qū)域可以包括S251、S252、S253和S254四個(gè)步驟,其中:S251:統(tǒng)計(jì)MSER區(qū)域的像素值或區(qū)域長寬比。示例性的,在實(shí)際應(yīng)用中,拍攝到的自然場(chǎng)景圖像幾乎沒有少于30個(gè)像素的文字圖像,并且一般文字區(qū)域的長寬比也在一定的范圍內(nèi),例如,文字區(qū)域的長寬比通常在0.3-3的范圍內(nèi),因此可以根據(jù)確定的MSER區(qū)域矩形框內(nèi)的像素值或長寬比,來初步過濾MSER區(qū)域中的非文本區(qū)域。S252:將像素值小于預(yù)設(shè)像素閾值或區(qū)域長寬比不在預(yù)設(shè)范圍內(nèi)的MSER區(qū)域過濾。示例性的,將像素?cái)?shù)少于30,或區(qū)域長寬比不在0.3-3范圍內(nèi)的MSER區(qū)域過濾。此外,當(dāng)一個(gè)文字區(qū)域有多個(gè)矩形框時(shí),為減少計(jì)算量,可以從多個(gè)矩形框中選取其中一個(gè)來代表該文字區(qū)域。例如,對(duì)于任意一個(gè)矩形框A,當(dāng)另一個(gè)矩形框B與矩形框A的重疊區(qū)域面積,與矩形框A和矩形框B并集的總面積的比值大于0.8時(shí),則認(rèn)為矩形框A和矩形框B位于同一個(gè)位置、代表的是同一個(gè)文字區(qū)域,將矩形框A和矩形框B合并,遍歷剩余所有矩形框,將符合上述合并條件的矩形框與矩形框A合并,同時(shí)也對(duì)待檢測(cè)圖像中其他矩形框進(jìn)行類似操作,可最大限度地減少后續(xù)計(jì)算量。S253:連續(xù)對(duì)過濾后剩余的MSER區(qū)域進(jìn)行卷積和下采樣處理,獲得特征映射圖。示例性的,本實(shí)施例采用MSER區(qū)域提取的二值化圖像對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。如圖2C所示,首先輸入一張32*32的圖像,經(jīng)過6個(gè)5*5的核矩陣對(duì)輸入圖像進(jìn)行卷積,得到C1層6個(gè)28*28的特征映射圖;對(duì)C1層的特征映射圖進(jìn)行下采樣處理,每4個(gè)像素(2*2)得到一個(gè)值,則得到S2層6個(gè)14*14的特征映射圖;然后利用5*5的核矩陣對(duì)S2層的特征映射圖進(jìn)行卷積,得到C3層的16個(gè)10*10的特征映射圖;和S2同理,對(duì)C3層的特征映射圖進(jìn)行下采樣處理,可以得到S4層的16個(gè)5*5的特征映射圖;利用5*5的核矩陣對(duì)S4層的特征映射圖進(jìn)行卷積,得到C5層的120個(gè)1*1的特征映射圖;同理,對(duì)C5層的特征映射圖進(jìn)行下采樣處理,可以得到F6層的84個(gè)1*1的特征映射圖。S254:將特征映射圖輸入到分類器中,根據(jù)分類器的輸出結(jié)果確定MSER區(qū)域?yàn)槲谋緟^(qū)域。示例性的,將上述S253中獲得的F6層的特征映射圖輸入到softmax分類器中,根據(jù)softmax分類器的輸出結(jié)果確定輸入的圖像為文本圖像,相應(yīng)的MSER區(qū)域?yàn)槲谋緟^(qū)域。在其他實(shí)施例中,也可采用SVM等其他分類器。經(jīng)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)MSERA區(qū)域進(jìn)行分類后,基本可以確定待檢測(cè)圖像中單個(gè)字符或文字的區(qū)域,基本過濾了非文本區(qū)域的矩形框,保留了文本區(qū)域矩形框。S260:在水平方向上合并相鄰文本區(qū)域。示例性的,對(duì)于包含英文單詞的待檢測(cè)圖像,還需要將各字符組合合并為單詞。計(jì)算所有相鄰字符區(qū)域之間的距離,并計(jì)算出平均距離;找到未被處理的最左側(cè)的字符區(qū)域,然后在水平方向上依次尋找與字符區(qū)域最近的字符區(qū)域,當(dāng)相鄰兩個(gè)字符區(qū)域的高度比在預(yù)設(shè)的高度比值范圍內(nèi)時(shí),例如,高度比在0.5-2之間時(shí),將這兩個(gè)字符區(qū)域合并,當(dāng)相鄰兩個(gè)字符區(qū)域之間的距離大于設(shè)定距離(如上述平均距離的3倍)時(shí),停止迭代,這樣可以劃分出處于同一行的文本區(qū)域。S270:對(duì)合并后的文本區(qū)域進(jìn)行區(qū)域內(nèi)單詞分割。示例性的,對(duì)于經(jīng)上述S260合并后的每組文本區(qū)域內(nèi),若相鄰兩個(gè)字符區(qū)域之間的距離大于上述平均距離,則將該相鄰的兩個(gè)字符區(qū)域分割開,這樣可以分割同一行中的不同單詞。重復(fù)S260和S270,直到所有文本區(qū)域均被處理。需要說明的是,本發(fā)明實(shí)施例中所述的MSER區(qū)域,也表示MSER區(qū)域?qū)?yīng)的區(qū)域圖像。綜上,在本技術(shù)方案中,接收初始圖像,對(duì)初始圖像進(jìn)行顏色空間轉(zhuǎn)換,獲取待檢測(cè)圖像,從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,最大穩(wěn)定極值區(qū)域?yàn)檫B通區(qū)域,過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域,并進(jìn)一步對(duì)文本區(qū)域進(jìn)行區(qū)域間合并及區(qū)域內(nèi)單詞分割。通過從待檢測(cè)圖像中提取MSER區(qū)域,以劃分連通區(qū)域的方式提取MSER區(qū)域作為候選區(qū)域,再對(duì)提取到的MSER區(qū)域進(jìn)行過濾篩選,最終得到待檢測(cè)圖像中的文本區(qū)域,區(qū)域劃分有利于減少計(jì)算量、提高檢測(cè)效率,同時(shí)提取MSER區(qū)域可減少圖像背景的干擾,可提高在檢測(cè)背景復(fù)雜的圖像時(shí)的準(zhǔn)確率。以下為本發(fā)明實(shí)施例提供的一種圖像檢測(cè)裝置的實(shí)施例,圖像檢測(cè)裝置與上述圖像檢測(cè)方法屬于同一個(gè)發(fā)明構(gòu)思,在裝置的實(shí)施例中未詳盡描述的細(xì)節(jié)內(nèi)容,請(qǐng)參考上述方法的實(shí)施例。實(shí)施例三請(qǐng)參考圖3,其是本發(fā)明實(shí)施例三提供的一種圖像檢測(cè)裝置的架構(gòu)示意圖。本實(shí)施例提供的一種圖像檢測(cè)裝置300,可以包括以下內(nèi)容:待檢測(cè)圖像獲取模塊310,用于獲取待檢測(cè)圖像。MSER區(qū)域提取模塊320,用于從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,MSER區(qū)域?yàn)檫B通區(qū)域。MSER區(qū)域過濾模塊330,用于過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。綜上,在本技術(shù)方案中,獲取待檢測(cè)圖像,從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,最大穩(wěn)定極值區(qū)域?yàn)檫B通區(qū)域,過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域。通過從待檢測(cè)圖像中提取MSER區(qū)域,以劃分連通區(qū)域的方式提取MSER區(qū)域作為候選區(qū)域,再對(duì)提取到的MSER區(qū)域進(jìn)行過濾篩選,最終得到待檢測(cè)圖像中的文本區(qū)域,區(qū)域劃分有利于減少計(jì)算量、提高檢測(cè)效率,同時(shí)提取MSER區(qū)域可減少圖像背景的干擾,可提高在檢測(cè)背景復(fù)雜的圖像時(shí)的準(zhǔn)確率。實(shí)施例四請(qǐng)參考圖4A和圖4B,其中,圖4A是本發(fā)明實(shí)施例四提供的一種圖像檢測(cè)裝置的架構(gòu)示意圖,圖4B是圖4A中MSER區(qū)域過濾模塊450的可選實(shí)施方式的架構(gòu)示意圖。本實(shí)施例與實(shí)施例三的主要區(qū)別在于,在實(shí)施例三的基礎(chǔ)上增加了初始圖像接收模塊410、顏色空間轉(zhuǎn)換模塊420、文本區(qū)域合并模塊460和單詞分割模塊470的內(nèi)容,并進(jìn)一步提供了MSER區(qū)域過濾模塊450的可選實(shí)施方式。本實(shí)施例提供的一種圖像檢測(cè)裝置400,可以包括如下內(nèi)容:初始圖像接收模塊410,用于接收初始圖像。顏色空間轉(zhuǎn)換模塊420,用于對(duì)初始圖像進(jìn)行顏色空間轉(zhuǎn)換,以獲得待檢測(cè)圖像。待檢測(cè)圖像獲取模塊430,用于獲取待檢測(cè)圖像。MSER區(qū)域提取模塊440,用于從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,MSER區(qū)域?yàn)檫B通區(qū)域。優(yōu)選的,MSER區(qū)域提取模塊440,具體用于:對(duì)待檢測(cè)圖像進(jìn)行二值化處理,調(diào)節(jié)二值化閾值在[0,255]范圍內(nèi)變化,當(dāng)連通區(qū)域的面積變化幅度V(i)小于設(shè)定的變化幅度值時(shí),確定連通區(qū)域?yàn)镸SER區(qū)域;其中,Qi表示二值化閾值為i時(shí)連通區(qū)域的面積,Δ表示二值化閾值的微小變化。MSER區(qū)域過濾模塊450,用于過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域??蛇x的,如圖4B所示,MSER區(qū)域過濾模塊450可以包括統(tǒng)計(jì)單元451、過濾單元452、特征映射圖獲得單元453和文本區(qū)域確定單元454,其中:統(tǒng)計(jì)單元451,用于統(tǒng)計(jì)MSER區(qū)域的像素值或區(qū)域長寬比。過濾單元452,用于將像素值小于預(yù)設(shè)像素閾值或區(qū)域長寬比不在預(yù)設(shè)范圍內(nèi)的MSER區(qū)域過濾。特征映射圖獲得單元453,用于連續(xù)對(duì)過濾后剩余的MSER區(qū)域進(jìn)行卷積和下采樣處理,獲得特征映射圖。文本區(qū)域確定單元454,用于將特征映射圖輸入到分類器中,根據(jù)分類器的輸出結(jié)果確定MSER區(qū)域?yàn)槲谋緟^(qū)域。文本區(qū)域合并模塊460,用于在水平方向上合并相鄰文本區(qū)域。單詞分割模塊470,用于對(duì)合并后的文本區(qū)域進(jìn)行區(qū)域內(nèi)單詞分割。綜上,在本技術(shù)方案中,接收初始圖像,對(duì)初始圖像進(jìn)行顏色空間轉(zhuǎn)換,獲取待檢測(cè)圖像,從待檢測(cè)圖像中提取最大穩(wěn)定極值MSER區(qū)域,其中,最大穩(wěn)定極值區(qū)域?yàn)檫B通區(qū)域,過濾MSER區(qū)域,得到待檢測(cè)圖像中的文本區(qū)域,并進(jìn)一步對(duì)文本區(qū)域進(jìn)行區(qū)域間合并及區(qū)域內(nèi)單詞分割。通過從待檢測(cè)圖像中提取MSER區(qū)域,以劃分連通區(qū)域的方式提取MSER區(qū)域作為候選區(qū)域,再對(duì)提取到的MSER區(qū)域進(jìn)行過濾篩選,最終得到待檢測(cè)圖像中的文本區(qū)域,區(qū)域劃分有利于減少計(jì)算量、提高檢測(cè)效率,同時(shí)提取MSER區(qū)域可減少圖像背景的干擾,可提高在檢測(cè)背景復(fù)雜的圖像時(shí)的準(zhǔn)確率。注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1