本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖片中文字區(qū)域的獲取方法及裝置。
背景技術(shù):隨著互聯(lián)網(wǎng)技術(shù)和多媒體技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)上的圖片內(nèi)容呈現(xiàn)爆炸性增長(zhǎng)趨勢(shì),這些圖片大多含有文字信息,而且這些文字信息一般能比較準(zhǔn)確的描述圖片的內(nèi)容。因此,如何有效的識(shí)別這些文字信息,對(duì)于圖片的處理(例如:刪除包含非法廣告信息的圖片等)具有重要的意義。在圖片文字的識(shí)別過(guò)程中,圖片文字區(qū)域的獲取是一個(gè)關(guān)鍵的環(huán)節(jié),現(xiàn)有技術(shù)在通過(guò)光學(xué)字符識(shí)別(OpticalCharacterRecognition,OCR)來(lái)識(shí)別圖片中的文字信息時(shí),對(duì)于圖片文字區(qū)域的獲取較復(fù)雜,而且準(zhǔn)確率低。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供一種圖片中文字區(qū)域的獲取方法,以解決現(xiàn)有技術(shù)在獲取圖片中的文字區(qū)域時(shí),復(fù)雜度高、準(zhǔn)確率低的問(wèn)題。本發(fā)明實(shí)施例一方面提供了一種圖片中文字區(qū)域的獲取方法,所述方法包括:對(duì)當(dāng)前圖片進(jìn)行預(yù)處理;對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理,所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類;獲取角點(diǎn)處理后的連通區(qū)域,將所述連通區(qū)域作為文字區(qū)域輸出。本發(fā)明實(shí)施例另一方面提供了一種圖片中文字區(qū)域的獲取裝置,所述裝置包括:預(yù)處理單元,用于對(duì)當(dāng)前圖片進(jìn)行預(yù)處理;角點(diǎn)處理單元,用于在所述預(yù)處理單元處理完后進(jìn)行角點(diǎn)處理,所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類;輸出單元,用于獲取角點(diǎn)處理后的連通區(qū)域,將所述連通區(qū)域作為文字區(qū)域輸出。從上述技術(shù)方案可以看出,本發(fā)明實(shí)施例通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理,可以快速、準(zhǔn)確的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效,實(shí)用性強(qiáng)。附圖說(shuō)明為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例一提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程圖;圖2a、2b是本發(fā)明實(shí)施例一提供的原圖以及角點(diǎn)二值圖;圖3a、3b是本發(fā)明實(shí)施例一提供的角點(diǎn)濾波前后的示例圖;圖4a、4b是本發(fā)明實(shí)施例一提供的角點(diǎn)聚類前后的示例圖;圖5是本發(fā)明實(shí)施例一提供的圖片文字區(qū)域的示例圖;圖6是本發(fā)明實(shí)施例二提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程圖;圖7是本發(fā)明實(shí)施例三提供的圖片中文字區(qū)域的獲取裝置的組成結(jié)構(gòu)。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下對(duì)照附圖并結(jié)合實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。為了說(shuō)明本發(fā)明所述的技術(shù)方案,下面通過(guò)具體實(shí)施例來(lái)進(jìn)行說(shuō)明。實(shí)施例一:圖1示出了本發(fā)明實(shí)施例一提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程,該方法過(guò)程詳述如下:在步驟S201中,對(duì)當(dāng)前圖片進(jìn)行預(yù)處理。在本實(shí)施例中,預(yù)處理過(guò)程包括但不局限于圖片二值化以及以下至少一種:噪點(diǎn)去除、明度增強(qiáng)、尺寸歸一化、圖像馬賽克。其中,噪點(diǎn)去除可以采用現(xiàn)有的降噪算法去掉原圖片(當(dāng)前圖片)中的雜色和噪點(diǎn)。明度增強(qiáng)是為了對(duì)圖片中的文字邊緣做增強(qiáng)可讀效果的處理,包括調(diào)整RGB色彩分布、更換明度提取算法、整圖/局部銳化處理、增強(qiáng)對(duì)比度、整圖/局部邊緣增強(qiáng)等。為了保證后續(xù)處理時(shí)參數(shù)設(shè)置的統(tǒng)一,在進(jìn)行角點(diǎn)處理之前,可以對(duì)原圖片的尺寸進(jìn)行歸一化處理,將尺度較大的原圖片縮小到一個(gè)合理的尺寸,如高度大于400px的圖片在保持寬高比的前提下縮小到400px高。而對(duì)于小尺寸的圖片為了避免圖像失真則不做擴(kuò)大處理。另外,由于有些圖片的文字在邊緣上比較平滑(如字體邊緣采用了色彩過(guò)渡,明度過(guò)渡等邊緣處理手段),如果直接在像素級(jí)別上獲取角點(diǎn)存在丟失數(shù)據(jù)的可能。因此,本實(shí)施例將原始圖片轉(zhuǎn)換成一個(gè)一定規(guī)則的馬賽克圖片(例如:將400px的圖片轉(zhuǎn)換成2×2像素的馬賽克圖片,即將原圖片中的4個(gè)像素點(diǎn)合并為1個(gè)像素點(diǎn)),因此轉(zhuǎn)換后的馬賽克圖片不僅可以在一定程度上降低丟失角點(diǎn)的可能性(合并和,角點(diǎn)尺寸變大),而且可以大大的提升角點(diǎn)獲取的速度。在步驟S202中,對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理,所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類。有選的是,以表一的3×3模板為例說(shuō)明角點(diǎn)獲取的過(guò)程:表一BA1CAB1表一中A、B、C、A1、B1為圖片二值化后的像素點(diǎn),令:rA=(fA–fC)2+(fA1–fC)2(1)rB=(fB–fC)2+(fB1–fC)2(2)R1=min(rA,rB)(3)其中,f表示像素點(diǎn)的亮度分量,如果R1小于第一閾值T1(例如200),則說(shuō)明中心像素點(diǎn)C不是角點(diǎn),如果R1大于或者等于第一閾值T1,則繼續(xù)令:X1=(fB–fA)×(fA–fC)+(fB1–fA1)×(fA1–fC)(4)X2=(fB–fA1)×(fA1–fC)+(fB1–fA)×(fA–fC)(5)M=rA(6)N=min(X1,X2)(7)Z=rB–rA–2×N(8)R2=M-N2/Z(9)如果N<0且N+Z>0則通過(guò)上式重新計(jì)算R2,當(dāng)R2大于或者第二閾值T2(例如700),則判定中心像素點(diǎn)C點(diǎn)為角點(diǎn),獲取所述該中心像素點(diǎn)。如圖2a、2b所示,圖2a為原圖,圖2b為采用本實(shí)施例角點(diǎn)獲取方法獲取的角點(diǎn)二值圖,其中白色點(diǎn)為角點(diǎn)。需要說(shuō)明的是,因?yàn)閳D2b為經(jīng)過(guò)馬賽克(2×2像素)處理后的圖片,因而獲得的角點(diǎn)數(shù)為原圖的1/4,大大的縮小了計(jì)算量,提高了角點(diǎn)獲取的效率。需要說(shuō)明的是,當(dāng)模板為2×2時(shí),相當(dāng)于只取了3×3模板的一個(gè)角,會(huì)丟失角點(diǎn)。而超過(guò)3×3的模板計(jì)算復(fù)雜度較高、效率會(huì)低很多。在本實(shí)施例中,角點(diǎn)濾波具體包括計(jì)算角點(diǎn)獲取后圖片(如圖2b)上每一行的角點(diǎn)數(shù),當(dāng)所述角點(diǎn)數(shù)小于第三閾值(例如400px圖片下的閾值為8)時(shí),刪除該行的所有角點(diǎn);或者計(jì)算預(yù)設(shè)模板覆蓋塊內(nèi)的角點(diǎn)數(shù),當(dāng)所述角點(diǎn)數(shù)小于所述模板覆蓋塊的閾值(例如模板6×10、6×16、6×50對(duì)應(yīng)的閾值分別為3、4、6)時(shí),刪除所述模板覆蓋塊內(nèi)的所有角點(diǎn)數(shù)。由于文字區(qū)域的角點(diǎn)密度較大,通過(guò)本實(shí)施例的角點(diǎn)濾波法可有效過(guò)濾出一些明顯不是從文字中獲取出來(lái)的角點(diǎn),如圖3a、3b所示,圖3a為角點(diǎn)濾波前,圖3b為角點(diǎn)濾波后。在本實(shí)施例中,所述角點(diǎn)聚類具體包括連接角點(diǎn)距離小于或者等于第四閾值的兩個(gè)角點(diǎn),如圖4a、4b所示,圖3a為角點(diǎn)聚類前,圖3b為角點(diǎn)聚類后。舉例說(shuō)明如下(但不以該舉例為限):假設(shè)P為角點(diǎn),如果存在角點(diǎn)Q落在以P為左上角且長(zhǎng)為10、寬為5的矩形區(qū)域內(nèi),則以P、Q為對(duì)角線形成的矩陣區(qū)域作為候選文字區(qū)域,該區(qū)域內(nèi)的點(diǎn)都作為角點(diǎn)。在步驟S203中,獲取角點(diǎn)處理后的連通區(qū)域,將所述連通區(qū)域作為文字區(qū)域輸出。具體為,獲取角點(diǎn)聚類后的連通線段,并合并獲取后的所有連通線段,獲得連通區(qū)域,由于獲得的多個(gè)連通區(qū)域之間可能存在相互重疊,因此需要?jiǎng)h除所述連通區(qū)域中的重疊部分,將刪除重疊部分的連通區(qū)域作為文字區(qū)域(如圖5所示)輸出。在本實(shí)施例中,為了提高獲取連通區(qū)域的效率,可以通過(guò)預(yù)設(shè)的模板塊(例如4×4)來(lái)獲取連通線段,判斷所述模板塊中的角點(diǎn)數(shù)是否大于預(yù)設(shè)閾值(例如例如400px圖片下的閾值為12)時(shí),若是,則判定所述模板塊內(nèi)的角點(diǎn)屬于同一連通線段,提取該連通線段。本發(fā)明實(shí)施例根據(jù)漢字的特征(即漢字含有豐富的角點(diǎn)),通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理,可以快速、準(zhǔn)確的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效,實(shí)用性強(qiáng)。需要說(shuō)明的是,本發(fā)明實(shí)施例的技術(shù)方案主要針對(duì)郵箱、即時(shí)通信、WEB發(fā)布平臺(tái)以及微信等手機(jī)通訊軟件內(nèi)的圖片進(jìn)行文字區(qū)域獲取,經(jīng)過(guò)對(duì)實(shí)際采樣的圖片的測(cè)試,對(duì)所述圖片中規(guī)則排列(水平或者垂直)的文字區(qū)域的召回率接近100%,而且運(yùn)行速度快(毫秒級(jí)處理完單張圖片),可以滿足實(shí)時(shí)處理的性能要求,具有極大的實(shí)用價(jià)值。實(shí)施例二:圖6示出了本發(fā)明實(shí)施例二提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程,本發(fā)明實(shí)施例二在實(shí)施例一的基礎(chǔ)上增加了步驟S604。在步驟S604中,將所述圖片劃分成多個(gè)區(qū)域,為每個(gè)區(qū)域設(shè)置不同的權(quán)值,并根據(jù)所設(shè)置的權(quán)值,計(jì)算所述文字區(qū)域的加權(quán)和。在實(shí)際應(yīng)用中,如果能夠在海量圖片中快速、準(zhǔn)確的獲取圖片的文字區(qū)域,可方便用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息,有效阻止非法廣告等騷擾性或者有害行圖片的傳播。為了讓用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息,文字區(qū)域應(yīng)該盡可能的落在用戶的視覺(jué)中心范圍內(nèi),本發(fā)明實(shí)施例通過(guò)將所述圖片劃分成多個(gè)區(qū)域(例如通過(guò)水平和豎直共四條分割線,將原圖片分割成九個(gè)區(qū)域),為每個(gè)區(qū)域設(shè)置不同的權(quán)值(根據(jù)常識(shí),圖片中心區(qū)域的權(quán)值最大),并根據(jù)所設(shè)置的權(quán)值,計(jì)算所述文字區(qū)域的加權(quán)和來(lái)確定所述文字區(qū)域落在視覺(jué)中心范圍的權(quán)重,即所述文字區(qū)域的加權(quán)和越大,則說(shuō)明有價(jià)值的文字越集中分布在視覺(jué)中心范圍內(nèi)。通過(guò)本發(fā)明實(shí)施例可以讓用戶更方便的了解圖片中文字區(qū)域的分布。實(shí)施例三:圖7示出了本發(fā)明實(shí)施例三提供的圖片中文字區(qū)域的獲取裝置的組成結(jié)構(gòu),為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。該圖片中文字區(qū)域的獲取裝置可以是運(yùn)行于各應(yīng)用終端(例如手機(jī)等)內(nèi)的軟件單元、硬件單元或者軟硬件相結(jié)合的單元。該圖片中文字區(qū)域的獲取裝置7包括預(yù)處理單元71、角點(diǎn)處理單元72及輸出單元73,其具體功能如下:預(yù)處理單元71,用于對(duì)當(dāng)前圖片進(jìn)行預(yù)處理;角點(diǎn)處理單元72,用于在所述預(yù)處理單元處理完后進(jìn)行角點(diǎn)處理,所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類;輸出單元73,用于獲取角點(diǎn)處理后的連通區(qū)域,將所述連通區(qū)域作為文字區(qū)域輸出。進(jìn)一步的,所述角點(diǎn)處理單元72包括:角點(diǎn)獲取模塊721,用于根據(jù)預(yù)設(shè)模板,判斷公式一的結(jié)果值是否小于第一閾值,若否,繼續(xù)判斷公式二的結(jié)果值是否小于第二閾值,若否,則判定所述預(yù)設(shè)模板內(nèi)的中心點(diǎn)為角點(diǎn),獲取所述中心點(diǎn),其中所述預(yù)設(shè)模板為3×3模板:公式一:R1=min(rA,rB),其中rA=(fA–fC)2+(fA1–fC)2,rB=(fB–fC)2+(fB1–fC)2,A、B、C、A1、B1表示像素點(diǎn),C表示中心點(diǎn),f表示像素點(diǎn)的亮度分量;公式二:R2=M-N2/Z,其中M=rA,N=min(X1,X2),Z=rB-rA-2×N,X1=(fB–fA)×(fA–fC)+(fB1–fA1)×(fA1–fC),X2=(fB–fA1)×(fA1–fC)+(fB1-fA)×(fA-fC);角點(diǎn)濾波模塊722,用于計(jì)算角點(diǎn)獲取后圖片上每一行的角點(diǎn)數(shù),當(dāng)所述角點(diǎn)數(shù)小于第三閾值時(shí),刪除該行的所有角點(diǎn);或者計(jì)算預(yù)設(shè)模板覆蓋塊內(nèi)的角點(diǎn)數(shù),當(dāng)所述角點(diǎn)數(shù)小于所述模板覆蓋塊的閾值時(shí),刪除所述模板覆蓋塊內(nèi)的所有角點(diǎn)數(shù);角點(diǎn)聚類模塊723,用于連接角點(diǎn)距離小于或者等于第四閾值的兩個(gè)角點(diǎn)。所述輸出單元73包括:獲取模塊731,用于獲取角點(diǎn)聚類后的連通線段,并合并獲取后的所有連通線段,獲得連通區(qū)域;刪除模塊732,用于刪除所述連通區(qū)域中的重疊部分;輸出模塊733,用于將刪除重疊部分的連通區(qū)域作為文字區(qū)域輸出。進(jìn)一步的,所述裝置7還包括:權(quán)值計(jì)算單元74,用于將所述圖片劃分成多個(gè)區(qū)域,為每個(gè)區(qū)域設(shè)置不同的權(quán)值,并根據(jù)所設(shè)置的權(quán)值,計(jì)算所述文字區(qū)域的加權(quán)和。在本實(shí)施例中,所述預(yù)處理包括但不局限于二值化處理以及以下至少一種:噪點(diǎn)去除、明度增強(qiáng)、尺寸歸一化、圖像馬賽克。本實(shí)施例提供的圖片中文字區(qū)域的獲取裝置可以使用在前述對(duì)應(yīng)的圖片中文字區(qū)域的獲取方法,詳情參見(jiàn)上述圖片中文字區(qū)域的獲取方法實(shí)施例一的相關(guān)描述,在此不再贅述。本領(lǐng)域普通技術(shù)人員可以理解為實(shí)施例二所包括的各個(gè)單元、模塊只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元、模塊的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。綜上所述,本發(fā)明實(shí)施例根據(jù)漢字的特征(即漢字含有豐富的角點(diǎn)),通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理,可以快速(毫秒級(jí)處理完單張圖片)、準(zhǔn)確(圖片中規(guī)則排列(水平或者垂直)的文字區(qū)域的召回率接近100%)的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效,可以滿足實(shí)時(shí)處理的性能要求,實(shí)用性強(qiáng)。另外,通過(guò)將所述圖片劃分成多個(gè)區(qū)域,為每個(gè)區(qū)域設(shè)置不同的權(quán)值,并根據(jù)所設(shè)置的權(quán)值,計(jì)算所述文字區(qū)域的加權(quán)和,通過(guò)所述加權(quán)和來(lái)確定所述文字區(qū)域落在視覺(jué)中心范圍的權(quán)重,即所述文字區(qū)域的加權(quán)和越大,則說(shuō)明有價(jià)值的文字越集中分布在視覺(jué)中心范圍內(nèi),方便用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息。本領(lǐng)域普通技術(shù)人員還可以理解,實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以在存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),包括ROM/RAM、磁盤(pán)、光盤(pán)等。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。