一種圖片中文字區(qū)域的獲取方法及裝置與流程

文檔序號(hào)：12541648閱讀：214來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于圖像處理技術(shù)領(lǐng)域，尤其涉及一種圖片中文字區(qū)域的獲取方法及裝置。

背景技術(shù)：
隨著互聯(lián)網(wǎng)技術(shù)和多媒體技術(shù)的快速發(fā)展，互聯(lián)網(wǎng)上的圖片內(nèi)容呈現(xiàn)爆炸性增長(zhǎng)趨勢(shì)，這些圖片大多含有文字信息，而且這些文字信息一般能比較準(zhǔn)確的描述圖片的內(nèi)容。因此，如何有效的識(shí)別這些文字信息，對(duì)于圖片的處理（例如：刪除包含非法廣告信息的圖片等）具有重要的意義。在圖片文字的識(shí)別過(guò)程中，圖片文字區(qū)域的獲取是一個(gè)關(guān)鍵的環(huán)節(jié)，現(xiàn)有技術(shù)在通過(guò)光學(xué)字符識(shí)別（OpticalCharacterRecognition，OCR）來(lái)識(shí)別圖片中的文字信息時(shí)，對(duì)于圖片文字區(qū)域的獲取較復(fù)雜，而且準(zhǔn)確率低。

技術(shù)實(shí)現(xiàn)要素：
本發(fā)明實(shí)施例提供一種圖片中文字區(qū)域的獲取方法，以解決現(xiàn)有技術(shù)在獲取圖片中的文字區(qū)域時(shí)，復(fù)雜度高、準(zhǔn)確率低的問(wèn)題。本發(fā)明實(shí)施例一方面提供了一種圖片中文字區(qū)域的獲取方法，所述方法包括：對(duì)當(dāng)前圖片進(jìn)行預(yù)處理；對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理，所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類；獲取角點(diǎn)處理后的連通區(qū)域，將所述連通區(qū)域作為文字區(qū)域輸出。本發(fā)明實(shí)施例另一方面提供了一種圖片中文字區(qū)域的獲取裝置，所述裝置包括：預(yù)處理單元，用于對(duì)當(dāng)前圖片進(jìn)行預(yù)處理；角點(diǎn)處理單元，用于在所述預(yù)處理單元處理完后進(jìn)行角點(diǎn)處理，所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類；輸出單元，用于獲取角點(diǎn)處理后的連通區(qū)域，將所述連通區(qū)域作為文字區(qū)域輸出。從上述技術(shù)方案可以看出，本發(fā)明實(shí)施例通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理，可以快速、準(zhǔn)確的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效，實(shí)用性強(qiáng)。附圖說(shuō)明為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例一提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程圖；圖2a、2b是本發(fā)明實(shí)施例一提供的原圖以及角點(diǎn)二值圖；圖3a、3b是本發(fā)明實(shí)施例一提供的角點(diǎn)濾波前后的示例圖；圖4a、4b是本發(fā)明實(shí)施例一提供的角點(diǎn)聚類前后的示例圖；圖5是本發(fā)明實(shí)施例一提供的圖片文字區(qū)域的示例圖；圖6是本發(fā)明實(shí)施例二提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程圖；圖7是本發(fā)明實(shí)施例三提供的圖片中文字區(qū)域的獲取裝置的組成結(jié)構(gòu)。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下對(duì)照附圖并結(jié)合實(shí)施例，對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。為了說(shuō)明本發(fā)明所述的技術(shù)方案，下面通過(guò)具體實(shí)施例來(lái)進(jìn)行說(shuō)明。實(shí)施例一：圖1示出了本發(fā)明實(shí)施例一提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程，該方法過(guò)程詳述如下：在步驟S201中，對(duì)當(dāng)前圖片進(jìn)行預(yù)處理。在本實(shí)施例中，預(yù)處理過(guò)程包括但不局限于圖片二值化以及以下至少一種：噪點(diǎn)去除、明度增強(qiáng)、尺寸歸一化、圖像馬賽克。其中，噪點(diǎn)去除可以采用現(xiàn)有的降噪算法去掉原圖片（當(dāng)前圖片）中的雜色和噪點(diǎn)。明度增強(qiáng)是為了對(duì)圖片中的文字邊緣做增強(qiáng)可讀效果的處理，包括調(diào)整RGB色彩分布、更換明度提取算法、整圖/局部銳化處理、增強(qiáng)對(duì)比度、整圖/局部邊緣增強(qiáng)等。為了保證后續(xù)處理時(shí)參數(shù)設(shè)置的統(tǒng)一，在進(jìn)行角點(diǎn)處理之前，可以對(duì)原圖片的尺寸進(jìn)行歸一化處理，將尺度較大的原圖片縮小到一個(gè)合理的尺寸，如高度大于400px的圖片在保持寬高比的前提下縮小到400px高。而對(duì)于小尺寸的圖片為了避免圖像失真則不做擴(kuò)大處理。另外，由于有些圖片的文字在邊緣上比較平滑（如字體邊緣采用了色彩過(guò)渡，明度過(guò)渡等邊緣處理手段），如果直接在像素級(jí)別上獲取角點(diǎn)存在丟失數(shù)據(jù)的可能。因此，本實(shí)施例將原始圖片轉(zhuǎn)換成一個(gè)一定規(guī)則的馬賽克圖片（例如：將400px的圖片轉(zhuǎn)換成2×2像素的馬賽克圖片，即將原圖片中的4個(gè)像素點(diǎn)合并為1個(gè)像素點(diǎn)），因此轉(zhuǎn)換后的馬賽克圖片不僅可以在一定程度上降低丟失角點(diǎn)的可能性（合并和，角點(diǎn)尺寸變大），而且可以大大的提升角點(diǎn)獲取的速度。在步驟S202中，對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理，所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類。有選的是，以表一的3×3模板為例說(shuō)明角點(diǎn)獲取的過(guò)程：表一BA1CAB1表一中A、B、C、A1、B1為圖片二值化后的像素點(diǎn)，令：rA=(fA–fC)2+(fA1–fC)2（1）rB=(fB–fC)2+(fB1–fC)2（2）R1=min(rA，rB)（3）其中，f表示像素點(diǎn)的亮度分量，如果R1小于第一閾值T1（例如200），則說(shuō)明中心像素點(diǎn)C不是角點(diǎn)，如果R1大于或者等于第一閾值T1，則繼續(xù)令：X1=(fB–fA)×(fA–fC)+(fB1–fA1)×(fA1–fC)（4）X2=(fB–fA1)×(fA1–fC)+(fB1–fA)×(fA–fC)（5）M=rA（6）N=min(X1,X2)（7）Z=rB–rA–2×N（8）R2=M-N2/Z（9）如果N<0且N+Z>0則通過(guò)上式重新計(jì)算R2，當(dāng)R2大于或者第二閾值T2（例如700），則判定中心像素點(diǎn)C點(diǎn)為角點(diǎn)，獲取所述該中心像素點(diǎn)。如圖2a、2b所示，圖2a為原圖，圖2b為采用本實(shí)施例角點(diǎn)獲取方法獲取的角點(diǎn)二值圖，其中白色點(diǎn)為角點(diǎn)。需要說(shuō)明的是，因?yàn)閳D2b為經(jīng)過(guò)馬賽克（2×2像素）處理后的圖片，因而獲得的角點(diǎn)數(shù)為原圖的1/4，大大的縮小了計(jì)算量，提高了角點(diǎn)獲取的效率。需要說(shuō)明的是，當(dāng)模板為2×2時(shí)，相當(dāng)于只取了3×3模板的一個(gè)角，會(huì)丟失角點(diǎn)。而超過(guò)3×3的模板計(jì)算復(fù)雜度較高、效率會(huì)低很多。在本實(shí)施例中，角點(diǎn)濾波具體包括計(jì)算角點(diǎn)獲取后圖片（如圖2b）上每一行的角點(diǎn)數(shù)，當(dāng)所述角點(diǎn)數(shù)小于第三閾值（例如400px圖片下的閾值為8）時(shí)，刪除該行的所有角點(diǎn)；或者計(jì)算預(yù)設(shè)模板覆蓋塊內(nèi)的角點(diǎn)數(shù)，當(dāng)所述角點(diǎn)數(shù)小于所述模板覆蓋塊的閾值（例如模板6×10、6×16、6×50對(duì)應(yīng)的閾值分別為3、4、6）時(shí)，刪除所述模板覆蓋塊內(nèi)的所有角點(diǎn)數(shù)。由于文字區(qū)域的角點(diǎn)密度較大，通過(guò)本實(shí)施例的角點(diǎn)濾波法可有效過(guò)濾出一些明顯不是從文字中獲取出來(lái)的角點(diǎn)，如圖3a、3b所示，圖3a為角點(diǎn)濾波前，圖3b為角點(diǎn)濾波后。在本實(shí)施例中，所述角點(diǎn)聚類具體包括連接角點(diǎn)距離小于或者等于第四閾值的兩個(gè)角點(diǎn)，如圖4a、4b所示，圖3a為角點(diǎn)聚類前，圖3b為角點(diǎn)聚類后。舉例說(shuō)明如下（但不以該舉例為限）：假設(shè)P為角點(diǎn)，如果存在角點(diǎn)Q落在以P為左上角且長(zhǎng)為10、寬為5的矩形區(qū)域內(nèi)，則以P、Q為對(duì)角線形成的矩陣區(qū)域作為候選文字區(qū)域，該區(qū)域內(nèi)的點(diǎn)都作為角點(diǎn)。在步驟S203中，獲取角點(diǎn)處理后的連通區(qū)域，將所述連通區(qū)域作為文字區(qū)域輸出。具體為，獲取角點(diǎn)聚類后的連通線段，并合并獲取后的所有連通線段，獲得連通區(qū)域，由于獲得的多個(gè)連通區(qū)域之間可能存在相互重疊，因此需要?jiǎng)h除所述連通區(qū)域中的重疊部分，將刪除重疊部分的連通區(qū)域作為文字區(qū)域（如圖5所示）輸出。在本實(shí)施例中，為了提高獲取連通區(qū)域的效率，可以通過(guò)預(yù)設(shè)的模板塊（例如4×4）來(lái)獲取連通線段，判斷所述模板塊中的角點(diǎn)數(shù)是否大于預(yù)設(shè)閾值（例如例如400px圖片下的閾值為12）時(shí)，若是，則判定所述模板塊內(nèi)的角點(diǎn)屬于同一連通線段，提取該連通線段。本發(fā)明實(shí)施例根據(jù)漢字的特征（即漢字含有豐富的角點(diǎn)），通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理，可以快速、準(zhǔn)確的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效，實(shí)用性強(qiáng)。需要說(shuō)明的是，本發(fā)明實(shí)施例的技術(shù)方案主要針對(duì)郵箱、即時(shí)通信、WEB發(fā)布平臺(tái)以及微信等手機(jī)通訊軟件內(nèi)的圖片進(jìn)行文字區(qū)域獲取，經(jīng)過(guò)對(duì)實(shí)際采樣的圖片的測(cè)試，對(duì)所述圖片中規(guī)則排列（水平或者垂直）的文字區(qū)域的召回率接近100%，而且運(yùn)行速度快（毫秒級(jí)處理完單張圖片），可以滿足實(shí)時(shí)處理的性能要求，具有極大的實(shí)用價(jià)值。實(shí)施例二：圖6示出了本發(fā)明實(shí)施例二提供的圖片中文字區(qū)域的獲取方法的實(shí)現(xiàn)流程，本發(fā)明實(shí)施例二在實(shí)施例一的基礎(chǔ)上增加了步驟S604。在步驟S604中，將所述圖片劃分成多個(gè)區(qū)域，為每個(gè)區(qū)域設(shè)置不同的權(quán)值，并根據(jù)所設(shè)置的權(quán)值，計(jì)算所述文字區(qū)域的加權(quán)和。在實(shí)際應(yīng)用中，如果能夠在海量圖片中快速、準(zhǔn)確的獲取圖片的文字區(qū)域，可方便用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息，有效阻止非法廣告等騷擾性或者有害行圖片的傳播。為了讓用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息，文字區(qū)域應(yīng)該盡可能的落在用戶的視覺(jué)中心范圍內(nèi)，本發(fā)明實(shí)施例通過(guò)將所述圖片劃分成多個(gè)區(qū)域（例如通過(guò)水平和豎直共四條分割線，將原圖片分割成九個(gè)區(qū)域），為每個(gè)區(qū)域設(shè)置不同的權(quán)值（根據(jù)常識(shí)，圖片中心區(qū)域的權(quán)值最大），并根據(jù)所設(shè)置的權(quán)值，計(jì)算所述文字區(qū)域的加權(quán)和來(lái)確定所述文字區(qū)域落在視覺(jué)中心范圍的權(quán)重，即所述文字區(qū)域的加權(quán)和越大，則說(shuō)明有價(jià)值的文字越集中分布在視覺(jué)中心范圍內(nèi)。通過(guò)本發(fā)明實(shí)施例可以讓用戶更方便的了解圖片中文字區(qū)域的分布。實(shí)施例三：圖7示出了本發(fā)明實(shí)施例三提供的圖片中文字區(qū)域的獲取裝置的組成結(jié)構(gòu)，為了便于說(shuō)明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。該圖片中文字區(qū)域的獲取裝置可以是運(yùn)行于各應(yīng)用終端（例如手機(jī)等）內(nèi)的軟件單元、硬件單元或者軟硬件相結(jié)合的單元。該圖片中文字區(qū)域的獲取裝置7包括預(yù)處理單元71、角點(diǎn)處理單元72及輸出單元73，其具體功能如下：預(yù)處理單元71，用于對(duì)當(dāng)前圖片進(jìn)行預(yù)處理；角點(diǎn)處理單元72，用于在所述預(yù)處理單元處理完后進(jìn)行角點(diǎn)處理，所述角點(diǎn)處理包括角點(diǎn)獲取、角點(diǎn)濾波以及角點(diǎn)聚類；輸出單元73，用于獲取角點(diǎn)處理后的連通區(qū)域，將所述連通區(qū)域作為文字區(qū)域輸出。進(jìn)一步的，所述角點(diǎn)處理單元72包括：角點(diǎn)獲取模塊721，用于根據(jù)預(yù)設(shè)模板，判斷公式一的結(jié)果值是否小于第一閾值，若否，繼續(xù)判斷公式二的結(jié)果值是否小于第二閾值，若否，則判定所述預(yù)設(shè)模板內(nèi)的中心點(diǎn)為角點(diǎn)，獲取所述中心點(diǎn)，其中所述預(yù)設(shè)模板為3×3模板：公式一：R1=min(rA，rB)，其中rA=(fA–fC)2+(fA1–fC)2，rB=(fB–fC)2+(fB1–fC)2，A、B、C、A1、B1表示像素點(diǎn)，C表示中心點(diǎn)，f表示像素點(diǎn)的亮度分量；公式二：R2=M-N2/Z，其中M=rA，N=min(X1,X2)，Z=rB-rA-2×N，X1=(fB–fA)×(fA–fC)+(fB1–fA1)×(fA1–fC)，X2=(fB–fA1)×(fA1–fC)+(fB1-fA)×(fA-fC)；角點(diǎn)濾波模塊722，用于計(jì)算角點(diǎn)獲取后圖片上每一行的角點(diǎn)數(shù)，當(dāng)所述角點(diǎn)數(shù)小于第三閾值時(shí)，刪除該行的所有角點(diǎn)；或者計(jì)算預(yù)設(shè)模板覆蓋塊內(nèi)的角點(diǎn)數(shù)，當(dāng)所述角點(diǎn)數(shù)小于所述模板覆蓋塊的閾值時(shí)，刪除所述模板覆蓋塊內(nèi)的所有角點(diǎn)數(shù)；角點(diǎn)聚類模塊723，用于連接角點(diǎn)距離小于或者等于第四閾值的兩個(gè)角點(diǎn)。所述輸出單元73包括：獲取模塊731，用于獲取角點(diǎn)聚類后的連通線段，并合并獲取后的所有連通線段，獲得連通區(qū)域；刪除模塊732，用于刪除所述連通區(qū)域中的重疊部分；輸出模塊733，用于將刪除重疊部分的連通區(qū)域作為文字區(qū)域輸出。進(jìn)一步的，所述裝置7還包括：權(quán)值計(jì)算單元74，用于將所述圖片劃分成多個(gè)區(qū)域，為每個(gè)區(qū)域設(shè)置不同的權(quán)值，并根據(jù)所設(shè)置的權(quán)值，計(jì)算所述文字區(qū)域的加權(quán)和。在本實(shí)施例中，所述預(yù)處理包括但不局限于二值化處理以及以下至少一種：噪點(diǎn)去除、明度增強(qiáng)、尺寸歸一化、圖像馬賽克。本實(shí)施例提供的圖片中文字區(qū)域的獲取裝置可以使用在前述對(duì)應(yīng)的圖片中文字區(qū)域的獲取方法，詳情參見(jiàn)上述圖片中文字區(qū)域的獲取方法實(shí)施例一的相關(guān)描述，在此不再贅述。本領(lǐng)域普通技術(shù)人員可以理解為實(shí)施例二所包括的各個(gè)單元、模塊只是按照功能邏輯進(jìn)行劃分的，但并不局限于上述的劃分，只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可；另外，各功能單元、模塊的具體名稱也只是為了便于相互區(qū)分，并不用于限制本發(fā)明的保護(hù)范圍。綜上所述，本發(fā)明實(shí)施例根據(jù)漢字的特征（即漢字含有豐富的角點(diǎn)），通過(guò)對(duì)預(yù)處理后的圖片進(jìn)行角點(diǎn)處理，可以快速（毫秒級(jí)處理完單張圖片）、準(zhǔn)確（圖片中規(guī)則排列（水平或者垂直）的文字區(qū)域的召回率接近100%）的獲取圖片中的文字區(qū)域。而且實(shí)現(xiàn)方案簡(jiǎn)單、高效，可以滿足實(shí)時(shí)處理的性能要求，實(shí)用性強(qiáng)。另外，通過(guò)將所述圖片劃分成多個(gè)區(qū)域，為每個(gè)區(qū)域設(shè)置不同的權(quán)值，并根據(jù)所設(shè)置的權(quán)值，計(jì)算所述文字區(qū)域的加權(quán)和，通過(guò)所述加權(quán)和來(lái)確定所述文字區(qū)域落在視覺(jué)中心范圍的權(quán)重，即所述文字區(qū)域的加權(quán)和越大，則說(shuō)明有價(jià)值的文字越集中分布在視覺(jué)中心范圍內(nèi)，方便用戶在盡可能短的時(shí)間內(nèi)注意到所述文字區(qū)域的信息。本領(lǐng)域普通技術(shù)人員還可以理解，實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成，所述的程序可以在存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中，所述的存儲(chǔ)介質(zhì)，包括ROM/RAM、磁盤(pán)、光盤(pán)等。以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王暉;謝曉境
技術(shù)所有人：騰訊科技（深圳）有限公司
我是此專利的發(fā)明人

上一篇：一種肛周一體式?jīng)_洗噴霧器的制作方法與工藝
上一篇：一種線纜盤(pán)包裝機(jī)的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖片中文字區(qū)域的獲取方法及裝置與流程