本發(fā)明涉及社交應(yīng)用技術(shù)領(lǐng)域,特別涉及一種圖片類型識別的方法和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,一些社交應(yīng)用也日益被廣泛使用。用戶可通過社交應(yīng)用發(fā)布一些文章,例如博文、評論等。這些文章通過互聯(lián)網(wǎng)的傳播,可使得更多的用戶能夠獲得所需信息。
其中,用戶通過社交應(yīng)用發(fā)布文字較多的文章時,會轉(zhuǎn)換成對應(yīng)的圖片來進(jìn)行發(fā)布,例如:用戶發(fā)表文字較多的博文時,通常會用長微博類工具撰寫長文,然后生成文本長圖來發(fā)布內(nèi)容。用于這類長圖圖片占用存儲空間較大,在非WIFI環(huán)境下移動終端查看文本圖片會耗費(fèi)較多流量。另外,文本長圖加載較慢也會影響用戶的閱讀體驗(yàn)。若用戶采用微博頭條文章產(chǎn)品來發(fā)布文字較多的博文時,則不會耗費(fèi)較多流量,也不會影響用戶的閱讀速度。
可見,對發(fā)布文本長圖的用戶進(jìn)行提醒,可及時更改發(fā)表文字較多的文章的方式,提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種圖片類型識別的方法和裝置,用以提高圖片中信息的傳播量。
本發(fā)明提供一種圖片類型識別的方法,該方法包括:
對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和;
將所述圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū);
根據(jù)每個所述候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū);
若所述有效文本行相鄰區(qū)的高度滿足設(shè)定條件,識別所述圖片為文本長圖。
本發(fā)明一實(shí)施例中,所述若所述有效文本行相鄰區(qū)的高度滿足設(shè)定條件,識別所述圖片為文本長圖包括:
將所述圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和;
若所述行高和與所述圖片的高度的比值大于第二預(yù)設(shè)值,確定所述圖片為候選文本長圖;
從所述候選文本長圖中識別出文本長圖。
本發(fā)明一實(shí)施例中,所述若所述有效文本行相鄰區(qū)的高度滿足設(shè)定條件,識別所述圖片為文本長圖包括:
根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度;
確定每個有效文本行相鄰區(qū)的高度與所述基準(zhǔn)高度之間的相對差值;
將每個相對差值與第三預(yù)設(shè)值進(jìn)行比較,獲得所述相對差值大于所述第三預(yù)設(shè)值的第一個數(shù),以及所述相對差值小于或等于所述第三預(yù)設(shè)值的第二個數(shù);
若所述第一個數(shù)與第二個數(shù)的比值小于第四預(yù)設(shè)值時,確定所述圖片為候選文本長圖;
從所述候選文本長圖中識別出文本長圖。
本發(fā)明一實(shí)施例中,所述根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度包括:
對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)行高;或,
對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇至少兩個有效文本行相鄰區(qū)的高度進(jìn)行平均值運(yùn)算,將運(yùn)算后的平均值確定為基準(zhǔn)高度。
本發(fā)明一實(shí)施例中,所述從所述候選文本長圖中識別出文本長圖包括:
對所述候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和;
將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較;
若各列像素值之和均大于等于所述第五預(yù)設(shè)值,確定所述候選文本長圖為文本長圖。
本發(fā)明提供一種圖片類型識別的裝置,該裝置包括:
掃描處理單元,用于對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和;
連接單元,用于將所述圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū);
確定單元,用于根據(jù)每個所述候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū);
識別單元,用于若所述有效文本行相鄰區(qū)的高度滿足設(shè)定條件,識別所述圖片為文本長圖。
本發(fā)明一實(shí)施例中,所述識別單元,具體用于將所述圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和,若所述行高和與所述圖片的高度的比值大于第二預(yù)設(shè)值,確定所述圖片為候選文本長圖,從所述候選文本長圖中識別出文本長圖。
本發(fā)明一實(shí)施例中,所述識別單元,具體用于根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度,確定每個有效文本行相鄰區(qū)的高度與所述基準(zhǔn)高度之間的相對差值,將每個相對差值與第三預(yù)設(shè)值進(jìn)行比較,獲得所述相對差值大于所述第三預(yù)設(shè)值的第一個數(shù),以及所述相對差值小于或等于所述第三預(yù)設(shè)值的第二個數(shù),若所述第一個數(shù)與第二個數(shù)的比值小于第四預(yù)設(shè)值時,確定所述圖片為候選文本長圖,從所述候選文本長圖中識別出文本長圖。
本發(fā)明一實(shí)施例中,所述識別單元,具體用于對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)高度;或,對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇至少兩個有效文本行相鄰區(qū)的高度進(jìn)行平均值運(yùn)算,將運(yùn)算后的平均值確定為基準(zhǔn)高度。
本發(fā)明一實(shí)施例中,所述識別單元,還用于對所述候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和,將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較,若各列像素值之和大于等于所述第五預(yù)設(shè)值,確定所述候選文本長圖為文本長圖。
本發(fā)明實(shí)施例的一些有益效果可以包括:
可見,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶發(fā)布的是文本長圖,這樣用戶可及時更改發(fā)表文字較多的文章的方式,或者進(jìn)行降頻處理,減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說明
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1是根據(jù)一示例性實(shí)施例示出的圖片類型識別的流程圖;
圖2是根據(jù)一示例性實(shí)施例一示出的圖片類型識別的流程圖;
圖3是根據(jù)一示例性實(shí)施例二示出的圖片類型識別的流程圖;
圖4是根據(jù)一示例性實(shí)施例示出的圖片類型識別的裝置的結(jié)構(gòu)圖;
圖5是根據(jù)一示例性實(shí)施例三示出的圖片類型識別的裝置結(jié)構(gòu)圖。
具體實(shí)施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本公開實(shí)施例提供的技術(shù)方案,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶針對信息的類型確定發(fā)布信息的方式,用以減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
圖1是根據(jù)一示例性實(shí)施例示出的圖片類型識別的流程圖。圖片類型識別的過程如圖1所示,包括:
步驟101:對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和。
用戶在通過社交應(yīng)用發(fā)布信息時,可將信息轉(zhuǎn)換為圖片進(jìn)行發(fā)布,例如:發(fā)布文字較多的博文時,采用長微博類工具撰寫長文,然后生成文本長圖來發(fā)布信息。或者,將一些表格,評論轉(zhuǎn)換成對應(yīng)的圖片進(jìn)行發(fā)布。這樣,發(fā)布的信息采用的圖片形式
可將發(fā)布的圖片進(jìn)行二值化,從而形成有像素點(diǎn)組成的二值化后的圖片。具體可采用大津算法將圖片進(jìn)行二值化分割,背景像素值為0,前景像素值為1。
然后,逐行掃描二值化后的圖片,將二值化后的圖片每行像素值分別進(jìn)行累加,得到每行像素的行像素值之和。
步驟102:將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。
確定了每行像素的行像素值之和后,可逐一將每行像素的行像素值之和與第一預(yù)設(shè)值進(jìn)行比較,若當(dāng)前行像素值之和大于第一預(yù)設(shè)值,則可將當(dāng)前像素行確定為候選文本行,即將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行。這里,第一預(yù)設(shè)值可根據(jù)圖片寬度值進(jìn)行確定,例如第一預(yù)設(shè)值為圖片寬度值的5%,或者第一預(yù)設(shè)值為圖片寬度值的8%。當(dāng)然,還可以是其他值,可根據(jù)應(yīng)用環(huán)境還確定。
確定了候選文本行后,可將所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。
例如:發(fā)布的圖片進(jìn)行二值化后形成的圖片中,包括了100行,其中,第1行至第20行,第25行至30行,第33行、第42行,第51行至第80行,以及第82行至第100行都是候選文本行。那么對所有相鄰的候選文本行進(jìn)行連接,形成的對應(yīng)的候選文本行相鄰區(qū)包括:第一候選文本行相鄰區(qū)、第二候選文本行相鄰區(qū)、第三候選文本行相鄰區(qū),以及第四候選文本行相鄰區(qū)。其中,第一候選文本行相鄰區(qū)包括:第1行至第20行的候選文本行;第二候選文本行相鄰區(qū)包括:第25行至第30行的候選文本行;第三候選文本行相鄰區(qū)包括:第51行至第80行的候選文本行;第四候選文本行相鄰區(qū)包括:第82行至第100行的候選文本行。而第33行、第42行不與其他的候選文本行連接,從而不能形成對應(yīng)的候選文本行相鄰區(qū)。
步驟103:根據(jù)每個候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū)。
這里,可將每個候選文本行相鄰區(qū)的高度與第一預(yù)設(shè)范圍進(jìn)行比較,若當(dāng)前候選文本行相鄰區(qū)的高度在第一預(yù)設(shè)范圍內(nèi),確定當(dāng)前候選文本行相鄰區(qū)為候選文本行相鄰區(qū)。而候選文本行相鄰區(qū)中的每個候選文本行為有效文本行。
第一預(yù)設(shè)范圍可設(shè)定為10行像素高度至40行像素高度,如上例,將每個候選文本行相鄰區(qū)的高度與第一預(yù)設(shè)范圍進(jìn)行比較時,由于第一候選文本行相鄰區(qū)的高度是20行像素高度,在第一預(yù)設(shè)范圍內(nèi),從而可確定第一候選文本行相鄰區(qū)為有效文本行相鄰區(qū);而第二候選文本行相鄰區(qū)的高度是5行像素高度,不在第一預(yù)設(shè)范圍內(nèi),從而可確定第二候選文本行相鄰區(qū)不是有效文本行相鄰區(qū);第三候選文本行相鄰區(qū)的高度是29行像素高度,在第一預(yù)設(shè)范圍內(nèi),從而可確定第三候選文本行相鄰區(qū)為有效文本行相鄰區(qū);第四候選文本行相鄰區(qū)的高度是18行像素高度,在第一預(yù)設(shè)范圍內(nèi),從而可確定第四候選文本行相鄰區(qū)為有效文本行相鄰區(qū)。因此,該發(fā)布的圖片中,包括第1-20行、第51-80行,以及第82-100行形成的有效文本行相鄰區(qū)
步驟104:若有效文本行相鄰區(qū)的高度滿足設(shè)定條件,識別圖片為文本長圖。
確定了圖片中的有效文本行相鄰區(qū),還可以繼續(xù)根據(jù)有效文本行相鄰區(qū)的高度,來進(jìn)一步判讀圖片是否為文本長圖。
其中,可將圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和;然后,若行高和與圖片的高度的比值大于第二預(yù)設(shè)值,確定圖片為候選文本長圖;從而,可從候選文本長圖中識別出文本長圖。
例如:第二預(yù)設(shè)值為0.35、0.4,或0.5中任一值,則可得到圖片中全部的有效文本行相鄰區(qū)的高度累加后的行高和,如上述,在100行的二值化的圖片中,有效文本行相鄰區(qū)的高度為20+30+19=69行像素的高度,這樣,行高和與圖片的高度的比值為0.69,大于第二預(yù)設(shè)值,確定圖片為候選文本長圖,從而,可從候選文本長圖中識別出文本長圖。
當(dāng)然,本發(fā)明不限于此,還可以根據(jù)有效文本行相鄰區(qū)的高度之間的差值,來判斷圖片是否為文本長圖,具體可包括:根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度;確定每個有效文本行相鄰區(qū)的高度與基準(zhǔn)高度之間的相對差值;將每個相對差值與第三預(yù)設(shè)值進(jìn)行比較,獲得相對差值大于第三預(yù)設(shè)值的第一個數(shù),以及相對差值小于或等于第三預(yù)設(shè)值的第二個數(shù);若第一個數(shù)與第二個數(shù)的比值小于第四預(yù)設(shè)值時,確定圖片為候選文本長圖;從候選文本長圖中識別出文本長圖。
而根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度了包括:對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)行高;或,對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇至少兩個有效文本行相鄰區(qū)的高度進(jìn)行平均值運(yùn)算,將運(yùn)算后的平均值確定為基準(zhǔn)高度。
例如:二值化后的圖片包括100行,對第1-20行,第22-35行,第36-48行,第51-80行,以及第82-100行,根據(jù)有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)行高,例如將第82-100行形成的有效文本行相鄰區(qū)的高度19行像素高度確定為基準(zhǔn)高度,然后,將第1-20行形成的有效文本行相鄰區(qū)的高度,第22-35行形成的有效文本行相鄰區(qū)的高度,第36-48行形成的有效文本行相鄰區(qū)的高度,以及第51--80行形成的有效文本行相鄰區(qū)的高度與19行像素高度進(jìn)行相對差值的運(yùn)算,并統(tǒng)計相對差值大于第三預(yù)設(shè)值的第一個數(shù),以及相對差值小于或等于第三預(yù)設(shè)值的第二個數(shù),例如:第一個數(shù)為1,而第二個數(shù)為3,第四預(yù)設(shè)值為0.5,這樣,第一個數(shù)與第二個數(shù)的比值為0.33,小于第四預(yù)設(shè)值,從而,可確定圖片為候選文本長圖;從候選文本長圖中識別出為文本長圖。
這里,從候選文本長圖中識別出為文本長圖可包括:直接將候選文本長圖識別為文本長圖。
可見,本發(fā)明實(shí)施例中,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū)的高度,并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而可根據(jù)圖片的類型,可采用對應(yīng)的降低流量耗費(fèi)的處理,例如:向用戶發(fā)送文本長圖的提醒信息,這樣用戶可及時更改發(fā)表文字較多的文章的方式,或者在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn),減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
因此,識別圖片為文本長圖之后,還包括:向發(fā)布終端發(fā)送文本長圖的提醒信息?;蛘?,在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn)?;蛘?,既向發(fā)布終端發(fā)送文本長圖的提醒信息,又在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn)。
在上述步驟104中,確定圖片為候選文本長圖,可直接將候選文本長圖識別為文本長圖。但是由于與表格類,評論類信息對應(yīng)的圖片可能也有有效文本行相鄰區(qū),且有效文本行相鄰區(qū)的高度也滿足設(shè)定條件,因此,為進(jìn)一步識別文本長圖的準(zhǔn)確率,則將候選文本長圖識別為文本長圖可包括:對候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和;將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較;若各列像素值之和均大于等于第五預(yù)設(shè)值,確定候選文本長圖為文本長圖。
其中,第五預(yù)設(shè)值可根據(jù)應(yīng)用場景確定,例如,圖片高度值的1%或0.5%這樣的較少值,由于沒有列像素值之和小于第五預(yù)設(shè)值,即各列像素值之和均大于等于所述第五預(yù)設(shè)值,這樣可以排除空白列,從而,可提高排除與表格類,評論類信息對應(yīng)的圖片的幾率,提高了識別文本長圖的準(zhǔn)確率。
下面將操作流程集合到具體實(shí)施例中,舉例說明本公開實(shí)施例提供的方法。
實(shí)施例一,圖2是根據(jù)一示例性實(shí)施例一示出的圖片類型識別的流程圖,參見圖2,本實(shí)施例中圖片類型識別的過程包括:
步驟201:對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和,將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。
同樣,可采用大津算法將圖片進(jìn)行二值化分割,背景像素值為0,前景像素值為1。然后,逐行掃描二值化后的圖片,將二值化后的圖片每行像素值分別進(jìn)行累加,得到每行像素的行像素值之和。
將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行;對所有相鄰的候選文本行進(jìn)行連接,形成候選文本行相鄰區(qū);
步驟202:根據(jù)每個候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū)。
將每個候選文本行相鄰區(qū)的高度與第一預(yù)設(shè)范圍進(jìn)行比較;若當(dāng)前候選文本行相鄰區(qū)的高度在第一預(yù)設(shè)范圍內(nèi),確定當(dāng)前候選文本行相鄰區(qū)為有效文本行相鄰區(qū)。
步驟203:將圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和。
這里,可得到圖片中全部的有效文本行相鄰區(qū)的高度累加后的行高和。
步驟204:判斷行高和與圖片的高度的比值是否大于第二預(yù)設(shè)值?若是,執(zhí)行步驟205,否則,流程結(jié)束。
第二預(yù)設(shè)值為0.35、0.4,或0.5中任一值。若行高和與圖片的高度的比值為0.6,則大于第二預(yù)設(shè)值,執(zhí)行步驟205。行高和與圖片的高度的比值為0.2,則小于第二預(yù)設(shè)值,流程結(jié)束。
步驟205:確定圖片為候選文本長圖。
由于行高和與圖片的高度的比值大于第二預(yù)設(shè)值,因此,可確定圖片為候選文本長圖。
步驟206:從候選文本長圖中識別出文本長圖。
這里,可直接將候選文本長圖識別為文本長圖?;蛘?,還可對候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和;將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較;若各列像素值之和均大于等于第五預(yù)設(shè)值,確定候選文本長圖為文本長圖。從而,可提高排除與表格類,評論類信息對應(yīng)的圖片的幾率,提高了識別文本長圖的準(zhǔn)確率。
步驟207:向發(fā)布終端發(fā)送文本長圖的提醒信息。
當(dāng)然,識別出圖片為文本長圖,則可通過向終端發(fā)送文本長圖的提醒信息,來提示用戶更改發(fā)表文字較多的文章的方式,從而提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
可見,本實(shí)施中,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶發(fā)布的是文本長圖,這樣用戶可及時更改發(fā)表文字較多的文章的方式,減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
實(shí)施例二,圖3是根據(jù)一示例性實(shí)施例二示出的圖片類型識別的流程圖。參見圖3,本實(shí)施例中圖片類型識別的過程包括:
步驟301:對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和,將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。
同樣,可采用大津算法將圖片進(jìn)行二值化分割,背景像素值為0,前景像素值為1。然后,逐行掃描二值化后的圖片,將二值化后的圖片每行像素值分別進(jìn)行累加,得到每行像素的行像素值之和。將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行;對所有相鄰的候選文本行進(jìn)行連接,形成候選文本行相鄰區(qū)
步驟302:根據(jù)每個候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū)。
這里,將每個候選文本行相鄰區(qū)的高度與第一預(yù)設(shè)范圍進(jìn)行比較;若當(dāng)前候選文本行相鄰區(qū)的高度在第一預(yù)設(shè)范圍內(nèi),確定當(dāng)前候選文本行相鄰區(qū)為有效候選文本行相鄰區(qū)。
步驟303:根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度。
這里,對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)行高;或,對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇至少兩個有效文本行相鄰區(qū)的高度進(jìn)行平均值運(yùn)算,將運(yùn)算后的平均值確定為基準(zhǔn)行高。
步驟304:確定每個有效文本行相鄰區(qū)的高度與基準(zhǔn)高度之間的相對差值。
這里,進(jìn)行差值運(yùn)算,得到每個有效文本行相鄰區(qū)的高度與基準(zhǔn)高度之間的相對差值。
步驟305:將每個相對差值與第三預(yù)設(shè)值進(jìn)行比較,獲得相對差值大于第三預(yù)設(shè)值的第一個數(shù),以及相對差值小于或等于第三預(yù)設(shè)值的第二個數(shù)。
可進(jìn)行統(tǒng)計,得到第一個數(shù)與第二個數(shù)。第三預(yù)設(shè)值可根據(jù)具體應(yīng)用環(huán)境進(jìn)行設(shè)定。
步驟306:判斷第一個數(shù)與第二個數(shù)的比值是否小于第四預(yù)設(shè)值?若是,執(zhí)行步驟307,否則,流程結(jié)束。
第四預(yù)設(shè)值比較小,例如:0.1、0.2、0.3等等。第一個數(shù)與第二個數(shù)的比值比第四預(yù)設(shè)值小,則表明絕大部分的有效文本行的行高是標(biāo)準(zhǔn)的。
步驟307:確定圖片為候選文本長圖。
由于第一個數(shù)與第二個數(shù)的比值比第四預(yù)設(shè)值小,可確定圖片為候選文本長圖。
步驟308:從候選文本長圖中識別出文本長圖。
同樣,可直接將候選文本長圖識別為文本長圖。或者,對候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和;將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較;若各列像素值之和均大于等于第五預(yù)設(shè)值,確定候選文本長圖為文本長圖。
步驟309:向發(fā)布終端發(fā)送文本長圖的提醒信息,以及在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn)。
這里,即可以提示用戶更改發(fā)表文字較多的文章的方式,又可以進(jìn)行降頻處理,從而,減少對流量的耗費(fèi),并且可提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
可見,本實(shí)施中,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶發(fā)布的是文本長圖,這樣用戶可及時更改發(fā)表文字較多的文章的方式,并可進(jìn)行降頻處理,從而,減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。
根據(jù)上述圖片類型識別的過程,可構(gòu)建一種圖片類型識別的裝置,如圖4所示,該裝置包括:包括:掃描處理單元410、連接單元420、確定單元430以及識別單元440,其中,
掃描處理單元410,用于對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和。
連接單元420,用于將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。
確定單元430,用于根據(jù)每個候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū)。
識別單元440,用于若有效文本行的行高滿足設(shè)定條件,識別圖片為文本長圖。
本發(fā)明實(shí)施例中,識別單元440,具體用于將圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和,若行高和與圖片的高度的比值大于第二預(yù)設(shè)值,確定圖片為候選文本長圖,從候選文本長圖中識別出文本長圖。
本發(fā)明另一實(shí)施例中,識別單元440,具體用于根據(jù)每個有效文本行相鄰區(qū)的高度,確定基準(zhǔn)高度,確定每個有效文本行相鄰區(qū)的高度與基準(zhǔn)高度之間的相對差值,將每個相對差值與第三預(yù)設(shè)值進(jìn)行比較,獲得相對差值大于第三預(yù)設(shè)值的第一個數(shù),以及相對差值小于或等于第三預(yù)設(shè)值的第二個數(shù),若第一個數(shù)與第二個數(shù)的比值小于第四預(yù)設(shè)值時,確定圖片為候選文本長圖,從候選文本長圖中識別出文本長圖。
本發(fā)明實(shí)施例中,識別單元440,具體用于對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇一個有效文本行相鄰區(qū)的高度為基準(zhǔn)行高;或,對各有效文本行相鄰區(qū)的高度進(jìn)行排序,從排在中間的有效文本行相鄰區(qū)的高度中選擇至少兩個有效文本行相鄰區(qū)的高度進(jìn)行平均值運(yùn)算,將運(yùn)算后的平均值確定為基準(zhǔn)行高。
本發(fā)明實(shí)施例中,識別單元440,還用于對候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和,將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較,若各列像素值之和均大于等于第五預(yù)設(shè)值,確定候選文本長圖為文本長圖。
本發(fā)明實(shí)施例中,裝置還包括:提醒單元,用于向發(fā)布終端發(fā)送文本長圖的提醒信息。
本發(fā)明實(shí)施例中,裝置還包括:降頻處理單元,用于在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn)。
可見,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶發(fā)布的是文本長圖,這樣用戶可及時更改發(fā)表文字較多的文章的方式,或者進(jìn)行降頻處理,減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
下面舉例說明本公開實(shí)施例提供的裝置。
實(shí)施例三,圖5是根據(jù)一示例性實(shí)施例三示出的圖片類型識別的裝置結(jié)構(gòu)圖,參見圖5,本實(shí)施例中,該裝置包括:包括:掃描處理單元410、連接單元420、確定單元430以及識別單元440,還包括提醒單元450以及降頻處理單元460。
具體地,掃描處理單元410對發(fā)布的圖片進(jìn)行二值化,并逐行掃描二值化后的圖片,確定每行像素的行像素值之和。
連接單元450將圖片中行像素值之和大于第一預(yù)設(shè)值的像素行確定為候選文本行,并對所有相鄰的候選文本行進(jìn)行連接,形成對應(yīng)的候選文本行相鄰區(qū)。這樣,確定單元430根據(jù)每個候選文本行相鄰區(qū)的高度,將高度在第一預(yù)設(shè)范圍內(nèi)的候選文本行相鄰區(qū)確定為有效文本行相鄰區(qū)。
從而,識別單元440可將圖片中每個有效文本行相鄰區(qū)的高度進(jìn)行累加,得到行高和。當(dāng)然,若確定單元440確定行高和與圖片的高度的比值大于第二預(yù)設(shè)值時,確定圖片為候選文本長圖。并且,識別單元440可直接將候選文本長圖識別為文本長圖。或者,對候選文本長圖進(jìn)行逐列掃描,確定每列像素的列像素值之和;將每列的列像素值之和與第五預(yù)設(shè)值進(jìn)行比較;若各列像素值之和均大于等于第五預(yù)設(shè)值,確定候選文本長圖為文本長圖。
而提醒單元450可向發(fā)布終端發(fā)送文本長圖的提醒信息。同時,降頻處理單元460在推薦數(shù)據(jù)流中對圖片進(jìn)行降頻展現(xiàn)。從而,即可以提示用戶更改發(fā)表文字較多的文章的方式,又可以進(jìn)行降頻處理,減少對流量的耗費(fèi),并且可提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
可見,本實(shí)施中,根據(jù)發(fā)布的圖片中每行的行像素值之后,確定圖片中的有效文本行相鄰區(qū),并當(dāng)有效文本行相鄰區(qū)的高度滿足設(shè)定條件,可確定圖片為文本長圖,從而,可提醒用戶發(fā)布的是文本長圖,這樣用戶可及時更改發(fā)表文字較多的文章的方式,并可進(jìn)行降頻處理,從而,減少對流量的耗費(fèi),提高發(fā)布內(nèi)容被閱讀的幾率,進(jìn)一步擴(kuò)大信息的傳播量。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。