專利名稱:創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置,特別涉及一種能提高數(shù)據(jù)庫(kù)的檢索效率的創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)購(gòu)物已經(jīng)逐漸融入了百姓的生活,越來越多的互聯(lián)網(wǎng)用戶開始接受這一方便快捷的購(gòu)物方式。這些互聯(lián)網(wǎng)用戶往往希望快速且準(zhǔn)確地從海量商品圖像中搜索選取出其感興趣的商品的圖像,從而參考和/或購(gòu)買相應(yīng)的物品。但是網(wǎng)絡(luò)上顯示的商品圖像繁多復(fù)雜,既有利用相機(jī)等圖像采集設(shè)備實(shí)際拍攝所得到的實(shí)際商品的圖像,以及對(duì)實(shí)際拍攝圖像進(jìn)行簡(jiǎn)單處理(如插值或采樣)后的實(shí)際商品的圖像,此外,還有一些并非由圖像采集設(shè)備實(shí)際拍攝所得到的圖像,如合成圖像、圖像軟件生成的圖像等。由于實(shí)際拍攝所得到的實(shí)際商品的圖像更能準(zhǔn)確代表商品,因此用戶通常是希望快速搜索出此類圖像,而非其他圖像。從這個(gè)角度出發(fā),可將互聯(lián)網(wǎng)上的數(shù)字圖像大致分為兩類,一類是對(duì)實(shí)際商品的拍攝或掃描得到的圖像(包括經(jīng)過簡(jiǎn)單處理的實(shí)際商品的圖像),如圖I所示的連衣裙、領(lǐng)帶、腰帶等,這些對(duì)于通過互聯(lián)網(wǎng)挑選購(gòu)買商品的用戶來說是有參考價(jià)值的,在此被稱為參考圖像;另一類是沒有參考價(jià)值的圖像,如由計(jì)算機(jī)軟件生成的圖像,以及非商品(如文字掃描圖像等)圖像,如圖2所示的鱷魚標(biāo)志等,這些對(duì)于通過互聯(lián)網(wǎng)挑選購(gòu)買商品的用戶來說是沒有用的,被稱為非參考圖像。通過自動(dòng)將互聯(lián)網(wǎng)上的圖像進(jìn)行區(qū)分以認(rèn)定其是參考圖像或是非參考圖像,并將參考圖像納入圖像數(shù)據(jù)庫(kù)中,而將非參考圖像排除在圖像數(shù)據(jù)庫(kù)之外,從而可以創(chuàng)建對(duì)于上述用戶而言更為簡(jiǎn)化、有用的圖像數(shù)據(jù)庫(kù),由此提高圖像數(shù)據(jù)庫(kù)的搜索效率,減少用戶的搜索時(shí)間,降低服務(wù)器的負(fù)擔(dān)。一種區(qū)分方法是,基于圖像顏色數(shù)、主顏色率、色彩飽和度、顏色直方圖相關(guān)性這幾個(gè)特性來區(qū)分參考圖像與非參考圖像,該區(qū)分方法的原理是通過與參考圖像相比,滿足以下條件的圖像為非參考圖像顏色比較單一,主顏色率比較高,色彩飽和度高的像素點(diǎn)較多;并且非參考圖像的顏色直方圖與統(tǒng)計(jì)所得的平均顏色直方圖的相關(guān)性大于非參考圖像的顏色直方圖與統(tǒng)計(jì)所得的參考圖像的平均顏色直方圖的相關(guān)性。這種方法的準(zhǔn)確率和召回率偏低。其中,準(zhǔn)確率是指區(qū)分出的相關(guān)圖像中被正確區(qū)分的相關(guān)圖像與被區(qū)分出的所有相關(guān)圖像的比值。例如,區(qū)分出的真正的參考圖像與區(qū)分出的所有參考圖像的比值;召回率是指區(qū)分出的目標(biāo)圖像與所有目標(biāo)圖像的比值,例如區(qū)分出的參考圖像與所有參考圖像的比值。上述方法對(duì)于例如尺度及顏色被插值或采樣的圖像,由于這些處理改變了原圖像的一些性質(zhì),如顏色數(shù)、主顏色率等,因而,使用上述區(qū)分方法很難有效地區(qū)分出參考圖像和非參考圖像。此外,互聯(lián)網(wǎng)上的數(shù)字圖像還包括通常包含白色、灰色或黑色主體顏色且信息較少的圖像,這種圖像被稱為垃圾圖像。垃圾圖像中既有對(duì)上述用戶有用的參考圖像,也有對(duì)上述用戶無用的非參考圖像。因而,若僅使用上述判斷方法進(jìn)行判斷,則很可能產(chǎn)生將所有垃圾圖像都?xì)w為非參考圖像的誤判。例如,對(duì)于一種顯示置于黑色背景上的白色襯衫的參考圖像,這種圖像本身的顏色數(shù)比較少,色彩飽和度較高,如果使用上述判斷方法僅基于圖像顏色數(shù)、色彩飽和度等進(jìn)行判斷,則會(huì)將其錯(cuò)誤地判斷為非參考圖像。
發(fā)明內(nèi)容
鑒于上述缺陷,本申請(qǐng)的一個(gè)目的是提供一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置,其可以快速、準(zhǔn)確地對(duì)大規(guī)模圖像庫(kù)進(jìn)行分類,從而提高圖像數(shù)據(jù)庫(kù)的搜索效率。為了實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┮环N創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法,其包括如下步驟I)獲取待區(qū)分的輸入圖像;
2)通過以下步驟來判斷輸入圖像是參考圖像還是非參考圖像a.對(duì)所述輸入圖像進(jìn)行預(yù)處理;b.對(duì)所述輸入圖像進(jìn)行垃圾圖像判斷處理;c.對(duì)所述輸入圖像進(jìn)行文字圖像判別處理;3)將判斷為參考圖像的圖像納入圖像數(shù)據(jù)庫(kù)中。本申請(qǐng)還提供一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的裝置,其包括獲取圖像模塊,用于獲取待區(qū)分的輸入圖像;以及預(yù)處理模塊,用于對(duì)所述輸入圖像進(jìn)行預(yù)處理,從而判斷輸入圖像是參考圖像還是非參考圖像;垃圾圖像判斷處理模塊,用于對(duì)所述輸入圖像進(jìn)行垃圾圖像判斷處理,從而判斷輸入圖像是參考圖像還是非參考圖像;文字圖像判別處理模塊,用于對(duì)所述輸入圖像進(jìn)行文字圖像判別處理,從而判斷輸入圖像是參考圖像還是非參考圖像;以及圖像納入模塊,用于將判斷為參考圖像的圖像納入圖像數(shù)據(jù)庫(kù)中。在本申請(qǐng)中,圖像預(yù)處理利用了如圖像尺度及顏色數(shù)等幾個(gè)效率極高的判斷項(xiàng),將那些容易區(qū)分的非參考圖像召回,這樣可以減少之后的垃圾圖像與文字圖像判別處理的判斷量,大大減少了運(yùn)行時(shí)間,從而提高了算法的效率。此外,在本申請(qǐng)中,作用于顏色空間的垃圾圖像判斷處理并不是對(duì)整幅圖像的主顏色率及飽和度進(jìn)行判斷,而是對(duì)圖像進(jìn)行了分塊處理,通過各個(gè)分塊之間的顏色關(guān)系來判斷圖像的類型,因而使得判斷更為精確。另外,在本申請(qǐng)中,分析圖像所包含的內(nèi)容,提出了根據(jù)文字區(qū)域所占比例來判斷圖像的類型,其與顏色空間的判斷處理具有很好的互補(bǔ)性,從而以多角度全面進(jìn)行判斷,從而提聞了召回率。本申請(qǐng)包括如上所述的多個(gè)優(yōu)點(diǎn)。當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
圖I示例性示出了參考圖像的實(shí)例的示意圖;圖2示例性示出了非參考圖像的實(shí)例的示意圖;圖3示例性示出了根據(jù)本申請(qǐng)創(chuàng)建圖像數(shù)據(jù)庫(kù)的主要處理的流程圖4示例性示出了根據(jù)本申請(qǐng)實(shí)施例的圖像預(yù)處理的流程圖;圖5示例性示出了根據(jù)本申請(qǐng)實(shí)施例的垃圾圖像判斷處理的流程圖;圖6示例性示出了利用垃圾圖像判斷處理判斷為垃圾圖像的6個(gè)實(shí)例的示意圖;圖7示例性示出了根據(jù)本申請(qǐng)實(shí)施例的文字圖像判別處理的流程圖;圖8示例性示出了根據(jù)本申請(qǐng)實(shí)施例的文字圖像判別處理的改型的流程圖;圖9示例性示出了根據(jù)本申請(qǐng)實(shí)施例的Sobel邊緣檢測(cè)效果的示意圖;圖10示例性示出了根據(jù)本申請(qǐng)實(shí)施例的文字區(qū)域判斷效果的示意圖;
圖11示例性示出了根據(jù)本申請(qǐng)實(shí)施例的文字區(qū)域統(tǒng)計(jì)效果的示意圖;圖12示例性示出了根據(jù)本申請(qǐng)實(shí)施例的條紋誤判解決效果的一個(gè)實(shí)例的示意圖;圖13示例性示出了根據(jù)本申請(qǐng)實(shí)施例的條紋誤判解決效果的另一個(gè)實(shí)例的示意圖;圖14示例性示出了根據(jù)本申請(qǐng)實(shí)施例的文字圖像判斷過程的示意圖;以及圖15示例性示出了根據(jù)本申請(qǐng)實(shí)施例的創(chuàng)建圖像數(shù)據(jù)庫(kù)的裝置的功能框圖。
具體實(shí)施例方式現(xiàn)將參照附圖詳細(xì)描述根據(jù)本申請(qǐng)的創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置,其中將重點(diǎn)描述如何區(qū)分參考圖像和非參考圖像。根據(jù)一個(gè)實(shí)施例,先利用圖像的物理尺度與顏色數(shù)這兩個(gè)簡(jiǎn)單的判斷項(xiàng)進(jìn)行預(yù)處理,將那些容易區(qū)分的非參考圖像排除;接下來,利用垃圾圖像判斷處理,將顏色單一的非參考圖像排除;最后,利用文字圖像判別處理,將包含文字較多的非參考圖像召回。以上幾個(gè)處理分別作用于圖像的顏色空間與非顏色空間,故具有較好的互補(bǔ)性。以上幾個(gè)處理的執(zhí)行順序可由本領(lǐng)域的技術(shù)人員根據(jù)實(shí)際情況進(jìn)行調(diào)整。經(jīng)過以上幾個(gè)步驟,大部分的非參考圖像可以被召回,即召回率很高,且具有很高的準(zhǔn)確率,運(yùn)行效率也很高。下面將參考附圖進(jìn)行詳細(xì)描述。根據(jù)一個(gè)實(shí)施例,如圖3所示,其為創(chuàng)建圖像數(shù)據(jù)庫(kù)的主要流程圖。該圖像處理流程主要包括圖像獲取步驟Si,用于獲取待區(qū)分的輸入圖像;判斷通過圖像獲取步驟SI獲取的圖像是參考圖像還是非參考圖像的圖像預(yù)處理步驟S2、垃圾圖像判斷步驟S3;以及文字圖像判別步驟S4 ;以及將判斷為參考圖像的圖像添加到圖像數(shù)據(jù)庫(kù)中的步驟S5,和將判斷為非參考圖像的圖像排除在圖像數(shù)據(jù)庫(kù)之外的步驟S6。下面將參照附圖依次詳細(xì)說明上述處理流程的具體步驟。步驟SI,圖像獲取步驟;用于獲取待區(qū)分的輸入圖像;步驟S2,圖像預(yù)處理;參照?qǐng)D4描述的圖像預(yù)處理步驟S2,其利用一些簡(jiǎn)單的特征預(yù)先將那些在物理尺度和/或顏色空間上比較容易區(qū)分的非參考圖像召回,并對(duì)圖像進(jìn)行壓縮。根據(jù)一個(gè)實(shí)施例,該步驟S2具體包括以下步驟步驟S21,根據(jù)圖像的長(zhǎng)與寬像素值判斷輸入的圖像是否為非參考圖像。S卩,確定輸入圖像的長(zhǎng)與寬像素值,若輸入圖像的長(zhǎng)或?qū)捪袼刂敌∮谝婚撝?例如為80),則判斷這一輸入的圖像為非參考圖像,轉(zhuǎn)到步驟S6 ;否則,進(jìn)入步驟S22繼續(xù)進(jìn)行判斷。步驟S22,根據(jù)圖像的長(zhǎng)寬比判斷輸入的圖像是否為非參考圖像。對(duì)于參考圖像,由于其通過諸如相機(jī)之類的圖像采集設(shè)備拍攝而得,而圖像采集設(shè)備的形狀一定,故參考圖像的長(zhǎng)寬比有一定范圍。因而,若經(jīng)過步驟S21的圖像的長(zhǎng)寬比大于一閾值或小于一閾值(例如大于5或小于0. 20),則該圖像被判斷為非參考圖像,轉(zhuǎn)到步驟S6 ;否則,進(jìn)入步驟S23繼續(xù)進(jìn)行判斷。步驟S23,根據(jù)圖像的長(zhǎng)和寬像素值判斷是否對(duì)圖像進(jìn)行壓縮處理。S卩,判斷圖像的長(zhǎng)或?qū)捪袼刂凳欠翊笥谝婚撝?例如為200-250之間的任一值),若是,則進(jìn)入步驟S24 ;否則,即判斷圖像的長(zhǎng)、寬像素值并沒有大于一閾值,轉(zhuǎn)到步驟S25;步驟S24,對(duì)圖像進(jìn)行壓縮,之后進(jìn)入將在后面描述的步驟S25。
圖像壓縮的目的是為了減少后面執(zhí)行垃圾圖像判斷處理和文字圖像判別處理的運(yùn)行時(shí)間。經(jīng)過發(fā)明人的大量實(shí)驗(yàn)校驗(yàn),圖像壓縮雖對(duì)算法效果產(chǎn)生一定影響,但是大大減少了運(yùn)行時(shí)間。其中,壓縮后的圖像的長(zhǎng)寬比可以保持不變。步驟S25,根據(jù)圖像的顏色數(shù)判斷輸入圖像是否為非參考圖像。該步驟中,可將輸入圖像的顏色空間進(jìn)行壓縮,統(tǒng)計(jì)輸入圖像包含的顏色數(shù),若該顏色數(shù)小于一閾值(例如為7),則判斷該圖像為非參考圖像,轉(zhuǎn)到步驟S6 ;否則,進(jìn)入步驟S3進(jìn)行垃圾圖像判斷處理。經(jīng)大量實(shí)驗(yàn)證明,圖像預(yù)處理步驟運(yùn)行效率極高,將近50%的非參考圖像在這一步驟中被排除,而且準(zhǔn)確率極高,這大大減少了之后相對(duì)耗時(shí)的垃圾圖像與文字圖像判別處理的處理圖像數(shù)目,有效提高了算法運(yùn)行效率。上述步驟及其執(zhí)行順序僅為一個(gè)實(shí)施例,本領(lǐng)域的技術(shù)人員可以根據(jù)實(shí)際情況修改上述步驟,如刪除步驟S24,修改步驟S21、S22、S23、S25中的閾值,改變上述步驟的執(zhí)行順序,甚至在一定條件下重復(fù)執(zhí)行某些步驟。步驟S3、垃圾圖像判斷處理;該步驟中,對(duì)于顯示置于黑色背景上的白色襯衫的實(shí)拍圖像之類的本身顏色數(shù)比 較少且色彩飽和度較高的實(shí)拍圖像,如果只通過整幅圖像的顏色數(shù)、主顏色率等判斷項(xiàng)來判斷,則可能造成比較嚴(yán)重的誤判,即將其誤判為非參考圖像而被排除在圖像數(shù)據(jù)庫(kù)之外。因而,本申請(qǐng)針對(duì)這種情況對(duì)圖像進(jìn)行了分塊處理,根據(jù)各個(gè)分塊主顏色的關(guān)系來判斷圖像是非參考圖像還是參考圖像。具體地說,可以將輸入圖像分成多個(gè)塊,分別求取各個(gè)塊的主顏色,并根據(jù)整幅輸入圖像的主顏色與各個(gè)塊的主顏色來判斷輸入圖像為參考圖像還是非參考圖像。圖5示例性示出了根據(jù)本申請(qǐng)通過分塊處理進(jìn)行垃圾圖像判斷步驟S3的處理流程圖,包括以下步驟步驟S31、對(duì)圖像的顏色空間進(jìn)行壓縮,例如將256色圖像壓縮為32色圖像;步驟S32、判斷圖像的主顏色是否為白色或黑色,如果是,則進(jìn)入步驟S33 ;如果否,轉(zhuǎn)步驟S4 ;步驟S33、將圖像分成多個(gè)塊,并分別求取每個(gè)塊中的主顏色;該步驟中,可根據(jù)計(jì)算需要,將圖像分成2至32個(gè)塊,本實(shí)施例中優(yōu)選分成九個(gè)塊。
步驟S34、判斷圖像是否滿足主顏色為黑色并且九個(gè)塊的主顏色也為黑色,如果是,判斷該圖像為非參考圖像,轉(zhuǎn)步驟S5 ;如果否,進(jìn)入步驟S35 ;步驟S35、判斷圖像是否滿足主顏色為白色并且9個(gè)塊中有多個(gè)塊的主顏色也偏白色,如果是,判斷該圖像為非參考圖像,轉(zhuǎn)步驟S5 ;如果否,進(jìn)入步驟S36 ;步驟S36、判斷圖像是否對(duì)角上存在主顏色為白色的塊,如果是,判斷該圖像為非參考圖像,轉(zhuǎn)步驟S5,如果否,進(jìn)入步驟S4 ;上述步驟及其執(zhí)行順序僅為一個(gè)實(shí)施例,本領(lǐng)域的技術(shù)人員可以根據(jù)實(shí)際情況修改上述步驟,如圖像塊數(shù)的選取,圖像的主顏色的選取、色塊主顏色的選取,有效顏色的選
取等等。
利用上述垃圾圖像判斷處理可以正確地將顯示置于黑色背景上的白色襯衫的實(shí)拍圖像之類的本身顏色數(shù)比較少且色彩飽和度較高的圖像正確判斷為參考圖像。圖6為示出利用垃圾圖像判斷處理判斷為非參考圖像的6個(gè)實(shí)例的示意圖。步驟S4、文字圖像判別處理;由于非參考圖像中有很大一部分是文字圖像,這種文字圖像通常包含較多的文字,在顏色空間上比較難將這類圖像與參考圖像區(qū)分開來。因而,為了提高區(qū)分參考圖像和非參考圖像的準(zhǔn)確率,可針對(duì)這種特殊的文字圖像進(jìn)行判別。本申請(qǐng)通過判斷圖像中文字區(qū)域所占比例來區(qū)分這類圖像。具體地說,可以對(duì)輸入圖像的邊緣區(qū)域進(jìn)行檢測(cè)以得到邊緣點(diǎn)圖像,并根據(jù)邊緣點(diǎn)圖像中文字區(qū)域所占比例來判斷所述輸入圖像為參考圖像還是非參考圖像。優(yōu)選地,在將輸入圖像處理為邊緣點(diǎn)圖像之前,還包括將所述輸入圖像轉(zhuǎn)換成灰度圖的步驟。如圖7所示,其示例性示出了通過判斷圖像中文字區(qū)域所占比例來區(qū)分文字圖像的流程圖。下面是具體步驟。步驟S41、將圖像轉(zhuǎn)化為灰度圖。這是因?yàn)閷?duì)于文字圖像,圖像對(duì)比度的特征遠(yuǎn)明顯于顏色特征,故以下的操作均在灰度空間進(jìn)行,這樣也可以提高運(yùn)行效率。步驟S42、進(jìn)行邊緣檢測(cè),這是由于圖像中的文字區(qū)域具有比較明顯的邊緣特征。在一個(gè)實(shí)施例中,使用左對(duì)角和右對(duì)角索貝爾算子(Sobel operator, Sobel算子,是圖像處理中的算子之一,主要用作邊緣檢測(cè))Sobel算子對(duì)圖像的邊緣區(qū)域進(jìn)行檢測(cè),可以增強(qiáng)文字區(qū)域在圖像中的效果。之所以選用Sobel算子一方面是因?yàn)樵撍阕邮歉飨蛲缘?,因此?duì)各個(gè)方向的筆畫都能檢測(cè);另一方面,Sobel算子能產(chǎn)生雙重邊緣,這就更加凸顯了圖像中的文字筆畫的邊緣特征。圖9為Sobel邊緣檢測(cè)效果的示意圖,其中,左側(cè)的三個(gè)圖像為原圖(上面的兩張圖片為非參考圖像,下面的一張圖片為參考圖像),右側(cè)為通過邊緣檢測(cè)所得到的對(duì)應(yīng)的三個(gè)圖像。步驟S43、進(jìn)行文字區(qū)域的檢測(cè)。在一個(gè)實(shí)施例中,通過分析Sobel邊緣檢測(cè)所得到的邊緣點(diǎn)圖像,可以發(fā)現(xiàn)文字圖像存在一個(gè)特征,即文字行與行之間存在明顯的空白行。根據(jù)統(tǒng)計(jì),在未做壓縮前,圖像中文字的高度大多分布在8到45個(gè)像素之間,而經(jīng)過預(yù)處理中的壓縮后的文字高度大多都低于15個(gè)像素。因而,將上述邊緣點(diǎn)圖像分割為一個(gè)個(gè)16*16像素大小的窗口,分別對(duì)每一個(gè)窗口判斷是否為文字區(qū)域假設(shè)文字為橫向書寫文字,在窗口內(nèi)做橫向投影,投影值小于一定值的行被認(rèn)為是空白行,求取每個(gè)窗口內(nèi)最大的連續(xù)空白行數(shù)目Max_BL,之后根據(jù)Max_BL做判斷①若Max_BL小于第一閾值,則認(rèn)為在該窗口中沒有文字存在,為非文字區(qū)域,因?yàn)槿绻形淖执嬖?,不同行的文字之間應(yīng)該會(huì)有間隔;②若Max_BL大于第二閾值,同樣認(rèn)為該窗口為非文字區(qū)域;③若Max_BL處于第一與第二閾值之間,則判斷為文字區(qū)域。之后,除去判斷為非文字區(qū)域的窗口中的邊緣點(diǎn),保留第一與第二閾值之間的判斷為文字區(qū)域的窗口中的邊緣點(diǎn)。圖10為文字區(qū)域判斷效果示意圖。為了便于比對(duì),圖10中左側(cè)的三個(gè)圖像即為圖9中右側(cè)通過邊緣檢測(cè)所得到的三個(gè)圖像,圖10中右側(cè)的三個(gè)圖像為進(jìn)行文字區(qū)域檢測(cè)后得到的圖像。從該圖中可以看出,文字圖像的邊緣點(diǎn)基本都被保留下來,而非文字區(qū)域的邊緣點(diǎn)基本都被抑制。最后,進(jìn)行文字區(qū)域數(shù)目統(tǒng)計(jì)S44。經(jīng)過以上兩步處理,文字區(qū)域與非文字區(qū)域表現(xiàn)出了較明顯的不同,文字區(qū)域傾向于沿固定方向如橫向密集分布,而非文字區(qū)域傾向于無方向性的曲線分布。在一個(gè)實(shí)施例中,使用高10個(gè)像素、寬40個(gè)像素大小的矩形窗口,分別以4個(gè)像素的移動(dòng)量沿左右方向和8個(gè)像素的移動(dòng)量沿上下方向?qū)φ鶊D像區(qū)域進(jìn)行 像中文字區(qū)域所占比例,若該比例大于一定閾值,則該圖像被判斷為文字圖像,從而作為非參考圖像被排除在圖像數(shù)據(jù)庫(kù)之外,即進(jìn)入步驟S6 ;否則作為參考圖像被納入圖像數(shù)據(jù)庫(kù)中,即進(jìn)入步驟S5。圖11為文字區(qū)域統(tǒng)計(jì)效果示意圖,同樣,為了便于比對(duì),圖11中左側(cè)的三個(gè)圖像即為圖10中右側(cè)所示的進(jìn)行文字區(qū)域檢測(cè)后得到的圖像,圖11中的右側(cè)為利用文字區(qū)域數(shù)目統(tǒng)計(jì)而得到的文字區(qū)域的定位效果。經(jīng)過上述圖7所示的處理可以很好地將文字圖像識(shí)別出來,并將其作為非參考圖像排除在圖像數(shù)據(jù)庫(kù)之外。但是,由于條紋狀圖像經(jīng)過以上處理后與文字圖像表現(xiàn)出了類似的分布特性,因而對(duì)于這種條紋狀圖像,很容易產(chǎn)生誤判。針對(duì)于此,本申請(qǐng)人通過細(xì)致分析條紋狀圖像及文字圖案,發(fā)現(xiàn)條紋狀圖像的邊緣點(diǎn)傾向于呈現(xiàn)線狀分布,因此,利用這一區(qū)別點(diǎn)進(jìn)行具體判斷。即,參見圖8,其在圖7中的步驟S44之后加入進(jìn)行條紋判斷的步驟S45,這樣可以使得條紋狀商品圖像不被誤判,而可以正確地納入圖像數(shù)據(jù)庫(kù)中。下面將詳細(xì)地描述條紋判斷步驟S45。根據(jù)一實(shí)施例,計(jì)算上述10*40矩形窗口內(nèi)10行中相鄰像素差值的絕對(duì)值之和Sum_d,統(tǒng)計(jì)矩形窗口中Sum_d小于一定值的行的數(shù)目,如該數(shù)目大于一定閾值,則判斷該矩形區(qū)域不是文字區(qū)域。該判斷處理有效地解決了條紋狀圖案的誤判,效果如圖12和圖13所示。圖12和圖13中的(a)為原圖,(b)為Sobel邊緣檢測(cè)圖,(C)為文字區(qū)域判斷效果圖,(d)為未加條紋判斷項(xiàng)前得到的文字區(qū)域判斷示意圖,(e)為加上條紋判斷項(xiàng)后得到的文字區(qū)域統(tǒng)計(jì)示意圖,從圖11和圖12中的(d)與圖11和圖12中的(e)的對(duì)比可以看出,加入條紋判斷項(xiàng)后,原先誤判為文字的條紋圖案基本都能正確判斷。圖14為示例性示出整個(gè)文字判斷處理過程的示意圖,其中a為原圖,b為Sobel邊緣檢測(cè)結(jié)果,c為文字區(qū)域檢測(cè)結(jié)果,d為文字區(qū)域定位結(jié)果。通過以上幾個(gè)步驟的判斷處理,可以有效地區(qū)分出參考圖像與非參考圖像,從而可以將參考圖像納入圖像數(shù)據(jù)庫(kù)中,并將非參考圖像排除在圖像數(shù)據(jù)庫(kù)之外,由此提高圖像數(shù)據(jù)庫(kù)的搜索效率和準(zhǔn)確率。在一個(gè)實(shí)施例中,對(duì)互聯(lián)網(wǎng)上26000多張圖像的測(cè)試結(jié)果如下面的表I所示。表I
權(quán)利要求
1.一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法,其特征在于包括如下步驟 1)獲取待區(qū)分的輸入圖像; 2)通過以下步驟來判斷所述輸入圖像為參考圖像還是非參考圖像 a.對(duì)所述輸入圖像進(jìn)行預(yù)處理; b.對(duì)所述輸入圖像進(jìn)行垃圾圖像判斷處理; c.對(duì)所述輸入圖像進(jìn)行文字圖像判斷處理; 3)將判斷為參考圖像的圖像納入圖像數(shù)據(jù)庫(kù)中。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟a具體包括 根據(jù)所述輸入圖像的長(zhǎng)與寬的像素值、或者長(zhǎng)寬比來判斷所述輸入圖像是否為非參考圖像。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟a包括 根據(jù)所述輸入圖像的顔色數(shù)來判斷所述輸入圖像是否為非參考圖像。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,步驟b包括將所述輸入圖像分成多個(gè)塊,分別求取各個(gè)塊的主顔色,并根據(jù)整幅輸入圖像的主顔色與各個(gè)塊的主顔色來判斷所述輸入圖像為參考圖像還是非參考圖像。
5.根據(jù)權(quán)利要求I所述的方法,其中,步驟c包括對(duì)所述輸入圖像的邊緣區(qū)域進(jìn)行檢測(cè)以得到邊緣點(diǎn)圖像,并根據(jù)所述邊緣點(diǎn)圖像中文字區(qū)域所占比例來判斷所述輸入圖像為參考圖像還是非參考圖像。
6.根據(jù)權(quán)利要求5所述的方法,其中,在將所述輸入圖像處理為邊緣點(diǎn)圖像之前,還包括將所述輸入圖像轉(zhuǎn)換成灰度圖的步驟。
7.根據(jù)權(quán)利要求5所述的方法,其中,步驟c還包括對(duì)所述輸入圖像進(jìn)行條紋判斷的步驟,以將條紋狀商品的圖像判斷為參考圖像。
8.一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的裝置,包括 獲取圖像模塊,用于獲取待區(qū)分的輸入圖像; 預(yù)處理模塊,用于對(duì)所述輸入圖像進(jìn)行預(yù)處理,從而判斷所述輸入圖像是參考圖像還是非參考圖像; 垃圾圖像判斷處理模塊,用于對(duì)所述輸入圖像進(jìn)行垃圾圖像判斷處理,從而判斷所述輸入圖像是參考圖像還是非參考圖像; 文字圖像判別處理模塊,用于對(duì)所述輸入圖像進(jìn)行文字圖像判別處理,從而判斷所述輸入圖像是參考圖像還是非參考圖像;以及 圖像納入模塊,用于將判斷為參考圖像的圖像納入圖像數(shù)據(jù)庫(kù)中。
全文摘要
本申請(qǐng)涉及一種創(chuàng)建圖像數(shù)據(jù)庫(kù)的方法和裝置,該方法包括如下步驟1)獲取待區(qū)分的輸入圖像;2)通過以下步驟來判斷所述輸入圖像是參考圖像還是非參考圖像a.對(duì)所述輸入圖像進(jìn)行預(yù)處理;b.對(duì)所述輸入圖像進(jìn)行垃圾圖像判斷處理;c.對(duì)所述輸入圖像進(jìn)行文字圖像判別處理;3)將判斷為參考圖像的圖像納入圖像數(shù)據(jù)庫(kù)中。本申請(qǐng)的方法和裝置能高效且準(zhǔn)確地區(qū)分參考圖像和非參考圖像,并將對(duì)于互聯(lián)網(wǎng)用戶而言有用的參考圖像納入圖像數(shù)據(jù)庫(kù)中,將對(duì)于互聯(lián)網(wǎng)用戶而言無用的非參考數(shù)據(jù)排除在圖像數(shù)據(jù)庫(kù)之外,從而可以提高圖像數(shù)據(jù)庫(kù)的搜索效率。
文檔編號(hào)G06F17/30GK102682007SQ20111005926
公開日2012年9月19日 申請(qǐng)日期2011年3月11日 優(yōu)先權(quán)日2011年3月11日
發(fā)明者王永攀, 謝丁杰 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司