圖片識(shí)別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種圖片識(shí)別方法和裝置。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)的信息傳播速度非常快,一旦出現(xiàn)色情廣告等非法圖片,如果不能采用有效的方法遏制其傳播,可能造成非法圖片的泛濫,極大地?fù)p害互聯(lián)網(wǎng)服務(wù)的體驗(yàn)?;ヂ?lián)網(wǎng)中傳播的非法圖片通常相近,甚至來(lái)源于固定的種子圖片,通過(guò)這些種子圖片能夠查找互聯(lián)網(wǎng)中傳播的相同或相似非法圖片,并對(duì)其刪除?,F(xiàn)有技術(shù)主要依靠人工巡檢去發(fā)現(xiàn)這些種子圖片,并收集這些種子圖片以進(jìn)行互聯(lián)網(wǎng)中非法圖片的刪除。收集種子圖片的過(guò)程需要投入大量的人力,并且由于互聯(lián)網(wǎng)信息量龐大,通過(guò)人工巡檢的方法收集非法圖片的速度較慢,無(wú)法有效遏制互聯(lián)網(wǎng)中非法圖片的傳播。
[0003]針對(duì)上述的收集非法圖片的種子圖片的效率比較低的問(wèn)題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了一種圖片識(shí)別方法和裝置,以至少解決收集非法圖片的種子圖片的效率比較低的技術(shù)問(wèn)題。
[0005]根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種圖片識(shí)別方法,包括:接收客戶端指示的待識(shí)別圖片和標(biāo)識(shí);判斷所述標(biāo)識(shí)是否指示對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別;若判斷出所述標(biāo)識(shí)指示對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別,則將所述待識(shí)別圖片與圖片庫(kù)中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;如果所述圖片庫(kù)中存在與所述待識(shí)別圖片相同的所述種子圖片,則丟棄所述待識(shí)別圖片;如果所述圖片庫(kù)中不存在與所述待識(shí)別圖片相同的所述種子圖片、但存在與所述待識(shí)別圖片的相似度大于第一預(yù)定閾值的所述種子圖片,則將所述待識(shí)別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲(chǔ)在所述圖片庫(kù)中。
[0006]根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種圖片識(shí)別裝置,包括:接收單元,用于接收客戶端發(fā)送的待識(shí)別圖片和標(biāo)識(shí);第一判斷單元,用于判斷所述標(biāo)識(shí)是否指示對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別;比較單元,用于在判斷出所述標(biāo)識(shí)指示對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別時(shí),將所述待識(shí)別圖片與圖片庫(kù)中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;丟棄單元,用于在所述圖片庫(kù)中存在與所述待識(shí)別圖片相同的所述種子圖片時(shí),丟棄所述待識(shí)別圖片;第一存儲(chǔ)單元,用于在所述圖片庫(kù)中不存在與所述待識(shí)別圖片相同的所述種子圖片、但存在與所述待識(shí)別圖片的相似度大于第一預(yù)定閾值的所述種子圖片時(shí),將所述待識(shí)別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲(chǔ)在所述圖片庫(kù)中。
[0007]在本發(fā)明實(shí)施例中,通過(guò)接收客戶端指示的待識(shí)別圖片,并根據(jù)待識(shí)別圖片與圖片庫(kù)中存儲(chǔ)的種子圖片進(jìn)行比較,當(dāng)待識(shí)別圖片與種子圖片的相似度大于第一預(yù)定閾值時(shí),將待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中。由于待識(shí)別圖片由客戶端發(fā)送,客戶端又分布在互聯(lián)網(wǎng)的各個(gè)地方,因此通過(guò)接收客戶端的待識(shí)別圖片來(lái)收集種子圖片的速度遠(yuǎn)遠(yuǎn)大于人工巡檢發(fā)現(xiàn)種子圖片的速度,提高了收集種子圖片的效率。另外,在將待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中之前先進(jìn)行去重處理,避免了在圖片庫(kù)中重復(fù)存儲(chǔ)圖片,從而解決了收集非法圖片的種子圖片的效率比較低的技術(shù)問(wèn)題,進(jìn)而達(dá)到了提高收集種子圖片的效率的技術(shù)效果。
【附圖說(shuō)明】
[0008]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0009]圖1是根據(jù)本發(fā)明實(shí)施例的硬件結(jié)構(gòu)圖;
[0010]圖2是根據(jù)本發(fā)明實(shí)施例的圖片識(shí)別方法的流程圖;
[0011]圖3是根據(jù)本發(fā)明實(shí)施例的舉報(bào)圖片a的界面圖;
[0012]圖4是根據(jù)本發(fā)明實(shí)施例的將待識(shí)別圖片與圖片庫(kù)中記錄的需要?jiǎng)h除圖片的種子圖片進(jìn)行比較的流程圖;
[0013]圖5是根據(jù)本發(fā)明實(shí)施例的系統(tǒng)架構(gòu)模塊圖:
[0014]圖6是根據(jù)本發(fā)明實(shí)施例的圖片識(shí)別裝置的示意圖;
[0015]圖7是根據(jù)本發(fā)明實(shí)施例的執(zhí)行單元的示意圖;以及
[0016]圖8是根據(jù)本發(fā)明實(shí)施例的服務(wù)器的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0017]為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
[0018]需要說(shuō)明的是,本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類(lèi)似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0019]名詞解釋:
[0020]非法圖片包括網(wǎng)絡(luò)傳播的色情廣告、詐騙廣告等有損互聯(lián)網(wǎng)環(huán)境的不合法的圖片。
[0021]種子圖片包括互聯(lián)網(wǎng)中傳播的非法圖片通常相近,能夠表征與其他一個(gè)或者多個(gè)圖片為相同或者相似的圖片。
[0022]實(shí)施例1
[0023]根據(jù)本發(fā)明實(shí)施例,提供了一種可以通過(guò)本申請(qǐng)裝置實(shí)施例執(zhí)行的方法實(shí)施例,需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組可執(zhí)行指令的服務(wù)器中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0024]根據(jù)本發(fā)明實(shí)施例,提供了一種圖片的識(shí)別方法。
[0025]可選地,在本實(shí)施例中,上述圖片的識(shí)別方法可以應(yīng)用于如圖1所示的終端101和服務(wù)器102構(gòu)成的硬件環(huán)境中。如圖1所示,終端101通過(guò)網(wǎng)絡(luò)與服務(wù)器102進(jìn)行連接,上述網(wǎng)絡(luò)包括但不限于:廣域網(wǎng)、城域網(wǎng)或局域網(wǎng),終端101可以是手機(jī)、PC、筆記本或者平板電腦等,在終端101上安裝的瀏覽器、即時(shí)通訊工具、微博等應(yīng)用程序可以作為本實(shí)施例中的客戶端。
[0026]圖2是根據(jù)本發(fā)明實(shí)施例的圖片的識(shí)別方法的流程圖。如圖所示,該圖片的識(shí)別方法包括如下步驟:
[0027]步驟S202,接收客戶端指示的待識(shí)別圖片和標(biāo)識(shí);
[0028]步驟S204,判斷標(biāo)識(shí)是否指示對(duì)待識(shí)別圖片進(jìn)行識(shí)別;
[0029]步驟S206,若判斷出標(biāo)識(shí)指示對(duì)待識(shí)別圖片進(jìn)行識(shí)別,則將待識(shí)別圖片與圖片庫(kù)中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;
[0030]步驟S208,如果圖片庫(kù)中存在與待識(shí)別圖片相同的種子圖片,則丟棄待識(shí)別圖片;
[0031]步驟S210,如果圖片庫(kù)中不存在與待識(shí)別圖片相同的種子圖片、但存在與待識(shí)別圖片的相似度大于第一預(yù)定閾值的種子圖片,則將待識(shí)別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲(chǔ)在圖片庫(kù)中。
[0032]在本實(shí)施例中,通過(guò)接收客戶端指示的待識(shí)別圖片,并根據(jù)待識(shí)別圖片與圖片庫(kù)中存儲(chǔ)的種子圖片進(jìn)行比較,當(dāng)待識(shí)別圖片與種子圖片的相似度大于第一預(yù)定閾值時(shí),將待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中。由于待識(shí)別圖片由客戶端發(fā)送,客戶端又分布在互聯(lián)網(wǎng)的各個(gè)地方,因此通過(guò)接收客戶端的待識(shí)別圖片來(lái)收集種子圖片的速度遠(yuǎn)遠(yuǎn)大于人工巡檢發(fā)現(xiàn)種子圖片的速度,提高了收集種子圖片的效率。另外,在將待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中之前先進(jìn)行去重處理,也就是先判斷圖片庫(kù)中是否已經(jīng)存儲(chǔ)由該待識(shí)別圖片,如果圖片庫(kù)中已經(jīng)存在與該待識(shí)別圖片相同的種子圖片,則不再將該待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中,如果圖片庫(kù)中沒(méi)有,并且該待識(shí)別圖片與圖片庫(kù)中的種子圖片的相似度大于第一預(yù)定閾值,則將該待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中,避免了在圖片庫(kù)中重復(fù)存儲(chǔ)相同的圖片作為種子圖片。
[0033]具體地,接收客戶端發(fā)送的待識(shí)別圖片和標(biāo)識(shí)包括:接收安裝在PC上的瀏覽器客戶端、安裝在PC上的應(yīng)用客戶端、安裝在移動(dòng)終端上的瀏覽器客戶端、安裝在移動(dòng)終端上的應(yīng)用客戶端中的一個(gè)發(fā)送的待識(shí)別圖片的網(wǎng)址和標(biāo)識(shí);按照網(wǎng)址從服務(wù)器中獲取待識(shí)別圖片。
[0034]通過(guò)網(wǎng)絡(luò)在客戶端中傳播的圖片都會(huì)具有一個(gè)對(duì)應(yīng)到服務(wù)器的網(wǎng)址,將該網(wǎng)址發(fā)送給服務(wù)器后,服務(wù)器會(huì)根據(jù)網(wǎng)址查找待識(shí)別圖片,客戶端向服務(wù)器傳輸網(wǎng)址而不是圖片本身能夠節(jié)省網(wǎng)絡(luò)資源,另外,由于待識(shí)別圖片就存儲(chǔ)在服務(wù)器中,服務(wù)器按照網(wǎng)址查找即可,避免接收客戶端發(fā)送的圖片再存儲(chǔ)在服務(wù)器中,造成同一圖片的重復(fù)存儲(chǔ),從而避免服務(wù)器的緩存空間被過(guò)多占用。
[0035]具體地,圖片庫(kù)可以存儲(chǔ)在服務(wù)器102中,客戶端可以提供發(fā)送待識(shí)別圖片的入口,通過(guò)該入口客戶端將待識(shí)別圖片發(fā)送給服務(wù)器102,以便于服務(wù)器判斷是否將該待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中。該入口可以發(fā)送多種圖片,并不是所有的圖片都需要存儲(chǔ)在圖片庫(kù)中,通過(guò)標(biāo)識(shí)可以判斷是否需要對(duì)該待識(shí)別圖片進(jìn)行識(shí)別,并進(jìn)一步判斷是否將該待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中。如果圖片庫(kù)中不存在于該待識(shí)別圖片相同的種子圖片,但是存在與該待識(shí)別圖片的相似度大于第一預(yù)定閾值的種子圖片,說(shuō)明該待識(shí)別圖片為可以存儲(chǔ)在圖片庫(kù)中的圖片,則將該待識(shí)別圖片存儲(chǔ)在圖片庫(kù)中。在計(jì)算待識(shí)別圖片與種子圖片的相似度時(shí),可以通過(guò)對(duì)比兩張圖片的像素來(lái)進(jìn)行相似度的判斷,當(dāng)然,本實(shí)施例還可以采用其他方式進(jìn)行相似度的判斷,本實(shí)施例并不限于上述相似度判斷的方式。
[0036]客戶端在展示圖片時(shí),通常具有舉報(bào)、點(diǎn)贊、評(píng)論等功能作為發(fā)送圖片的入口,客戶端可以將舉報(bào)、點(diǎn)贊、評(píng)論等信息都發(fā)送給服務(wù)器,為了使得服務(wù)器從這些信息中區(qū)分哪些是可以被識(shí)別并存儲(chǔ)在圖片庫(kù)中的圖片。對(duì)客戶端發(fā)送給服務(wù)器的信息設(shè)置標(biāo)識(shí),如被舉報(bào)的信息的標(biāo)識(shí)為R,被評(píng)論的信息的標(biāo)識(shí)為C,被點(diǎn)贊的信息的標(biāo)識(shí)為P。當(dāng)服務(wù)器102接收到圖片和標(biāo)識(shí)“R”之后,即確定該接收到的圖片為被舉報(bào)的圖片,也即接收到了對(duì)接收到的圖片進(jìn)行識(shí)別的指示。
[0037]例如,圖片庫(kù)中存儲(chǔ)了色情暴力圖片的種子圖片,客戶端展示的圖片為圖片a,該圖片a被客戶端舉報(bào)給服務(wù)器102,服務(wù)器102從接收到的信息中接收到圖片a和標(biāo)識(shí)“R”,服務(wù)器102將圖片a與圖片庫(kù)中的種子圖片進(jìn)行比較。如果圖片庫(kù)中有一張圖片與圖片a相同,為了不重復(fù)存儲(chǔ)相同的圖片,將圖片a丟棄;如果圖片庫(kù)中沒(méi)有與圖片a相同的圖片,但是圖片a與圖片庫(kù)中的一張種子圖片的相似度大于90%,則確定該圖片a為色情暴力圖片,并將圖片a存儲(chǔ)在圖片庫(kù)中作為色情暴力圖片的種子圖片。需要說(shuō)明的是,如果服務(wù)器具有刪除圖片a的權(quán)限,當(dāng)確定圖片a與圖片庫(kù)中的一張圖片相同時(shí),可以將圖片a刪除,使圖片a不再通過(guò)網(wǎng)絡(luò)傳播。
[0038]具體地,客戶端向服務(wù)器舉報(bào)圖片a時(shí)可以顯示如圖3所示的界面,在該界面上展示有被舉報(bào)的圖片a的圖片類(lèi)型,如色情暴力、騷擾謾罵、廣告欺詐