本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,特別涉及一種圖片識(shí)別方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展及搜索引擎的不斷完善,用戶已不滿足于單一的文字檢索方式,更多時(shí)候要求搜索引擎能夠檢索出與所輸入圖片相似的相似圖片,而在此之前,需要搜索引擎能夠識(shí)別出圖片。
目前,搜索引擎主要通過(guò)訓(xùn)練cnn(convolutionalneuralnetwork,卷積神經(jīng)網(wǎng)絡(luò))模型,并基于已訓(xùn)練的cnn模型對(duì)圖片進(jìn)行識(shí)別。具體過(guò)程為:獲取待識(shí)別圖片和多個(gè)已訓(xùn)練的cnn模型;根據(jù)每個(gè)已訓(xùn)練的cnn模型,提取待識(shí)別圖片的特征向量,并對(duì)提取的特征向量進(jìn)行處理,得到多個(gè)參考類別概率向量,每個(gè)參考類別概率向量包括待識(shí)別圖片屬于每種類別的參考類別概率,且每一維度上的元素表示一種參考類別概率;計(jì)算多個(gè)參考類別概率向量在同一維度上的元素的平均值,得到每種類別的類別概率;將所有類別的類別概率組成類別概率向量;根據(jù)該類別概率向量,確定待識(shí)別圖片的類別。
由于需要根據(jù)多個(gè)已訓(xùn)練的cnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,且需要將多個(gè)參考類別概率向量每一維度上的元素進(jìn)行聚合,因而整個(gè)識(shí)別過(guò)程耗時(shí)較長(zhǎng)。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種圖片識(shí)別方法及裝置。所述技術(shù)方案如下:
一方面,提供了一種圖片識(shí)別方法,所述方法包括:
獲取待識(shí)別圖片;
獲取已訓(xùn)練的shnn(shallowandhashneuralnetwork,淺學(xué)習(xí)哈希神經(jīng)網(wǎng)絡(luò))模型,所述shnn由多個(gè)已訓(xùn)練的hnn(hashneuralnetwork,哈希神經(jīng)網(wǎng)絡(luò))模型聚合得到;
根據(jù)所述已訓(xùn)練的shnn模型,對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別,得到所述待識(shí)別圖片的類別概率向量,所述類別概率向量包括所述待識(shí)別圖片屬于每種類別的類別概率,每種類別的類別概率為多個(gè)參考類別概率向量的每一維度上的元素的平均值,所述多個(gè)參考類別概率向量由所述多個(gè)hnn模型對(duì)所述待識(shí)別圖片識(shí)別得到;
根據(jù)所述類別概率向量,確定所述待識(shí)別圖片的類別。
另一方面,提供了一種圖片識(shí)別裝置,所述裝置包括:
第一獲取模塊,用于獲取待識(shí)別圖片;
第二獲取模塊,用于獲取已訓(xùn)練的淺學(xué)習(xí)哈希神經(jīng)網(wǎng)絡(luò)shnn模型,所述shnn由多個(gè)已訓(xùn)練的哈希神經(jīng)網(wǎng)絡(luò)hnn模型聚合得到;
圖片識(shí)別模塊,用于根據(jù)所述已訓(xùn)練的shnn模型,對(duì)所述待識(shí)別圖片進(jìn)行識(shí)別,得到所述待識(shí)別圖片的類別概率向量,所述類別概率向量包括所述待識(shí)別圖片屬于每種類別的類別概率,每種類別的類別概率為多個(gè)參考類別概率向量的每一維度上的元素的平均值,所述多個(gè)參考類別概率向量由所述多個(gè)hnn模型對(duì)所述待識(shí)別圖片識(shí)別得到;
類別確定模塊,用于根據(jù)所述類別概率向量,確定所述待識(shí)別圖片的類別。
本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
由于采用已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,而該已訓(xùn)練的shnn模型由多個(gè)已訓(xùn)練的hnn模型聚合得到,因此,不僅能夠保證識(shí)別精度,而且大大地縮短了識(shí)別過(guò)程所消耗的時(shí)間。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一個(gè)實(shí)施例提供的一種圖片識(shí)別方法的流程圖;
圖2是本發(fā)明另一個(gè)實(shí)施例提供的一種模型聚合過(guò)程的示意圖;
圖3是本發(fā)明另一個(gè)實(shí)施例提供的一種圖片識(shí)別過(guò)程的示意圖;
圖4是本發(fā)明另一個(gè)實(shí)施例提供的一種圖片識(shí)別裝置的結(jié)構(gòu)示意圖;
圖5是根據(jù)一示例性實(shí)施例示出的一種用于圖片識(shí)別的服務(wù)器。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
隨著圖像識(shí)別技術(shù)的發(fā)展,基于cnn模型的圖片識(shí)別方式被廣泛應(yīng)用于社會(huì)生活的各個(gè)領(lǐng)域,例如,在國(guó)家安全、軍事安全和公共安全領(lǐng)域,如智能門(mén)禁、智能視頻監(jiān)控、公安布控、海關(guān)身份驗(yàn)證、司機(jī)駕照驗(yàn)證等典型的應(yīng)用;在民事和經(jīng)濟(jì)領(lǐng)域,如各類銀行卡、金融卡、信用卡、儲(chǔ)蓄卡的持卡人的身份驗(yàn)證;在搜索領(lǐng)域,如相似圖片的檢索等;在家庭娛樂(lè)領(lǐng)域,如對(duì)主人身份進(jìn)行識(shí)別智能玩具、家政機(jī)器人等。
目前現(xiàn)有的圖片識(shí)別方法因需要將多個(gè)參考類別概率向量進(jìn)行聚合,導(dǎo)致識(shí)別時(shí)間較長(zhǎng),且由于在檢索相似圖片時(shí),需要計(jì)算特征向量與圖片數(shù)據(jù)庫(kù)中存儲(chǔ)的每個(gè)圖片的特征向量之間的相似度,而提取的特征向量的維度較高,一般為4096維,導(dǎo)致檢索過(guò)程計(jì)算量較大,檢索時(shí)間較長(zhǎng)。
為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明實(shí)施例提供了一種圖片識(shí)別方法,以服務(wù)器執(zhí)行本方法為例,參見(jiàn)圖1,本發(fā)明實(shí)施例提供的方法流程包括:
101、服務(wù)器獲取已訓(xùn)練的shnn模型。
其中,shnn模型包括至少兩級(jí)卷積層、至少一級(jí)全連接層、哈希層及輸出層,該哈希層設(shè)置于全連接層與輸出層之間,用于將提取的特征向量轉(zhuǎn)化為二值哈希碼。該shnn模型為一種具有模型壓縮功能的神經(jīng)網(wǎng)絡(luò),由多個(gè)hnn模型聚合得到,可以模擬多個(gè)hnn模型聚合后的結(jié)果。采用shnn模型對(duì)圖片進(jìn)行識(shí)別,在保證識(shí)別精度的前提下,大大減少了圖片識(shí)別時(shí)間。
在本發(fā)明實(shí)施例中,服務(wù)器對(duì)shnn模型的訓(xùn)練過(guò)程,可參見(jiàn)下述步驟1011~1013:
1011、服務(wù)器獲取多個(gè)訓(xùn)練圖片。
其中,訓(xùn)練圖片為用于進(jìn)行模型訓(xùn)練的圖片,該訓(xùn)練圖片標(biāo)注有初始類別,該訓(xùn)練圖片的初始類別與待訓(xùn)練的hnn模型的識(shí)別類別有關(guān)。例如,當(dāng)待訓(xùn)練的hnn模型為能夠識(shí)別不同語(yǔ)種的模型時(shí),訓(xùn)練圖片可以為包括不同語(yǔ)種的字符或字符串的圖片;當(dāng)待訓(xùn)練的hnn模型為識(shí)別顏色的模型時(shí),訓(xùn)練圖片為包括不同顏色的圖片等。
服務(wù)器獲取的訓(xùn)練圖片的數(shù)量可以是1000個(gè)、2000個(gè)、3000個(gè)等,本實(shí)施例不對(duì)服務(wù)器獲取的訓(xùn)練圖片的數(shù)量作具體的限定。關(guān)于服務(wù)器獲取訓(xùn)練圖片的方式,包括但不限于:通過(guò)互聯(lián)網(wǎng)收集多個(gè)圖片,采用人工標(biāo)注的方式為收集到的每個(gè)圖片標(biāo)注初始類別,并將標(biāo)注有初始類別的圖片作為訓(xùn)練圖片。
1012、服務(wù)器根據(jù)多個(gè)訓(xùn)練圖片,對(duì)多個(gè)待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到多個(gè)已訓(xùn)練的hnn模型。
以對(duì)任一待訓(xùn)練的hnn模型為例,服務(wù)器對(duì)該待訓(xùn)練的hnn模型的訓(xùn)練過(guò)程,可參見(jiàn)下述步驟10121~10128:
10121、服務(wù)器獲取待訓(xùn)練的hnn模型的初始模型參數(shù),該初始模型參數(shù)包括各級(jí)卷積層的初始卷積核、各級(jí)卷積層的初始偏置矩陣、各級(jí)全連接層的初始權(quán)重矩陣和各級(jí)全連接層的初始偏置向量。
具體地,訓(xùn)練hnn模型的過(guò)程為確定待訓(xùn)練的hnn的模型參數(shù)的過(guò)程。在確定模型參數(shù)時(shí),可以先給待訓(xùn)練的hnn模型初始化一個(gè)初始模型參數(shù),并在后續(xù)的訓(xùn)練過(guò)程中,不斷優(yōu)化該初始模型參數(shù),并將優(yōu)化得到的最優(yōu)模型參數(shù)作為已訓(xùn)練的hnn模型的模型參數(shù)。
其中,待訓(xùn)練的hnn模型通常包括至少兩級(jí)卷積層、至少一級(jí)全連接層、哈希層及輸出層,且每級(jí)卷積層包括多個(gè)卷積核和多個(gè)偏置矩陣,每級(jí)全連接層包括多個(gè)權(quán)重矩陣和多個(gè)偏置向量,因此,獲取到的模型參數(shù)包括各級(jí)卷積層的初始卷積核、哈希算法、各級(jí)卷積層的初始偏置矩陣、全連接層的初始權(quán)重矩陣和全連接層的初始偏置向量。關(guān)于待訓(xùn)練的hnn模型包括的卷積層的數(shù)量和全連接層的數(shù)量可以根據(jù)需要設(shè)定。關(guān)于每級(jí)卷積層包括的卷積核和偏置矩陣的數(shù)量,以及每級(jí)全連接層包括的權(quán)重矩陣和偏置向量的數(shù)量,本發(fā)明實(shí)施例不作具體限定。關(guān)于具體的哈希算法,本實(shí)施例同樣不作具體的限定,只要能將特征向量轉(zhuǎn)換為二值哈希碼即可。另外,對(duì)于每個(gè)卷積核和偏置矩陣的維度,以及每個(gè)權(quán)重矩陣和每個(gè)偏置向量的維度,均可以取經(jīng)驗(yàn)值。例如,第一級(jí)卷積層可以包括96個(gè)大小為5×5的卷積核c1,
結(jié)合上述內(nèi)容,在獲取待訓(xùn)練的hnn模型的初始模型參數(shù)時(shí),可以在指定數(shù)值范圍內(nèi)隨機(jī)選取一個(gè)值作為初始模型參數(shù)中各個(gè)元素的值。例如,對(duì)于每一個(gè)初始卷積核、初始權(quán)重矩陣、初始偏置矩陣和初始偏置向量中的每一個(gè)元素,可以在[-r,r]區(qū)間中取一個(gè)隨機(jī)數(shù)。此處,r是初始化模型參數(shù)的閾值,其可以為經(jīng)驗(yàn)值。例如,r可以取0.001。
10122、服務(wù)器在各級(jí)卷積層上,使用各級(jí)卷積層上的初始卷積核和初始偏置矩陣,對(duì)每個(gè)訓(xùn)練圖片分別進(jìn)行卷積操作和最大池化操作,得到每個(gè)訓(xùn)練圖片在各級(jí)卷積層上的特征向量。
通過(guò)卷積操作和最大池化操作能夠?qū)崿F(xiàn)由淺入深地提取圖片不同層次的特征。因此,在訓(xùn)練待訓(xùn)練的hnn模型時(shí),為了獲得訓(xùn)練圖片的特征向量,可以在各級(jí)卷積層上,對(duì)訓(xùn)練圖片進(jìn)行卷積操作和最大池化操作。
在使用各級(jí)卷積層上的初始卷積核和初始偏置矩陣,對(duì)每個(gè)訓(xùn)練圖片分別進(jìn)行卷積操作和最大池化操作,得到每個(gè)訓(xùn)練圖片在各級(jí)卷積層上的特征向量時(shí),包括但不限于通過(guò)如下步驟101221~101223來(lái)實(shí)現(xiàn):
101221、對(duì)于任一訓(xùn)練圖片,將在上一級(jí)卷積層上的特征向量輸入當(dāng)前卷積層,使用當(dāng)前卷積層上的初始卷積核和初始偏置矩陣,對(duì)上一級(jí)卷積層上的特征向量進(jìn)行卷積操作,得到當(dāng)前卷積層上的卷積圖像。
101222、對(duì)當(dāng)前卷積層上的卷積圖像進(jìn)行最大池化操作,得到訓(xùn)練圖片在當(dāng)前卷積層上的特征向量后,繼續(xù)將當(dāng)前卷積層上的特征向量傳輸至下一級(jí)卷積層。
101223、在下一級(jí)卷積層對(duì)當(dāng)前卷積層上的特征向量進(jìn)行卷積操作和最大池化操作,直至在最后一級(jí)卷積層進(jìn)行卷積操作和最大池化操作,得到最后一層卷積層上的特征向量為止。
其中,在各級(jí)卷積層上進(jìn)行卷積操作和最大池化操作的原理同上述步驟101221~101223中的原理一致,具體可參見(jiàn)上述步驟101221~101223中的內(nèi)容,此處不再贅述。
10123、服務(wù)器在各級(jí)全連接層上,使用各級(jí)初始權(quán)重矩陣和初始偏置向量,對(duì)每個(gè)特征向量進(jìn)行處理,得到每個(gè)訓(xùn)練圖片的參考類別概率向量。
對(duì)于一個(gè)訓(xùn)練圖像的特征向量,可以將其輸入全連接層,使用全連接層的權(quán)重矩陣乘以該特征向量,并將乘積結(jié)果與該全連接層的偏置向量相加,從而得到該訓(xùn)練圖片的參考類別概率向量。
其中,參考類別概率向量為一個(gè)一維向量,參考類別概率向量包括訓(xùn)練圖片屬于每種類別的參考類別概率,且參考類別概率向量中的元素的個(gè)數(shù)與待訓(xùn)練的hnn模型能夠識(shí)別的類別的數(shù)目有關(guān)。例如,如果待訓(xùn)練圖片能夠區(qū)別十種類別的圖片,則參考類別概率向量中包括十個(gè)元素,每個(gè)元素表示該訓(xùn)練圖片屬于某一種類別的參考類別概率。
10124、服務(wù)器根據(jù)每個(gè)訓(xùn)練圖片的參考類別概率向量及每個(gè)訓(xùn)練圖片的初始類別,計(jì)算類別誤差。
其中,根據(jù)每個(gè)訓(xùn)練圖像的參考類別概率向量及每個(gè)訓(xùn)練圖片的初始類別,計(jì)算類別誤差,包括但不限于通過(guò)如下步驟101241~101243來(lái)實(shí)現(xiàn):
101241、服務(wù)器獲取每個(gè)訓(xùn)練圖片的初始類別。
101242、服務(wù)器根據(jù)每個(gè)訓(xùn)練圖片的參考類別概率向量及每個(gè)訓(xùn)練圖片的初始類別,計(jì)算每個(gè)訓(xùn)練圖片的類別誤差。
101243、計(jì)算所有訓(xùn)練圖片的類別誤差平均值,將類別誤差平均值作為類別誤差。
10125、服務(wù)器將每個(gè)訓(xùn)練圖片的特征向量轉(zhuǎn)換為二值哈希嗎,并計(jì)算二值哈希碼的平均值,得到平均二值哈希碼。
該過(guò)程具體實(shí)現(xiàn)時(shí),可參見(jiàn)后續(xù)步驟。
10125、基于類別誤差及平均二值哈希碼值,服務(wù)器對(duì)待訓(xùn)練的hnn模型的模型參數(shù)進(jìn)行調(diào)整。
在調(diào)整待訓(xùn)練的hnn模型的模型參數(shù)時(shí),包括但不限于:根據(jù)平均二值哈希碼值優(yōu)化哈希算法,并利用sgd(stochasticgradientdescent,隨機(jī)梯度下降)算法,將類別誤差反向傳導(dǎo)回該待訓(xùn)練的hnn模型,從而實(shí)現(xiàn)更新該待訓(xùn)練的hnn模型的模型參數(shù)中的所有元素。
10127、基于調(diào)整后的模型參數(shù)和多個(gè)訓(xùn)練圖片,服務(wù)器繼續(xù)對(duì)模型參數(shù)進(jìn)行調(diào)整,直至迭代次數(shù)達(dá)到預(yù)設(shè)次數(shù)。
其中,預(yù)設(shè)次數(shù)可以為經(jīng)驗(yàn)值,為了使已訓(xùn)練的hnn模型比較準(zhǔn)確,該預(yù)設(shè)次數(shù)的取值可以選取較大的數(shù)值,例如,選取10000。
10128、服務(wù)器將迭代次數(shù)達(dá)到預(yù)設(shè)次數(shù)時(shí)所得到的模型參數(shù)對(duì)應(yīng)的hnn模型作為已訓(xùn)練的hnn模型。
例如,如果預(yù)設(shè)次數(shù)為10000,在將迭代次數(shù)達(dá)到10000時(shí)得到的模型參數(shù)為已訓(xùn)練的hnn模型的模型參數(shù),此時(shí)得到的hnn模型即為已訓(xùn)練的hnn模型。
上述以對(duì)一個(gè)待訓(xùn)練的hnn模型的訓(xùn)練過(guò)程為例,對(duì)于其他待訓(xùn)練的hnn模型的訓(xùn)練與上述對(duì)該待訓(xùn)練的hnn模型的訓(xùn)練過(guò)程相同,所不同的是選取的初始模型參數(shù),具體參見(jiàn)上述對(duì)該待訓(xùn)練的hnn模型的訓(xùn)練過(guò)程,此處不再贅述。
1013、服務(wù)器對(duì)多個(gè)已訓(xùn)練的hnn模型進(jìn)行聚合,得到已訓(xùn)練的shnn模型。
服務(wù)器對(duì)多個(gè)已訓(xùn)練的hnn模型進(jìn)行聚合,得到已訓(xùn)練的shnn模型的過(guò)程,可參見(jiàn)如下步驟10131~10135:
10131、服務(wù)器獲取多個(gè)建模圖片。
其中,建模圖片為用于構(gòu)建shnn模型的圖片,服務(wù)器獲取的建模圖片的數(shù)量可以是2000個(gè)、4000個(gè)、5000個(gè)等,本實(shí)施例不對(duì)服務(wù)器獲取的建模圖片的數(shù)量作具體的限定。關(guān)于服務(wù)器獲取建模圖片的方式,包括但不限于:通過(guò)互聯(lián)網(wǎng)收集多個(gè)圖片,并將收集到的圖片作為建模圖片。
10132、對(duì)于任一建模圖片,服務(wù)器根據(jù)每個(gè)已訓(xùn)練的hnn模型,對(duì)建模圖片進(jìn)行識(shí)別,得到建模圖片的多個(gè)類別概率向量。
對(duì)于任一建模圖片,服務(wù)器將該建模圖片輸入到每個(gè)已訓(xùn)練的hnn模型后,從建模圖片中提取特征向量,并對(duì)提取的特征向量進(jìn)行處理,得到多個(gè)參考類別概率向量。
10133、服務(wù)器計(jì)算多個(gè)參考類別概率向量在同一維度上的元素的平均值,得到該建模圖片對(duì)應(yīng)的類別概率向量。
對(duì)于得到的多個(gè)參考類別概率向量,服務(wù)器計(jì)算多個(gè)類別概率向量在同一維度上的元素的平均值,得到每一維度上的元素的平均值,將多個(gè)參考類別概率向量在每一維度上的元素的平均值組成該建模圖片對(duì)應(yīng)的類別概率向量。
例如,已訓(xùn)練的hnn模型為能夠識(shí)別不同廟宇的模型,且能夠識(shí)別的廟宇類別為中國(guó)廟宇、日本廟宇、泰國(guó)廟宇及印度廟宇,對(duì)于已訓(xùn)練的hnn模型n1、n2及n3,其中,n1模型識(shí)別出建模圖片為中國(guó)廟宇、日本廟宇、泰國(guó)廟宇及印度廟宇的參考類別概率分別為0.85、0.1、0.05、0,n2模型識(shí)別出建模圖片為中國(guó)廟宇、日本廟宇、泰國(guó)廟宇及印度廟宇的參考類別概率分別為0.35、0.4、0.15、0.1,n3模型識(shí)別出建模圖片為中國(guó)廟宇、日本廟宇、泰國(guó)廟宇及印度廟宇的參考類別概率分別為0.75、0.2、0.05、0,則建模圖片為中國(guó)廟宇的類別概率=(0.85+0.35+0.75)/3=0.65,建模圖片為日本廟宇的類別概率=(0.1+0.4+0.2)/3=0.23,建模圖片為泰國(guó)廟宇的類別概率=(0.05+0.15+0.05)/3=0.09,建模圖片為印度廟宇的類別概率=(0+0.1+0)/3=0.03,將三個(gè)參考類別概率向量在每一維度上的元素的平均值組成類別概率向量,該類別概率向量為(0.65,0.23,0.09,0.03)。
10134、服務(wù)器根據(jù)建模圖片對(duì)應(yīng)的類別概率向量,確定建模圖片的初始類別。
基于上述步驟10133中得到的建模圖片對(duì)應(yīng)的類別概率向量,服務(wù)器將該類別概率向量包括的各個(gè)維度上的元素的最大值作為建模圖片的初始類別。例如,上述例子中得到的建模圖片對(duì)應(yīng)的類別概率向量為(0.65,0.23,0.09,0.03),根據(jù)該類別概率向量,該類別概率向量中元素的最大值為0.65,因而可確定建模圖片的初始類別為中國(guó)廟宇。
10135、服務(wù)器根據(jù)多個(gè)添加了初始類別的建模圖片,對(duì)任一待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到已訓(xùn)練的shnn模型。
服務(wù)器將得到的初始類別添加到建模圖片中,并采用上述步驟10121~10128的方法對(duì)任一待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到已訓(xùn)練的shnn模型。由于該已訓(xùn)練的shnn模型由多個(gè)已訓(xùn)練的hnn模型聚合得到,因而采用該已訓(xùn)練的shnn模型對(duì)圖片進(jìn)行識(shí)別,可得到與多個(gè)已訓(xùn)練的hnn模型具有相同精度的識(shí)別結(jié)果。另外,當(dāng)?shù)玫揭延?xùn)練的shnn模型之后,服務(wù)器可將多個(gè)已訓(xùn)練的hnn模型刪除,以減輕服務(wù)器的存儲(chǔ)壓力。
需要說(shuō)明的是,由于參考類別概率向量包括了圖片屬于每種類別的參考類別概率,該參考類別概率實(shí)際上為一種預(yù)測(cè)值,因此,本發(fā)明實(shí)施例還將該參考類別概率向量稱為poi(pointofinterest,興趣點(diǎn))預(yù)測(cè)值。
上述以根據(jù)每個(gè)建模圖片的初始類別對(duì)待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練為例,實(shí)際上,由于每個(gè)已訓(xùn)練的hnn模型均具有哈希層,該哈希層可將提取的特征向量映射為二值哈希碼,該二值哈希碼為由0或1組成的字符串,因而在根據(jù)建模圖片對(duì)待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練時(shí),還包括根據(jù)多個(gè)建模圖片的二值哈希碼對(duì)待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練的過(guò)程,具體過(guò)程為:
(1)、對(duì)于任一建模圖片,服務(wù)器將該建模圖片輸入到每個(gè)已訓(xùn)練的hnn模型,得到多個(gè)特征向量。
(2)、對(duì)于任一特征向量,服務(wù)器根據(jù)與該特征向量相應(yīng)的已訓(xùn)練的hnn模型,將該特征向量中每一維度上的元素轉(zhuǎn)換為一個(gè)s型值,得到與該特征向量維度數(shù)量相同的多個(gè)s型值。
(3)、服務(wù)器將多個(gè)s型值與第二預(yù)設(shè)數(shù)值進(jìn)行比較,如果任一s型值大于第二預(yù)設(shè)數(shù)值,則將該s型值映射為1,如果任一s型值小于第二預(yù)設(shè)數(shù)值,則將該s型值映射為0。接著,服務(wù)器按照該特征向量中每一維度上的元素順序,將多個(gè)s型值所映射的0或1組成字符串,得到該特征向量對(duì)應(yīng)的二值哈希碼。
其中,第二預(yù)設(shè)數(shù)值可根據(jù)經(jīng)驗(yàn)值設(shè)置,且該第二預(yù)設(shè)數(shù)值可以為0.5、0.6、0.7等,本實(shí)施例不對(duì)第二預(yù)設(shè)數(shù)值的大小作具體的限定。
(4)、服務(wù)器計(jì)算每個(gè)已訓(xùn)練的hnn模型對(duì)應(yīng)的二值哈希碼的平均值,得到平均二值哈希碼。
服務(wù)器計(jì)算多個(gè)已訓(xùn)練的hnn模型對(duì)應(yīng)的二值哈希碼在同一維度上的元素的平均值,并將每一維度上元素的平均值與第二預(yù)設(shè)數(shù)值進(jìn)行比較,當(dāng)任一維度上元素的平均值大于第二預(yù)設(shè)數(shù)值,則將該維度上的元素映射為1,當(dāng)任一維度上元素的平均值小于第二預(yù)設(shè)數(shù)值,則將該維度上的元素映射為0,之后,服務(wù)器將每一維度上的元素映射得到的0或1組成字符串,得到平均二值哈希碼。
例如,設(shè)定第二預(yù)設(shè)數(shù)值為0.5,對(duì)于已訓(xùn)練的hnn模型n1、n2及n3,n1模型將提取的特征向量每一維度上的元素進(jìn)行轉(zhuǎn)換,得到的s型值為0.93、0.3、0.59、0.81,n2模型將提取的特征向量每一維度上的元素進(jìn)行轉(zhuǎn)換,得到的s型值為0.12、0.83、0.07、0.91,n3模型將提取的特征向量每一維度上的元素進(jìn)行轉(zhuǎn)換,得到的s型值為0.89、0.74、0.28、0.9,將n1模型對(duì)應(yīng)的四個(gè)s型值分別與0.5進(jìn)行比較,可得到n1模型對(duì)應(yīng)的二值哈希碼為1011,將n2模型對(duì)應(yīng)的四個(gè)s型值分別與0.5進(jìn)行比較,可得到n2模型對(duì)應(yīng)的二值哈希碼為0101,將n3模型對(duì)應(yīng)的四個(gè)s型值分別與0.5進(jìn)行比較,可得到n3模型對(duì)應(yīng)的二值哈希碼為1101。之后,服務(wù)器計(jì)算已訓(xùn)練的hnn模型n1、n2及n3對(duì)應(yīng)的二值哈希碼每一維度上的元素的平均值,對(duì)于第一維度上的元素的平均值為(0.93+0.12+0.89)/3=0.64,對(duì)于第二維度上的元素的平均值為(0.3+0.83+0.74)/3=0.62,對(duì)于第三維度上的元素的平均值為(0.59+0.07+0.28)/3=0.31,對(duì)于第四維度上的元素的平均值為(0.81+0.91+0.9)/3=0.87,并將每一維度上的元素的平均值與第二預(yù)設(shè)數(shù)值進(jìn)行比較,通過(guò)比較可得到平均二值哈希碼為1101。
對(duì)于上述服務(wù)器對(duì)多個(gè)已訓(xùn)練的hnn模型進(jìn)行聚合,得到已訓(xùn)練的shnn模型的過(guò)程,下面以圖2為例進(jìn)行詳述。
參見(jiàn)圖2,對(duì)于已訓(xùn)練的hnn模型n1、n2及n3,當(dāng)將任一建模圖片輸入到已訓(xùn)練的hnn模型n1中,可得到參考類別概率向量為(0.85,0.1,0.05),將提取的特征向量轉(zhuǎn)換的多個(gè)s型值為0.93、0.3、0.59、0.81,多個(gè)s型值映射得到的二值哈希碼為1011,當(dāng)將該建模圖片輸入到已訓(xùn)練的hnn模型n2中,可得到參考類別概率向量為(0.45,0.5,0.05),將提取的特征向量轉(zhuǎn)換的多個(gè)s型值為0.12、0.83、0.07、0.91,多個(gè)s型值映射得到的二值哈希碼為0101,當(dāng)將該建模圖片輸入到已訓(xùn)練的hnn模型n3中,可得到參考類別概率向量為(0.95,0.05,0),將提取的特征向量轉(zhuǎn)換的多個(gè)s型值為089、0.74、0.28、0.9,多個(gè)s型值映射得到的二值哈希碼為1101,計(jì)算通過(guò)三個(gè)模型得到的參考類別概率向量的平均值,得到該建模圖片對(duì)應(yīng)的類別概率向量為(0.75,0.22,0.23),通過(guò)計(jì)算三個(gè)模型的多個(gè)s型值的平均值,得到平均s型值為(0.64,0.62,0.31,0.87),通過(guò)計(jì)算三個(gè)模型的二值哈希碼的平均值,得到平均二值哈希碼為(1101)。對(duì)于每個(gè)建模圖片均采用上述方式進(jìn)行處理,得到每個(gè)建模圖片對(duì)應(yīng)的類別概率向量及平均二值哈希碼。
102、服務(wù)器獲取待識(shí)別圖片。
關(guān)于服務(wù)器獲取待識(shí)別圖片的方式,包括但不限于:接收終端通過(guò)搜索引擎發(fā)送的圖片,并將接收到的圖片作為待識(shí)別圖片。
103、服務(wù)器根據(jù)已訓(xùn)練的shnn模型,對(duì)待識(shí)別圖片進(jìn)行識(shí)別,得到待識(shí)別圖片的類別概率向量。
由于每種類別的類別概率實(shí)際上為多個(gè)參考類別概率向量的每一維度上的元素的平均值,因此,采用本實(shí)施例提供的方法根據(jù)一個(gè)模型即可得到與多個(gè)hnn模型相同的類別概率向量,在保證識(shí)別精度的前提下,縮減了識(shí)別過(guò)程所消耗的時(shí)間。
基于預(yù)先已訓(xùn)練的shnn模型,當(dāng)獲取到待識(shí)別圖片,服務(wù)器將該待識(shí)別圖片輸入到已訓(xùn)練的shnn模型中,根據(jù)該已訓(xùn)練的shnn模型,從待識(shí)別圖片中提取特征向量,并對(duì)提取的特征向量進(jìn)行處理,得到待識(shí)別圖片的類別概率向量,該類別概率向量包括待識(shí)別圖片屬于每種類別的類別概率。
當(dāng)已訓(xùn)練的shnn模型為能夠識(shí)別指定位置區(qū)域內(nèi)不同地點(diǎn)的模型時(shí),根據(jù)該已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,得到的類別概率向量包括待識(shí)別圖片屬于不同地點(diǎn)的類別概率,此時(shí)如果待識(shí)別圖片具有fov(fieldofview,相機(jī)視錐模型)標(biāo)簽,該fon標(biāo)簽包括拍攝位置、拍攝方向角、可視夾角及最大可視距離等,則服務(wù)器可根據(jù)fov標(biāo)簽,對(duì)待識(shí)別圖片進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果,對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新。具體過(guò)程可參見(jiàn)步驟1031~1033:
1031、服務(wù)器根據(jù)fov標(biāo)簽,確定至少一個(gè)目標(biāo)地標(biāo)。
該過(guò)程具體實(shí)現(xiàn)時(shí),可參見(jiàn)以下步驟10311~10312:
10311、服務(wù)器根據(jù)fov標(biāo)簽中的拍攝位置,確定多個(gè)可選地標(biāo)。
服務(wù)器可以拍攝位置為中心,在指定位置范圍內(nèi),選取多個(gè)可選地標(biāo),該可選地標(biāo)為待識(shí)別圖片中的拍攝內(nèi)容可能屬于的景點(diǎn)。
10312、服務(wù)器根據(jù)拍攝方向角、可視夾角及最大可視距離,從多個(gè)可選地標(biāo)中,選取至少一個(gè)目標(biāo)地標(biāo)。
在本實(shí)施例中,至少一個(gè)目標(biāo)地標(biāo)與類別概率向量中包括的類別的種類相同,例如,至少一個(gè)目標(biāo)地標(biāo)為故宮、北海公園、景山公園,則類別概率向量中包括的類別也應(yīng)為故宮、北海公園、景山公園。
1032、服務(wù)器計(jì)算每個(gè)目標(biāo)地標(biāo)的捕捉概率。
服務(wù)器計(jì)算每個(gè)目標(biāo)地標(biāo)的捕捉概率時(shí),可對(duì)每個(gè)目標(biāo)地標(biāo)所在的高斯曲線進(jìn)行積分,并將得到的積分值作為每個(gè)目標(biāo)地標(biāo)的捕捉概率。
1033、服務(wù)器根據(jù)至少一個(gè)目標(biāo)地標(biāo)的捕捉概率,對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新。
服務(wù)器計(jì)算至少一個(gè)目標(biāo)地標(biāo)和類別概率向量中同一類別對(duì)應(yīng)的捕捉概率和類別概率的概率平均值,并根據(jù)每種類別的概率平均值,對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新。
例如,待識(shí)別圖片的類別概率向量對(duì)應(yīng)的類別為故宮、北海公園、景山公園,且故宮、北海公園、景山公園的類別概率分別為0.85、0.15、0,至少一個(gè)目標(biāo)地標(biāo)為故宮、北海公園,且故宮、北海公園的捕捉概率為0.95、0.05,則故宮的概率平均值=(0.85+0.95)/2=0.9,北海公園的概率平均值=(0.15+0.05)/2=0.1,景山公園的概率平均值=(0+0)/2=0,根據(jù)每種類別的概率平均值,得到更新后的識(shí)別圖片的類別概率向量為(0.9,0.1,0)。
通過(guò)每個(gè)目標(biāo)地標(biāo)的捕捉概率對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新,進(jìn)一步提高了識(shí)別結(jié)果的準(zhǔn)確性。
104、服務(wù)器根據(jù)類別概率向量,確定待識(shí)別圖片的類別。
在本實(shí)施例中,如果待識(shí)別圖片不具有fov標(biāo)簽,則服務(wù)器可直接將待識(shí)別圖片的類別概率向量中的最大值,作為待識(shí)別圖片的類別。例如,根據(jù)類別概率向量,確定待識(shí)別圖片為故宮、北海公園、景山公園的類別概率分別為0.85、0.15、0,則可確定該待識(shí)別圖片的類別為故宮;如果待識(shí)別圖片具有fov標(biāo)簽,則服務(wù)器可將更新后的待識(shí)別圖片的類別概率向量中的最大值,作為待識(shí)別圖片的類別。例如,根據(jù)更新后的類別概率向量,確定待識(shí)別圖片為故宮、北海公園、景山公園的類別概率分別為0.9、0.1、0,則可確定該待識(shí)別圖片的類別為故宮。
105、服務(wù)器根據(jù)已訓(xùn)練的shnn模型,檢索待識(shí)別圖片的相似圖片。
在采用已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別的過(guò)程中,服務(wù)器還可根據(jù)待識(shí)別圖片的特征向量,檢索出待識(shí)別圖片的相似圖片。具體檢索過(guò)程如下:
服務(wù)器根據(jù)已訓(xùn)練的shnn模型,提取待識(shí)別圖片的特征向量,并將所提取的特征向量映射為二值哈希碼,進(jìn)而計(jì)算圖片數(shù)據(jù)庫(kù)中存儲(chǔ)的每個(gè)圖片的二值哈希碼與二值哈希碼之間的海明距離,如果任一圖片的二值哈希碼與二值哈希碼之間的海明距離小于第一預(yù)設(shè)數(shù)值,則確定圖片為待識(shí)別圖片的相似圖片。
其中,海明距離為兩個(gè)二值哈希碼在同一位置上不同字符的數(shù)量,例如,兩個(gè)二值哈希碼10101和00110,由于該兩個(gè)二值哈希碼的第一位、第四位及第五位上的字符不同,因而這兩個(gè)二值哈希碼之間的海明距離為3。第一預(yù)設(shè)數(shù)值可根據(jù)二值哈希碼的位數(shù)確定,例如,二值哈希碼的位數(shù)為10位,則第一預(yù)設(shè)數(shù)值可以為1、2、3、4等。
服務(wù)器將所提取的特征向量映射為二值哈希碼的過(guò)程為:服務(wù)器將特征向量中每一維度上的元素轉(zhuǎn)換為一個(gè)s型值,得到與特征向量維度數(shù)量相同的多個(gè)s型值,對(duì)于多個(gè)s型值,如果任一s型值大于第二預(yù)設(shè)數(shù)值,則將該s型值映射為1,如果該s型值小于第二預(yù)設(shè)數(shù)值,則將s型值映射為0,接著,按照特征向量中每一維度的元素順序,將多個(gè)s型值所映射的0或1組成字符串,得到二值哈希碼。
通常現(xiàn)有技術(shù)在進(jìn)行相似圖片檢索時(shí),需要計(jì)算所提取的特征向量的相似度,由于所提取的特征向量的維度較高,一般為4096維,導(dǎo)致相似度計(jì)算時(shí)計(jì)算量較大,檢索時(shí)間較長(zhǎng),檢索效率較低。而本發(fā)明中進(jìn)行相似圖片檢索時(shí)所采用的二值哈希碼僅由0或1組成,由于無(wú)需采用復(fù)雜的算法進(jìn)行相似度計(jì)算,即可查找到相似圖片,因而檢索時(shí)間較短,檢索效率較高。
圖3示出了一種圖片識(shí)別過(guò)程的示意圖,參見(jiàn)圖3,根據(jù)多個(gè)訓(xùn)練圖片,對(duì)多個(gè)待訓(xùn)練hnn模型n1、…nm進(jìn)行離線訓(xùn)練,得到多個(gè)已訓(xùn)練的hnn模型,將多個(gè)建模圖片輸入到多個(gè)已訓(xùn)練的hnn模型中,得到多個(gè)參考類別概率向量及多個(gè)二值哈希碼,根據(jù)每個(gè)建模圖片對(duì)應(yīng)的多個(gè)參考類別概率向量,計(jì)算每個(gè)建模圖片對(duì)應(yīng)的類別概率向量,并根據(jù)每個(gè)建模圖片對(duì)應(yīng)的多個(gè)二值哈希碼,計(jì)算每個(gè)建模圖片對(duì)應(yīng)的平均二值哈希碼,基于建模圖片對(duì)應(yīng)的類別概率向量和平均二值哈希碼,對(duì)任一待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到已訓(xùn)練的shnn模型。
對(duì)于待識(shí)別圖片q.img,將該待識(shí)別圖片q.img輸入到已訓(xùn)練的shnn模型中,根據(jù)已訓(xùn)練的shnn模型,對(duì)該待識(shí)別圖片q.img進(jìn)行識(shí)別,得到類別概率向量。由于該待識(shí)別圖片q.img具有fov標(biāo)簽,因此,服務(wù)器還將根據(jù)fov標(biāo)簽中的拍攝位置,確定多個(gè)可選地標(biāo)pa、pb、pc、pd、pe,進(jìn)而根據(jù)fov標(biāo)簽中的拍攝方向角、可視夾角及最大可視距離,從多個(gè)可選地標(biāo)中,選取目標(biāo)地標(biāo)pa、pb,進(jìn)而計(jì)算目標(biāo)地標(biāo)pa、pb的捕捉概率,并根據(jù)目標(biāo)地標(biāo)pa、pb的捕捉概率,對(duì)類別概率向量進(jìn)行更新,從而根據(jù)更新后的類別概率向量,確定待識(shí)別圖片q.img的類別。
需要說(shuō)明的是,本實(shí)施例提供的方法不僅適用于圖片識(shí)別,還適用于對(duì)視頻數(shù)據(jù)進(jìn)行識(shí)別,對(duì)于視頻數(shù)據(jù)在進(jìn)行識(shí)別時(shí),可通過(guò)截幀的方式視頻數(shù)據(jù)截取為多幀圖片,并對(duì)每幀圖片進(jìn)行識(shí)別。
本發(fā)明實(shí)施例提供的方法,由于采用已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,而該已訓(xùn)練的shnn模型由多個(gè)已訓(xùn)練的hnn模型聚合得到,因此,不僅能夠保證識(shí)別精度,而且大大地縮短了識(shí)別過(guò)程所消耗的時(shí)間。另外,在進(jìn)行相似圖片檢索時(shí),無(wú)需進(jìn)行復(fù)雜的計(jì)算,僅需計(jì)算不同圖片的二值哈希碼之間的海明距離即可,因而大大減少了計(jì)算復(fù)雜度,縮減了檢索時(shí)間,提高了檢索效率。
參見(jiàn)圖4,本發(fā)明實(shí)施例提供了一種圖片識(shí)別裝置,該裝置包括:
第一獲取模塊401,用于獲取待識(shí)別圖片;
第二獲取模塊402,用于獲取已訓(xùn)練的shnn模型,shnn由多個(gè)已訓(xùn)練的hnn模型聚合得到;
圖片識(shí)別模塊403,用于根據(jù)已訓(xùn)練的shnn模型,對(duì)待識(shí)別圖片進(jìn)行識(shí)別,得到待識(shí)別圖片的類別概率向量,類別概率向量包括待識(shí)別圖片屬于每種類別的類別概率,每種類別的類別概率為多個(gè)參考類別概率向量的每一維度上的元素的平均值,該多個(gè)參考類別概率向量由所述多個(gè)hnn模型對(duì)待識(shí)別圖片識(shí)別得到;
類別確定模塊404,用于根據(jù)類別概率向量,確定待識(shí)別圖片的類別。
在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
第三獲取模塊,用于獲取多個(gè)訓(xùn)練圖片,每個(gè)訓(xùn)練圖片標(biāo)注有初始類別;
模型訓(xùn)練模塊,用于根據(jù)多個(gè)訓(xùn)練圖片,對(duì)多個(gè)待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到多個(gè)已訓(xùn)練的hnn模型;
模型聚合模塊,用于對(duì)多個(gè)已訓(xùn)練的hnn模型進(jìn)行聚合,得到已訓(xùn)練的shnn模型。
在本發(fā)明的另一個(gè)實(shí)施例中,模型聚合模塊,用于獲取多個(gè)建模圖片;對(duì)于任一建模圖片,根據(jù)每個(gè)已訓(xùn)練的hnn模型,對(duì)建模圖片進(jìn)行識(shí)別,得到建模圖片的多個(gè)參考類別概率向量;計(jì)算建模圖片對(duì)應(yīng)的多個(gè)參考類別概率向量在同一維度上的元素的平均值,得到建模圖片對(duì)應(yīng)的類別概率向量;根據(jù)建模圖片對(duì)應(yīng)的類別概率向量,確定建模圖片的初始類別;根據(jù)多個(gè)添加了初始類別的建模圖片,對(duì)任一待訓(xùn)練的hnn模型進(jìn)行訓(xùn)練,得到已訓(xùn)練的shnn模型。
在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
特征提取模塊,用于根據(jù)已訓(xùn)練的shnn模型,提取待識(shí)別圖片的特征向量,并將所提取的特征向量映射為二值哈希碼,該二值哈希碼為由0或1組成的字符串;
第一計(jì)算模塊,用于計(jì)算圖片數(shù)據(jù)庫(kù)中存儲(chǔ)的每個(gè)圖片的二值哈希碼與二值哈希碼之間的海明距離;
相似圖片確定模塊,用于如果任一圖片的二值哈希碼與二值哈希碼之間的海明距離小于第一預(yù)設(shè)數(shù)值,確定圖片為待識(shí)別圖片的相似圖片。
在本發(fā)明的另一個(gè)實(shí)施例中,特征提取模塊,用于將特征向量中每一維度上的元素轉(zhuǎn)換為一個(gè)s型值,得到與特征向量維度數(shù)量相同的多個(gè)s型值;如果任一s型值大于第二預(yù)設(shè)數(shù)值,則將s型值映射為1;如果s型值小于第二預(yù)設(shè)數(shù)值,則將s型值映射為0;按照特征向量中每一維度的元素順序,將多個(gè)s型值所映射的0或1組成字符串,得到二值哈希碼。
在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
地標(biāo)確定模塊,用于如果待識(shí)別圖片具有相機(jī)視錐模型fov標(biāo)簽,根據(jù)fov標(biāo)簽,確定至少一個(gè)目標(biāo)地標(biāo),fov標(biāo)簽包括拍攝位置、拍攝方向角、可視夾角及最大可視距離;
第二計(jì)算模塊,用于計(jì)算每個(gè)目標(biāo)地標(biāo)的捕捉概率;
更新模塊,用于根據(jù)至少一個(gè)目標(biāo)地標(biāo)的捕捉概率,對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新。
在本發(fā)明的另一個(gè)實(shí)施例中,地標(biāo)確定模塊,用于根據(jù)拍攝位置,確定多個(gè)可選地標(biāo);根據(jù)拍攝方向角、可視夾角及最大可視距離,從多個(gè)可選地標(biāo)中,選取至少一個(gè)目標(biāo)地標(biāo)。
在本發(fā)明的另一個(gè)實(shí)施例中,更新模塊,用于計(jì)算至少一個(gè)目標(biāo)地標(biāo)和類別概率向量中同一類別對(duì)應(yīng)的捕捉概率和類別概率的概率平均值;根據(jù)每種類別的概率平均值,對(duì)待識(shí)別圖片的類別概率向量進(jìn)行更新。
綜上所述,本發(fā)明實(shí)施例提供的裝置,由于采用已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,而該已訓(xùn)練的shnn模型由多個(gè)已訓(xùn)練的hnn模型聚合得到,因此,不僅能夠保證識(shí)別精度,而且大大地縮短了識(shí)別過(guò)程所消耗的時(shí)間。
圖5是根據(jù)一示例性實(shí)施例示出的一種用于圖片識(shí)別的服務(wù)器。參照?qǐng)D5,服務(wù)器500包括處理組件522,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器532所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理組件522的執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器532中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件522被配置為執(zhí)行指令,以執(zhí)行上述圖1中圖片識(shí)別方法中服務(wù)器所執(zhí)行的功能
服務(wù)器500還可以包括一個(gè)電源組件526被配置為執(zhí)行服務(wù)器500的電源管理,一個(gè)有線或無(wú)線網(wǎng)絡(luò)接口550被配置為將服務(wù)器500連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(i/o)接口558。服務(wù)器500可以操作基于存儲(chǔ)在存儲(chǔ)器532的操作系統(tǒng),例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或類似。
本發(fā)明實(shí)施例提供的服務(wù)器,由于采用已訓(xùn)練的shnn模型對(duì)待識(shí)別圖片進(jìn)行識(shí)別,而該已訓(xùn)練的shnn模型由多個(gè)已訓(xùn)練的hnn模型聚合得到,因此,不僅能夠保證識(shí)別精度,而且大大地縮短了識(shí)別過(guò)程所消耗的時(shí)間。
需要說(shuō)明的是:上述實(shí)施例提供的圖片識(shí)別裝置在識(shí)別圖片時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將圖片識(shí)別裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的圖片識(shí)別裝置與圖片識(shí)別方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過(guò)程詳見(jiàn)方法實(shí)施例,這里不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。