【技術(shù)領(lǐng)域】
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種視頻分類方法及裝置、計算機(jī)設(shè)備與可讀介質(zhì)。
背景技術(shù):
隨著互聯(lián)網(wǎng)的高速增長,其已成為用戶獲取信息的重要渠道。但與此同時,信息的爆炸也產(chǎn)生了很多用戶不想看到或者不感興趣的內(nèi)容。尤其近些年,根據(jù)用戶的興趣展示內(nèi)容推薦已經(jīng)逐漸成為互聯(lián)網(wǎng)產(chǎn)品的基本功能。
例如,現(xiàn)有的視頻領(lǐng)域中視頻的推薦方案中,可以依據(jù)視頻的標(biāo)題以及用戶對視頻的回復(fù)等等,對視頻進(jìn)行分類。然后再基于視頻的分類向用戶推薦視頻。但是現(xiàn)有技術(shù)中,視頻標(biāo)題以及視頻回復(fù)的編輯最主要的來源都是普通用戶。普通用戶編輯的視頻回復(fù)具有很強(qiáng)的隨意性,并且視頻標(biāo)題更多的是突出發(fā)布者的心情,比如太厲害了,非常搞笑之類的,從而導(dǎo)致基于視頻標(biāo)題以及視頻的回復(fù)均無法有效地對視頻內(nèi)容進(jìn)行分類,甚至?xí)灰恍┑退滓曨l內(nèi)容制造者利用。
因此,現(xiàn)有技術(shù)中,基于視頻標(biāo)題以及視頻的回復(fù)對視頻內(nèi)容進(jìn)行分類的準(zhǔn)確性較差。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種視頻分類方法及裝置、計算機(jī)設(shè)備與可讀介質(zhì),用于提高視頻分類的準(zhǔn)確性。
本發(fā)明提供一種視頻分類方法,所述方法包括:
從目標(biāo)視頻中獲取多幀圖片;
根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各所述幀的所述圖片進(jìn)行識別,預(yù)測各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率;
根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取所述目標(biāo)視頻的目標(biāo)類別。
進(jìn)一步可選地,如上所述的方法中,根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取所述目標(biāo)視頻的目標(biāo)類別,具體包括:
根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,從各幀的所述圖片對應(yīng)的預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為所述目標(biāo)視頻的目標(biāo)類別;
或者根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,對各幀的所述圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理,得到所述目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別的概率;從所述目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為所述目標(biāo)視頻的目標(biāo)類別。
進(jìn)一步可選地,如上所述的方法中,根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各所述幀的所述圖片進(jìn)行識別,預(yù)測各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率之前,還包括:
采集數(shù)張已知類別的訓(xùn)練圖片,生成圖片訓(xùn)練庫;
利用所述圖片訓(xùn)練庫中的所述數(shù)張訓(xùn)練圖片,訓(xùn)練所述圖片分類模型。
進(jìn)一步可選地,如上所述的方法中,利用所述圖片訓(xùn)練庫中的所述數(shù)張訓(xùn)練圖片,訓(xùn)練所述圖片分類模型,具體包括:
依次將各張所述訓(xùn)練圖片輸入至所述圖片分類模型中,使得所述圖片分類模型輸出對應(yīng)的所述訓(xùn)練圖片在各預(yù)設(shè)類別中的概率;
根據(jù)對應(yīng)的所述訓(xùn)練圖片在各預(yù)設(shè)類別中的概率,確定所述訓(xùn)練圖片的預(yù)測類別;
檢測對應(yīng)的所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別是否一致;
當(dāng)對應(yīng)所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別不一致時,調(diào)整所述圖片分類模型的參數(shù),使得所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別一致;
重復(fù)執(zhí)行上述步驟,直至所述數(shù)張訓(xùn)練圖片訓(xùn)練完畢,且所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別一致,確定所述圖片分類模型的參數(shù),從而確定所述圖片分類模型。
進(jìn)一步可選地,如上所述的方法中,根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取所述目標(biāo)視頻的目標(biāo)類別之后,還包括:
根據(jù)用戶的歷史行為檢測所述用戶感興趣的類別;
檢測所述用戶感興趣的類別中是否包括所述目標(biāo)類別;
若包括,向所述用戶推薦所述目標(biāo)視頻。
本發(fā)明還提供一種視頻分類裝置,所述裝置包括:
圖片獲取模塊,用于從目標(biāo)視頻中獲取多幀圖片;
預(yù)測模塊,用于根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各所述幀的所述圖片進(jìn)行識別,預(yù)測各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率;
類別獲取模塊,用于根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取所述目標(biāo)視頻的目標(biāo)類別。
進(jìn)一步可選地,如上所述的裝置中,所述類別獲取模塊,具體用于:
根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,從各幀的所述圖片對應(yīng)的預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為所述目標(biāo)視頻的目標(biāo)類別;
或者根據(jù)各幀的所述圖片對應(yīng)的各預(yù)設(shè)類別的概率,對各幀的所述圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理,得到所述目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別的概率;從所述目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為所述目標(biāo)視頻的目標(biāo)類別。
進(jìn)一步可選地,如上所述的裝置中,還包括:
采集模塊,用于采集數(shù)張已知類別的訓(xùn)練圖片,生成圖片訓(xùn)練庫;
訓(xùn)練模塊,用于利用所述圖片訓(xùn)練庫中的所述數(shù)張訓(xùn)練圖片,訓(xùn)練所述圖片分類模型。
進(jìn)一步可選地,如上所述的裝置中,所述訓(xùn)練模塊,具體用于:
依次將各張所述訓(xùn)練圖片輸入至所述圖片分類模型中,使得所述圖片分類模型輸出對應(yīng)的所述訓(xùn)練圖片在各預(yù)設(shè)類別中的概率;
根據(jù)對應(yīng)的所述訓(xùn)練圖片在各預(yù)設(shè)類別中的概率,確定所述訓(xùn)練圖片的預(yù)測類別;
檢測對應(yīng)的所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別是否一致;
當(dāng)對應(yīng)所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別不一致時,調(diào)整所述圖片分類模型的參數(shù),使得所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別一致;
重復(fù)執(zhí)行上述步驟,直至所述數(shù)張訓(xùn)練圖片訓(xùn)練完畢,且所述訓(xùn)練圖片的已知類別和所述訓(xùn)練圖片的預(yù)測類別一致,確定所述圖片分類模型的參數(shù),從而確定所述圖片分類模型。
進(jìn)一步可選地,如上所述的裝置中,還包括:
檢測模塊,用于根據(jù)用戶的歷史行為檢測所述用戶感興趣的類別;
所述檢測模塊,還用于檢測所述用戶感興趣的類別中是否包括所述目標(biāo)類別;
推薦模塊,用于若所述檢測模塊檢測所述用戶感興趣的類別中包括所述目標(biāo)類別,向所述用戶推薦所述目標(biāo)視頻。
本發(fā)明還提供一種計算機(jī)設(shè)備,所述設(shè)備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如上所述的視頻分類方法。
本發(fā)明還提供一種計算機(jī)可讀介質(zhì),其上存儲有計算機(jī)程序,該程序被處理器執(zhí)行時實現(xiàn)如上所述的視頻分類方法。
本發(fā)明的視頻分類方法及裝置、計算機(jī)設(shè)備與可讀介質(zhì),通過從目標(biāo)視頻中獲取多幀圖片,根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率;根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別。本發(fā)明的技術(shù)方案,可以克服現(xiàn)有技術(shù)中直接基于視頻標(biāo)題以及視頻的回復(fù)對視頻內(nèi)容進(jìn)行分類的準(zhǔn)確性較差的技術(shù)問題,通過基于預(yù)先訓(xùn)練的圖片分類模型預(yù)測目標(biāo)視頻中的多幀圖片對應(yīng)的各預(yù)設(shè)類別的概率,從而獲取目標(biāo)視頻的目標(biāo)類別,能夠有效地提高對目標(biāo)視頻分類的準(zhǔn)確性。
【附圖說明】
圖1為本發(fā)明的視頻分類方法實施例一的流程圖。
圖2為本發(fā)明的視頻分類方法實施例二的流程圖。
圖3為本發(fā)明的視頻分類裝置實施例一的結(jié)構(gòu)圖。
圖4為本發(fā)明的視頻分類裝置實施例二的結(jié)構(gòu)圖。
圖5為本發(fā)明的計算機(jī)設(shè)備實施例的結(jié)構(gòu)圖。
圖6為本發(fā)明提供的一種計算機(jī)設(shè)備的示例圖。
【具體實施方式】
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)描述。
圖1為本發(fā)明的視頻分類方法實施例一的流程圖。如圖1所示,本實施例的視頻分類方法,具體可以包括如下步驟:
100、從目標(biāo)視頻中獲取多幀圖片;
本實施例的視頻分類方法的執(zhí)行主體為視頻分類裝置,本實施例的視頻分類裝置可以為一電子實體裝置,也可以采用軟件集成的裝置。
本實施例的視頻分類方法中,首先可以從目標(biāo)視頻中獲取多幀圖片。例如該多幀圖片最好不為連續(xù)的多幀,例如多幀圖片中任意兩幀圖片對應(yīng)的時間幀的時間差需要大于一定的時間長度閾值,以保證該兩幀圖片非連續(xù)幀的圖片,使得每一幀圖片的選取都盡量不受前一幀圖片的影響,都是獨(dú)立的,從而保證視頻分類的準(zhǔn)確性。本實施例中的多幀圖片的數(shù)量,可以根據(jù)需求設(shè)置10個以內(nèi)或者10個以上,甚至幾十個。
101、根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率;
本實施例的預(yù)先訓(xùn)練的圖片分類模型能夠根據(jù)每一幀圖片,對每一幀圖片屬于哪個預(yù)設(shè)類別的概率進(jìn)行預(yù)測。本實施例中的圖片分類模型需要預(yù)先設(shè)置圖片能夠被分類的預(yù)設(shè)類別,這里的預(yù)設(shè)類別可以僅包括一層分類的類別;也可以不僅包括一級類別,同時還包括二級類別。為了便于表示,本實施例的圖片分類模型根據(jù)各幀圖片,預(yù)測的該幀圖片所屬類別的概率可以采用向量的形式。該向量的維度等于預(yù)先設(shè)置的所有預(yù)設(shè)類別的數(shù)量,該向量中每一個元素的數(shù)值等于該位置對應(yīng)的預(yù)設(shè)類別的概率值。例如預(yù)先設(shè)置該圖片能夠被分類的預(yù)設(shè)類別的數(shù)量有30個,那么在預(yù)測時,圖片分類模型會預(yù)測某幀圖片的概率為一個30維的向量,向量中每一個元素的數(shù)值如p18為0.3,假如向量中第18個位置處對應(yīng)的預(yù)設(shè)類別為娛樂,p18為0.3表示該幀圖片的類別屬于娛樂的概率為0.3。
102、根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別。
根據(jù)上述步驟,可以獲得視頻中獲取的各幀所屬預(yù)設(shè)類別的概率,然后可以綜合考慮視頻中獲取的各幀的圖片屬于各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別。
例如該步驟102“根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別”,具體可以包括如下兩種方式:
第一種方式:根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,從各幀的圖片對應(yīng)的預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別;
該實施方式中,將每一幀圖片所屬于各預(yù)設(shè)類別的概率羅列出來,從中取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別。例如,預(yù)設(shè)類別有20個,第一幀圖片對應(yīng)的各預(yù)設(shè)類別的概率分別為p1,1=0.1、p1,2=0.3、……、p1,10=0.3、……p1,19=0.2、p1,20=0.1。p1,1=0.1表示第一幀圖片屬于第1預(yù)設(shè)類別的概率為0.1,p1,2=0.3表示第一幀圖片屬于第2預(yù)設(shè)類別的概率為0.3,p1,10=0.3表示第一幀圖片屬于第10預(yù)設(shè)類別的概率為0.3,p1,19=0.2表示第一幀圖片屬于第19預(yù)設(shè)類別的概率為0.2,p1,20=0.1表示第一幀圖片屬于第20預(yù)設(shè)類別的概率為0.1;而該第1幀圖片屬于其他預(yù)設(shè)類別的概率為0。同理,對應(yīng)第二幀圖片對應(yīng)的各預(yù)設(shè)類別的概率分別為p2,1=0.2、p2,2=0.6、……、p2,11=0.1、……p2,19=0.1。p2,1=0.2表示第二幀圖片屬于第1預(yù)設(shè)類別的概率為0.2,p2,2=0.6表示第2幀圖片屬于第2預(yù)設(shè)類別的概率為0.6,p2,11=0.1表示第2幀圖片屬于第11預(yù)設(shè)類別的概率為0.1,p2,19=0.1表示第2幀圖片屬于第19預(yù)設(shè)類別的概率為0.1。如果從該目標(biāo)視頻中還獲取了其他幀圖片,對于每一幀圖片都采用步驟101,都可以獲取到該幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率。具體可以獲取每一幀圖片對應(yīng)的預(yù)設(shè)類別的概率的最大值;然后將所有各幀圖片的概率最大值對應(yīng)的預(yù)設(shè)類別作為該目標(biāo)視頻的目標(biāo)類別。例如,本實施例中,如果其他幀圖片對應(yīng)的概率最大值都小于0.6,那么可以認(rèn)為概率0.6對應(yīng)的類別為該目標(biāo)視頻對應(yīng)的目標(biāo)類別,即可以認(rèn)為該目標(biāo)視頻的目標(biāo)類別為第2預(yù)設(shè)類別。
第二種方式為:根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,對各幀的圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理,得到目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別的概率;從目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別。
本實施例的技術(shù)方案,在獲取到每一幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率之后,對各幀的圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理。假如,目標(biāo)視頻獲取到3幀圖片。同理,第一幀圖片對應(yīng)的各預(yù)設(shè)類別的概率分別為p1,1=0.1、p1,2=0.3、……、p1,10=0.3、……p1,19=0.2、p1,20=0.1;其余預(yù)設(shè)類別概率為0。第二幀圖片對應(yīng)的各預(yù)設(shè)類別的概率分別為p2,1=0.2、p2,2=0.6、……、p2,11=0.1、……p2,19=0.1;其余預(yù)設(shè)類別概率為0。第三幀圖片對應(yīng)的各預(yù)設(shè)類別的概率分別為p3,1=0.7、p3,10=0.2,p3,20=0.1;其余預(yù)設(shè)類別概率為0。將各幀的圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理之后,目標(biāo)視頻屬于第1預(yù)設(shè)類別的概率為p1=p1,1+p2,1+p3,1=0.1+0.2+0.7=1.0,目標(biāo)視頻屬于第2預(yù)設(shè)類別的概率為p2=p1,2+p2,2+p3,2=0.3+0.6+0=0.9,目標(biāo)視頻屬于第10預(yù)設(shè)類別的概率為p10=p1,10+p2,10+p3,10=0.3+0+0.2=0.5,目標(biāo)視頻屬于第11預(yù)設(shè)類別的概率為p11=p1,11+p2,11+p3,11=0+0.1+0=0.1,目標(biāo)視頻屬于第19預(yù)設(shè)類別的概率為p19=p1,19+p2,19+p3,19=0.2+0.1+0=0.3,目標(biāo)視頻屬于第20預(yù)設(shè)類別的概率為p20=p1,20+p2,20+p3,20=0.1+0+0.1=0.2。然后再從目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別,其中目標(biāo)視頻屬于第1預(yù)設(shè)類別的概率為p1=1.0為最大,此時可以認(rèn)為目標(biāo)視頻的目標(biāo)類別為第1預(yù)設(shè)類別。
其中第二種方式獲得的目標(biāo)視頻的目標(biāo)類別比第一種方式獲得的目標(biāo)視頻的目標(biāo)類別更為準(zhǔn)確。
本實施例的視頻分類方法,通過從目標(biāo)視頻中獲取多幀圖片,根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率;根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別。本實施例的技術(shù)方案,可以克服現(xiàn)有技術(shù)中直接基于視頻標(biāo)題以及視頻的回復(fù)對視頻內(nèi)容進(jìn)行分類的準(zhǔn)確性較差的技術(shù)問題,通過基于預(yù)先訓(xùn)練的圖片分類模型預(yù)測目標(biāo)視頻中的多幀圖片對應(yīng)的各預(yù)設(shè)類別的概率,從而獲取目標(biāo)視頻的目標(biāo)類別,能夠有效地提高對目標(biāo)視頻分類的準(zhǔn)確性。
圖2為本發(fā)明的視頻分類方法實施例二的流程圖。本實施例的視頻分類方法,在上述圖1所示實施例的技術(shù)方案的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖2所示,本實施例的視頻分類方法,具體可以包括如下步驟:
200、采集數(shù)張已知類別的訓(xùn)練圖片,生成圖片訓(xùn)練庫;
201、利用圖片訓(xùn)練庫中的數(shù)張訓(xùn)練圖片,訓(xùn)練圖片分類模型;
例如該步驟201“利用圖片訓(xùn)練庫中的數(shù)張訓(xùn)練圖片,訓(xùn)練圖片分類模型”,具體可以包括如下步驟:
(a1)依次將各張訓(xùn)練圖片輸入至圖片分類模型中,使得圖片分類模型輸出對應(yīng)的訓(xùn)練圖片在各預(yù)設(shè)類別中的概率;
(a2)根據(jù)對應(yīng)的訓(xùn)練圖片在各預(yù)設(shè)類別中的概率,確定訓(xùn)練圖片的預(yù)測類別;
(a3)檢測對應(yīng)的訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別是否一致;當(dāng)對應(yīng)訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別不一致時,執(zhí)行步驟(a4);當(dāng)對應(yīng)訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致時,返回步驟(a1)使用下一張訓(xùn)練圖片輸入至圖片分類模型中進(jìn)行訓(xùn)練。
(a4)調(diào)整圖片分類模型的參數(shù),使得訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致;
重復(fù)執(zhí)行上述步驟(a1)-(a4),直至數(shù)張訓(xùn)練圖片訓(xùn)練完畢,且訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致,確定圖片分類模型的參數(shù),從而確定圖片分類模型。
在訓(xùn)練之前,該圖片分類模型的參數(shù)為初始值,當(dāng)向該圖片分類模型輸入第一張訓(xùn)練圖片的時候,圖片分類模型基于初始參數(shù),可以預(yù)測出該訓(xùn)練圖片在各預(yù)設(shè)類別中的概率;然后根據(jù)對應(yīng)的訓(xùn)練圖片在各預(yù)設(shè)類別中的概率,確定訓(xùn)練圖片的預(yù)測類別,例如,可以選擇概率最大的預(yù)設(shè)類別作為該訓(xùn)練圖片的預(yù)設(shè)類別。然后檢測對應(yīng)的訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別是否一致。例如,若某訓(xùn)練圖片在預(yù)測時,在第1預(yù)設(shè)類別的概率為0.6,第2預(yù)設(shè)類別的概率為0.2,還在第9預(yù)設(shè)類別的概率為0.2。而該訓(xùn)練圖片的已知類別為第2預(yù)設(shè)類別,即在第2預(yù)設(shè)類別的概率為1.0,此時應(yīng)該調(diào)整圖片分類模型的參數(shù),使得訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致,即使得該圖片分類模型預(yù)測的該訓(xùn)練圖片在第2預(yù)設(shè)類別的概率朝1.0的方向增加,而使得該圖片分類模型預(yù)測的該訓(xùn)練圖片在第1預(yù)設(shè)類別的概率和第9預(yù)設(shè)類別的概率朝概率為0的方向遞減,此時該張訓(xùn)練圖片訓(xùn)練完畢,接下來使用上一張訓(xùn)練圖片調(diào)整后的圖片分類模型的參數(shù)訓(xùn)練下一張訓(xùn)練圖片,依次類推,再次調(diào)整圖片分類模型的參數(shù);接下來,再使用下下一張訓(xùn)練圖片繼續(xù)訓(xùn)練圖片分類模型,調(diào)整圖片分類模型的參數(shù),直至數(shù)張訓(xùn)練圖片訓(xùn)練完畢,且訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別趨于一致,確定圖片分類模型的參數(shù),從而確定圖片分類模型。
實際應(yīng)用中,當(dāng)數(shù)張訓(xùn)練圖片對圖片分類模型訓(xùn)練一輪之后,若訓(xùn)練圖片的已知類別和與圖片分類模型對訓(xùn)練圖片的預(yù)測類別仍不一致,此時可以使用數(shù)張訓(xùn)練圖片對圖片分類模型再訓(xùn)練一輪或者多輪,直到訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別趨于一致,確定圖片分類模型的參數(shù),從而確定圖片分類模型。
本實施例中的圖片訓(xùn)練庫中采集的訓(xùn)練圖片的數(shù)量可以成千上萬,甚至幾十萬張,圖片訓(xùn)練庫中包括的訓(xùn)練圖片的數(shù)量越多,訓(xùn)練的圖片分類模型的參數(shù)越準(zhǔn)確,該訓(xùn)練后的圖片分類模型預(yù)測的各圖片在各預(yù)設(shè)類別的概率越準(zhǔn)確。
202、從目標(biāo)視頻中獲取多幀圖片;
203、根據(jù)預(yù)先訓(xùn)練的圖片分類模型對各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率;
204、根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,對各幀的圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理,得到目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別的概率;
205、從目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別;
上述步驟202-205的實施詳細(xì)可以參考上述圖1所示實施例的相關(guān)記載,在此不再贅述。
206、根據(jù)用戶的歷史行為檢測用戶感興趣的類別;
207、檢測用戶感興趣的類別中是否包括目標(biāo)類別;若包括,執(zhí)行步驟208;否則若不包括,繼續(xù)檢測下一用戶感興趣的類別中是否包括目標(biāo)類別;
208、向用戶推薦目標(biāo)視頻。
進(jìn)一步可選地,本實施例中還包括根據(jù)目標(biāo)視頻的目標(biāo)類別向用戶推薦目標(biāo)視頻的應(yīng)用場景。例如,在某個視頻播放平臺的視頻庫中,新增加了一個視頻,可以按照上述步驟202-204的方式,獲取到目標(biāo)視頻的目標(biāo)類別。然后可以檢測使用該視頻應(yīng)用的各個用戶的歷史行為,判斷各個用戶使用對該目標(biāo)視頻感興趣。例如,可以先根據(jù)用戶的歷史行為檢測用戶感興趣的類別都有哪些,然后判斷用戶感興趣的類別中是否包括該目標(biāo)視頻的目標(biāo)類別,若包括可以向該用戶推薦該目標(biāo)視頻,從而能夠在視頻庫中一旦新加入用戶感興趣的新視頻,可以及時向用戶推薦其感興趣的視頻,提高用戶的使用體驗度,從而能夠留住該視頻播放平臺中的用戶。若檢測到某用戶感興趣的類別中未包括目標(biāo)類別,一定避免向該用戶推薦該目標(biāo)視頻,以防止用戶的反感。此時可以繼續(xù)檢測使用該視頻播放平臺的下一個用戶,直到對該視頻播放平臺的所有用戶做檢測,并向該視頻播放平臺的所有對目標(biāo)類別感興趣的用戶推薦該目標(biāo)視頻。
本實施例的視頻分類方法,通過上述方法可以克服現(xiàn)有技術(shù)中直接基于視頻標(biāo)題以及視頻的回復(fù)對視頻內(nèi)容進(jìn)行分類的準(zhǔn)確性較差的技術(shù)問題,通過基于預(yù)先訓(xùn)練的圖片分類模型預(yù)測目標(biāo)視頻中的多幀圖片對應(yīng)的各預(yù)設(shè)類別的概率,從而獲取目標(biāo)視頻的目標(biāo)類別,能夠有效地提高對目標(biāo)視頻分類的準(zhǔn)確性。而且還能夠進(jìn)一步及時準(zhǔn)確的向感興趣的用戶推薦該目標(biāo)視頻,提高用戶的體驗度。
圖3為本發(fā)明的視頻分類裝置實施例一的結(jié)構(gòu)圖。如圖3所示,本實施例的視頻分類裝置,具體可以包括:圖片獲取模塊10、預(yù)測模塊11和類別獲取模塊12。
其中圖片獲取模塊10用于從目標(biāo)視頻中獲取多幀圖片;
預(yù)測模塊11用于根據(jù)預(yù)先訓(xùn)練的圖片分類模型對圖片獲取模塊10獲取的各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率;
類別獲取模塊12用于根據(jù)預(yù)測模塊11預(yù)測的各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,獲取目標(biāo)視頻的目標(biāo)類別。
本實施例的視頻分類裝置,通過采用上述模塊實現(xiàn)視頻分類的實現(xiàn)原理以及技術(shù)效果與上述相關(guān)方法實施例的實現(xiàn)相同,詳細(xì)可以參考上述相關(guān)方法實施例的記載,在此不再贅述。
圖4為本發(fā)明的視頻分類裝置實施例二的結(jié)構(gòu)圖。如圖4所示,本實施例的視頻分類裝置,在上述圖3所示實施例的技術(shù)方案的基礎(chǔ)上,進(jìn)一步還可以包括如下技術(shù)方案。
本實施例的視頻分類裝置中,類別獲取模塊12具體用于:
根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,從各幀的圖片對應(yīng)的預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別;
或者根據(jù)各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率,對各幀的圖片的預(yù)設(shè)類別的概率進(jìn)行加權(quán)處理,得到目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別的概率;從目標(biāo)視頻對應(yīng)的各預(yù)設(shè)類別中獲取概率最大的預(yù)設(shè)類別作為目標(biāo)視頻的目標(biāo)類別。
進(jìn)一步可選地,如圖4所示,本實施例的視頻分類裝置中,還包括:
采集模塊13用于采集數(shù)張已知類別的訓(xùn)練圖片,生成圖片訓(xùn)練庫;
訓(xùn)練模塊14用于利用圖片訓(xùn)練庫中的數(shù)張訓(xùn)練圖片,訓(xùn)練圖片分類模型。
對應(yīng)地,預(yù)測模塊11用于根據(jù)訓(xùn)練模塊14預(yù)先訓(xùn)練的圖片分類模型對圖片獲取模塊10獲取的各幀的圖片進(jìn)行識別,預(yù)測各幀的圖片對應(yīng)的各預(yù)設(shè)類別的概率。
進(jìn)一步可選地,本實施例的視頻分類裝置中,訓(xùn)練模14具體用于:
依次將各張訓(xùn)練圖片輸入至圖片分類模型中,使得圖片分類模型輸出對應(yīng)的訓(xùn)練圖片在各預(yù)設(shè)類別中的概率;
根據(jù)對應(yīng)的訓(xùn)練圖片在各預(yù)設(shè)類別中的概率,確定訓(xùn)練圖片的預(yù)測類別;
檢測對應(yīng)的訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別是否一致;
當(dāng)對應(yīng)訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別不一致時,調(diào)整圖片分類模型的參數(shù),使得訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致;
重復(fù)執(zhí)行上述步驟,直至數(shù)張訓(xùn)練圖片訓(xùn)練完畢,且訓(xùn)練圖片的已知類別和訓(xùn)練圖片的預(yù)測類別一致,確定圖片分類模型的參數(shù),從而確定圖片分類模型。
進(jìn)一步可選地,如圖4所示,本實施例的視頻分類裝置中,還包括:
檢測模塊15用于根據(jù)用戶的歷史行為檢測用戶感興趣的類別;
檢測模塊15還用于檢測用戶感興趣的類別中是否包括類別獲取模塊12獲取的目標(biāo)視頻的目標(biāo)類別;
推薦模塊16用于若檢測模塊15檢測用戶感興趣的類別中包括目標(biāo)類別,向用戶推薦目標(biāo)視頻。
本實施例的視頻分類裝置,通過采用上述模塊實現(xiàn)視頻分類的實現(xiàn)原理以及技術(shù)效果與上述相關(guān)方法實施例的實現(xiàn)相同,詳細(xì)可以參考上述相關(guān)方法實施例的記載,在此不再贅述。
圖5為本發(fā)明的計算機(jī)設(shè)備實施例的結(jié)構(gòu)圖。如圖5所示,本實施例的計算機(jī)設(shè)備,包括:一個或多個處理器30,以及存儲器40,存儲器40用于存儲一個或多個程序,當(dāng)存儲器40中存儲的一個或多個程序被一個或多個處理器30執(zhí)行,使得一個或多個處理器30實現(xiàn)如上任一實施例的視頻分類方法。圖5所示實施例中以包括多個處理器30為例。
例如,圖6為本發(fā)明提供的一種計算機(jī)設(shè)備的示例圖。圖6示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機(jī)設(shè)備12a的框圖。圖6顯示的計算機(jī)設(shè)備12a僅僅是一個示例,不應(yīng)對本發(fā)明實施例的功能和使用范圍帶來任何限制。
如圖6所示,計算機(jī)設(shè)備12a以通用計算設(shè)備的形式表現(xiàn)。計算機(jī)設(shè)備12a的組件可以包括但不限于:一個或者多個處理器16a,系統(tǒng)存儲器28a,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28a和處理器16a)的總線18a。
總線18a表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(vesa)局域總線以及外圍組件互連(pci)總線。
計算機(jī)設(shè)備12a典型地包括多種計算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計算機(jī)設(shè)備12a訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動的和不可移動的介質(zhì)。
系統(tǒng)存儲器28a可以包括易失性存儲器形式的計算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲器(ram)30a和/或高速緩存存儲器32a。計算機(jī)設(shè)備12a可以進(jìn)一步包括其它可移動/不可移動的、易失性/非易失性計算機(jī)系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34a可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖6未顯示,通常稱為“硬盤驅(qū)動器”)。盡管圖6中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動器,以及對可移動非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這些情況下,每個驅(qū)動器可以通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18a相連。系統(tǒng)存儲器28a可以包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明上述圖1-圖4各實施例的功能。
具有一組(至少一個)程序模塊42a的程序/實用工具40a,可以存儲在例如系統(tǒng)存儲器28a中,這樣的程序模塊42a包括——但不限于——操作系統(tǒng)、一個或者多個應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實現(xiàn)。程序模塊42a通常執(zhí)行本發(fā)明所描述的上述圖1-圖4各實施例中的功能和/或方法。
計算機(jī)設(shè)備12a也可以與一個或多個外部設(shè)備14a(例如鍵盤、指向設(shè)備、顯示器24a等)通信,還可與一個或者多個使得用戶能與該計算機(jī)設(shè)備12a交互的設(shè)備通信,和/或與使得該計算機(jī)設(shè)備12a能與一個或多個其它計算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22a進(jìn)行。并且,計算機(jī)設(shè)備12a還可以通過網(wǎng)絡(luò)適配器20a與一個或者多個網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20a通過總線18a與計算機(jī)設(shè)備12a的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合計算機(jī)設(shè)備12a使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動器、冗余處理器、外部磁盤驅(qū)動陣列、raid系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理器16a通過運(yùn)行存儲在系統(tǒng)存儲器28a中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實現(xiàn)上述實施例所示的視頻分類方法。
本發(fā)明還提供一種計算機(jī)可讀介質(zhì),其上存儲有計算機(jī)程序,該程序被處理器執(zhí)行時實現(xiàn)如上述實施例所示的視頻分類方法。
本實施例的計算機(jī)可讀介質(zhì)可以包括上述圖6所示實施例中的系統(tǒng)存儲器28a中的ram30a、和/或高速緩存存儲器32a、和/或存儲系統(tǒng)34a。
隨著科技的發(fā)展,計算機(jī)程序的傳播途徑不再受限于有形介質(zhì),還可以直接從網(wǎng)絡(luò)下載,或者采用其他方式獲取。因此,本實施例中的計算機(jī)可讀介質(zhì)不僅可以包括有形的介質(zhì),還可以包括無形的介質(zhì)。
本實施例的計算機(jī)可讀介質(zhì)可以采用一個或多個計算機(jī)可讀的介質(zhì)的任意組合。計算機(jī)可讀介質(zhì)可以是計算機(jī)可讀信號介質(zhì)或者計算機(jī)可讀存儲介質(zhì)。計算機(jī)可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式計算機(jī)磁盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機(jī)可讀的信號介質(zhì)還可以是計算機(jī)可讀存儲介質(zhì)以外的任何計算機(jī)可讀介質(zhì),該計算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設(shè)計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機(jī)程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計語言—諸如”c”語言或類似的程序設(shè)計語言。程序代碼可以完全地在用戶計算機(jī)上執(zhí)行、部分地在用戶計算機(jī)上執(zhí)行、作為一個獨(dú)立的軟件包執(zhí)行、部分在用戶計算機(jī)上部分在遠(yuǎn)程計算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計算機(jī)的情形中,遠(yuǎn)程計算機(jī)可以通過任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計算機(jī),或者,可以連接到外部計算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
在本發(fā)明所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(read-onlymemory,rom)、隨機(jī)存取存儲器(randomaccessmemory,ram)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。