本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種特定內(nèi)容識(shí)別方法、裝置和電子設(shè)備。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,基于互聯(lián)網(wǎng)的直播平臺(tái)得到了快速發(fā)展,直播作為一種新的媒體傳播方式,也吸引了越來越多的主播和用戶參與到直播中。
在直播中,一方面,用戶可以與主播進(jìn)行實(shí)時(shí)交互,具有很強(qiáng)的靈活性和實(shí)時(shí)性;但另一方面,直播的內(nèi)容不確定度較高,而且由于其實(shí)時(shí)性和并發(fā)量大的特點(diǎn),給包括非法內(nèi)容在內(nèi)的特定內(nèi)容監(jiān)管帶來了很大難度?,F(xiàn)有技術(shù)中,這種基于人工識(shí)別特定內(nèi)容的方式,在用于直播時(shí),識(shí)別效果很差,而且耗費(fèi)成本較高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種特定內(nèi)容識(shí)別方法,以實(shí)現(xiàn)針對(duì)直播的特定內(nèi)容識(shí)別,解決現(xiàn)有技術(shù)中人工識(shí)別特定內(nèi)容識(shí)別效果很差,而且耗費(fèi)成本較高的技術(shù)問題。
本發(fā)明的第二個(gè)目的在于提出一種特定內(nèi)容識(shí)別裝置。
本發(fā)明的第三個(gè)目的在于提出一種電子設(shè)備。
為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種特定內(nèi)容識(shí)別方法,包括:
對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫;
基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練;
將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練;
利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。
可選地,作為第一方面的第一種可能的實(shí)現(xiàn)方式,機(jī)器學(xué)習(xí)模型,包括第一級(jí)模型和第二級(jí)模型,所述第一級(jí)模型和所述第二級(jí)模型具有相同的模型結(jié)構(gòu)。
可選地,作為第一方面的第二種可能的實(shí)現(xiàn)方式,所述基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,包括:
基于所述圖片樣本庫,以及所述圖片樣本庫中各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)所述機(jī)器學(xué)習(xí)模型的第一級(jí)模型進(jìn)行訓(xùn)練。
可選地,作為第一方面的第三種可能的實(shí)現(xiàn)方式,所述將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,包括:
將所述測試圖片,利用經(jīng)過訓(xùn)練的第一級(jí)模型進(jìn)行內(nèi)容識(shí)別;
根據(jù)所述測試圖片中識(shí)別有誤的部分,對(duì)第二級(jí)模型進(jìn)行訓(xùn)練,得到經(jīng)過訓(xùn)練的第二級(jí)模型。
可選地,作為第一方面的第四種可能的實(shí)現(xiàn)方式,所述根據(jù)所述測試圖片中識(shí)別有誤的部分,對(duì)第二級(jí)模型進(jìn)行訓(xùn)練,得到經(jīng)過訓(xùn)練的第二級(jí)模型,包括:
從所述測試圖片中,查詢識(shí)別有誤的誤識(shí)別圖片,其中,所述誤識(shí)別圖片包括標(biāo)注為包含正常內(nèi)容的特定圖片,和/或標(biāo)注為包含特定內(nèi)容的正常圖片;
根據(jù)所述誤識(shí)別圖片,重新生成所述圖片樣本庫;
基于重新生成的所述圖片樣本庫,對(duì)所述機(jī)器學(xué)習(xí)模型的第二級(jí)模型進(jìn)行訓(xùn)練。
可選地,作為第一方面的第五種可能的實(shí)現(xiàn)方式,所述利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別,包括:
利用所述第一級(jí)模型對(duì)在線直播視頻的截圖進(jìn)行特定內(nèi)容識(shí)別;
根據(jù)識(shí)別的置信度,將識(shí)別的置信度低于閾值的在線直播視頻的截圖,利用所述第二級(jí)模型,進(jìn)行特定內(nèi)容識(shí)別。
可選地,作為第一方面的第六種可能的實(shí)現(xiàn)方式,所述機(jī)器學(xué)習(xí)模型為卷積神經(jīng)網(wǎng)絡(luò);所述特定內(nèi)容,包括非法內(nèi)容。
本發(fā)明實(shí)施例的特定內(nèi)容識(shí)別方法,通過對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。由于利用了機(jī)器學(xué)習(xí)模型進(jìn)行特定內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種特定內(nèi)容識(shí)別裝置,包括:
生成模塊,用于對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫;
訓(xùn)練模塊,用于基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練;
重訓(xùn)練模塊,用于將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練;
識(shí)別模塊,用于利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。
可選地,作為第二方面的第一種可能的實(shí)現(xiàn)方式,所述機(jī)器學(xué)習(xí)模型,包括第一級(jí)模型和第二級(jí)模型,所述第一級(jí)模型和所述第二級(jí)模型具有相同的模型結(jié)構(gòu)。
可選地,作為第二方面的第二種可能的實(shí)現(xiàn)方式,所述訓(xùn)練模塊,具體用于:
基于所述圖片樣本庫,以及所述圖片樣本庫中各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)所述機(jī)器學(xué)習(xí)模型的第一級(jí)模型進(jìn)行訓(xùn)練。
可選地,作為第二方面的第三種可能的實(shí)現(xiàn)方式,所述重訓(xùn)練模塊,包括:
識(shí)別單元,用于將所述測試圖片,利用經(jīng)過訓(xùn)練的第一級(jí)模型進(jìn)行內(nèi)容識(shí)別;
重訓(xùn)練單元,用于根據(jù)所述測試圖片中識(shí)別有誤的部分,對(duì)第二級(jí)模型進(jìn)行訓(xùn)練,得到經(jīng)過訓(xùn)練的第二級(jí)模型。
可選地,作為第二方面的第四種可能的實(shí)現(xiàn)方式,所述重訓(xùn)練單元,具體用于:
從所述測試圖片中,查詢識(shí)別有誤的誤識(shí)別圖片,其中,所述誤識(shí)別圖片包括標(biāo)注為包含正常內(nèi)容的特定圖片,和/或標(biāo)注為包含特定內(nèi)容的正常圖片;
根據(jù)所述誤識(shí)別圖片,重新生成所述圖片樣本庫;
基于重新生成的所述圖片樣本庫,對(duì)所述機(jī)器學(xué)習(xí)模型的第二級(jí)模型進(jìn)行訓(xùn)練。
可選地,作為第二方面的第五種可能的實(shí)現(xiàn)方式,所述識(shí)別模塊,具體用于:
利用所述第一級(jí)模型對(duì)在線直播視頻的截圖進(jìn)行特定內(nèi)容識(shí)別;
根據(jù)識(shí)別的置信度,將識(shí)別的置信度低于閾值的在線直播視頻的截圖,利用所述第二級(jí)模型,進(jìn)行特定內(nèi)容識(shí)別。
可選地,作為第二方面的第六種可能的實(shí)現(xiàn)方式,所述機(jī)器學(xué)習(xí)模型為卷積神經(jīng)網(wǎng)絡(luò);所述特定內(nèi)容,包括非法內(nèi)容。
本發(fā)明實(shí)施例的特定內(nèi)容識(shí)別裝置,通過對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。由于利用了機(jī)器學(xué)習(xí)模型進(jìn)行特定內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
為達(dá)上述目的,本發(fā)明第三方面實(shí)施例提出了電子設(shè)備,包括:殼體、處理器、存儲(chǔ)器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲(chǔ)器設(shè)置在電路板上;電源電路,用于為上述電子設(shè)備的各個(gè)電路或器件供電;存儲(chǔ)器用于存儲(chǔ)可執(zhí)行程序代碼;處理器通過讀取存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來運(yùn)行與可執(zhí)行程序代碼對(duì)應(yīng)的程序,用于執(zhí)行第一方面所述的特定內(nèi)容識(shí)別方法。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1為本發(fā)明實(shí)施例所提供的一種特定內(nèi)容識(shí)別方法的流程示意圖;
圖2為本發(fā)明實(shí)施例所提供的另一種特定內(nèi)容識(shí)別方法的流程示意圖;
圖3為本發(fā)明實(shí)施例提供的一種特定內(nèi)容識(shí)別裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的另一種特定內(nèi)容識(shí)別裝置的結(jié)構(gòu)示意圖;以及
圖5為本發(fā)明電子設(shè)備一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
下面參考附圖描述本發(fā)明實(shí)施例的特定內(nèi)容識(shí)別方法和裝置。
互聯(lián)網(wǎng)的直播具有實(shí)時(shí)性強(qiáng)、不確定程度高、并發(fā)量大等特點(diǎn),給內(nèi)容監(jiān)管帶來很大的挑戰(zhàn)。尤其是針對(duì)未成年人保護(hù)方面,需要能夠?qū)崟r(shí)監(jiān)測到直播中所包含的特定內(nèi)容。這里的特定內(nèi)容包括非法內(nèi)容、垃圾廣告、低俗內(nèi)容等等。
圖1為本發(fā)明實(shí)施例所提供的一種特定內(nèi)容識(shí)別方法的流程示意圖,本實(shí)施例所提供的方法,利用了機(jī)器學(xué)習(xí)模型進(jìn)行特定內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
如圖1所示,特定內(nèi)容識(shí)別方法包括以下步驟:
步驟101,對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫。
具體地,每隔預(yù)設(shè)幀數(shù),對(duì)歷史直播視頻進(jìn)行截圖,或者每隔預(yù)設(shè)周期,對(duì)歷史直播視頻進(jìn)行截圖。將截圖得到的圖片作為圖片樣本庫中的樣本圖片。采用人工方式,對(duì)截圖進(jìn)行識(shí)別,標(biāo)注每一張圖片為特定圖片還是正常圖片。
其中,未包含特定內(nèi)容的圖片可以視為正常圖片。
步驟102,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。
具體地,通過對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,使得機(jī)器學(xué)習(xí)模型學(xué)習(xí)到各參數(shù)值,從而實(shí)現(xiàn)對(duì)特定內(nèi)容的識(shí)別。
步驟103,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練。
具體地,將機(jī)器學(xué)習(xí)模型投入線上進(jìn)行運(yùn)行,周期性對(duì)在線直播視頻進(jìn)行截圖,得到測試圖片。利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型對(duì)測試圖片進(jìn)行內(nèi)容識(shí)別。
從所述測試圖片中,查詢識(shí)別有誤的誤識(shí)別圖片,其中,所述誤識(shí)別圖片包括標(biāo)注為包含正常內(nèi)容的特定圖片,和/或標(biāo)注為包含特定內(nèi)容的正常圖片;根據(jù)所述誤識(shí)別圖片,重新生成所述圖片樣本庫;基于重新生成的所述圖片樣本庫,對(duì)所述機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練。
步驟104,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。
本實(shí)施例所提供的方法,可以重復(fù)執(zhí)行步驟103和步驟104,從而使得機(jī)器學(xué)習(xí)模型更加完善,識(shí)別準(zhǔn)確率不斷提高。
本實(shí)施例中,對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。由于利用了機(jī)器學(xué)習(xí)模型進(jìn)行特定內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
為了清楚說明上一實(shí)施例,本實(shí)施例提供了另一種特定內(nèi)容識(shí)別方法,圖2為本發(fā)明實(shí)施例所提供的另一種特定內(nèi)容識(shí)別方法的流程示意圖,在本實(shí)施例中,機(jī)器學(xué)習(xí)模型具體為兩級(jí)模型,包括第一級(jí)模型和第二級(jí)模型,第一級(jí)模型和所述第二級(jí)模型具有相同的卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。第一級(jí)模型識(shí)別的置信度低于閾值時(shí),采用第二級(jí)模型進(jìn)行特定內(nèi)容識(shí)別。由于第二級(jí)模型是基于第一級(jí)模型識(shí)別有誤的誤識(shí)別圖片進(jìn)行訓(xùn)練得到的,因此,能夠獲得更加準(zhǔn)確的識(shí)別結(jié)果,提高識(shí)別準(zhǔn)確率。
本實(shí)施例的方法具體應(yīng)用于對(duì)非法內(nèi)容進(jìn)行識(shí)別的應(yīng)用場景下,從而本實(shí)施例中的特定內(nèi)容具體包括非法內(nèi)容,相應(yīng)地,特定圖片為包含特定內(nèi)容的圖片,具體可以為包含非法內(nèi)容的非法圖片。其中,這里的特定內(nèi)容可以是指垃圾廣告、暴力、色情等等。
如圖2所示,該特定內(nèi)容識(shí)別方法,包括:訓(xùn)練階段和識(shí)別階段。
其中,訓(xùn)練階段包括:
步驟201,對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫。
具體地,每隔預(yù)設(shè)幀數(shù),對(duì)歷史直播視頻進(jìn)行截圖,或者每隔預(yù)設(shè)周期,對(duì)歷史直播視頻進(jìn)行截圖。將截圖得到的圖片作為圖片樣本庫中的樣本圖片。采用人工方式,對(duì)截圖進(jìn)行識(shí)別,標(biāo)注每一張圖片為非法圖片還是正常圖片。
步驟202,基于圖片樣本庫,以及圖片樣本庫中各樣本圖片是否為非法內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型的第一級(jí)模型進(jìn)行訓(xùn)練。
其中,第一級(jí)模型和第二級(jí)模型均可參考谷歌公司的卷積神經(jīng)網(wǎng)絡(luò)模型inceptionv3。與inceptionv3不同的是,本實(shí)施例的第一級(jí)模型和第二級(jí)模型,在全連接層,將logit函數(shù)轉(zhuǎn)換成softmax函數(shù)輸出識(shí)別結(jié)果。從而可以直接采用輸出的0-1的數(shù)值,作為本次識(shí)別的置信度。
步驟203,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的第一級(jí)模型進(jìn)行內(nèi)容識(shí)別。
具體地,將在線直播視頻進(jìn)行截圖所得到的測試圖片,僅僅利用經(jīng)過訓(xùn)練的第一級(jí)模型進(jìn)行內(nèi)容識(shí)別,而不采用第二級(jí)模型進(jìn)行識(shí)別。
步驟204,根據(jù)測試圖片中識(shí)別有誤的部分,對(duì)第二級(jí)模型進(jìn)行訓(xùn)練,得到經(jīng)過訓(xùn)練的第二級(jí)模型。
具體地,從測試圖片中,查詢識(shí)別有誤的誤識(shí)別圖片,其中,誤識(shí)別圖片包括標(biāo)注為包含正常內(nèi)容的非法圖片,和/或標(biāo)注為包含非法內(nèi)容的正常圖片。根據(jù)誤識(shí)別圖片,重新生成所述圖片樣本庫?;谥匦律傻膱D片樣本庫,對(duì)機(jī)器學(xué)習(xí)模型的第二級(jí)模型進(jìn)行訓(xùn)練。
其中,識(shí)別階段包括:
步驟205,在線識(shí)別非法內(nèi)容時(shí),利用第一級(jí)模型對(duì)在線直播視頻的截圖進(jìn)行非法內(nèi)容識(shí)別,確定各截圖是否為非法圖片,及識(shí)別結(jié)果的置信度。
步驟206,判斷置信度是否低于閾值,若低于閾值,執(zhí)行步驟207,否則執(zhí)行步驟208。
步驟207,若置信度低于閾值,利用第二級(jí)模型,對(duì)該截圖重新進(jìn)行非法內(nèi)容識(shí)別,采信第二級(jí)模型的識(shí)別結(jié)果。
步驟208,若置信度不低于閾值,采信第一級(jí)模型的識(shí)別結(jié)果。
本實(shí)施例中,對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為非法內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行非法內(nèi)容識(shí)別。由于利用了機(jī)器學(xué)習(xí)模型進(jìn)行非法內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種特定內(nèi)容識(shí)別裝置。
圖3為本發(fā)明實(shí)施例提供的一種特定內(nèi)容識(shí)別裝置的結(jié)構(gòu)示意圖。
如圖3所示,該特定內(nèi)容識(shí)別裝置包括:生成模塊31、訓(xùn)練模塊32、重訓(xùn)練模塊33和識(shí)別模塊34。
生成模塊31,用于對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫。
訓(xùn)練模塊32,用于基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。
重訓(xùn)練模塊33,用于將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練。
識(shí)別模塊34,用于利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。
需要說明的是,前述對(duì)方法實(shí)施例的解釋說明也適用于該實(shí)施例的裝置,此處不再贅述。
基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了另一種特定內(nèi)容識(shí)別裝置的可能的實(shí)現(xiàn)方式,圖4為本發(fā)明實(shí)施例提供的另一種特定內(nèi)容識(shí)別裝置的結(jié)構(gòu)示意圖,在上一實(shí)施例的基礎(chǔ)上,機(jī)器學(xué)習(xí)模型,包括第一級(jí)模型和第二級(jí)模型,所述第一級(jí)模型和所述第二級(jí)模型具有相同的模型結(jié)構(gòu),例如:卷積神經(jīng)網(wǎng)絡(luò)。
進(jìn)一步,訓(xùn)練模塊32,具體用于:基于所述圖片樣本庫,以及所述圖片樣本庫中各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)所述機(jī)器學(xué)習(xí)模型的第一級(jí)模型進(jìn)行訓(xùn)練。
重訓(xùn)練模塊33,包括:識(shí)別單元331和重訓(xùn)練單元332。
識(shí)別單元331,用于將所述測試圖片,利用經(jīng)過訓(xùn)練的第一級(jí)模型進(jìn)行內(nèi)容識(shí)別。
重訓(xùn)練單元332,用于根據(jù)所述測試圖片中識(shí)別有誤的部分,對(duì)第二級(jí)模型進(jìn)行訓(xùn)練,得到經(jīng)過訓(xùn)練的第二級(jí)模型。
具體地,重訓(xùn)練單元332,具體用于:從所述測試圖片中,查詢識(shí)別有誤的誤識(shí)別圖片,其中,所述誤識(shí)別圖片包括標(biāo)注為包含正常內(nèi)容的特定圖片,和/或標(biāo)注為包含特定內(nèi)容的正常圖片;根據(jù)所述誤識(shí)別圖片,重新生成所述圖片樣本庫;基于重新生成的所述圖片樣本庫,對(duì)所述機(jī)器學(xué)習(xí)模型的第二級(jí)模型進(jìn)行訓(xùn)練。
進(jìn)一步,識(shí)別模塊34,具體用于:利用所述第一級(jí)模型對(duì)在線直播視頻的截圖進(jìn)行特定內(nèi)容識(shí)別;根據(jù)識(shí)別的置信度,將識(shí)別的置信度低于閾值的在線直播視頻的截圖,利用所述第二級(jí)模型,進(jìn)行特定內(nèi)容識(shí)別。
本發(fā)明實(shí)施例中,對(duì)歷史直播視頻進(jìn)行截圖,生成圖片樣本庫,基于圖片樣本庫中各樣本圖片,以及各樣本圖片是否為特定內(nèi)容的標(biāo)注,對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,將在線直播視頻進(jìn)行截圖所得到的測試圖片,利用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行內(nèi)容識(shí)別,根據(jù)識(shí)別結(jié)果對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行重新訓(xùn)練,利用經(jīng)過重新訓(xùn)練的機(jī)器學(xué)習(xí)模型,對(duì)在線直播視頻進(jìn)行特定內(nèi)容識(shí)別。由于利用了機(jī)器學(xué)習(xí)模型進(jìn)行特定內(nèi)容識(shí)別,識(shí)別過程無需人工進(jìn)行參與,減少了人力成本,提高了識(shí)別效率,解決了現(xiàn)有技術(shù)中人工識(shí)別效率較低的技術(shù)問題。
作為一種可能的應(yīng)用場景,本實(shí)施例所提供的裝置具體應(yīng)用于對(duì)非法內(nèi)容進(jìn)行識(shí)別的應(yīng)用場景下,從而本實(shí)施例中的特定內(nèi)容具體包括非法內(nèi)容,相應(yīng)地,特定圖片為包含特定內(nèi)容的圖片,具體可以為包含非法內(nèi)容的非法圖片。其中,這里的特定內(nèi)容可以是指垃圾廣告、暴力、色情等等。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)定制邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(ram),只讀存儲(chǔ)器(rom),可擦除可編輯只讀存儲(chǔ)器(eprom或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(cdrom)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。如,如果用硬件來實(shí)現(xiàn)和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場可編程門陣列(fpga)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
本發(fā)明實(shí)施例還提供一種電子設(shè)備,電子設(shè)備包含前述任一實(shí)施例所述的裝置。
圖5為本發(fā)明電子設(shè)備一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,可以實(shí)現(xiàn)本發(fā)明圖1-4所示實(shí)施例的流程,如圖5所示,上述電子設(shè)備可以包括:殼體41、處理器42、存儲(chǔ)器43、電路板44和電源電路45,其中,電路板44安置在殼體41圍成的空間內(nèi)部,處理器42和存儲(chǔ)器43設(shè)置在電路板44上;電源電路45,用于為上述電子設(shè)備的各個(gè)電路或器件供電;存儲(chǔ)器43用于存儲(chǔ)可執(zhí)行程序代碼;處理器42通過讀取存儲(chǔ)器43中存儲(chǔ)的可執(zhí)行程序代碼來運(yùn)行與可執(zhí)行程序代碼對(duì)應(yīng)的程序,用于執(zhí)行前述任一實(shí)施例所述的特定內(nèi)容識(shí)別方法。
處理器42對(duì)上述步驟的具體執(zhí)行過程以及處理器42通過運(yùn)行可執(zhí)行程序代碼來進(jìn)一步執(zhí)行的步驟,可以參見本發(fā)明圖1-4所示實(shí)施例的描述,在此不再贅述。
該電子設(shè)備以多種形式存在,包括但不限于:
(1)移動(dòng)通信設(shè)備:這類設(shè)備的特點(diǎn)是具備移動(dòng)通信功能,并且以提供話音、數(shù)據(jù)通信為主要目標(biāo)。這類終端包括:智能手機(jī)(例如iphone)、多媒體手機(jī)、功能性手機(jī),以及低端手機(jī)等。
(2)超移動(dòng)個(gè)人計(jì)算機(jī)設(shè)備:這類設(shè)備屬于個(gè)人計(jì)算機(jī)的范疇,有計(jì)算和處理功能,一般也具備移動(dòng)上網(wǎng)特性。這類終端包括:pda、mid和umpc設(shè)備等,例如ipad。
(3)便攜式娛樂設(shè)備:這類設(shè)備可以顯示和播放多媒體內(nèi)容。該類設(shè)備包括:音頻、視頻播放器(例如ipod),掌上游戲機(jī),電子書,以及智能玩具和便攜式車載導(dǎo)航設(shè)備。
(4)服務(wù)器:提供計(jì)算服務(wù)的設(shè)備,服務(wù)器的構(gòu)成包括處理器、硬盤、內(nèi)存、系統(tǒng)總線等,服務(wù)器和通用的計(jì)算機(jī)架構(gòu)類似,但是由于需要提供高可靠的服務(wù),因此在處理能力、穩(wěn)定性、可靠性、安全性、可擴(kuò)展性、可管理性等方面要求較高。
(5)其他具有數(shù)據(jù)交互功能的電子設(shè)備。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存儲(chǔ)記憶體(randomaccessmemory,ram)等。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。