亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法、裝置和服務(wù)器的制作方法

文檔序號(hào):7786892閱讀:249來(lái)源:國(guó)知局
專利名稱:基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法、裝置和服務(wù)器的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及云計(jì)算領(lǐng)域,特別涉及一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法、裝置和云計(jì)算服務(wù)器。
背景技術(shù)
音視頻指紋技術(shù),是通過(guò)特定算法從音視頻信號(hào)中提取的可以代表一段音視頻重要特征的基于內(nèi)容的數(shù)字摘要。隨著網(wǎng)絡(luò)技術(shù)和數(shù)字媒體壓縮技術(shù)的不斷創(chuàng)新,流媒體業(yè)務(wù)在移動(dòng)網(wǎng)絡(luò)和互聯(lián)網(wǎng)上都在高速的發(fā)展,用戶通過(guò)移動(dòng)終端觀看視頻業(yè)務(wù)的場(chǎng)景不斷增多,然而現(xiàn)有的云轉(zhuǎn)碼系統(tǒng)還存在以下不足:互聯(lián)網(wǎng)上的視頻內(nèi)容依賴唯一的資源標(biāo)識(shí)符進(jìn)行標(biāo)識(shí),但是互聯(lián)網(wǎng)上的同質(zhì)內(nèi)容非常多,對(duì)于云轉(zhuǎn)碼平臺(tái),不同的視頻資源標(biāo)識(shí)符所對(duì)應(yīng)的可能是相同的內(nèi)容,不能對(duì)視頻內(nèi)容進(jìn)行精確標(biāo)識(shí),從而影響了轉(zhuǎn)碼效率。

發(fā)明內(nèi)容
本發(fā)明的發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中存在問(wèn)題,并因此針對(duì)所述問(wèn)題中的至少一個(gè)問(wèn)題提出了一種新的技術(shù)方案。本發(fā)明的一個(gè)目的是提供一種用于基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼的技術(shù)方案。根據(jù)本發(fā)明的第一方面,提供了一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法,包括:根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋;根據(jù)所述視頻指紋和音頻指紋生成所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);當(dāng)所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中存在匹配內(nèi)容標(biāo)識(shí)時(shí),不對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與所述匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容。優(yōu)選地,根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋包括:提取視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋;和/或根據(jù)音視頻內(nèi)容生成音頻內(nèi)容的音頻指紋包括:提取音頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。優(yōu)選地,圖像特征為關(guān)鍵幀的局部區(qū)域的顏色特征,所述運(yùn)動(dòng)特征為相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。優(yōu)選地,當(dāng)所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中不存在匹配內(nèi)容標(biāo)識(shí)時(shí),對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。根據(jù)本發(fā)明的第二方面,提供一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置,包括轉(zhuǎn)碼模塊,指紋生成模塊,用于根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋;標(biāo)識(shí)生成模塊,用于根據(jù)所述視頻指紋和音頻指紋生成所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);標(biāo)識(shí)匹配模塊,用于將所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中進(jìn)行匹配,如果存在匹配內(nèi)容標(biāo)識(shí),則不對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與所述匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容;如果不存在匹配內(nèi)容標(biāo)識(shí),則通知所述轉(zhuǎn)碼模塊對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。
優(yōu)選地,指紋生成模塊包括:視頻指紋生成單元,用于提取音視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋;音頻指紋生成單元,用于提取接收到的音視頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。優(yōu)選地,圖像特征為關(guān)鍵幀的局部區(qū)域的顏色特征,所述運(yùn)動(dòng)特征為相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。優(yōu)選地,該裝置還包括:內(nèi)容解碼模塊,用于對(duì)所述音視頻內(nèi)容進(jìn)行解碼獲得視頻內(nèi)容和音頻內(nèi)容,將所述視頻內(nèi)容發(fā)送給所述視頻指紋生成單元,將所述音頻內(nèi)容發(fā)送給所述音頻指紋生成單元;編碼模塊,用于接收所述轉(zhuǎn)碼模塊輸出的已轉(zhuǎn)碼的視頻內(nèi)容,對(duì)所述已轉(zhuǎn)碼的視頻內(nèi)容進(jìn)行編碼輸出。優(yōu)選地,該裝置還包括:音視頻內(nèi)容庫(kù),用于存儲(chǔ)已轉(zhuǎn)碼的音視頻內(nèi)容;內(nèi)容標(biāo)識(shí)庫(kù),用于存儲(chǔ)所述音視頻內(nèi)容庫(kù)中的已轉(zhuǎn)碼的音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)。根據(jù)本發(fā)明的第三方面,還提供一種云計(jì)算服務(wù)器,包括上述的音視頻內(nèi)容轉(zhuǎn)碼裝置本發(fā)明的一個(gè)優(yōu)點(diǎn)在于,根據(jù)音視頻內(nèi)容獲得音視頻指紋信息,并根據(jù)音視頻指紋信息生成唯一內(nèi)容標(biāo)識(shí),當(dāng)存在對(duì)應(yīng)的內(nèi)容標(biāo)識(shí)時(shí),直接獲取已轉(zhuǎn)碼音視頻內(nèi)容,實(shí)現(xiàn)了首視頻內(nèi)容的精確標(biāo)識(shí),提聞了轉(zhuǎn)碼 效率。通過(guò)以下參照附圖對(duì)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。


構(gòu)成說(shuō)明書(shū)的一部分的附圖描述了本發(fā)明的實(shí)施例,并且連同說(shuō)明書(shū)一起用于解釋本發(fā)明的原理。參照附圖,根據(jù)下面的詳細(xì)描述,可以更加清楚地理解本發(fā)明,其中:圖1不出基于z 計(jì)算的首視頻內(nèi)容處理系統(tǒng)的不意圖;圖2示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法的一個(gè)實(shí)施例的流程圖;圖3示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法的另一個(gè)實(shí)施例的流程圖;圖4示出本發(fā)明的音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)生成的一個(gè)實(shí)施例的流程圖;圖5示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置的一個(gè)實(shí)施例的結(jié)構(gòu)圖;圖6示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置的另一個(gè)實(shí)施例的結(jié)構(gòu)具體實(shí)施例方式現(xiàn)在將參照附圖來(lái)詳細(xì)描述本發(fā)明的各種示例性實(shí)施例。應(yīng)注意到:除非另外具體說(shuō)明,否則在這些實(shí)施例中闡述的部件和步驟的相對(duì)布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個(gè)部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說(shuō)明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制。對(duì)于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說(shuō)明書(shū)的一部分。在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步討論。圖1示出基于云計(jì)算的音視頻內(nèi)容處理系統(tǒng)的示意圖。在圖1中示出流媒體接收終端11、流媒體服務(wù)器12、云轉(zhuǎn)碼平臺(tái)13、音視頻內(nèi)容庫(kù)14、和流媒體內(nèi)容傳送網(wǎng)絡(luò)15。流媒體接收終端11具有播放音視頻流的功能,能夠支持流媒體傳輸協(xié)議;流媒體內(nèi)容傳送網(wǎng)絡(luò)15具有分發(fā)、傳播音視頻流的功能,并支持流媒體協(xié)議通訊;流媒體服務(wù)器12具有接收終端播放流媒體內(nèi)容的請(qǐng)求、向云轉(zhuǎn)碼平臺(tái)發(fā)送轉(zhuǎn)碼請(qǐng)求、接收云轉(zhuǎn)碼平臺(tái)輸出的目標(biāo)碼流、向終端提供流媒體服務(wù)的功能;云轉(zhuǎn)碼平臺(tái)13具有對(duì)音視頻內(nèi)容進(jìn)行標(biāo)識(shí),對(duì)音視頻內(nèi)容進(jìn)行匹配,存儲(chǔ)內(nèi)容標(biāo)識(shí),接收轉(zhuǎn)碼請(qǐng)求,獲取音視頻內(nèi)容源,對(duì)音視頻內(nèi)容進(jìn)行解碼、切片、轉(zhuǎn)碼、編碼,碼率控制,碼流輸出的功能,并支持流媒體傳輸協(xié)議和文件本地存儲(chǔ);音視頻內(nèi)容庫(kù)14具有將本地音視頻文件或者音視頻流發(fā)送給云轉(zhuǎn)碼平臺(tái)的功能。流媒體協(xié)議包括但不限于=RTSP或HTTP或RTMP。流媒體內(nèi)容傳送網(wǎng)絡(luò)15包括但不限于:GSM,或CDMA,或3G移動(dòng)電話網(wǎng)絡(luò),或無(wú)線局域網(wǎng)WLAN,或下一代網(wǎng)絡(luò)系統(tǒng)NGN。需要指出,流媒體服務(wù)器、云轉(zhuǎn)碼平臺(tái)、音視頻內(nèi)容庫(kù)中的任意兩者或者三者可以位于同一服務(wù)器或者設(shè)備上。圖2示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法的一個(gè)實(shí)施例的流程圖。如圖2所示,步驟202,根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋。步驟204,根據(jù)視頻指紋和音頻指紋生成音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)。步驟206,對(duì)音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)和轉(zhuǎn)碼平臺(tái)內(nèi)容庫(kù)中存儲(chǔ)的內(nèi)容標(biāo)識(shí)進(jìn)行匹配。步驟208,判斷是否存在匹配?如果音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中存在匹配內(nèi)容標(biāo)識(shí),繼續(xù)步驟210,否則,對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼(步驟212)。步驟210,不對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容,以便直接提供給終端。上述實(shí)施例中,根據(jù)音視頻內(nèi)容獲得音視頻指紋信息,并根據(jù)音視頻指紋信息生成唯一內(nèi)容標(biāo)識(shí),當(dāng)存在對(duì)應(yīng)的內(nèi)容標(biāo)識(shí)時(shí),直接獲取已轉(zhuǎn)碼音視頻內(nèi)容,實(shí)現(xiàn)了音視頻內(nèi)容的精確標(biāo)識(shí),提聞了轉(zhuǎn)碼效率。圖3示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法的另一個(gè)實(shí)施例的流程圖。如圖3所示,步驟302,對(duì)音視頻內(nèi)容進(jìn)行解碼獲得視頻內(nèi)容和音頻內(nèi)容。步驟304,提取視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋。步驟306,提取音頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。步驟308,根據(jù)視頻指紋和音頻指紋生成音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)。步驟310,對(duì)音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)和轉(zhuǎn)碼平臺(tái)內(nèi)容庫(kù)中存儲(chǔ)的內(nèi)容標(biāo)識(shí)進(jìn)行匹配。步驟312,判斷是否存在匹配?如果音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中存在匹配內(nèi)容標(biāo)識(shí),則獲取與匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容(步驟314),否則,繼續(xù)步驟316。步驟316,對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。步驟318,對(duì)轉(zhuǎn)碼后的音視頻內(nèi)容進(jìn)行編碼。上述實(shí)施例中,通過(guò)視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋,通過(guò)音頻的物理類音頻特征作為音頻指紋,保證了指紋信息的唯一性。圖4示出本發(fā)明的音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)生成的一個(gè)實(shí)施例的流程圖。如圖4所示,步驟402,分別提取媒體文件的視頻內(nèi)容和N(N>= I)個(gè)音軌的音頻內(nèi)容。步驟404 406,分別提取視頻內(nèi)容的關(guān)鍵幀的局部區(qū)域的顏色特征和相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異,形成視頻內(nèi)容的視頻指紋。步驟408 410,分別提取N(N>= I)個(gè)音頻內(nèi)容的相鄰兩幀的頻域能量差異,形成N(N>= I)個(gè)音頻指紋。步驟412,結(jié)合視頻指紋和N(N > = I)個(gè)音頻指紋,形成該媒體文件的內(nèi)容標(biāo)識(shí)。上述實(shí)施例中,根據(jù)關(guān)鍵幀的顏色特征和幀間差異形成視頻指紋,根據(jù)音頻頻域能量差異形成音頻指紋,保證了指紋的唯一性。圖5示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置的一個(gè)實(shí)施例的結(jié)構(gòu)圖。如圖5所示,該裝置包括指紋生成模塊51、標(biāo)識(shí)生成模塊52、標(biāo)識(shí)匹配模塊53、轉(zhuǎn)碼模塊54。指紋生成模塊51根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋;標(biāo)識(shí)生成模塊52根據(jù)視頻指紋和音頻指紋生成音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);標(biāo)識(shí)匹配模塊53將音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中進(jìn)行匹配,如果存在匹配內(nèi)容標(biāo)識(shí),則不對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容;如果不存在匹配內(nèi)容標(biāo)識(shí),則通知轉(zhuǎn)碼模塊54對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。圖6示出本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置的另一個(gè)實(shí)施例的結(jié)構(gòu)圖。如圖6所示,該裝置還包括內(nèi)容解碼模塊60和編碼模塊67。內(nèi)容解碼模塊60對(duì)音視頻內(nèi)容進(jìn)行解碼獲得視頻內(nèi)容和音頻內(nèi)容,將視頻內(nèi)容發(fā)送給視頻指紋生成單元611,將音頻內(nèi)容發(fā)送給音頻指紋生成單元612 ;編碼模塊67接收轉(zhuǎn)碼模塊54輸出的已轉(zhuǎn)碼的視頻內(nèi)容,對(duì)已轉(zhuǎn)碼的視頻內(nèi)容進(jìn)行編碼輸出。在一個(gè)實(shí)施例中,指紋生成模塊61包括視頻指紋生成單元611和音頻指紋生成單元612。視頻指紋生成單元611接收來(lái)自內(nèi)容解碼模塊60的視頻內(nèi)容,提取音視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋;音頻指紋生成單元接收來(lái)自內(nèi)容解碼模塊60的音頻內(nèi)容,提取接收到的音視頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。圖像特征可以是關(guān)鍵幀的局部區(qū)域的顏色特征,運(yùn)動(dòng)特征可以是相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異;物理類音頻特征可以是相鄰兩幀的頻域能量差異。在一個(gè)實(shí)施例中,還包括內(nèi)容標(biāo)識(shí)庫(kù)65和音視頻內(nèi)容庫(kù)66。內(nèi)容標(biāo)識(shí)庫(kù)65存儲(chǔ)音視頻內(nèi)容庫(kù)中的已轉(zhuǎn)碼的音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)。音視頻內(nèi)容庫(kù)66存儲(chǔ)已轉(zhuǎn)碼的音視頻內(nèi)容。下面參考圖1介紹本發(fā)明的一個(gè)應(yīng)用例的流程。第一步:音視頻內(nèi)容庫(kù)向云轉(zhuǎn)碼平臺(tái)提供音視頻內(nèi)容源;
第二步:云轉(zhuǎn)碼平臺(tái)提取接收到的音視頻內(nèi)容中視頻的圖像特征(如關(guān)鍵幀的局部區(qū)域的顏色特征)和運(yùn)動(dòng)特征(如相鄰兩幀的局部區(qū)域的幀間差異)作為視頻指紋,提取接收到的音視頻內(nèi)容中音頻的物理類音頻特征(如相鄰兩幀的頻域能量差異)作為音頻指紋,視頻指紋和音頻指紋共同描述該音視頻內(nèi)容并組成該音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);第三步:云轉(zhuǎn)碼平臺(tái)將該音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)與所存儲(chǔ)的內(nèi)容標(biāo)識(shí)進(jìn)行比對(duì),如匹配則不對(duì)該音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,否則將該音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)存儲(chǔ)于云轉(zhuǎn)碼平臺(tái)中,并對(duì)該音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,將轉(zhuǎn)碼后的音視頻流提供給流媒體服務(wù)器;第四步:流媒體服務(wù)器將云轉(zhuǎn)碼平臺(tái)輸出的音視頻流提供給流媒體內(nèi)容傳送網(wǎng)絡(luò);第五步:流媒體內(nèi)容傳送網(wǎng)絡(luò)將流媒體服務(wù)器輸出的音視頻流提供給流媒體終端;第六步:終端接收流媒體服務(wù)器提供的音視頻流,進(jìn)行解碼和播放。至此,已經(jīng)詳細(xì)描述了根據(jù)本發(fā)明的基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法、裝置和服務(wù)器。為了避免遮蔽本發(fā)明的構(gòu)思,沒(méi)有描述本領(lǐng)域所公知的一些細(xì)節(jié)。本領(lǐng)域技術(shù)人員根據(jù)上面的描述,完全可以明白如何實(shí)施這里公開(kāi)的技術(shù)方案??赡芤栽S多方式來(lái)實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)。例如,可通過(guò)軟件、硬件、固件或者軟件、硬件、固件的任何組合來(lái)實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)。用于所述方法的步驟的上述順序僅是為了進(jìn)行說(shuō)明,本發(fā)明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說(shuō)明。此外,在一些實(shí)施例中,還可將本發(fā)明實(shí)施為記錄在記錄介質(zhì)中的程序,這些程序包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲(chǔ)用于執(zhí)行根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已經(jīng)通過(guò)示例對(duì)本發(fā)明的一些特定實(shí)施例進(jìn)行了詳細(xì)說(shuō)明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,以上示例僅是為了進(jìn)行說(shuō)明,而不是為了限制本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員應(yīng)該理解,可在不脫離本發(fā)明的范圍和精神的情況下,對(duì)以上實(shí)施例進(jìn)行修改。本發(fā)明的范圍由所附權(quán)利要求來(lái)限定。
權(quán)利要求
1.一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法,其特征在于,包括: 根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋; 根據(jù)所述視頻指紋和音頻指紋生成所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí); 當(dāng)所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中存在匹配內(nèi)容標(biāo)識(shí)時(shí),不對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與所述匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋包括: 提取視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋; 和/或 根據(jù)音視頻內(nèi)容生成音頻內(nèi)容的音頻指紋包括: 提取音頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述圖像特征為關(guān)鍵幀的局部區(qū)域的顏色特征,所述運(yùn)動(dòng)特征為相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。
4.根據(jù)權(quán)利要求1所述的方法,當(dāng)所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中不存在匹配內(nèi)容標(biāo)識(shí)時(shí),對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。
5.根據(jù)權(quán)利要求4所述的 方法,其特征在于,還包括: 對(duì)轉(zhuǎn)碼后的音視頻內(nèi)容進(jìn)行編碼。
6.一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼裝置,包括轉(zhuǎn)碼模塊,其特征在于,還包括: 指紋生成模塊,用于根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋;標(biāo)識(shí)生成模塊,用于根據(jù)所述視頻指紋和音頻指紋生成所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);標(biāo)識(shí)匹配模塊,用于將所述音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中進(jìn)行匹配,如果存在匹配內(nèi)容標(biāo)識(shí),則不對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與所述匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容;如果不存在匹配內(nèi)容標(biāo)識(shí),則通知所述轉(zhuǎn)碼模塊對(duì)所述音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述指紋生成模塊包括: 視頻指紋生成單元,用于提取音視頻內(nèi)容中視頻的圖像特征和運(yùn)動(dòng)特征作為視頻指紋; 音頻指紋生成單元,用于提取接收到的音視頻內(nèi)容中音頻的物理類音頻特征作為音頻指紋。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述圖像特征為關(guān)鍵幀的局部區(qū)域的顏色特征,所述運(yùn)動(dòng)特征為相鄰兩關(guān)鍵幀的局部區(qū)域的幀間差異;所述物理類音頻特征為相鄰兩幀的頻域能量差異。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 內(nèi)容解碼模塊,用于對(duì)所述音視頻內(nèi)容進(jìn)行解碼獲得視頻內(nèi)容和音頻內(nèi)容,將所述視頻內(nèi)容發(fā)送給所述視頻指紋生成單元,將所述音頻內(nèi)容發(fā)送給所述音頻指紋生成單元;編碼模塊,用于接收所述轉(zhuǎn)碼模塊輸出的已轉(zhuǎn)碼的視頻內(nèi)容,對(duì)所述已轉(zhuǎn)碼的視頻內(nèi)容進(jìn)行編碼輸出。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:音視頻內(nèi)容庫(kù),用于存儲(chǔ)已轉(zhuǎn)碼的音視頻內(nèi)容;內(nèi)容標(biāo)識(shí)庫(kù),用于存儲(chǔ)所述音視頻內(nèi)容庫(kù)中的已轉(zhuǎn)碼的音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)。
11.一種云計(jì)算服 務(wù)器,包括權(quán)利要求6至10中任意一項(xiàng)所述的音視頻內(nèi)容轉(zhuǎn)碼裝置。
全文摘要
本發(fā)明公開(kāi)了一種基于云計(jì)算的音視頻內(nèi)容轉(zhuǎn)碼方法、裝置和服務(wù)器,涉及云計(jì)算流媒體技術(shù)領(lǐng)域。該方法包括根據(jù)音視頻內(nèi)容生成視頻內(nèi)容的視頻指紋和音頻內(nèi)容的音頻指紋;根據(jù)視頻指紋和音頻指紋生成音視頻內(nèi)容的內(nèi)容標(biāo)識(shí);當(dāng)音視頻內(nèi)容的內(nèi)容標(biāo)識(shí)在轉(zhuǎn)碼平臺(tái)的內(nèi)容標(biāo)識(shí)庫(kù)中存在匹配內(nèi)容標(biāo)識(shí)時(shí),不對(duì)音視頻內(nèi)容進(jìn)行轉(zhuǎn)碼,獲取與匹配內(nèi)容標(biāo)識(shí)對(duì)應(yīng)的已轉(zhuǎn)碼音視頻內(nèi)容。根據(jù)音視頻內(nèi)容獲得音視頻指紋信息,并根據(jù)音視頻指紋信息生成唯一內(nèi)容標(biāo)識(shí),當(dāng)存在對(duì)應(yīng)的內(nèi)容標(biāo)識(shí)時(shí),直接獲取已轉(zhuǎn)碼音視頻內(nèi)容,實(shí)現(xiàn)了音視頻內(nèi)容的精確標(biāo)識(shí),提高了轉(zhuǎn)碼效率。
文檔編號(hào)H04N21/2343GK103179430SQ20111042841
公開(kāi)日2013年6月26日 申請(qǐng)日期2011年12月20日 優(yōu)先權(quán)日2011年12月20日
發(fā)明者包盛, 王愛(ài)寶, 黃小桑 申請(qǐng)人:中國(guó)電信股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1