部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0115]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0116]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(Read-Only Memory, ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory, RAM)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0117]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種視頻處理方法,其特征在于,預(yù)先對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行位置信息和對(duì)象描述的標(biāo)記;該方法包括: 接收客戶端發(fā)送的查詢請(qǐng)求,所述查詢請(qǐng)求中包含用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息; 將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述; 利用確定出的對(duì)象描述進(jìn)行查詢,將查詢得到的相關(guān)信息返回給所述客戶端。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行位置信息的標(biāo)記包括:對(duì)視頻畫(huà)面中的對(duì)象所在的區(qū)域范圍以及所在幀的信息進(jìn)行標(biāo)記; 所述用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息包括:所述用戶在視頻畫(huà)面中選擇位置的坐標(biāo)信息或范圍信息,以及所在幀的信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配包括: 確定與用戶在視頻畫(huà)面中選擇位置位于相同幀的標(biāo)記區(qū)域范圍,將所述坐標(biāo)信息所落在的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象,或者將與所述范圍信息具有最多重疊的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行對(duì)象描述的標(biāo)記包括: 獲取人工對(duì)視頻畫(huà)面中的對(duì)象標(biāo)記的對(duì)象描述;或者, 通過(guò)圖像識(shí)別對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行識(shí)別,利用識(shí)別結(jié)果對(duì)視頻畫(huà)面中的對(duì)象標(biāo)記對(duì)象描述。
5.根據(jù)權(quán)利要求1或4所述的方法,其特征在于,所述對(duì)象描述包括關(guān)鍵詞;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:利用所述關(guān)鍵詞進(jìn)行本地查詢或網(wǎng)絡(luò)查詢;或者, 所述對(duì)象描述包括指向第三方接口的鏈接;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:根據(jù)所述指向第三方接口的鏈接向所述第三方查詢并獲取相關(guān)信息;或者, 所述對(duì)象描述包括指向第三方的內(nèi)容;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:查詢并獲取所述指向第三方的內(nèi)容。
6.根據(jù)權(quán)利要求1至4任一權(quán)項(xiàng)所述的方法,其特征在于,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
7.一種視頻處理方法,其特征在于,該方法包括: 確定用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息; 向服務(wù)器端發(fā)送包含所述位置信息的查詢請(qǐng)求; 獲取所述服務(wù)器端返回的所述對(duì)象的相關(guān)信息;其中所述相關(guān)信息是所述服務(wù)器端將所述位置信息與預(yù)先對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行標(biāo)記的位置信息進(jìn)行匹配后,利用匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述進(jìn)行查詢得到的。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
9.根據(jù)權(quán)利要求7或8所述的方法,其特征在于,該方法還包括:展現(xiàn)獲取的所述相關(guān)信息,具體包括: 當(dāng)所述相關(guān)信息為文本時(shí),采用浮動(dòng)窗口或滾動(dòng)條的方式展現(xiàn)所述文本; 當(dāng)所述相關(guān)信息為音頻時(shí),播放所述音頻,在播放所述音頻的過(guò)程中所述視頻暫停播放; 當(dāng)所述相關(guān)信息為視頻時(shí),采用浮動(dòng)窗口的方式播放該視頻。
10.一種視頻處理裝置,其特征在于,該裝置包括: 標(biāo)記單元,用于對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行位置信息和對(duì)象描述的標(biāo)記; 交互單元,用于接收客戶端發(fā)送的查詢請(qǐng)求,所述查詢請(qǐng)求中包含用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息;將查詢單元提供的相關(guān)信息返回給所述客戶端; 匹配單元,用于將所述所選擇對(duì)象的位置信息與所述標(biāo)記單元標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述; 查詢單元,用于利用所述匹配單元確定出的對(duì)象描述進(jìn)行查詢,將查詢得到的相關(guān)信息提供給所述交互單元。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述標(biāo)記單元在對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行位置信息標(biāo)記時(shí),具體執(zhí)行:對(duì)視頻畫(huà)面中的對(duì)象所在的區(qū)域范圍以及所在幀的信息進(jìn)行標(biāo)記; 所述用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息包括:所述用戶在視頻畫(huà)面中選擇位置的坐標(biāo)信息或范圍信息,以及所在幀的信息。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述匹配單元在將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配時(shí),具體執(zhí)行: 確定與用戶在視頻畫(huà)面中選擇位置位于相同幀的標(biāo)記區(qū)域范圍,將所述坐標(biāo)信息所落在的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象,或者將與所述范圍信息具有最多重疊的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象。
13.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述標(biāo)記單元在對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行對(duì)象描述的標(biāo)記時(shí),具體執(zhí)行: 獲取人工對(duì)視頻畫(huà)面中的對(duì)象標(biāo)記的對(duì)象描述;或者, 通過(guò)圖像識(shí)別對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行識(shí)別,利用識(shí)別結(jié)果對(duì)視頻畫(huà)面中的對(duì)象標(biāo)記對(duì)象描述。
14.根據(jù)權(quán)利要求10或13所述的裝置,其特征在于,所述對(duì)象描述包括關(guān)鍵詞時(shí),所述查詢單元利用所述關(guān)鍵詞進(jìn)行本地查詢或網(wǎng)絡(luò)查詢;或者, 所述對(duì)象描述包括指向第三方接口的鏈接時(shí),所述查詢單元根據(jù)指向第三方接口的鏈接向所述第三方查詢并獲取相關(guān)信息;或者, 所述對(duì)象描述包括指向第三方的內(nèi)容時(shí),所述查詢單元查詢并獲取所述指向第三方的內(nèi)容。
15.根據(jù)權(quán)利要求10至13任一權(quán)項(xiàng)所述的裝置,其特征在于,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
16.一種視頻處理裝置,其特征在于,該裝置包括: 確定單元,用于確定用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息; 交互單元,用于向服務(wù)器端發(fā)送包含所述位置信息的查詢請(qǐng)求;獲取所述服務(wù)器端返回的所述對(duì)象的相關(guān)信息; 其中所述相關(guān)信息是所述服務(wù)器端將所述位置信息與預(yù)先對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行標(biāo)記的位置信息進(jìn)行匹配后,利用匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述進(jìn)行查詢得到的。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
18.根據(jù)權(quán)利要求16或17所述的裝置,其特征在于,該裝置還包括:展現(xiàn)單元,用于展現(xiàn)所述交互單元獲取的所述相關(guān)信息,具體包括: 當(dāng)所述相關(guān)信息為文本時(shí),采用浮動(dòng)窗口或滾動(dòng)條的方式展現(xiàn)所述文本; 當(dāng)所述相關(guān)信息為音頻時(shí),播放所述音頻,在播放所述音頻的過(guò)程中所述視頻暫停播放; 當(dāng)所述相關(guān)信息為視頻時(shí),采用浮動(dòng)窗口的方式播放該視頻。
【專利摘要】本發(fā)明提供了一種視頻處理方法和視頻處理裝置,其中方法包括:預(yù)先對(duì)視頻畫(huà)面中的對(duì)象進(jìn)行位置信息和對(duì)象描述的標(biāo)記;接收客戶端發(fā)送的查詢請(qǐng)求,所述查詢請(qǐng)求中包含用戶在視頻畫(huà)面中所選擇對(duì)象的位置信息;將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述;利用確定出的對(duì)象描述進(jìn)行查詢,將查詢得到的相關(guān)信息返回給所述客戶端。本發(fā)明能夠?qū)崿F(xiàn)在視頻播放過(guò)程中基于視頻畫(huà)面中的內(nèi)容與用戶進(jìn)行交互,方便用戶獲取視頻畫(huà)面中內(nèi)容的相關(guān)信息。
【IPC分類】H04N21-472, H04N21-25
【公開(kāi)號(hào)】CN104602128
【申請(qǐng)?zhí)枴緾N201410851966
【發(fā)明人】張志輝
【申請(qǐng)人】北京百度網(wǎng)訊科技有限公司
【公開(kāi)日】2015年5月6日
【申請(qǐng)日】2014年12月31日