視頻處理方法和視頻處理裝置的制造方法
【專利說明】
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種視頻處理方法和視頻處理裝置?!尽颈尘凹夹g(shù)】】
[0002]隨著智能手機(jī)、平板電腦、智能電視、智能家居等智能終端的普及,通過智能終端觀看視頻成為主流。目前的智能終端只能對(duì)視頻進(jìn)行播放,但在視頻播放過程中用戶無法基于視頻畫面中的內(nèi)容進(jìn)行交互。用戶在視頻播放過程中可能對(duì)其中播放的某個(gè)人物、物體甚至場(chǎng)景等感興趣,現(xiàn)在只能手動(dòng)通過搜索引擎等其他工具進(jìn)行查詢,一方面用戶操作比較麻煩,需要在額外的工具進(jìn)行手動(dòng)查詢,另一方面用戶可能會(huì)面臨不知道查詢什么的問題,例如用戶可能對(duì)視頻中的某個(gè)人物感興趣,但并不知道這個(gè)人物是誰,那么也就不知道如何在搜索引擎的搜索框中輸入怎樣的關(guān)鍵詞。
【
【發(fā)明內(nèi)容】
】
[0003]有鑒于此,本發(fā)明提供了一種視頻處理方法和視頻處理裝置,以便于實(shí)現(xiàn)在視頻播放過程中基于視頻畫面中的內(nèi)容與用戶進(jìn)行交互,方便用戶獲取視頻畫面中內(nèi)容的相關(guān)信息。
[0004]具體技術(shù)方案如下:
[0005]本發(fā)明提供了一種視頻處理方法,預(yù)先對(duì)視頻畫面中的對(duì)象進(jìn)行位置信息和對(duì)象描述的標(biāo)記;該方法包括:
[0006]接收客戶端發(fā)送的查詢請(qǐng)求,所述查詢請(qǐng)求中包含用戶在視頻畫面中所選擇對(duì)象的位置信息;
[0007]將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述;
[0008]利用確定出的對(duì)象描述進(jìn)行查詢,將查詢得到的相關(guān)信息返回給所述客戶端。
[0009]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,對(duì)視頻畫面中的對(duì)象進(jìn)行位置信息的標(biāo)記包括:對(duì)視頻畫面中的對(duì)象所在的區(qū)域范圍以及所在幀的信息進(jìn)行標(biāo)記;
[0010]所述用戶在視頻畫面中所選擇對(duì)象的位置信息包括:所述用戶在視頻畫面中選擇位置的坐標(biāo)信息或范圍信息,以及所在幀的信息。
[0011]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配包括:
[0012]確定與用戶在視頻畫面中選擇位置位于相同幀的標(biāo)記區(qū)域范圍,將所述坐標(biāo)信息所落在的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象,或者將與所述范圍信息具有最多重疊的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象。
[0013]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,對(duì)視頻畫面中的對(duì)象進(jìn)行對(duì)象描述的標(biāo)記包括:
[0014]獲取人工對(duì)視頻畫面中的對(duì)象標(biāo)記的對(duì)象描述;或者,
[0015]通過圖像識(shí)別對(duì)視頻畫面中的對(duì)象進(jìn)行識(shí)別,利用識(shí)別結(jié)果對(duì)視頻畫面中的對(duì)象標(biāo)記對(duì)象描述。
[0016]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象描述包括關(guān)鍵詞;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:利用所述關(guān)鍵詞進(jìn)行本地查詢或網(wǎng)絡(luò)查詢;或者,
[0017]所述對(duì)象描述包括指向第三方接口的鏈接;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:根據(jù)所述指向第三方接口的鏈接向所述第三方查詢并獲取相關(guān)信息;或者,
[0018]所述對(duì)象描述包括指向第三方的內(nèi)容;所述利用確定出的對(duì)象描述進(jìn)行查詢包括:查詢并獲取所述指向第三方的內(nèi)容。
[0019]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
[0020]本發(fā)明還提供了一種視頻處理方法,該方法包括:
[0021]確定用戶在視頻畫面中所選擇對(duì)象的位置信息;
[0022]向服務(wù)器端發(fā)送包含所述位置信息的查詢請(qǐng)求;
[0023]獲取所述服務(wù)器端返回的所述對(duì)象的相關(guān)信息;其中所述相關(guān)信息是所述服務(wù)器端將所述位置信息與預(yù)先對(duì)視頻畫面中的對(duì)象進(jìn)行標(biāo)記的位置信息進(jìn)行匹配后,利用匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述進(jìn)行查詢得到的。
[0024]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
[0025]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,該方法還包括:展現(xiàn)獲取的所述相關(guān)信息,具體包括:
[0026]當(dāng)所述相關(guān)信息為文本時(shí),采用浮動(dòng)窗口或滾動(dòng)條的方式展現(xiàn)所述文本;
[0027]當(dāng)所述相關(guān)信息為音頻時(shí),播放所述音頻,在播放所述音頻的過程中所述視頻暫停播放;
[0028]當(dāng)所述相關(guān)信息為視頻時(shí),采用浮動(dòng)窗口的方式播放該視頻。
[0029]本發(fā)明還提供了一種視頻處理裝置,該裝置包括:
[0030]標(biāo)記單元,用于對(duì)視頻畫面中的對(duì)象進(jìn)行位置信息和對(duì)象描述的標(biāo)記;
[0031]交互單元,用于接收客戶端發(fā)送的查詢請(qǐng)求,所述查詢請(qǐng)求中包含用戶在視頻畫面中所選擇對(duì)象的位置信息;將查詢單元提供的相關(guān)信息返回給所述客戶端;
[0032]匹配單元,用于將所述所選擇對(duì)象的位置信息與所述標(biāo)記單元標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述;
[0033]查詢單元,用于利用所述匹配單元確定出的對(duì)象描述進(jìn)行查詢,將查詢得到的相關(guān)信息提供給所述交互單元。
[0034]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述標(biāo)記單元在對(duì)視頻畫面中的對(duì)象進(jìn)行位置信息標(biāo)記時(shí),具體執(zhí)行:對(duì)視頻畫面中的對(duì)象所在的區(qū)域范圍以及所在幀的信息進(jìn)行標(biāo)記;
[0035]所述用戶在視頻畫面中所選擇對(duì)象的位置信息包括:所述用戶在視頻畫面中選擇位置的坐標(biāo)信息或范圍信息,以及所在幀的信息。
[0036]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述匹配單元在將所述所選擇對(duì)象的位置信息與標(biāo)記的位置信息進(jìn)行匹配時(shí),具體執(zhí)行:
[0037]確定與用戶在視頻畫面中選擇位置位于相同幀的標(biāo)記區(qū)域范圍,將所述坐標(biāo)信息所落在的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象,或者將與所述范圍信息具有最多重疊的標(biāo)記區(qū)域范圍對(duì)應(yīng)的對(duì)象確定為匹配的標(biāo)記對(duì)象。
[0038]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述標(biāo)記單元在對(duì)視頻畫面中的對(duì)象進(jìn)行對(duì)象描述的標(biāo)記時(shí),具體執(zhí)行:
[0039]獲取人工對(duì)視頻畫面中的對(duì)象標(biāo)記的對(duì)象描述;或者,
[0040]通過圖像識(shí)別對(duì)視頻畫面中的對(duì)象進(jìn)行識(shí)別,利用識(shí)別結(jié)果對(duì)視頻畫面中的對(duì)象標(biāo)記對(duì)象描述。
[0041]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象描述包括關(guān)鍵詞時(shí),所述查詢單元利用所述關(guān)鍵詞進(jìn)行本地查詢或網(wǎng)絡(luò)查詢;或者,
[0042]所述對(duì)象描述包括指向第三方接口的鏈接時(shí),所述查詢單元根據(jù)指向第三方接口的鏈接向所述第三方查詢并獲取相關(guān)信息;或者,
[0043]所述對(duì)象描述包括指向第三方的內(nèi)容時(shí),所述查詢單元查詢并獲取所述指向第三方的內(nèi)容。
[0044]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
[0045]本發(fā)明還提供了一種視頻處理裝置,該裝置包括:
[0046]確定單元,用于確定用戶在視頻畫面中所選擇對(duì)象的位置信息;
[0047]交互單元,用于向服務(wù)器端發(fā)送包含所述位置信息的查詢請(qǐng)求;獲取所述服務(wù)器端返回的所述對(duì)象的相關(guān)信息;
[0048]其中所述相關(guān)信息是所述服務(wù)器端將所述位置信息與預(yù)先對(duì)視頻畫面中的對(duì)象進(jìn)行標(biāo)記的位置信息進(jìn)行匹配后,利用匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述進(jìn)行查詢得到的。
[0049]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,所述對(duì)象包括:人物、物體、文字或場(chǎng)景。
[0050]根據(jù)本發(fā)明一優(yōu)選實(shí)施方式,該裝置還包括:展現(xiàn)單元,用于展現(xiàn)所述交互單元獲取的所述相關(guān)信息,具體包括:
[0051]當(dāng)所述相關(guān)信息為文本時(shí),采用浮動(dòng)窗口或滾動(dòng)條的方式展現(xiàn)所述文本;
[0052]當(dāng)所述相關(guān)信息為音頻時(shí),播放所述音頻,在播放所述音頻的過程中所述視頻暫停播放;
[0053]當(dāng)所述相關(guān)信息為視頻時(shí),采用浮動(dòng)窗口的方式播放該視頻。
[0054]由以上技術(shù)方案可以看出,本發(fā)明通過服務(wù)器端將用戶在視頻畫面中所選擇對(duì)象的位置信息與已標(biāo)記的位置信息進(jìn)行匹配,確定匹配得到的標(biāo)記對(duì)象所對(duì)應(yīng)的對(duì)象描述,將利用確定出的對(duì)象描述查詢到的相關(guān)信息返回給客戶端,從而實(shí)現(xiàn)在視頻播放過程中基于視頻畫面中的內(nèi)容與用戶進(jìn)行交互,方便用戶獲取