本公開(kāi)涉及視頻技術(shù)領(lǐng)域,尤其涉及獲取視頻信息的方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,視頻業(yè)務(wù)不斷增加,如何對(duì)視頻進(jìn)行更有效的搜索成為需要解決的問(wèn)題。目前使用的視頻搜索方法為:基于視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索。比如,視頻類應(yīng)用中,一般通過(guò)搜索電視劇、電影和節(jié)目的名稱來(lái)查找相關(guān)的電視劇、電影和節(jié)目,但這種方法存在一定的局限性。比如,有的時(shí)候人們看到某個(gè)影視片段或者某段臺(tái)詞,卻不知道是哪個(gè)影視劇或者節(jié)目里的,如果不知道影視劇的名稱,查找起來(lái)十分困難。
技術(shù)實(shí)現(xiàn)要素:
本公開(kāi)實(shí)施例提供獲取視頻信息的方法及裝置。所述技術(shù)方案如下:
第一方面,提供一種獲取視頻信息的方法,包括:
獲取針對(duì)視頻應(yīng)用程序的輸入信息,所述輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
獲取與所述輸入信息匹配的目標(biāo)視頻信息;
控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述獲取與所述輸入信息匹配的目標(biāo)視頻信息,可包括:
獲取所述輸入信息的第一特征信息;
獲取候選視頻信息的候選特征信息;
從所述候選特征信息中獲取與所述第一特征信息匹配的第二特征信息;
從所述候選視頻信息中獲取所述第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述第一特征信息或所述候選特征信息或所述第二特征信息可包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要和視頻的圖像摘要。
在一個(gè)實(shí)施例中,所述控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息,可包括:
獲取視頻信息列表;
輸出所述視頻信息列表;
其中,所述視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。
在一個(gè)實(shí)施例中,所述控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息,可包括:
檢測(cè)針對(duì)所述視頻信息列表的選擇操作;
響應(yīng)于檢測(cè)到所述選擇操作,輸出所述選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
在一個(gè)實(shí)施例中,所述獲取候選視頻信息的候選特征信息,可包括:
通過(guò)以下至少一項(xiàng)獲取所述候選特征信息:
通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取所述候選特征信息;
通過(guò)聲音識(shí)別,獲取所述候選特征信息;
通過(guò)圖像識(shí)別,獲取所述候選特征信息。
在一個(gè)實(shí)施例中,所述獲取與所述輸入信息匹配的目標(biāo)視頻信息,可包括:
從視頻信息庫(kù)中獲取與所述輸入信息匹配度最高的目標(biāo)視頻信息。
第二方面,提供一種獲取視頻信息的裝置,包括:
第一獲取模塊,用于獲取針對(duì)視頻應(yīng)用程序的輸入信息,所述輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
第二獲取模塊,用于獲取與所述第一獲取模塊獲取的輸入信息匹配的目標(biāo)視頻信息;
輸出模塊,用于控制目標(biāo)設(shè)備輸出所述第二獲取模塊獲取的目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述第二獲取模塊,可包括:
第一獲取子模塊,用于獲取所述輸入信息的第一特征信息;
第二獲取子模塊,用于獲取候選視頻信息的候選特征信息;
第三獲取子模塊,用于從所述第二獲取子模塊獲取的候選特征信息中獲取與所述第一獲取子模塊獲取的第一特征信息匹配的第二特征信息;
第四獲取子模塊,用于從所述候選視頻信息中獲取所述第三獲取子模塊獲取的第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述第一特征信息或所述候選特征信息或所述第二特征信息可包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要和視頻的圖像摘要。
在一個(gè)實(shí)施例中,所述輸出模塊可包括:
第五獲取子模塊,用于獲取視頻信息列表;
第一輸出子模塊,用于輸出所述第五獲取子模塊獲取的視頻信息列表;
其中,所述視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。
在一個(gè)實(shí)施例中,所述輸出模塊可包括:
檢測(cè)子模塊,用于檢測(cè)針對(duì)所述視頻信息列表的選擇操作;
第二輸出子模塊,用于響應(yīng)于所述檢測(cè)子模塊檢測(cè)到所述選擇操作,輸出所述選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
在一個(gè)實(shí)施例中,所述第二獲取子模塊還可用于:
通過(guò)以下至少一項(xiàng)獲取所述候選特征信息:
通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取所述候選特征信息;
通過(guò)聲音識(shí)別,獲取所述候選特征信息;
通過(guò)圖像識(shí)別,獲取所述候選特征信息。
在一個(gè)實(shí)施例中,所述第二獲取模塊可包括:
第六獲取子模塊,用于從視頻信息庫(kù)中獲取與所述輸入信息匹配度最高的目標(biāo)視頻信息。
第三方面,提供一種獲取視頻信息的裝置,包括:
處理器;
用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:
獲取針對(duì)視頻應(yīng)用程序的輸入信息,所述輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
獲取與所述輸入信息匹配的目標(biāo)視頻信息;
控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息。
本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
上述技術(shù)方案,通過(guò)獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息,獲取與輸入信息匹配的目標(biāo)視頻信息,控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。由于可以通過(guò)臺(tái)詞信息、音頻信息、圖像信息中的至少一項(xiàng)來(lái)查找視頻,從而可以幫助用戶快速找到想要的視頻。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本發(fā)明的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本發(fā)明的原理。
圖1是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的方法的流程圖。
圖2是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的方法中步驟S102的流程圖。
圖3是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的方法中步驟S103的流程圖。
圖4是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的方法中步驟S103的又一個(gè)流程圖。
圖5是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的裝置的框圖。
圖6是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的裝置中第二獲取模塊52的框圖。
圖7是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的裝置中輸出模塊53的框圖。
圖8是根據(jù)一示例性實(shí)施例示出的獲取視頻信息的裝置中輸出模塊53的另一個(gè)框圖。
圖9是根據(jù)一示例性實(shí)施例示出的適用于獲取視頻信息的裝置的框圖。
圖10是根據(jù)一示例性實(shí)施例示出的適用于獲取視頻信息的裝置的框圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
本公開(kāi)實(shí)施例提供一種獲取視頻信息的方法。參考圖1,圖1是根據(jù)一示例性實(shí)施例示出的一種獲取視頻信息的方法的流程圖,該獲取視頻信息的方法可用于終端也可用于服務(wù)器中。終端可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等任一終端設(shè)備。如圖1所示,該獲取視頻信息的方法包括以下步驟S101至S103:
在步驟S101中,獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息。
在步驟S102中,獲取與輸入信息匹配的目標(biāo)視頻信息。
在步驟S103中,控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。
用戶打開(kāi)應(yīng)用,想搜索某個(gè)視頻時(shí),輸入與視頻相關(guān)的文字、聲音或者視頻等信息。對(duì)這些輸入的信息進(jìn)行處理,比如,對(duì)視頻的臺(tái)詞文本進(jìn)行分詞或?qū)σ曨l的聲音轉(zhuǎn)化為聲音摘要或?qū)⒁曨l的圖像轉(zhuǎn)化為圖像摘要。如果視頻數(shù)據(jù)庫(kù)中存在與處理結(jié)果匹配的視頻,則輸出該視頻。
為了節(jié)約終端的內(nèi)存以及處理上述步驟所占用的空間,本實(shí)施例中,上述方法用于服務(wù)器時(shí),當(dāng)服務(wù)器獲取到與輸入信息匹配的目標(biāo)視頻信息時(shí),將目標(biāo)視頻信息發(fā)送給終端。
本公開(kāi)實(shí)施例的上述方法,通過(guò)獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息,獲取與輸入信息匹配的目標(biāo)視頻信息,控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。由于可以通過(guò)臺(tái)詞信息、音頻信息、圖像信息中的至少一項(xiàng)來(lái)查找視頻,從而可以幫助用戶快速找到想要的視頻。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的方法。參考圖2,圖2是根據(jù)一示例性實(shí)施例示出的另一種獲取視頻信息的方法的流程圖。如圖2所示,圖1所示的步驟S102可以包括步驟S1021至S1024:
在步驟S1021中,獲取輸入信息的第一特征信息。
在一個(gè)實(shí)施例中,第一特征信息可以包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要、視頻的圖像摘要。
用戶打開(kāi)應(yīng)用,想要搜索某一視頻時(shí),會(huì)在搜索框中輸入文字、音頻、或者視頻等輸入信息。從輸入信息中獲取輸入信息的第一特征信息,舉例說(shuō)明,用戶輸入的為某一段視頻時(shí),獲取該視頻的圖像摘要,圖像摘要可以為某一幀或某幾幀圖像。
在步驟S1022中,獲取候選視頻信息的候選特征信息。
在一個(gè)實(shí)施例中,候選特征信息可以包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要、視頻的圖像摘要。
在搜索框中輸入信息后,從視頻數(shù)據(jù)庫(kù)中獲取候選視頻信息,并獲取候選視頻信息的候選特征信息。候選特征信息可以與候選視頻信息對(duì)應(yīng)保存,根據(jù)候選視頻信息可以找到對(duì)應(yīng)的候選視頻信息。
在步驟S1023中,從候選特征信息中獲取與第一特征信息匹配的第二特征信息。
與第一特征信息匹配的第二特征信息可以是與第一特征信息一樣的第二特征信息或者與第一特征信息的相似度大于預(yù)設(shè)閾值的第二特征信息。舉例說(shuō)明,某一候選視頻的候選特征信息為圖像摘要,該圖像摘要為三幅圖像。第一特征信息為一副圖像,從候選特征信息中獲取與第一特征信息匹配的第二特征信息即為從這三幅圖像中確定出與該一副圖像一樣的圖像。
在步驟S1024中,從候選視頻信息中獲取第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
第二特征信息對(duì)應(yīng)的視頻即為目標(biāo)視頻。在一個(gè)實(shí)施例中,第二特征信息可以包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要、視頻的圖像摘要。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的方法。參考圖3,圖3是根據(jù)一示例性實(shí)施例示出的另一種獲取視頻信息的方法的流程圖。如圖3所示,圖1所示的步驟S103可以包括步驟S1031至S1032:
在步驟S1031中,獲取視頻信息列表。
其中,視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。搜索出的目標(biāo)視頻信息可能不止一條,將其以列表的形式呈現(xiàn)給用戶,可以使用戶更直觀的了解搜索結(jié)果。
在步驟S1032中,輸出視頻信息列表。
根據(jù)輸入信息搜索出的視頻可能不止一個(gè),本實(shí)施例中,將搜索到的視頻按照與輸入信息的相關(guān)度由高到低的順序進(jìn)行排序,或者將相關(guān)度大于預(yù)定閾值的視頻輸出。比如將相關(guān)度最高的視頻輸出,從而方便用戶快速找到想要的視頻。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的方法。參考圖4,圖4是根據(jù)一示例性實(shí)施例示出的另一種獲取視頻信息的方法的流程圖。如圖4所示,步驟S103還可以包括步驟S1033至S1034:
在步驟S1033中,檢測(cè)針對(duì)視頻信息列表的選擇操作。
在步驟S1034中,響應(yīng)于檢測(cè)到選擇操作,輸出選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
本實(shí)施例中,用戶可以從視頻信息列表中選擇自己需要的視頻進(jìn)行輸出,更好滿足用戶需求。
在一個(gè)實(shí)施例中,步驟S1022可通過(guò)以下至少一種方式獲取候選特征信息:
方式一,通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取候選特征信息。
方式二,通過(guò)聲音識(shí)別,獲取候選特征信息。
方式三,通過(guò)圖像識(shí)別,獲取候選特征信息。
舉例說(shuō)明,首先,服務(wù)器對(duì)視頻數(shù)據(jù)庫(kù)中的所有視頻進(jìn)行計(jì)算,抽取出聲音,轉(zhuǎn)換成聲音摘要,保存在數(shù)據(jù)庫(kù)中。抽取臺(tái)詞,保存在數(shù)據(jù)庫(kù)中。抽取視頻信息,轉(zhuǎn)換成圖像摘要,保存在數(shù)據(jù)庫(kù)中。
當(dāng)用戶打開(kāi)應(yīng)用時(shí),會(huì)輸入文字,錄制音頻或拍攝視頻,應(yīng)用把這些信息上傳到云端。服務(wù)器對(duì)文字進(jìn)行分詞,或把音頻轉(zhuǎn)成聲音摘要,或把圖像轉(zhuǎn)成圖像摘要,到數(shù)據(jù)庫(kù)中搜索相似的內(nèi)容。發(fā)現(xiàn)相似的內(nèi)容,根據(jù)相似度進(jìn)行排序,只留下指定閾值相似度的視頻,然后將視頻信息返回給應(yīng)用,用戶可以看到視頻的名稱,截圖,點(diǎn)擊可以播放視頻。
在一個(gè)實(shí)施例中,步驟S102還可以實(shí)施為步驟A:
步驟A,從視頻信息庫(kù)中獲取與輸入信息匹配度最高的目標(biāo)視頻信息。
本實(shí)施例中,從視頻信息庫(kù)中獲取與輸入信息匹配度最高的目標(biāo)視頻信息,可以幫助用戶快速找到想要的視頻。
下述為本公開(kāi)裝置實(shí)施例,可以用于執(zhí)行本公開(kāi)方法實(shí)施例。
本公開(kāi)實(shí)施例提供一種獲取視頻信息的裝置。參考圖5,圖5是根據(jù)一示例性實(shí)施例示出的一種獲取視頻信息的裝置的框圖,該裝置可以通過(guò)軟件、硬件或者兩者的結(jié)合實(shí)現(xiàn)成為電子設(shè)備的部分或者全部。如圖5所示,該獲取視頻信息的裝置包括:
第一獲取模塊51,被配置為獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
第二獲取模塊52,被配置為獲取與第一獲取模塊51獲取的輸入信息匹配的目標(biāo)視頻信息;
輸出模塊53,被配置為控制目標(biāo)設(shè)備輸出第二獲取模塊52獲取的目標(biāo)視頻信息。
用戶打開(kāi)應(yīng)用,想搜索某個(gè)視頻時(shí),輸入與視頻相關(guān)的文字、聲音或者視頻等信息。對(duì)這些輸入的信息進(jìn)行處理,比如,對(duì)視頻的臺(tái)詞文本進(jìn)行分詞或?qū)σ曨l的聲音轉(zhuǎn)化為聲音摘要或?qū)⒁曨l的圖像轉(zhuǎn)化為圖像摘要。如果視頻數(shù)據(jù)庫(kù)中存在與處理結(jié)果匹配的視頻,則輸出該視頻。
為了節(jié)約終端的內(nèi)存以及處理上述步驟所占用的空間,本實(shí)施例中,上述方法用于服務(wù)器時(shí),當(dāng)服務(wù)器獲取到與輸入信息匹配的目標(biāo)視頻信息時(shí),將目標(biāo)視頻信息發(fā)送給終端。
本公開(kāi)實(shí)施例的上述裝置,通過(guò)獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息,獲取與輸入信息匹配的目標(biāo)視頻信息,控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。由于可以通過(guò)臺(tái)詞信息、音頻信息、圖像信息中的至少一項(xiàng)來(lái)查找視頻,從而可以幫助用戶快速找到想要的視頻。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的裝置。參考圖6,圖6是根據(jù)一示例性實(shí)施例示出的一種獲取視頻信息的裝置中第二獲取模塊52的框圖。如圖6所示,第二獲取模塊52,可包括:
第一獲取子模塊521,被配置為獲取輸入信息的第一特征信息;
第二獲取子模塊522,被配置為獲取候選視頻信息的候選特征信息;
第三獲取子模塊523,被配置為從第二獲取子模塊獲取的候選特征信息中獲取與第一獲取子模塊獲取的第一特征信息匹配的第二特征信息;
第四獲取子模塊524,被配置為從候選視頻信息中獲取第三獲取子模塊獲取的第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,第一特征信息或候選特征信息或第二特征信息可包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要和視頻的圖像摘要。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的裝置。參考圖7,圖7是根據(jù)一示例性實(shí)施例示出的一種獲取視頻信息的裝置中輸出模塊53的框圖。如圖7所示,輸出模塊53可包括:
第五獲取子模塊531,被配置為獲取視頻信息列表;
第一輸出子模塊532,被配置為輸出第五獲取子模塊獲取的視頻信息列表;
其中,視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。
根據(jù)輸入信息搜索出的視頻可能不止一個(gè),本實(shí)施例中,將搜索到的視頻按照與輸入信息的相關(guān)度由高到低的順序進(jìn)行排序,或者將相關(guān)度大于預(yù)定閾值的視頻輸出。比如將相關(guān)度最高的視頻輸出,從而方便用戶快速找到想要的視頻。
在一個(gè)實(shí)施例中,提供另一種獲取視頻信息的裝置。參考圖8,圖8是根據(jù)一示例性實(shí)施例示出的一種獲取視頻信息的裝置中輸出模塊53的另一個(gè)框圖。如圖8所示,輸出模塊53可包括:
檢測(cè)子模塊533,被配置為檢測(cè)針對(duì)視頻信息列表的選擇操作;
第二輸出子模塊534,被配置為響應(yīng)于檢測(cè)子模塊檢測(cè)到選擇操作,輸出選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
本實(shí)施例中,用戶可以從視頻信息列表中選擇自己需要的視頻進(jìn)行輸出,更好滿足用戶需求。
在一個(gè)實(shí)施例中,第二獲取子模塊522還可被配置為:
通過(guò)以下至少一項(xiàng)獲取候選特征信息:
通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取候選特征信息;
通過(guò)聲音識(shí)別,獲取候選特征信息;
通過(guò)圖像識(shí)別,獲取候選特征信息。
舉例說(shuō)明,首先,服務(wù)器對(duì)視頻數(shù)據(jù)庫(kù)中的所有視頻進(jìn)行計(jì)算,抽取出聲音,轉(zhuǎn)換成聲音摘要,保存在數(shù)據(jù)庫(kù)中。抽取臺(tái)詞,保存在數(shù)據(jù)庫(kù)中。抽取視頻信息,轉(zhuǎn)換成圖像摘要,保存在數(shù)據(jù)庫(kù)中。
當(dāng)用戶打開(kāi)應(yīng)用時(shí),會(huì)輸入文字,錄制音頻或拍攝視頻,應(yīng)用把這些信息上傳到云端。服務(wù)器對(duì)文字進(jìn)行分詞,或把音頻轉(zhuǎn)成聲音摘要,或把圖像轉(zhuǎn)成圖像摘要,到數(shù)據(jù)庫(kù)中搜索相似的內(nèi)容。發(fā)現(xiàn)相似的內(nèi)容,根據(jù)相似度進(jìn)行排序,只留下指定閾值相似度的視頻,然后將視頻信息返回給應(yīng)用,用戶可以看到視頻的名稱,截圖,點(diǎn)擊可以播放視頻。
在一個(gè)實(shí)施例中,第二獲取模塊52可包括:
第六獲取子模塊,被配置為從視頻信息庫(kù)中獲取與輸入信息匹配度最高的目標(biāo)視頻信息。
本實(shí)施例中,從視頻信息庫(kù)中獲取與輸入信息匹配度最高的目標(biāo)視頻信息,可以幫助用戶快速找到想要的視頻。
本公開(kāi)實(shí)施例的上述裝置,通過(guò)獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息,獲取與輸入信息匹配的目標(biāo)視頻信息,控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。由于可以通過(guò)臺(tái)詞信息、音頻信息、圖像信息中的至少一項(xiàng)來(lái)查找視頻,從而可以幫助用戶快速找到想要的視頻。
本公開(kāi)實(shí)施例還提供一種獲取視頻信息的裝置,包括:
處理器;
用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
其中,處理器被配置為:
獲取針對(duì)視頻應(yīng)用程序的輸入信息,輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
獲取與輸入信息匹配的目標(biāo)視頻信息;
控制目標(biāo)設(shè)備輸出目標(biāo)視頻信息。
上述處理器還可被配置為:
獲取輸入信息的第一特征信息;
獲取候選視頻信息的候選特征信息;
從候選特征信息中獲取與第一特征信息匹配的第二特征信息;
從候選視頻信息中獲取第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
上述處理器還可被配置為:
第一特征信息或候選特征信息或第二特征信息可包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要和視頻的圖像摘要。
上述處理器還可被配置為:
獲取視頻信息列表;
輸出視頻信息列表;
其中,視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。
上述處理器還可被配置為:
檢測(cè)針對(duì)視頻信息列表的選擇操作;
響應(yīng)于檢測(cè)到選擇操作,輸出選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
上述處理器還可被配置為:
通過(guò)以下至少一項(xiàng)獲取候選特征信息:
通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取候選特征信息;
通過(guò)聲音識(shí)別,獲取候選特征信息;
通過(guò)圖像識(shí)別,獲取候選特征信息。
上述處理器還可被配置為:
從視頻信息庫(kù)中獲取與輸入信息匹配度最高的目標(biāo)視頻信息。
圖9是根據(jù)一示例性實(shí)施例示出的一種用于獲取視頻信息的裝置的框圖,該裝置適用于終端設(shè)備。例如,裝置1200可以是移動(dòng)電話、計(jì)算機(jī)、數(shù)字廣播終端、消息收發(fā)設(shè)備、游戲控制臺(tái)、平板設(shè)備、醫(yī)療設(shè)備、健身設(shè)備、個(gè)人數(shù)字助理等。
裝置1200可以包括以下一個(gè)或多個(gè)組件:處理組件1202,存儲(chǔ)器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(I/O)的接口1212,傳感器組件1214,以及通信組件1216。
處理組件1202通??刂蒲b置1200的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件1202可以包括一個(gè)或多個(gè)處理器1220來(lái)執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個(gè)或多個(gè)模塊,便于處理組件1202和其他組件之間的交互。例如,處理組件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
存儲(chǔ)器1204被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在裝置1200的操作。這些數(shù)據(jù)的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器1204可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(ROM),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤(pán)或光盤(pán)。
電源組件1206為裝置1200的各種組件提供電力。電源組件1206可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件1208包括在所述裝置1200和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件1208包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置1200處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件1210被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件1210包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置1200處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1204或經(jīng)由通信組件1216發(fā)送。在一些實(shí)施例中,音頻組件1210還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
I/O接口1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤(pán),點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
傳感器組件1214包括一個(gè)或多個(gè)傳感器,用于為裝置1200提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件1214可以檢測(cè)到裝置1200的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置1200的顯示器和小鍵盤(pán),傳感器組件1214還可以檢測(cè)裝置1200或裝置1200一個(gè)組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1214還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件1214還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件1216被配置為便于裝置1200和其他設(shè)備之間有線或無(wú)線方式的通信。裝置1200可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件1216經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件1216還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。
在示例性實(shí)施例中,裝置1200可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器1204,上述指令可由裝置1200的處理器820執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤(pán)和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
圖10是根據(jù)一示例性實(shí)施例示出的一種用于獲取視頻信息的裝置的框圖。例如,裝置1900可以被提供為一服務(wù)器。裝置1900包括處理組件1922,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器1932所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理組件1922的執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器1932中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件1922被配置為執(zhí)行指令,以執(zhí)行上述方法。
裝置1900還可以包括一個(gè)電源組件1926被配置為執(zhí)行裝置1900的電源管理,一個(gè)有線或無(wú)線網(wǎng)絡(luò)接口1950被配置為將裝置1900連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(I/O)接口1958。裝置1900可以操作基于存儲(chǔ)在存儲(chǔ)器1932的操作系統(tǒng),例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。
一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由裝置1200的處理器執(zhí)行時(shí),使得裝置1200能夠執(zhí)行上述獲取視頻信息的方法,所述方法包括:
獲取針對(duì)視頻應(yīng)用程序的輸入信息,所述輸入信息包括以下至少一項(xiàng):臺(tái)詞信息、音頻信息、圖像信息;
獲取與所述輸入信息匹配的目標(biāo)視頻信息;
控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述獲取與所述輸入信息匹配的目標(biāo)視頻信息,可包括:
獲取所述輸入信息的第一特征信息;
獲取候選視頻信息的候選特征信息;
從所述候選特征信息中獲取與所述第一特征信息匹配的第二特征信息;
從所述候選視頻信息中獲取所述第二特征信息對(duì)應(yīng)的目標(biāo)視頻信息。
在一個(gè)實(shí)施例中,所述第一特征信息或所述候選特征信息或所述第二特征信息可包括以下至少一項(xiàng):內(nèi)容標(biāo)簽、臺(tái)詞文本、視頻的聲音摘要和視頻的圖像摘要。
在一個(gè)實(shí)施例中,所述控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息,可包括:
獲取視頻信息列表;
輸出所述視頻信息列表;
其中,所述視頻信息列表包括至少一項(xiàng)目標(biāo)視頻信息,且按照匹配度由高到低的順序進(jìn)行排列。
在一個(gè)實(shí)施例中,所述控制目標(biāo)設(shè)備輸出所述目標(biāo)視頻信息,可包括:
檢測(cè)針對(duì)所述視頻信息列表的選擇操作;
響應(yīng)于檢測(cè)到所述選擇操作,輸出所述選擇操作指示目標(biāo)視頻信息對(duì)應(yīng)的視頻。
在一個(gè)實(shí)施例中,所述獲取候選視頻信息的候選特征信息,可包括:
通過(guò)以下至少一項(xiàng)獲取所述候選特征信息:
通過(guò)對(duì)臺(tái)詞文本進(jìn)行分詞,獲取所述候選特征信息;
通過(guò)聲音識(shí)別,獲取所述候選特征信息;
通過(guò)圖像識(shí)別,獲取所述候選特征信息。
在一個(gè)實(shí)施例中,所述獲取與所述輸入信息匹配的目標(biāo)視頻信息,可包括:
從視頻信息庫(kù)中獲取與所述輸入信息匹配度最高的目標(biāo)視頻信息。
本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的公開(kāi)后,將容易想到本公開(kāi)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。