亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

視頻搜索方法及視頻搜索裝置的制造方法

文檔序號:10655334閱讀:234來源:國知局
視頻搜索方法及視頻搜索裝置的制造方法
【專利摘要】本發(fā)明提供一種視頻搜索方法及視頻搜索裝置。本發(fā)明的視頻搜索方法,包括接收視頻搜索信息,其中,所述視頻搜索信息中包括目標角色的角色信息,所述角色信息用于標識不同角色;根據(jù)目標角色的角色信息獲取所述目標角色對應的視頻片段;根據(jù)所述目標角色對應的視頻片段生成所述目標角色所對應的搜索視頻。本發(fā)明能夠讓用戶觀看到視頻中自己所關(guān)注的角色視頻片段,以滿足用戶對視頻搜索的個性化需求。
【專利說明】
視頻搜索方法及視頻搜索裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及視頻處理領(lǐng)域,尤其設(shè)及一種視頻捜索方法及視頻捜索裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展與網(wǎng)絡(luò)帶寬的提升,人們越來越多地通過網(wǎng)絡(luò)媒體進行視 頻播放與觀看。
[0003] 然而,因為網(wǎng)絡(luò)視頻的數(shù)據(jù)量成幾何增長,如何在互聯(lián)網(wǎng)上的海量視頻中快速尋 找到符合用戶需求的視頻成為一個棘手的問題。目前,視頻捜索的主要途徑包括捜索引擎 間接捜索W及影視客戶端捜索等。捜索方法主要是基于視頻的影片名、演員及導演等關(guān)鍵 詞捜索,或者是基于影視分類的視頻捜索,展現(xiàn)的單元也是視頻整體,如電視劇分集播放, 電影按照整部影片長度等。
[0004] 然而,隨著現(xiàn)代生活節(jié)奏的加快,用戶可W花費在影視觀看上的時間越來越少,更 多的用戶不再想觀看視頻整體,而是想快速的觀看視頻中自己所關(guān)注的角色片段,因此,現(xiàn) 有的視頻捜索方法已經(jīng)不能滿足用戶的個性化需求。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供一種視頻捜索方法及視頻捜索裝置,旨在為用戶提供目標視頻中自己 所關(guān)注的角色片段,滿足用戶對視頻捜索的個性化需求。
[0006] 第一方面,本發(fā)明提供一種視頻捜索方法,包括:
[0007] 接收視頻捜索信息,其中,視頻捜索信息中包括目標角色的角色信息,角色信息用 于標識不同角色;
[000引根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段;
[0009] 根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視頻。
[0010] 第二方面,本發(fā)明提供一種視頻捜索裝置,包括:
[0011] 接收模塊,用于接收視頻捜索信息,其中,視頻捜索信息中包括目標角色的角色信 息,角色信息用于標識不同角色;
[0012] 視頻獲取模塊,用于根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段;
[0013] 視頻拼接模塊,用于根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視 頻。
[0014] 第=方面,本發(fā)明提供一種視頻捜索裝置,包括:
[0015] 接收器,用于接收視頻捜索信息,其中,視頻捜索信息中包括目標角色的角色信 息,角色信息用于標識不同角色;
[0016] 存儲器,用于存儲程序;
[0017] 處理器,用于執(zhí)行存儲器存儲的程序,W根據(jù)目標角色的角色信息獲取所述目標 角色對應的視頻片段,并根據(jù)所述目標角色對應的視頻片段生成所述目標角色對應的捜索 視頻。
[0018] 本發(fā)明提供的視頻捜索方法,首先接收視頻捜索信息,其中,視頻捜索信息中包括 目標角色的角色信息,角色信息用于標識不同角色;再根據(jù)目標角色的角色信息獲取目標 角色對應的所有視頻片段;最后根據(jù)目標角色對應的所有視頻片段獲得目標角色所對應的 視頻。運樣可W讓用戶觀看到目標視頻中自己所關(guān)注的角色所對應的視頻片段,省去了用 戶自己手動捜索、調(diào)整播放進度的過程,有效提高了用戶的觀影體驗,滿足了用戶對視頻捜 索的個性化需求。
【附圖說明】
[0019] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可W 根據(jù)運些附圖獲得其他的附圖。
[0020] 圖IA是本發(fā)明實施例一提供的一種視頻捜索方法的流程示意圖;
[0021] 圖IB是本發(fā)明實施例一提供的另一種視頻捜索方法的流程示意圖;
[0022] 圖IC是本發(fā)明實施例一提供的第=種視頻捜索方法的流程示意圖;
[0023] 圖2A是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第一種流程示意圖;
[0024] 圖2B是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第二種流程示意圖;
[0025] 圖2C是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第=種流程示意圖;
[0026] 圖2D是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第四種流程示意圖;
[0027] 圖2E是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第五種流程示意圖;
[0028] 圖2F是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多 個視頻片段的第六種流程示意圖;
[0029] 圖3A是本發(fā)明實施例一提供的根據(jù)目標角色對應的視頻片段生成目標角色所對 應的捜索視頻的一種流程示意圖;
[0030] 圖3B是本發(fā)明實施例一提供的根據(jù)目標角色對應的視頻片段生成目標角色所對 應的捜索視頻的另一種流程示意圖;
[0031 ]圖4A是本發(fā)明實施例二提供的一種視頻捜索裝置的結(jié)構(gòu)示意圖;
[0032] 圖4B是本發(fā)明實施例二提供的另一種視頻捜索裝置的結(jié)構(gòu)示意圖;
[0033] 圖5是本發(fā)明實施例=提供的視頻捜索裝置的結(jié)構(gòu)示意圖;
【具體實施方式】
[0034] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0035] 圖IA是本發(fā)明實施例一提供的一種視頻捜索方法的流程示意圖。該方法的執(zhí)行主 體可W為智能手機、智能電視、高清機頂盒、平板電腦、筆記本電腦、超級移動個人計算機 (英文:Ultra-mobile Personal Computer,簡稱:UMPC)、上網(wǎng)本、個人數(shù)字助理(英文: Personal Digital Assistant,簡稱:PDA)等終端;同時,該方法的執(zhí)行主體還可W為具有 視頻捜索功能的應用軟件,比如騰訊視頻、愛奇藝視頻、百度等。如圖IA所示,本實施例提 供的視頻捜索方法具體包括W下步驟:
[0036] Sll、接收視頻捜索信息,其中,視頻捜索信息中包括目標角色的角色信息,角色信 息用于標識不同角色。
[0037] S12、根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段。
[0038] S13、根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視頻。
[0039] 示例的,視頻捜索信息可W是用戶通過終端設(shè)備的語音輸入裝置輸入的語音捜索 信息,終端設(shè)備上的語音輸入裝置接收到語音捜索信息后,可對語音捜索信息內(nèi)用于標識 角色的角色信息,如視頻中的角色名字進行解析,從而獲知用戶想要觀看到的目標角色。當 然,本發(fā)明實施例的視頻捜索信息還可W通過終端設(shè)備的其他輸入方式輸入,比如通過終 端設(shè)備的觸摸屏輸入、通過與終端設(shè)備相連的鍵盤輸入等,顯然此處僅是舉例說明,并不代 表本發(fā)明實施例的視頻捜索信息的輸入方式局限于此。
[0040] 示例的,在對視頻捜索信息中的角色信息進行解析時,可W利用關(guān)鍵字匹配等不 同方式,并在預先建立好的角色信息庫中進行檢索與查詢,判斷視頻捜索信息中是否包含 有目標角色的角色信息,本發(fā)明對此不做限定。
[0041] 在進行視頻捜索時,首先需要接收到視頻捜索信息,且視頻捜索信息中包括有用 戶所需的目標角色的角色信息,該角色信息可用于標識不同的角色,運樣才能進行后續(xù)的 視頻片段捜索過程。具體的,因為在視頻中可存在有不同的角色,每個角色出現(xiàn)在視頻中的 不同時間段里。運樣,想要獲取目標角色的視頻片段時,可W通過目標角色的角色信息,獲 取到該目標角色所對應的視頻片段,每個視頻片段中,均只包含該特定人物角色的畫面及 聲音,運樣可為后續(xù)的合成提供基礎(chǔ)。
[0042] 具體的,因為通常角色為某一原始視頻里所特定的人物或其他角色,因而可根據(jù) 在視頻中不斷更替出現(xiàn)的不同角色,可W將視頻劃分成為多個視頻片段。圖IB是本發(fā)明實 施例一提供的另一種視頻捜索方法的流程示意圖。如圖IB所示,在接收視頻捜索信息之前, 該視頻捜索方法還可W包括:
[0043] S14、獲取原始視頻中各個角色的角色信息;
[0044] S15、根據(jù)原始視頻中各個角色的角色信息,將原始視頻劃分為多個視頻片段,每 個視頻片段對應一個角色的角色信息。
[0045] 運樣,可W獲取原始視頻里各個不同角色的角色信息,W對不同角色進行區(qū)分,并 根據(jù)不同角色對原始視頻進行分割處理。
[0046] W對一段原始視頻進行分割處理為例,該段原始視頻可W包括有A、B和C=個主要 角色,按照視頻中顯示的角色不同,可W將視頻分為20段,如表1所示。
[0047] 表1原始視頻按照角色劃分的分段示意表
[004引
[0049] 其中,整段原始視頻被分為1-20段,且每段視頻中對應一個角色或者沒有角色。原 始視頻中的片段1,3,7,10,12,16和20均對應角色A;片段4,9,11,13,15和18只對應角色B; 片段2,5,8,14,17對應的是角色(:,而片段6和片段19為背景片段,沒有人物角色的畫面或聲 音出現(xiàn)。
[0050] 原始視頻劃分完畢后,可W利用播放標簽等信息,在原始視頻中對應的時間軸位 置上進行標記,運樣在后續(xù)查找時,只需要獲得特定的播放標簽,即可捜索到該播放標簽在 原始視頻上對應的時間軸,從而查找到原始視頻中的視頻片段。示例的,本發(fā)明實施例的播 放標簽為目標視頻片段在原始視頻的時間軸上所對應的時間標簽,比如電影《一個人的江 湖》第35分鐘~第38分鐘。其中,原始視頻既可W為一段單獨的視頻文件,也可W為由多個 視頻組成的劇集。
[0051] 具體的,可W利用原始視頻中的角色信息,進行原始視頻中的不同角色的標識。角 色信息能夠體現(xiàn)出不同角色的特征,并將特定角色與其它角色區(qū)分出來。一般的,角色信息 可W為視頻字幕中對應的文本特征,也可W是視頻圖像帖中的角色外形特征,或者是視頻 中角色的聲音特征等。
[0052] 在利用角色信息對原始視頻進行劃分時,所利用到的角色信息一般是通過對原始 視頻進行處理和角色甄別而獲取到的。具體的,可W預先對原始視頻進行遍歷和特征提取, W構(gòu)建出一個特征數(shù)據(jù)庫,再利用模式識別或分類方法篩選出特定角色的特征。
[0053] 利用角色信息對原始視頻進行分段,劃分出多個對應不同角色的視頻片段后,即 可根據(jù)目標角色的角色信息,對所有視頻片段進行篩選,W獲得對應該目標角色的所有視 頻片段。其中,目標角色的角色信息可W由用戶進行輸入,例如用戶可輸入目標角色的角色 名稱、角色面部的圖片、或者角色的一段聲音等。得到目標角色的角色信息后,即可在視頻 片段中進行檢索與篩選,挑選出符合該目標角色的角色信息的視頻片段。一般的,為了避免 遺漏,需要獲取整個原始視頻,W尋找出原始視頻中所有符合該角色的片段。
[0054] 還是W表1中的視頻分段為例。因為只需要獲得人物角色所對應的視頻片段,所W 可忽略背景片段,而將不同人物角色所對應的視頻片段進行分類,具體的劃分如表2所示。 具體的,獲取目標角色的視頻片段,既可W是獲取符合條件的視頻片段的播放標簽,也可W 是將符合條件的視頻片段從原始視頻上剪輯下來,W形成獨立的視頻片段文件。一般的,為 了節(jié)省資源與空間,通??蒞只獲取目標角色視頻片段的播放標簽,而不形成新的獨立視 頻片段文件。
[0055] 表2不同角色所對應的視頻片段示意表
[0化6]
[0057] 因為對原始視頻進行角色解析和分割,需要占用大量的時間及計算處理資源,為 了減少后續(xù)重復播放時對時間和資源的占用,還可W將剪輯好的視頻片段保存起來。例如, 根據(jù)原始視頻中的角色信息,將原始視頻劃分為多個視頻片段之后,可W將視頻片段存儲 在媒體庫中。媒體庫可W為網(wǎng)絡(luò)上的媒體庫,也可W是在本地存儲。媒體庫中,存儲運按照 角色信息而進行劃分的視頻片段,當后續(xù)需要播放對應不同角色的視頻時,即可直接從媒 體庫中查找相關(guān)視頻片段,并進行后續(xù)拼接與合成。
[0058] 獲取希望得到的目標角色的視頻片段后,因為用戶希望得到的是包含該目標角色 內(nèi)容的一整段視頻,所W需要對目標角色對應的視頻片段進行拼接,W生成目標角色所對 應的一段完整的捜索視頻。
[0059] 圖IC是本發(fā)明實施例一提供的第=種視頻捜索方法的流程示意圖。如圖IC所示, 在前述圖IA和圖IB所示的實施方式基礎(chǔ)上,在根據(jù)目標角色對應的視頻片段生成目標角 色對應的捜索視頻時,具體可W包括如下步驟:
[0060] S131、根據(jù)時間軸順序拼接目標角色對應的視頻片段,生成目標角色對應的捜索 視頻。
[0061] 因為原始視頻在播放時,所有視頻片段均按照時間軸的順序先后出現(xiàn),因而視頻 是按照時間軸順序進行拼接所得到,可W保證目標角色所對應的視頻中,不同視頻片段之 間仍然符合在原始片段中的先后播放順序,而不會出現(xiàn)視頻片段之間的錯位、亂序現(xiàn)象,即 不會存在視頻情節(jié)的邏輯或順序問題,能夠保證用戶的觀看體驗。此外,也可W設(shè)置不同的 拼接、合成方法,W形成具有其它效果的目標角色所對應的視頻。
[0062] 本實施例中,當用戶想要獲取自己所關(guān)注的角色所對應的視頻片段時,可W先接 收包含有目標角色的角色信息的視頻捜索信息,其中,運些角色信息可用于標識不同角色, 然后再根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段;最后根據(jù)目標角色對應的 視頻片段生成目標角色所對應的捜索視頻。運樣可W根據(jù)視頻中特定角色所對應的部分片 段而生成對應的捜索視頻,從而讓用戶觀看到目標視頻中自己所關(guān)注的角色所對應的部 分,省去了用戶自己手動捜索、調(diào)整播放進度的過程,有效提高了用戶的觀影體驗,滿足了 用戶的個性化視頻捜索需求。
[0063] 在獲取特定角色對應的視頻片段時,原始視頻可W根據(jù)不同的角色,而被預先分 割成多個視頻片段,并將按角色劃分好的視頻片段存儲在網(wǎng)絡(luò)上或者本地的媒體庫中,運 樣當需要觀看特定角色對應的片段時,即可直接從媒體庫中直接提取已制作好的該角色所 對應的多個視頻片段,并進行拼接合并,合成可供用戶觀看的視頻。此外,也可W直接將原 始視頻進行劃分和處理,運樣可W在缺乏現(xiàn)有的媒體庫時,仍然可W從原始視頻中直接提 取相應角色所對應的多個視頻片段,并由運些視頻片段得到最終的該特定角色對應的視 頻。在前述實施例的基礎(chǔ)上,W下針對不同的角色信息,分別提供將原始視頻劃分為多個視 頻片段的幾個【具體實施方式】。
[0064] 作為一種可選的實施方式,當原始視頻包含有對應的字幕文件時,可W根據(jù)字幕 文件中的內(nèi)容,進行不同角色的判斷與甄別。圖2A是本發(fā)明實施例一提供的根據(jù)原始視頻 中的角色信息將原始視頻劃分為多個視頻片段的第一種流程示意圖。如圖2A所示,在前述 圖IB至圖IC的實施方式基礎(chǔ)上,當角色信息為原始視頻對應的字幕文件所攜帶的角色信 息時,根據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片段的步驟,具體可W包括 如下內(nèi)容:
[0065] S151、根據(jù)原始視頻對應的字幕文件所攜帶的角色信息將字幕文件劃分為多個文 本分段,其中,每個文本分段對應原始視頻中的一個角色。
[0066] S152、根據(jù)每個文本分段的時間軸信息確定文本分段在原始視頻中對應的視頻片 段。
[0067] 其中,當原始視頻包括有多個分集視頻時,對于每個分集視頻。其對應的字幕文件 都會出現(xiàn)重復的時間軸。為了避免不同分集視頻所對應字幕文件的時間軸信息產(chǎn)生重復, 還需要對字幕文件中的時間軸信息進行處理,使每個分集視頻對應字幕文件的時間軸與其 它字幕文件的時間軸不同。
[0068] 為了適應原始視頻中包括多個分集視頻的情況,可選的,圖2B是本發(fā)明實施例一 提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片段的第二種流程示意圖。 如圖2B所示,在前述圖2A基礎(chǔ)上,在上述步驟S151之前,還可W包括如下步驟:
[0069] S153、當原始視頻包括多個分集視頻片段時,對多個分集視頻片段對應字幕文件 的時間軸信息進行歸一化處理,W使每個字幕文件的時間軸信息對應該字幕文件在原始視 頻中的唯一顯示時間。
[0070] 此時,對于每個分集視頻片段對應的字幕文件,均可對其時間軸信息進行歸一化 處理,使每個字幕文件的時間軸信息,均能夠唯一地表示該段字幕在整個原始視頻中的顯 示時間,讓原始視頻中每個時間段均對應有唯一的字幕,避免因字幕文件中時間軸信息相 同,而出現(xiàn)無法辨別相應視頻片段的情況。
[0071 ]在本實施例方式中,原始視頻包含有對應的字幕文件,字幕文件可W內(nèi)嵌進原始 視頻中,也可W作為外掛的獨立文件存在。因為原始視頻中包含有對應的字幕文件,所W可 W通過字幕文件中所攜帶的角色信息,對字幕文件進行分割處理。一般的,在原始視頻的字 幕中,人物對白等字幕中會包含有人物角色名稱等信息,此時即可通過關(guān)鍵字等方式,查找 到標識有不同人物角色的相應的字幕文本。該字幕文本分段所對應的視頻片段即為某一角 色的視頻片段。
[0072] 而當原始視頻的字幕中不包含角色名稱信息時,還可W通過自然語言處理方法進 行文本的語義理解,從而得知字幕文本的說話主體,進而獲取角色信息。語義理解的方法, 可W粗略劃分出不同角色所對應的字幕文本分段。
[0073] 因為字幕中包含有字幕文本和時間軸信息,所W得到字幕各個文本分段與原始視 頻中不同角色的對應關(guān)系后,可W通過不同字幕文本所對應的不同時間軸信息,確定每個 文本分段在原始視頻中所對應的視頻時間位置,并根據(jù)該時間位置進行視頻片段的劃分。
[0074] 采用原始視頻的字幕文件所攜帶的角色信息,進行不同角色視頻片段的劃分,因 為字幕文件的時間軸信息與原始視頻的畫面同步性較高(一般字幕與畫面的同步誤差在 0.1秒W內(nèi)),所W進行視頻片段劃分時,劃分出的范圍較為精確;而且因為字幕文件通常為 文本格式,文件體積較小,所W可W減少視頻捜索的處理時間,W及減少處理器功耗。
[0075] 此外,作為另一種可能的實施方式,還可W利用原始視頻中,不同角色的面部特征 信息進行角色的識別與視頻片段的劃分。具體的,圖2C是本發(fā)明實施例一提供的根據(jù)原始 視頻中的角色信息將原始視頻劃分為多個視頻片段的第S種流程示意圖。如圖2C所示,在 圖IB至圖IC所示實施方式的基礎(chǔ)上,當角色信息為原始視頻中角色的面部特征信息時,根 據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片段的步驟,具體可W包括:
[0076] S154、對原始視頻中每個圖像帖進行人臉識別,W獲得圖像帖的面部特征信息,其 中,每個圖像帖對應原始視頻中一個角色。
[0077] S155、將每個圖像帖的面部特征信息與面部特征信息數(shù)據(jù)庫中所存儲的面部特征 信息進行比較,W獲得圖像帖的面部特征信息所對應的角色,其中,面部特征信息數(shù)據(jù)庫用 于記錄面部特征信息與角色之間的對應關(guān)系。
[0078] S156、根據(jù)每個圖像帖的面部特征信息所對應的角色,將原始視頻劃分為多個視 頻片段。
[0079] 本實施方式中,當對原始視頻進行角色識別時,可W對原始視頻進行逐帖的人臉 識別過程。人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù),可W通 過對原始視頻中圖像帖進行偵測,例如根據(jù)人臉器官的形狀描述W及他們之間的距離特性 判斷出圖像帖中有沒有出現(xiàn)角色的面部,當從圖像帖中識別出人臉后,再采集圖像帖中的 面部特征信息。該過程中,首先需要準確標定出人臉的位置和大小,然后將角色面部的圖 形和形狀特征通過數(shù)學處理,得到可進行衡量與比較的數(shù)學特征,例如直方圖特征、顏色特 征、模板特征、結(jié)構(gòu)特征等。運些特征即可作為面部特征信息。面部特征可W表示唯一的角 色,從而對該角色進行標識。
[0080] 獲得原始視頻中各圖像帖的面部特征信息后,需要將得到的面部特征信息與面部 特征信息數(shù)據(jù)庫中所存儲的面部特征信息進行比對,從而確定圖像帖上的面部特征信息與 面部特征信息數(shù)據(jù)庫中所存儲的哪些面部特征信息相一致。因為面部特征信息數(shù)據(jù)庫中記 錄有面部特征信息與角色之間的對應關(guān)系,所W可W進而得知圖像帖的面部特征信息對應 原始視頻中的哪一個人物角色。
[0081] 對原始視頻中的所有圖像帖均提取面部特征信息,并進行角色的檢測識別后,可 W將圖像帖所對應的角色進行統(tǒng)計、整合,從而將圖像帖整合成為視頻片段,每個視頻片段 均對應一個獨立的角色,運樣即可完成視頻片段的劃分工作。
[0082] 其中,用于進行面部特征信息比對的面部特征信息數(shù)據(jù)庫,可W是將大量角色數(shù) 據(jù)存儲起來而形成的數(shù)據(jù)庫,也可W是在對原始視頻進行數(shù)據(jù)采集和加工后進行歸類,從 而得到該原始視頻的面部特征信息數(shù)據(jù)庫得到。因為在不同視頻中,即使是同一演員,其塑 造的人物角色的面部特征也有可能存在很大的不同,所W為了保證面部特征信息數(shù)據(jù)庫中 所記錄的面部特征信息和原始視頻中的角色面部特征更為吻合,保證對角色具有較高的識 別率,通??刹捎脤υ家曨l進行數(shù)據(jù)處理,W得到基于該原始視頻的面部特征信息數(shù)據(jù) 庫。
[0083] 通過面部特征信息進行角色的識別,可W直接根據(jù)角色呈現(xiàn)的圖像和畫面進行識 另IJ,從而保證了識別出的角色與畫面之間的一致性及同步性。
[0084] 具體的,圖2D是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃 分為多個視頻片段的第四種流程示意圖。如圖2D所示,在前述圖2C的實施方式基礎(chǔ)上,為了 建立面部特征信息數(shù)據(jù)庫,當在根據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片 段的步驟之前,還可W包括如下步驟:
[0085] S157、對原始視頻中每個圖像帖進行人臉識別,并采集識別出人臉的圖像帖中的 面部特征信息。
[0086] S158、對面部特征信息進行模式識別,W檢測面部特征信息所對應的角色。
[0087] S159、將面部特征信息與面部特征信息所對應的角色登記在面部特征信息數(shù)據(jù)庫 中。
[0088] 其中,可首先對原始視頻中所有的圖像帖進行遍歷,每個圖像帖均進行人臉識別 過程,并將可識別出人臉的圖像帖中的面部特征信息提取出來;然后通過機器學習和人工 智能算法對面部特征信息進行模式識別,將相似度超過一定闊值的面部特征信息進行歸類 和集成,從而得到面部特征信息所對應的角色;最后,可將面部特征信息與該面部特征信息 所對應的角色登記在面部特征信息數(shù)據(jù)庫之中,W便在后續(xù)的視頻片段劃分步驟中進行面 部特征信息的查詢與比對。
[0089] 此外,作為另一種可能的實施方式,還可W通過原始視頻中不同角色的聲音特征 信息進行角色的識別。具體的,圖2E是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息 將原始視頻劃分為多個視頻片段的第五種流程示意圖。如圖2E所示,在圖IB至圖IC所示實 施方式的基礎(chǔ)上,當角色信息為原始視頻中角色的聲音特征信息時,根據(jù)原始視頻中的角 色信息將原始視頻劃分為多個視頻片段的步驟,具體可W包括:
[0090] S1510、對原始視頻中每個聲音片段進行聲音識別,W獲得每個聲音片段的聲音特 征信息,其中,媒體聲音片段對應原始視頻中一個角色;
[0091] S1511、將每個聲音片段的聲音特征信息與聲音特征信息數(shù)據(jù)庫中所存儲的聲音 特征信息進行比較,W獲得聲音片段的聲音特征信息所對應的角色,其中,聲音特征信息數(shù) 據(jù)庫用于記錄聲音特征信息與角色之間的對應關(guān)系;
[0092] S1512、根據(jù)每個聲音片段的聲音特征信息所對應的角色,將原始視頻劃分為多個 視頻片段。
[0093] 和利用面部特征信息進行角色識別的方法類似,本實施方式中,當對原始視頻進 行角色識別時,可W對原始視頻中每個聲音片段進行聲音識別。具體的,聲音識別可W為聲 紋識別(Voiceprint Recognition ,簡稱VPR)。聲紋識別又稱為說話人識別(Speaker Recognition),其基本含義包含兩類,即說話人辨認(Speaker Identification)和說話人 確認(Speaker Verification)。前者用W判斷某段語音來自于若干人中的哪一個具體角 色所說;而后者用W確認某段語音是否是指定的某個人所說。因為聲紋識別通過對提取角 色的聲音特征信息進行識別,而與聲音文本無關(guān),因而不需要使說話角色的發(fā)音內(nèi)容保持 一樣,從而可W方便的進行角色識別。
[0094] 在獲得每個聲音片段的聲音特征信息后,需要將得到的聲音特征信息與聲音特征 信息數(shù)據(jù)庫中所存儲的聲音特征信息進行比對,W得知聲音特征信息對應著原始視頻中的 哪一個人物角色。其后,即可將不同的聲音片段所對應的視頻部分進行劃分、整合,從而將 原始視頻劃分為對應不同角色的多個視頻片段,其具體方法與步驟與前述圖中所示的方法 類似,此處不再寶述。
[00%]通過角色的聲音特征信息進行角色的識別和視頻片段的劃分,因為聲音特征信息 是通過提取視頻中的音頻而得到,其數(shù)據(jù)量較少,所W可W在準確識別的同時,減少對視頻 的處理時間。
[0096] 同樣的,聲音特征信息數(shù)據(jù)庫也可W根據(jù)原始視頻中的聲音數(shù)據(jù)而建立。具體的, 圖2F是本發(fā)明實施例一提供的根據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片 段的第六種流程示意圖。如圖2F所示,在前述圖沈的實施方式基礎(chǔ)上,為了建立聲音特征信 息數(shù)據(jù)庫,當在根據(jù)原始視頻中的角色信息將原始視頻劃分為多個視頻片段的步驟之前, 還包括如下步驟:
[0097] S1513、對原始視頻中每個聲音片段進行聲音識別,并采集識別出人聲的聲音片段 中的聲音特征信息;
[0098] S1514、對聲音特征信息進行模式識別,W檢測聲音特征信息所對應的角色;
[0099] S1515、將聲音特征信息與聲音特征信息所對應的角色登記在聲音特征信息數(shù)據(jù) 庫中。
[0100] 上述具體步驟與圖沈中所示的實施方式類似,均是對原始視頻中的聲音片段進行 遍歷,W得到有人聲的聲音片段中的聲音特征信息,再利用機器學習等方法對聲音特征信 息進行模式識別,從而得到各個聲音特征信息所對應的角色,并將對應關(guān)系記錄在聲音特 征信息數(shù)據(jù)庫之中。而其中基于聲紋等聲音特征信息的諸多特性,在對聲音特征信息進行 模式識別時,具體可W采用W下方法:根據(jù)隱式馬爾可夫模型方法和矢量量化聚類方法對 聲音特征信息進行模式識別,W檢測聲音特征信息所對應的角色。采用隱式馬爾可夫模型 方法和矢量量化聚類方法相結(jié)合的方式,一方面可W得到較好的識別效果,另一方面算法 復雜度不高,能夠保證處理速度,減少處理器負擔。
[0101] W上各實施方式,均為對原始視頻中的字幕、角色的面部特征或角色的聲音特征 等角色特征信息進行識別,W提取出原始視頻中對應該角色的相應視頻片段,W便在缺乏 媒體庫的情況下,進行視頻片段的捜索與查找工作,并保障后續(xù)的視頻片段查找、拼接及合 成步驟的順利實現(xiàn)。
[0102] 此外,在根據(jù)媒體庫中提供的現(xiàn)成視頻片段,或者根據(jù)前述各實施方式得到的視 頻片段的基礎(chǔ)上進行拼接及合成時,當用戶想要看到不同角色之間的對話、互動等配合表 演時,此時的目標角色包括至少兩個角色。而如果僅按照其中每個角色的角色信息進行單 獨查找,則只能獲得不同角色的各自對應的視頻片段,而無法甄別出兩個角色之間的配合 表演片段。為了準確地找出兩個角色之間的配合表演片段,需要將兩個不同角色綜合進行 考慮。具體的,在前述圖IC所示的實施方式基礎(chǔ)上,當目標角色中包括有兩個不同的角色, 如第一目標角色和第二目標角色時,根據(jù)目標角色的角色信息獲取目標角色對應的視頻片 段的步驟,具體可W為:根據(jù)第一目標角色的角色信息獲取第一目標角色對應的視頻片段, 并根據(jù)第二目標角色的角色信息獲取第二目標角色對應的視頻片段。
[0103] 因為第一目標角色和第二目標角色是用戶想要看到的相互配合表演的兩個角色, 所W在獲取目標角色所對應的視頻片段時,需要各自根據(jù)兩個不同角色的角色信息,分別 獲取第一目標角色對應的視頻片段,W及第二目標角色對應的視頻片段,W便進行后續(xù)處 理。
[0104] 在獲取到兩個目標角色所對應的視頻片段的基礎(chǔ)上,可W通過判斷兩個目標角色 對應的視頻片段在時間軸上的相對位置和關(guān)系,從而提取出第一目標角色和第二目標角色 在進行對話或者其它配合表演時的整體視頻片段。
[0105] 在上述實施方式的基礎(chǔ)上,對應的,根據(jù)目標角色對應的視頻片段生成目標角色 所對應的捜索視頻的步驟也需要進行相應的調(diào)整。圖3A是本發(fā)明實施例一提供的根據(jù)目標 角色對應的視頻片段生成目標角色所對應的捜索視頻的一種流程示意圖。如圖3A所示,在 前述圖IC的實施方式基礎(chǔ)上,當目標角色中包括有兩個不同的角色,如第一目標角色和第 二目標角色時,根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視頻,其具體可 W包括:
[0106] S132、從第二目標角色對應的視頻片段中,獲取時間軸上位于第一目標角色對應 的視頻片段之前或之后的第二目標角色對應的視頻片段;
[0107] S133、根據(jù)時間軸順序,拼接第一目標角色對應的視頻片段和位于第一目標角色 對應的視頻片段之前或之后的第二目標角色對應的視頻片段,生成第一目標角色對應的捜 索視頻。
[0108] 根據(jù)上述方法,在按照時間軸順序?qū)Φ谝荒繕私巧珜囊曨l片段W及第二目標 角色對應的視頻片段進行拼接時,首先對于每個第一目標角色所對應的視頻片段,均獲取 在時間軸上位于該視頻片段之前或之后的第二目標角色對應的視頻片段。與位于該視頻片 段之前或之后的第二目標角色對應視頻片段,可W為該第一目標角色對應的視頻片段的前 一視頻片段或后一視頻片段,也可W是與該第一目標角色對應視頻片段之間具有一定間隔 的視頻片段,如兩個視頻片段之間的時間間隔小于一定時間闊值等。如首先查找到其中一 個角色所對應的視頻片段,則需要判斷在原始視頻中該視頻片段之前或之后的視頻片段是 否為另一角色所對應的視頻片段,如果是,則說明查找到了第一目標角色與第二目標角色 之間配合表演的視頻片段,將查找到的運兩個視頻片段一起作為目標角色所對應的視頻片 段;而如果查找到的其中一個角色所對應的視頻片段并非是另一個角色所對應的視頻片 段,而是其它角色的或者背景視頻片段,則說明運兩個視頻片段中,第一目標角色與第二目 標角色之間并沒有進行配合演出,故應將運兩個視頻片段舍去。其中,與位于該視頻片段之 前或之后的第二目標角色對應視頻片段,可W為該第一目標角色對應的視頻片段的前一視 頻片段或后一視頻片段,也可W是與該第一目標角色對應視頻片段之間具有一定間隔的視 頻片段,如兩個視頻片段之間的時間間隔小于一定時間闊值等。
[0109] 當查找到滿足條件的第一視頻片段W及位于該第一目標角色對應的視頻片段之 前或之后的第二目標角色對應的視頻片段后,即可將運些視頻片段拼接起來,生成第一目 標角色所對應的視頻片段。
[0110] 根據(jù)上述方法,可W對所有的視頻片段進行查找判斷,從而獲得所有的目標角色 對應的視頻片段,并將運些視頻片段拼接集合起來,從而生成第一目標角色和第二目標角 色配合演出時對應的視頻。如果目標角色有多個時,其查找策略也和兩個角色配合表演時 類似,此處不再寶述。
[0111] 通過上述方法,可W獲得不同角色之間在進行對話、互動等配合表演時的視頻片 段,讓用戶在觀賞到需要的角色時,還能夠獲取更加完善的劇情。
[0112] 進一步的,當查找第一目標角色與第二目標角色對應的視頻片段,并進行視頻片 段的拼接或合成時,為保證所獲取到的視頻片段與目標角色之間具有較強的關(guān)聯(lián)性,還可 W在獲取第二目標角色對應視頻片段時進行進一步約束。圖3B是本發(fā)明實施例一提供的根 據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視頻的另一種流程示意圖。如圖3B 所示,在前述圖IC的基礎(chǔ)上,根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視 頻的步驟,具體可包括:
[0113] S134、從第二目標角色對應的視頻片段中,獲取在時間軸上,對應的上一視頻片段 或下一視頻片段為第一目標角色對應的視頻片段的第二目標角色對應的視頻片段;
[0114] S135、根據(jù)時間軸順序,拼接第一目標角色對應的視頻片段和在時間軸上對應的 上一視頻片段或下一視頻片段為第一目標角色對應的視頻片段的第二目標角色對應的視 頻片段,生成第一目標角色對應的捜索視頻。
[0115] 按照上述步驟,在獲取滿足條件的第二目標角色對應視頻片段時,可W判斷該第 二目標角色對應的視頻片段是否和第一目標角色對應視頻片段相連,即為第一目標角色對 應視頻片段在時間軸上的上一個視頻片段或者下一個視頻片段,如果是,則該第二目標角 色對應的視頻片段就是滿足要求,且能夠與第一目標角色進行拼接合成的第二目標角色對 應視頻片段,如果不是,則該第二目標角色被舍棄。
[0116] 根據(jù)上述條件篩選出所有滿足要求的第二目標角色對應視頻片段后,可W按照時 間軸順序,對運些第二目標角色對應的視頻片段與第一目標角色對應的視頻片段進行拼 接,從而生成第一目標角色對應的捜索視頻。
[0117] 此外,因為目標角色可能與其他角色存在有互動場景,或者在一段關(guān)聯(lián)性較強的 情節(jié)中間隔地出現(xiàn),此時,如果僅僅選擇出現(xiàn)該目標角色的視頻片段,而舍棄了與該目標角 色有較強情節(jié)關(guān)聯(lián)的視頻片段,就會使拼接而成的視頻顯得支離破碎,大大降低了用戶的 觀影體驗。為了避免上述現(xiàn)象,在查找目標角色所對應的視頻片段時,還可W獲取與目標角 色有關(guān)聯(lián)的情節(jié)或場景。具體的,根據(jù)時間軸順序拼接目標角色對應的視頻片段,生成目標 角色對應的捜索視頻可包括W下步驟:當查找到的第一視頻片段與第二視頻片段之間存 在其它角色的視頻片段,且第一視頻片段與第二視頻片段之間的時間軸間隔小于預設(shè)時間 闊值時,將第一視頻片段、第二視頻片段W及在第一視頻片段與第二視頻片段之間的視頻 片段一起作為目標角色對應的視頻片段,其中,第一視頻片段和第二視頻片段均為目標角 色對應的視頻片段,且第一視頻片段和第二視頻片段按時間軸順序排列。
[0118] 其中,第一視頻片段和第二視頻片段均為所查找到的目標角色對應的視頻片段, 且第一視頻片段和第二視頻片段按照時間軸順序前后排列。當?shù)谝灰曨l片段和第二視頻片 段之間的時間軸間隔小于一定值,如預設(shè)時間闊值時,則說明第一視頻片段和第二視頻片 段之間很可能存在情節(jié)關(guān)聯(lián),或者是處于同一場景下。而此時為了保證情節(jié)的流楊性,需要 將第一視頻片段與第二視頻片段之間所有的視頻片段與上述兩個視頻片段一起提取出來, W共同作為目標角色所對應的視頻片段。該段視頻片段中,不僅包含有目標角色所對應的 視頻片段,還可能包含有其它角色或者是動作、場景等視頻片段,運些視頻片段一起構(gòu)成了 該目標角色在某一場景下的一個完整、連貫的故事情節(jié),因而能夠有效地保證用戶的觀影 效果。
[0119] 需要說明的是,用于分辨第一視頻片段和第二視頻片段是否存在情節(jié)或場景關(guān)聯(lián) 的預設(shè)時間闊值,可W設(shè)置為不同的取值,如5-10秒等。此外,也可W根據(jù)原始視頻的不同 類型而設(shè)置不同值,如節(jié)奏較快的動作片,則可將預設(shè)時間闊值設(shè)置的較短,而原始視頻為 節(jié)奏較慢的愛情片等類型時,可W設(shè)置較長的預設(shè)時間闊值,運樣可W進一步提高視頻片 段與目標角色之間對應的準確性。
[0120] 根據(jù)上述方法,可W獲得與目標角色有關(guān)的情節(jié)與場景的整體片段,避免了拼接 而成的視頻過于零碎,而影響到用戶觀影體驗的問題,使用戶可W欣賞到較為完整的情節(jié) 片段。
[0121] 圖4A是本發(fā)明實施例二提供的一種視頻捜索裝置的結(jié)構(gòu)示意圖。本實施例提供的 視頻捜索裝置可W執(zhí)行前述實施例一中所述的視頻捜索方法。具體的,如圖4A所示,本實施 例提供的視頻捜索裝置200具體包括:
[0122] 接收模塊21,用于接收視頻捜索信息,其中,視頻捜索信息中包括目標角色的角色 信息,角色信息用于標識不同角色;
[0123] 視頻獲取模塊22,用于根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段;
[0124] 視頻拼接模塊23,用于根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索 視頻。
[0125] 視頻捜索裝置在獲取不同角色的視頻片段前,首先需要接收到視頻捜索信息,并 通過視頻捜索信息中所包括的目標角色的角色信息而查找到該目標角色對應的所有視頻 片段。運些視頻片段可W是現(xiàn)有的已經(jīng)劃分完成的片段,也可W是先獲取到原始視頻,再根 據(jù)原始視頻而進行劃分的。
[0126] 因為通常角色為某一原始視頻里所特定的人物或其他角色,因而根據(jù)在視頻中不 斷更替出現(xiàn)的不同角色,可W將視頻劃分成為多個視頻片段。圖4B是本發(fā)明實施例二提供 的另一種視頻捜索裝置的結(jié)構(gòu)示意圖。如圖4B所示,為了按照不同角色將原始視頻劃分為 多個片段,視頻捜索裝置還包括角色處理模塊24和視頻處理模塊25,角色處理模塊24用于 在接收視頻捜索信息之前,獲取原始視頻中的各個角色的角色信息,視頻處理模塊25用于 根據(jù)原始視頻中各個角色的角色信息,將原始視頻劃分為多個視頻片段,每個視頻片段對 應一個角色的角色信息。
[0127] 在對原始視頻進行視頻捜索時,需要根據(jù)原始視頻中的角色信息,將原始視頻劃 分成多個視頻片段。具體的,原始視頻中,存在有不同的角色,每個角色出現(xiàn)在原始視頻中 的不同時間段里。運樣,根據(jù)在視頻中不斷更替出現(xiàn)的不同角色,可W將視頻劃分成為多個 視頻片段,每個視頻片段中,均只包含一個人物角色的畫面及聲音,運樣可W將原始視頻按 照出現(xiàn)角色的不同進行分區(qū)或分塊處理,W便后續(xù)的挑選及合成。
[0128] 具體的,可W利用原始視頻中的角色信息,進行原始視頻中的不同角色的標識。角 色信息能夠體現(xiàn)出不同角色的特征,并將特定角色與其它角色區(qū)分出來。一般的,角色信息 可W為視頻字幕中對應的文本特征,也可W是視頻圖像帖中的角色外形特征,或者是視頻 中角色的聲音特征等。
[0129] 利用角色信息對原始視頻進行分段,劃分出多個對應不同角色的視頻片段后,即 可根據(jù)目標角色的角色信息,對所有視頻片段進行篩選,W獲得對應該目標角色的視頻片 段。其中,目標角色的角色信息可W由用戶進行輸入,例如用戶可輸入目標角色的角色名 稱、角色面部的圖片、或者角色的一段聲音等。得到目標角色的角色信息后,即可在視頻片 段中進行檢索與篩選,挑選出符合該目標角色的角色信息的視頻片段。
[0130] 可選的,作為一種可實施的方式,角色信息為原始視頻對應的字幕文件所攜帶的 角色信息,
[0131] 視頻處理模塊25具體用于:
[0132] 根據(jù)原始視頻對應的字幕文件所攜帶的角色信息將字幕文件劃分為多個文本分 段,其中,每個文本分段對應原始視頻中的一個角色;
[0133] 根據(jù)每個文本分段的時間軸信息確定文本分段在原始視頻中對應的視頻片段。
[0134] 當原始視頻由多個分集視頻組成時,可選的,根據(jù)原始視頻對應的字幕文件所攜 帶的角色信息將字幕文件劃分為多個文本分段之前,視頻處理模塊25還用于:
[0135] 當原始視頻包括多個分集視頻片段時,對多個分集視頻片段對應字幕文件的時間 軸信息進行歸一化處理,W使每個字幕文件的時間軸信息對應該字幕文件在原始視頻中的 唯一顯示時間。
[0136] 可選的,作為另一種可實施的方式,角色信息為原始視頻中角色的面部特征信息, 角色處理模塊24具體用于:
[0137] 對原始視頻中每個圖像帖進行人臉識別,W獲得圖像帖的面部特征信息,其中,每 個圖像帖對應原始視頻中一個角色;
[0138] 將每個圖像帖的面部特征信息與面部特征信息數(shù)據(jù)庫中所存儲的面部特征信息 進行比較,W獲得圖像帖的面部特征信息所對應的角色,其中,面部特征信息數(shù)據(jù)庫用于記 錄面部特征信息與角色之間的對應關(guān)系;
[0139] 視頻處理模塊25還用于:根據(jù)每個圖像帖的面部特征信息所對應的角色,將原始 視頻劃分為多個視頻片段。
[0140] 當對原始視頻進行角色識別時,可W對原始視頻進行逐帖的人臉識別過程。面部 特征可W表示唯一的角色,從而對該角色進行標識。獲得原始視頻中各圖像帖的面部特征 信息后,需要將得到的面部特征信息與面部特征信息數(shù)據(jù)庫中所存儲的面部特征信息進行 比對,從而確定圖像帖上的面部特征信息與面部特征信息數(shù)據(jù)庫中所存儲的哪些面部特征 信息相一致。因為面部特征信息數(shù)據(jù)庫中記錄有面部特征信息與角色之間的對應關(guān)系,所 W可W進而得知圖像帖的面部特征信息對應原始視頻中的哪一個人物角色。
[0141] 對原始視頻中的所有圖像帖均提取面部特征信息,并進行角色的檢測識別后,可 W將圖像帖所對應的角色進行統(tǒng)計、整合,從而將圖像帖整合成為視頻片段,每個視頻片段 均對應一個獨立的角色,運樣即可完成視頻片段的劃分工作。
[0142] 可選的,在上述實施方式的基礎(chǔ)上,在根據(jù)原始視頻中的角色信息將原始視頻劃 分為多個視頻片段之前,角色處理模塊24還可W用于:
[0143] 對原始視頻中每個圖像帖進行人臉識別,并采集識別出人臉的圖像帖中的面部特 征信息;
[0144] 對面部特征信息進行模式識別,W檢測面部特征信息所對應的角色;
[0145] 將面部特征信息與面部特征信息所對應的角色登記在面部特征信息數(shù)據(jù)庫中。
[0146] 其中,可首先對原始視頻中所有的圖像帖進行遍歷,每個圖像帖均進行人臉識別 過程,并將可識別出人臉的圖像帖中的面部特征信息提取出來;然后通過機器學習和人工 智能算法對面部特征信息進行模式識別,將相似度超過一定闊值的面部特征信息進行歸類 和集成,從而得到面部特征信息所對應的角色;最后,可將面部特征信息與該面部特征信息 所對應的角色登記在面部特征信息數(shù)據(jù)庫之中,W便在后續(xù)的視頻片段劃分步驟中進行面 部特征信息的查詢與比對。
[0147] 可選的,作為另一種可實施的方式,角色信息為原始視頻中角色的聲音特征信息, 此時,角色處理模塊24具體用于:
[0148] 對原始視頻中每個聲音片段進行聲音識別,W獲得每個聲音片段的聲音特征信 息,其中,媒體聲音片段對應原始視頻中一個角色;
[0149] 將每個聲音片段的聲音特征信息與聲音特征信息數(shù)據(jù)庫中所存儲的聲音特征信 息進行比較,W獲得聲音片段的聲音特征信息所對應的角色,其中,聲音特征信息數(shù)據(jù)庫用 于記錄聲音特征信息與角色之間的對應關(guān)系;
[0150] 視頻處理模塊25用于根據(jù)每個聲音片段的聲音特征信息所對應的角色,將原始視 頻劃分為多個視頻片段。
[0151] 在獲得每個聲音片段的聲音特征信息后,需要將得到的聲音特征信息與聲音特征 信息數(shù)據(jù)庫中所存儲的聲音特征信息進行比對,W得知聲音特征信息對應著原始視頻中 的哪一個人物角色。其后,即可將不同的聲音片段所對應的視頻部分進行劃分、整合,從而 將原始視頻劃分為對應不同角色的多個視頻片段。
[0152] 通過角色的聲音特征信息進行角色的識別和視頻片段的劃分,因為聲音特征信息 是通過提取視頻中的音頻而得到,其數(shù)據(jù)量較少,所W可W在準確識別的同時,減少對視頻 的處理時間??蛇x的,在上一實施方式的基礎(chǔ)上,在根據(jù)原始視頻中的角色信息將原始視頻 劃分為多個視頻片段之前,角色處理模塊24還可W用于:
[0153] 對原始視頻中每個聲音片段進行聲音識別,并采集識別出人聲的聲音片段中的聲 音特征信息;
[0154] 對聲音特征信息進行模式識別,W檢測聲音特征信息所對應的角色;
[0155] 將聲音特征信息與聲音特征信息所對應的角色登記在聲音特征信息數(shù)據(jù)庫中。
[0156] 其中,可選的,角色處理模塊24具體還可W用于:
[0157] 根據(jù)隱式馬爾可夫模型方法和矢量量化聚類方法對聲音特征信息進行模式識別, W檢測聲音特征信息所對應的角色。
[0158] 得到了目標角色對應的視頻片段后,因為視頻片段之間均具有一定的時間先后順 序,所W在獲取了目標角色對應的視頻片段后,視頻拼接模塊23具體用于:
[0159] 根據(jù)時間軸順序拼接目標角色對應的視頻片段,生成目標角色對應的捜索視頻。
[0160] 可選的,作為另一種可實施的方式,視頻拼接模塊23具體可W用于:
[0161 ]根據(jù)時間軸順序拼接目標角色對應的所有視頻片段,并作為目標角色所對應的視 頻。
[0162] 按照時間軸順序?qū)σ曨l片段進行拼接,可W保證目標角色對應視頻的在時間上具 有順序性和邏輯性,保證用戶的觀影體驗。
[0163] 可選的,作為另一種可實施的方式,目標角色包括第一目標角色和第二目標角色, 視頻獲取模塊22具體用于:
[0164] 根據(jù)第一目標角色的角色信息獲取第一目標角色對應的視頻片段,并根據(jù)第二目 標角色的角色信息獲取第二目標角色對應的視頻片段。
[0165] 可選的,作為另一種可實施的方式,視頻拼接模塊23包括:
[0166] 確定子模塊231,用于從第二目標角色對應的視頻片段中,確定在時間軸上對應的 上一視頻片段或下一視頻片段為第一目標角色對應的視頻片段的第二目標角色對應的視 頻片段;
[0167] 拼接子模塊232,用于根據(jù)時間軸順序,拼接第一目標角色對應的視頻片段和在時 間軸上對應的上一視頻片段或下一視頻片段為第一目標角色對應的視頻片段的第二目標 角色對應的視頻片段,生成第一目標角色對應的捜索視頻。
[0168] 此外,視頻獲取模塊22還可W用于:
[0169] 當查找到的第一視頻片段與第二視頻片段之間存在其它角色的視頻片段,且第一 視頻片段與第二視頻片段之間的時間軸間隔小于預設(shè)時間闊值時,將第一視頻片段、第二 視頻片段W及在第一視頻片段與第二視頻片段之間的所有視頻片段一起作為目標角色對 應的視頻片段,其中,第一視頻片段和第二視頻片段均為目標角色對應的視頻片段,且第一 視頻片段和第二視頻片段按時間軸順序排列。
[0170] 基于上述實施例的技術(shù)方案,可W根據(jù)角色的角色信息對原始視頻進行劃分,得 到分別屬于不同角色的視頻片段,用戶在觀看時,即可通過輸入特定的角色,而查找并觀看 到視頻中該角色所對應的部分片段,用戶在觀看視頻時自由度更高,具有更佳的觀影體驗。
[0171] 本實施例中,為了滿足用戶希望獲取自己所關(guān)注的角色所對應的視頻片段的需 求,視頻捜索裝置可具體包括用于接收視頻捜索信息的接收模塊,其中,視頻捜索信息中包 括有目標角色的角色信息,角色信息用于標識不同角色,用于根據(jù)目標角色的角色信息獲 取目標角色對應的視頻片段的視頻獲取模塊,W及用于根據(jù)目標角色對應的視頻片段生成 目標角色所對應的捜索視頻的視頻拼接模塊,且其中每個視頻片段對應一個角色,角色信 息用于標識原始視頻中的不同角色。運樣可W讓用戶觀看到視頻中自己所關(guān)注的角色所對 應的部分片段,省去了用戶自己手動捜索、調(diào)整播放進度的過程,有效提高了用戶的觀影體 驗,滿足了用戶的個性化視頻捜索需求。
[0172] 圖5是本發(fā)明實施例=提供的視頻捜索裝置的結(jié)構(gòu)示意圖。本實施例中的視頻捜 索裝置用于執(zhí)行前述實施例一中的視頻捜索方法,具體的處理流程,與上述方法的處理流 程相同,在此本發(fā)明實施例不再累述。如圖5所示,本實施例提供的視頻捜索裝置具體包括:
[0173] 接收器31,用于接收視頻捜索信息,其中,該視頻捜索信息中包括目標角色的角色 信息,該角色信息用于標識不同角色;
[0174] 存儲器32,用于存儲程序;具體地,程序可W包括程序代碼,程序代碼包括計算機 操作指令。
[0175] 處理器33,用于執(zhí)行存儲器32所存儲的程序,W根據(jù)目標角色的角色信息獲取目 標角色對應的視頻片段;并根據(jù)目標角色對應的視頻片段生成目標角色所對應的捜索視 頻。
[0176] 此外,可選的,視頻捜索裝置還包括:
[0177] 視頻獲取接口 34,用于獲取原始視頻;
[0178] 處理器33還用于:根據(jù)原始視頻中各個角色的角色信息,將原始視頻劃分為多個 視頻片段,每個視頻片段對應一個角色的角色信息。
[0179] 其中,接收器31和視頻獲取接口 34與智能電視或者其他播放終端進行連接,用于 獲取及輸出各種數(shù)據(jù)及指令。存儲器32可W包含各種RAM存儲器或者非易失性存儲器(non? volatile memoir)。而處理器 33 的形式可能為中央處理器 (Central Processing Unit,簡 稱為CPU),或者是特定集成電路(Application Specific Integrated Circuit,簡稱為 ASIC),再或者是被配置成實施本發(fā)明實施例的一個或多個集成電路。處理器33是視頻捜索 裝置的控制中屯、,利用各種接口和線路連接整個裝置的各個部分,通過運行或執(zhí)行存儲在 存儲器32內(nèi)的軟件程序和/或模塊,W及調(diào)用存儲在存儲器32內(nèi)的數(shù)據(jù),執(zhí)行裝置的各種功 能和處理數(shù)據(jù),從而實現(xiàn)視頻捜索功能。
[0180] 在具體實現(xiàn)上,如果接收器31、視頻獲取接口 34、處理器33和存儲器32獨立實現(xiàn), 則接收器31、視頻采集接口 34、處理器33和存儲器32可W通過總線相互連接并完成相互間 的通信。所述總線可W是工業(yè)標準體系結(jié)構(gòu)(Indushy Standard Architecture,簡稱為 ISA)總線、外部設(shè)備互連(Peripheral Component,簡稱為PCI)總線或擴展工業(yè)標準體系結(jié) 構(gòu)巧Xtended IndustiT Standard A;rchitec1:ure,簡稱為EISA)總線等??偩€可W分為地址 總線、數(shù)據(jù)總線、控制總線等。為便于表示,圖中僅用一條粗線表示,但并不表示僅有一根總 線或一種類型的總線。
[0181] 本實施例中,視頻捜索裝置可先通過接收器接收視頻捜索信息,其中,視頻捜索信 息中包括有目標角色的角色信息,角色信息用于標識不同角色;再通過處理器讀取存儲器 中的程序,W根據(jù)目標角色的角色信息獲取目標角色對應的視頻片段;最后根據(jù)目標角色 對應的視頻片段生成目標角色所對應的捜索視頻。運樣可W讓用戶觀看到視頻中自己所關(guān) 注的角色所對應的部分片段,省去了用戶自己手動捜索、調(diào)整播放進度的過程,有效提高了 用戶的觀影體驗,滿足了用戶的個性化視頻捜索需求。
[0182] 最后應說明的是:W上各實施例僅用W說明本發(fā)明的技術(shù)方案,而非對其限制;盡 管參照前述各實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依 然可W對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分或者全部技術(shù)特征進 行等同替換;而運些修改或者替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù) 方案的范圍。
【主權(quán)項】
1. 一種視頻搜索方法,其特征在于,包括: 接收視頻搜索信息,其中,所述視頻搜索信息中包括目標角色的角色信息,所述角色信 息用于標識不同角色; 根據(jù)所述目標角色的角色信息獲取所述目標角色對應的視頻片段; 根據(jù)所述目標角色對應的視頻片段生成所述目標角色對應的搜索視頻。2. 根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,所述接收視頻搜索信息之前,還 包括: 獲取原始視頻中各個角色的角色信息; 根據(jù)所述原始視頻中各個所述角色的角色信息,將所述原始視頻劃分為多個視頻片 段,每個所述視頻片段對應一個所述角色的角色信息。3. 根據(jù)權(quán)利要求1-2任一項所述的視頻搜索方法,其特征在于,所述根據(jù)所述目標角色 對應的視頻片段生成所述目標角色對應的搜索視頻,具體包括: 根據(jù)時間軸順序拼接所述目標角色對應的視頻片段,生成所述目標角色對應的搜索視 頻。4. 根據(jù)權(quán)利要求3所述的視頻搜索方法,其特征在于,所述目標角色包括第一目標角色 和第二目標角色,所述根據(jù)所述目標角色的角色信息獲取所述目標角色對應的視頻片段, 具體包括: 根據(jù)所述第一目標角色的角色信息獲取所述第一目標角色對應的視頻片段,并根據(jù)所 述第二目標角色的角色信息獲取所述第二目標角色對應的視頻片段。5. 根據(jù)權(quán)利要求4所述的視頻搜索方法,其特征在于,所述根據(jù)時間軸順序拼接所述目 標角色對應的視頻片段,生成所述目標角色對應的搜索視頻,具體包括: 從所述第二目標角色對應的視頻片段中,獲取時間軸上位于所述第一目標角色對應的 視頻片段之前或之后的所述第二目標角色對應的視頻片段; 根據(jù)時間軸順序,拼接所述第一目標角色對應的視頻片段和位于所述第一目標角色對 應的視頻片段之前或之后的所述第二目標角色對應的視頻片段,生成所述第一目標角色對 應的搜索視頻。6. 根據(jù)權(quán)利要求4所述的視頻搜索方法,其特征在于,所述根據(jù)時間軸順序拼接所述目 標角色對應的視頻片段,生成所述目標角色對應的搜索視頻,具體包括: 從所述第二目標角色對應的視頻片段中,獲取在時間軸上,對應的上一視頻片段或下 一視頻片段為所述第一目標角色對應的視頻片段的所述第二目標角色對應的視頻片段; 根據(jù)時間軸順序,拼接所述第一目標角色對應的視頻片段和在時間軸上對應的上一視 頻片段或下一視頻片段為所述第一目標角色對應的視頻片段的所述第二目標角色對應的 視頻片段,生成所述第一目標角色對應的搜索視頻。7. -種視頻搜索裝置,其特征在于,包括: 接收模塊,用于接收視頻搜索信息,其中,所述視頻搜索信息中包括目標角色的角色信 息,所述角色信息用于標識不同角色; 視頻獲取模塊,用于根據(jù)目標角色的角色信息獲取所述目標角色對應的視頻片段; 視頻拼接模塊,用于根據(jù)所述目標角色對應的視頻片段生成所述目標角色對應的搜索 視頻。8. 根據(jù)權(quán)利要求7所述的視頻搜索裝置,其特征在于,所述視頻搜索裝置還包括: 角色獲取模塊,用于獲取原始視頻中的各個角色的角色信息; 視頻處理模塊,用于根據(jù)所述原始視頻中各個所述角色的角色信息,將所述原始視頻 劃分為多個視頻片段,每個所述視頻片段對應一個所述角色的角色信息。9. 根據(jù)權(quán)利要求7-8任一項所述的視頻搜索裝置,其特征在于,所述視頻拼接模塊具體 用于: 根據(jù)時間軸順序拼接所述目標角色對應的視頻片段,生成所述目標角色對應的搜索視 頻。10. 根據(jù)權(quán)利要求9所述的視頻搜索裝置,所述目標角色包括第一目標角色和第二目標 角色,其特征在于,所述視頻獲取模塊具體用于: 根據(jù)所述第一目標角色的角色信息獲取所述第一目標角色對應的視頻片段,并根據(jù)所 述第二目標角色的角色信息獲取所述第二目標角色對應的視頻片段。11. 根據(jù)權(quán)利要求10所述的視頻搜索裝置,其特征在于,所述視頻拼接模塊包括: 確定子模塊,用于從所述第二目標角色對應的視頻片段中,確定在時間軸上對應的上 一視頻片段或下一視頻片段為第一目標角色對應的視頻片段的所述第二目標角色對應的 視頻片段; 拼接子模塊,用于根據(jù)時間軸順序,拼接所述第一目標角色對應的視頻片段和在時間 軸上對應的上一視頻片段或下一視頻片段為第一目標角色對應的視頻片段的所述第二目 標角色對應的視頻片段,生成所述第一目標角色對應的搜索視頻。12. -種視頻搜索裝置,其特征在于,包括: 接收器,用于接收視頻搜索信息,其中,所述視頻搜索信息中包括目標角色的角色信 息,所述角色信息用于標識不同角色; 存儲器,用于存儲程序; 處理器,用于執(zhí)行所述存儲器存儲的程序,以根據(jù)目標角色的角色信息獲取所述目標 角色對應的視頻片段,并根據(jù)所述目標角色對應的視頻片段生成所述目標角色對應的搜索 視頻。13. 根據(jù)權(quán)利要求12所述的視頻搜索裝置,其特征在于,還包括: 視頻獲取接口,用于獲取原始視頻; 所述處理器還用于:根據(jù)所述原始視頻中各個所述角色的角色信息,將所述原始視頻 劃分為多個視頻片段,每個所述視頻片段對應一個所述角色的角色信息。
【文檔編號】G06F17/30GK106021496SQ201610341232
【公開日】2016年10月12日
【申請日】2016年5月19日
【發(fā)明人】馬宏, 王峰, 匡濤, 任曉楠
【申請人】海信集團有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1