亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

通過媒體內(nèi)容的語音搜索元數(shù)據(jù)的制作方法

文檔序號:9727371閱讀:321來源:國知局
通過媒體內(nèi)容的語音搜索元數(shù)據(jù)的制作方法
【專利說明】
[0001] 相關(guān)申請的交叉引用
[0002] 本申請要求提交于2014年10月3日的美國臨時(shí)專利申請No. 62/059, 703的利益, 其通過引用全部并入本文。
技術(shù)領(lǐng)域
[0003] 本公開一般涉及媒體內(nèi)容回放和交互。
【背景技術(shù)】
[0004] 經(jīng)由數(shù)字化視頻光盤(DVD)或錄像機(jī)(VCR)與媒體內(nèi)容交互的傳統(tǒng)方法一般依賴 于致動(dòng)回放按鈕或控件。例如,用戶可快進(jìn)或倒放媒體內(nèi)容的部分,例如,電影的場景,以實(shí) 現(xiàn)用戶希望查看或體驗(yàn)的特定部分的媒體內(nèi)容的回放。諸如智能手機(jī)、膝上型個(gè)人計(jì)算機(jī) (PC)等等的設(shè)備上的媒體交互在被流傳送到或下載到設(shè)備的媒體內(nèi)容的回放期間模仿該 類控制。

【發(fā)明內(nèi)容】

[0005] 根據(jù)一個(gè)實(shí)施例,一種計(jì)算機(jī)實(shí)施的方法包括經(jīng)由用戶設(shè)備從用戶接收語音輸 入。計(jì)算機(jī)實(shí)施的方法進(jìn)一步包括基于語音用戶輸入搜索媒體內(nèi)容的至少一部分。此外, 計(jì)算機(jī)實(shí)施的方法包括經(jīng)由用戶設(shè)備提供對媒體內(nèi)容的至少一部分的訪問。
[0006] 根據(jù)另一個(gè)實(shí)施例,一種裝置包括內(nèi)容數(shù)據(jù)庫,其包含一個(gè)或更多個(gè)媒體內(nèi)容文 件。裝置進(jìn)一步包括聲音識別單元,其經(jīng)配置識別表示搜索一個(gè)或更多個(gè)媒體內(nèi)容文件的 至少一部分的語音命令。此外,裝置包括搜索引擎,其經(jīng)配置基于識別的語音命令搜索一個(gè) 或更多個(gè)媒體內(nèi)容文件的至少一部分。
[0007] 根據(jù)另一個(gè)實(shí)施例,一種設(shè)備包括處理器,以及包括計(jì)算機(jī)程序代碼的存儲器。存 儲器和所述計(jì)算機(jī)程序代碼經(jīng)配置利用處理器使設(shè)備執(zhí)行至少以下內(nèi)容:顯示用戶界面, 其適于接收請求搜索媒體內(nèi)容的一個(gè)或更多個(gè)部分的語音輸入;將語音輸入傳送到媒體內(nèi) 容服務(wù)器,其經(jīng)配置執(zhí)行搜索媒體內(nèi)容的一個(gè)或更多個(gè)部分;以及從媒體內(nèi)容服務(wù)器接收 搜索結(jié)果,以用于呈現(xiàn)在設(shè)備上,其中搜索結(jié)果以與語音輸入的相關(guān)性水平相當(dāng)?shù)姆绞匠?現(xiàn)。
【附圖說明】
[0008] 根據(jù)一個(gè)或更多個(gè)不同實(shí)施例,參考以下附圖詳細(xì)描述了本公開。附圖被提供用 于僅說明的目的,并且僅僅示出典型或示例實(shí)施例。
[0009] 圖1示出其中可實(shí)施各種實(shí)施例的示例環(huán)境。
[0010] 圖2為根據(jù)各種實(shí)施例示出用于通過視頻文件進(jìn)行語音搜索的示例過程的操作 流程圖。
[0011] 圖3根據(jù)各種實(shí)施例示出用于執(zhí)行語音搜索的示例用戶界面。
[0012] 圖4A根據(jù)實(shí)施例示出用于執(zhí)行語音搜索并顯示搜索結(jié)果的示例簡單用戶界面。
[0013] 圖4B根據(jù)另一個(gè)實(shí)施例示出用于執(zhí)行語音搜索并顯示搜索結(jié)果的示例高級用戶 界面。
[0014] 圖5根據(jù)一個(gè)實(shí)施例示出用于呈現(xiàn)搜索結(jié)果的示例用戶界面。
[0015] 圖6為可用于實(shí)施本公開中描述的實(shí)施例的各種特征的示例計(jì)算模塊。
[0016] 附圖不是詳盡的并且不將本公開局限于所公開的精確形式。
【具體實(shí)施方式】
[0017] 如先前所描述,與媒體交互的傳統(tǒng)方法可包括用戶快進(jìn)或倒放媒體內(nèi)容,以實(shí)現(xiàn) 特定部分的媒體內(nèi)容的回放。在DVD的情況下,希望查看電影中的特定場景的用戶通常在 回放期間快進(jìn)和倒放電影,直到達(dá)到所需的場景。可替代地,用戶可跳到電影的特定"章 節(jié)"。然而,通過傳統(tǒng)交互方法能夠?qū)崿F(xiàn)的間隔尺寸(granularity)水平通常為粗略或不精 確的。
[0018] 使用具有小顯示器(相對于傳統(tǒng)TV或監(jiān)視器)的智能手機(jī)或平板PC能夠通常使 傳統(tǒng)媒體交互的不精確性質(zhì)惡化。這是因?yàn)樵擃愒O(shè)備上的回放控件或機(jī)制也是相當(dāng)小的。
[0019] 此外,搜索媒體內(nèi)容的傳統(tǒng)方法依賴于僅文本搜索,并且通常僅檢索完整版本的 媒體內(nèi)容,或者在基于諸如副標(biāo)題信息的僅文本元數(shù)據(jù)的電影媒體背景下檢索具體'幀'。
[0020] 因此,本公開中描述的各種實(shí)施例提供系統(tǒng)和方法,其允許用戶使用語音命令或 輸入來搜索用戶所感興趣的媒體內(nèi)容(例如,一個(gè)或更多個(gè)電影)的一個(gè)或更多個(gè)部分 (例如,一個(gè)或更多個(gè)場景)。本公開背景下的媒體內(nèi)容能夠?yàn)槿魏晤愋偷拿襟w內(nèi)容,諸如 電影、音樂、音頻書籍等等。用戶不局限于經(jīng)由語音命令或輸入在回放期間搜索單個(gè)媒體 內(nèi)容的特定部分。例如,用戶可搜索一個(gè)或更多個(gè)內(nèi)容存儲庫、數(shù)字圖書館或數(shù)據(jù)庫中的內(nèi) 容。此外,并且基于由用戶發(fā)出的特定語音命令,能夠訪問、生成和/或呈現(xiàn)截短版本的媒 體,例如,拼接在一起的故事情節(jié)、相關(guān)場景等等。
[0021] 圖1為示出其中能夠?qū)嵤└鞣N實(shí)施例的示例環(huán)境的圖示。圖1示出用于提供媒體 內(nèi)容的語音搜索的系統(tǒng)100。如圖1中所示,系統(tǒng)100能夠包括用戶設(shè)備102。用戶設(shè)備102 可包括處理器104和存儲器單元106,并且能夠經(jīng)配置接收呈現(xiàn)在顯示器108上的數(shù)字媒體 內(nèi)容。用戶設(shè)備102可進(jìn)一步經(jīng)配置訪問在內(nèi)容數(shù)據(jù)庫或存儲庫(諸如電子程序向?qū)А⒃?線媒體存儲等等)上存儲的媒體內(nèi)容列表。如先前所提到的,設(shè)備102可為平板PC、智能手 機(jī)、膝上型PC等等。
[0022] 系統(tǒng)100可進(jìn)一步包括媒體服務(wù)器112,其可以由內(nèi)容提供商操作,諸 如電纜提供商(例如,COMCAST" )、YouTube'數(shù)字媒體內(nèi)容分發(fā)商,諸如 Amazon?n iTunes?、NetHix%或其他第二方分發(fā)商。媒體服務(wù)器112可包括其上能 夠存儲數(shù)字媒體內(nèi)容的內(nèi)容數(shù)據(jù)庫114。媒體服務(wù)器112還進(jìn)一步包括搜索引擎116,以用 于基于用戶的語音命令或輸入執(zhí)行媒體內(nèi)容的或媒體內(nèi)容的部分的搜索。搜索引擎116可 包括語音識別/聲音到文本引擎(或其他轉(zhuǎn)換引擎),以用于接收和分析用戶的語音命令或 輸入或?qū)⒂脩舻恼Z音命令或輸入轉(zhuǎn)換為搜索引擎116能夠理解和跟隨的搜索指令。進(jìn)一步 地,系統(tǒng)100可包括第三方內(nèi)容提供商120,其可包括和/或控制其自己的內(nèi)容數(shù)據(jù)庫122。 在某些情況下,第三方內(nèi)容提供商120可從媒體服務(wù)器112提供內(nèi)容(例如,通過訪問內(nèi)容 數(shù)據(jù)庫114以及將媒體傳送到用戶設(shè)備102)。應(yīng)指出的是,系統(tǒng)100可包括更多或更少的 媒體服務(wù)器、內(nèi)容提供商和/或用戶設(shè)備。
[0023] 能夠經(jīng)由網(wǎng)絡(luò)110完成媒體服務(wù)器112、第三方內(nèi)容提供商120和/或用戶設(shè)備 102中的一個(gè)或更多個(gè)之間的通信。網(wǎng)絡(luò)110可以是任何通信網(wǎng)絡(luò),諸如蜂窩式或數(shù)據(jù)網(wǎng) 絡(luò)、衛(wèi)星網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)、虛擬專用網(wǎng)(VPN)、局域網(wǎng)(LAN)、無線LAN(WLAN)、廣域網(wǎng) (WAN)、個(gè)人區(qū)域網(wǎng)(PAN)、一部分互聯(lián)網(wǎng)、一部分公用交換電話網(wǎng)(PSTN),或它們的任何組 合。因此,網(wǎng)絡(luò)110可采用各種通信介質(zhì),諸如同軸電纜、光纖電纜系統(tǒng)、以太網(wǎng)、無線電波 等等。
[0024] 根據(jù)各種實(shí)施例,能夠使用元數(shù)據(jù)完成搜索或搜遍媒體內(nèi)容。也就是說,元數(shù)據(jù)能 夠1)包括在諸如生產(chǎn)者或編輯者等發(fā)起者的媒體內(nèi)容中,2)在媒體內(nèi)容文件(場景描述、 時(shí)間、位置、字符)的制作或編輯期間,由計(jì)算機(jī)自動(dòng)地生成,以及/或者3)由一個(gè)或更多 個(gè)用戶生成。在YouTube"·媒體內(nèi)容的情況下,例如,元數(shù)據(jù)能夠包括用戶插入的關(guān)鍵字、 標(biāo)簽、標(biāo)題、注釋等等。在播音室制作的媒體內(nèi)容的情況下,元數(shù)據(jù)可包括幀信息、索引信 息、到增強(qiáng)的或補(bǔ)充的內(nèi)容的鏈接等等。應(yīng)指出的是,各種類型的媒體內(nèi)容中的元數(shù)據(jù)的類 型和/或量能夠不同。例如,作為內(nèi)容其本身為計(jì)算機(jī)生成的結(jié)果,計(jì)算機(jī)動(dòng)畫媒體內(nèi)容可 具有與其關(guān)聯(lián)的大量元數(shù)據(jù)(例如,關(guān)于對象的元數(shù)據(jù))。
[0025] 此外,元數(shù)據(jù)能夠在任何時(shí)間(例如,在制作期間,或在由用戶查看之后)與媒體 內(nèi)容關(guān)聯(lián)。例如,已經(jīng)查看或體驗(yàn)特定的一段媒體內(nèi)容的用戶可提供反饋或"第三方"元數(shù) 據(jù),其能夠從粉絲網(wǎng)站或社交媒體出口和服務(wù)被訪問、挖掘、聚合等等。該類第三方元數(shù)據(jù) 然后能夠與媒體內(nèi)容關(guān)聯(lián),并隨后被索引。此外,如本文所述的元數(shù)據(jù)可進(jìn)一步包括時(shí)間元 數(shù)據(jù),其能夠提供基于時(shí)間的信息以及/或者提供對關(guān)于其自己的或與其他類型元數(shù)據(jù)結(jié) 合的媒體內(nèi)容的一個(gè)或更多個(gè)部分的訪問。例如,能夠包括表示在媒體內(nèi)容時(shí)間線上的情 緒的時(shí)間元數(shù)據(jù),其中用戶能夠根據(jù)情緒搜索特定章節(jié)、場景、鏡頭,或者例如,跳過媒體內(nèi) 容的令人沮喪的部分。
[0026] 該類元數(shù)據(jù)能夠作為嵌入元數(shù)據(jù)、鏈接元數(shù)據(jù)等等與特定媒體內(nèi)容文件或電影 (幀組)中的特定場景或照相機(jī)鏡頭角度關(guān)聯(lián)。場景能夠是具有開始幀和結(jié)束幀的幀序列, 其中幀涉及故事的事件、角色或地點(diǎn)。元數(shù)據(jù)能夠包括但不限于以下內(nèi)容:男演員(一個(gè)或 更多個(gè))/女演員名字(一個(gè)或更多個(gè))(實(shí)際名字和人物角色名字);電影原聲帶歌曲的 歌詞;電影對話框;歌曲名;場景標(biāo)題;場景描述;影片地點(diǎn);拍攝地點(diǎn);故事地點(diǎn)、特定場 景中所示出或包含的產(chǎn)品;情感;對象;動(dòng)作;聲學(xué)或音頻指紋;關(guān)鍵詞;和/或可與媒體內(nèi) 容的一個(gè)或更多個(gè)部分關(guān)聯(lián)的任何其他標(biāo)記??商娲鼗虺嗽獢?shù)據(jù)之外,副標(biāo)題能夠被 利用作為用于媒體內(nèi)容搜索的基礎(chǔ)。
[0027] 在發(fā)送媒體內(nèi)
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1