專利名稱:一種提供文本文件信息的方法、系統(tǒng)及服務端的制作方法
技術領域:
本發(fā)明涉及互聯(lián)網(wǎng)領域,特別是涉及一種提供文本文件的方法、系統(tǒng)及服 務端信息。
背景技術:
隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,互聯(lián)網(wǎng)上的流J(某體資源(音頻及視頻)的數(shù) 量不斷增長。目前互聯(lián)網(wǎng)上聚合大量的流媒體資源,但是較多的流媒體文件(例
如AVI格式的電影文件等)中無字幕(文本文件),或者原有字幕中所用的語 言與用戶期望看到的字幕語言不同,因此用戶需要手動查找并下載其期望的字 幕文件,字幕文件(文本文件)中記錄了臺詞及每句臺詞顯示的時間,可通過 特定的插件將字幕(文本文件)嵌入流i某體文件中。
為了實現(xiàn)字幕與流媒體播放同步,符合用戶的感官體驗,要求字幕的出現(xiàn) 與流媒體文件的播放一致。但是互聯(lián)網(wǎng)上流媒體資源的數(shù)量較大,同一個流媒 體文件可能存在多個不同的版本,其播放時長也可能不同,而且一個流士某體文 件還可能被分割為多個片段,因此同一個流媒體文件可能存在多個版本的字幕 文件(文本文件)。
現(xiàn)有的字幕(文本文件)下載,需要用戶手動搜索和選擇,以下載與流媒 體文件對應的字幕文件。目前用戶搜索一個流i某體文件對應的字幕文件時,流 媒體文件與字幕文件的對應僅限于通過關鍵字(例如文件名稱)和文件分段信 息(例如一個流媒體文件被分為3個片段),用戶需要從多個搜索結(jié)果中選擇 對應的字幕文件,只能將每個字幕文件嵌入流媒體文件中,并通過實際體驗來 判斷該字幕文件是否與該流媒體文件對應,而且找到對應的字幕文件后,用戶 需要手動下載并將字幕文件(文本文件)與流媒體文件進行關聯(lián),操作繁瑣。
發(fā)明人在發(fā)明過程中發(fā)現(xiàn),現(xiàn)有技術不能實現(xiàn)準確提供與流媒體文件對應 的字幕文件(文本文件)信息。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種提供文本文件的方法、系統(tǒng)及服務端,以實現(xiàn)準確 提供與流々某體文件對應的文本文件信息。
本發(fā)明實施例的方法包括確定終端當前新建任務所指向的流i某體文件; 獲取該流媒體文件的文件標識,并根據(jù)對應關系獲得與該流媒體文件對應的文 本文件的文件標識;根據(jù)獲得的文本文件的文件標識向終端提供文本文件信 息。
本發(fā)明實施例的系統(tǒng)包括終端,用于新建任務;服務端,用于確定終端 當前新建任務所指向的流i某體文件,獲取該流^ 某體文件的文件標識,并根據(jù)對 應關系獲得與該流媒體文件對應的文本文件的文件標識,以及根據(jù)獲得的文本 文件的文件標識向終端提供文本文件信息。
本發(fā)明實施例的服務端包括確定單元,用于確定終端當前新建任務所指 向的流媒體文件;第一獲取單元,用于獲取該流媒體文件的文件標識;第二獲 取單元,用于根據(jù)對應關系獲取與該流媒體文件對應的文本文件的文件標識; 提供單元,用于根據(jù)文本文件的文件標識向終端提供文本文件信息。
本發(fā)明實施例中,服務端獲取流媒體文件和文本文件的相關信息,并分別 計算所述相關信息相互匹配的流if某體文件和文本文件的文件標識,以及建立對 應關系。預先建立對應關系后,服務端確定終端當前新建任務所指向的流々某體 文件,獲取該流+某體文件的文件標識,并根據(jù)對應關系獲得與該流媒體文件對 應的文本文件的文件標識,以及根據(jù)獲得的文本文件的文件標識向終端提供文 本文件信息。因此本發(fā)明實施例能夠?qū)崿F(xiàn)準確提供與流媒體文件對應的文本文 件信息。
圖1為本發(fā)明實施例中的方法步驟流程圖; 圖2為本發(fā)明實施例中的系統(tǒng)結(jié)構(gòu)示意圖; 圖3為本發(fā)明實施例中的服務端結(jié)構(gòu)示意圖之一; 圖4為本發(fā)明實施例中的服務端結(jié)構(gòu)示意圖之二; 圖5為本發(fā)明實施例中的服務端結(jié)構(gòu)示意圖之三; 圖6為本發(fā)明方法實施例1的步驟流程圖; 圖7為本發(fā)明方法實施例2的步驟流程圖; 圖8為本發(fā)明方法實施例3的步驟流程圖。
具體實施例方式
為了實現(xiàn)準確提供與流媒體文件對應的文本文件信息,本發(fā)明實施例提供 一種提供文本文件信息的方法、系統(tǒng)及服務端,以下分別簡要概述。
本發(fā)明實施例提供一種提供文本文件信息的方法,在預先建立一些對應關 系(可將其保存在數(shù)據(jù)庫中)后,參見圖l所示,執(zhí)行下列主要步驟
51、 確定終端當前新建任務所指向的流媒體文件;
52、 獲取該流媒體文件的文件標識,并根據(jù)對應關系獲得與該流^ 某體文件 對應的文本文4牛的文〗牛標識;
53、 根據(jù)獲得的文本文件的文件標識向終端提供文本文件信息。 所述文件標識可為文件名或內(nèi)容簽名(ContentIdentity, CID)等。其中,
內(nèi)容簽名CID是根據(jù)預設的算法對二進制文件的內(nèi)容數(shù)據(jù)進行計算后獲得的。 預設的算法可以是對不同的二進制文件的內(nèi)容數(shù)據(jù)進行處理得到不同的處理 結(jié)果的任一算法,其處理結(jié)果(即內(nèi)容簽名)可唯一標識二進制文件,或者, 也可以是處理結(jié)果重復率極低,在可接受范圍內(nèi)的算法。
所述預先建立對應關系的步驟包括服務端獲取流媒體文件和文本文件的 相關信息,分別獲取相關信息相互匹配的流i某體文件和文本文件的文件標識,
并建立其對應關系。
以下依次描述獲取并匹配相關信息、獲取文件標識、建立對應關系的具體 步驟。
獲取并匹配相關信息的步驟流媒體文件和文本文件的相關信息均至少包 括文件名稱和播放時長,還可以包括文件類型等。服務端獲取文件的相關信 息時,可直接獲取文件名稱,可通過下述方式獲取播放時長根據(jù)流媒體文件 的文件頭的內(nèi)容獲取流媒體文件的播放時長,根據(jù)文本文件的內(nèi)容獲取文本文 件的播放時長。
當流媒體文件和文本文件的相關信息同時滿足以下兩個條件時,可判定流 媒體文件和文本文件的相關信息相互匹配。
條件一、流媒體文件的相關信息中的文件名稱和文本文件的相關信息中的 文件名稱相同;
條件二 、流媒體文件的相關信息中的播放時長和文本文件的相關信息中的 播放時長相同,或誤差在一預定范圍內(nèi)(因有時最后一段字幕的出現(xiàn)時間不一 定是視頻播放的最后時刻)。
獲取文件標識的步驟
當文件標識為文件名時,直接從文件獲取文件名;
當文件標識為內(nèi)容簽名CID時,獲取文件標識包括以下因素(之后不再贅
述)
因素一、釆用能算出文件內(nèi)容的唯一標識的算法來計算內(nèi)容簽名,或者, 也可以是采用處理結(jié)果重復率極低,在可接受范圍內(nèi)的算法來計算,例如,對 每個二進制文件的內(nèi)容數(shù)據(jù)進行哈希運算,得到文件內(nèi)容的哈希值,該文件內(nèi)
容的哈希值可以唯一代表該二進制文件內(nèi)容信息。哈希算法可以采用信息_摘 要算法MD( Message-Digest Algorithm) 5 、 MD4等,安全散列算法SHA (Secure Hash Algorithm)、 SHS ( Secure Hash Standard,)等。
因素二、選擇計算的對象。例如,可以對文件的所有二進制數(shù)據(jù)內(nèi)容進行 計算;也可以任意選取文件中至少兩段二進制數(shù)據(jù)內(nèi)容進行計算,而且選取的 每段二進制數(shù)據(jù)內(nèi)容的長度任意,例如可以對文件起始20K字節(jié)信息、中間 20K字節(jié)信息進行計算,也可以對文件起始IOK字節(jié)信息、中間10K字節(jié)信 息以及結(jié)尾IOK字節(jié)信息進行計算。
因素三、對計算后的結(jié)果進行合成的方式。當任意選取文件中至少兩段二 進制數(shù)據(jù)內(nèi)容進行計算時,對計算后得出的結(jié)果可以采用但不限于以下方式進 行合成例如采用MD5算法計算,可以將計算后得出的各MD5值首尾相連合 成該文件的內(nèi)容簽名作為文件標識;也可以再以MD5算法對前述計算后得出 的結(jié)果再進行計算,得出內(nèi)容簽名,作為該文件的文件標識。
建立對應關系的步驟建立相關信息相互匹配的流々某體文件和文本文件的 文件標識的對應關系,例如,可建立相關信息相互匹配的流媒體文件的內(nèi)容簽 名和文本文件的文件名的對應關系,或建立相互匹配的流々某體文件和文本文件 的內(nèi)容簽名的對應關系。進一步,該對應關系中還可以關聯(lián)保存文本文件的 URL (統(tǒng)一資源定位符)地址。
顯然,當文件標識為內(nèi)容簽名CID時,所述步驟S2中,服務端獲取該流 媒體文件的文件標識所采用的算法,應當與建立所述對應關系時所采用的算法 相同。
進一步,當對應關系中還關聯(lián)保存文本文件的URL地址時,服務端向終 端提供文本文件信息時的具體步驟包括服務端才艮據(jù)獲得的文本文件的文件標 識得到關聯(lián)的文本文件的URL地址,并向終端4是供該URL地址,終端從該 URL地址下載文本文件。
本發(fā)明實施例還提供一種提供文本文件信息的系統(tǒng),參見圖2所示,包括 終端和服務端,其中,終端,用于新建任務;服務端,用于確定終端當前新建 任務所指向的流媒體文件,獲取該流媒體文件的文件標識,并根據(jù)對應關系獲 得與該流^ 某體文件對應的文本文件的文件標識,以及才艮據(jù)獲得的文本文件的文 件標識向終端提供文本文件信息。
進一步,該系統(tǒng)中的服務端還用于獲取流4某體文件和文本文件的相關信 息,分別獲取所述相關信息相互匹配的流媒體文件和文本文件的文件標識,并 建立其對應關系。
本發(fā)明實施例還提供一種提供文本文件信息的服務端,參見圖3所示,包
括確定單元、第一獲取單元、第二獲取單元和提供單元。其中,確定單元, 用于確定終端當前新建任務所指向的流媒體文件;第一獲取單元,用于獲取該 流媒體文件的文件標識;第二獲取單元,用于根據(jù)對應關系獲取與該流媒體文 件對應的文本文件的文件標識;提供單元,用于^4居文本文件的文件標識向終 端提供文本文件信息。
進一步,參見圖4所示,該服務端還可以包括獲取匹配單元、文件標識 獲取單元、對應關系建立單元。其中,獲取匹配單元,用于獲取流媒體文件和 文本文件的相關信息,并匹配所述相關信息;文件標識獲:f又單元,用于獲取所 述相關信息相互匹配的流i某體文件和文本文件的文件標識;對應關系建立單 元,用于建立所述相關信息相互匹配的流^ 某體文件和文本文件的文件標識的對 應關系。
再進一步,對應關系建立單元還在所述對應關系中關聯(lián)保存文本文件的 URL地址。參見圖5所示,服務端還可包括第三獲取單元,用于從對應關系中 獲取流媒體文件對應的文本文件的URL地址,并發(fā)送到所述提供單元。提供 單元向終端提供文本文件的URL地址,供終端下載文本文件。
下面以3個實施例來詳細描述本發(fā)明實施例的方法。
方法實施例1、提供視頻文件對應的字幕文件信息。
本實施例中的流々某體文件為視頻文件,文本文件為字幕文件,當前新建任 務為播放視頻文件。參見圖6所示,本實施例的步驟流程如下
步驟IOI、服務端確定用戶當前播放的視頻文件,例如用戶通過^L頻播放 程序(如Real player)播放電影或者在線播放電影(或MTV ),服務端確定該 電影(或MTV)的名稱、文件類型等。 步驟102、服務端獲取該視頻文件的文件標識,并才艮據(jù)對應關系獲得與該 ^L頻文件對應的字幕文件的文件標識。
月良務端可以通過但不限于信息-摘要算法MD5 (Message-Digest Algorithm 5 ),分別對該視頻文件(電影或MTV )起始的32k字節(jié)信息、中間的32k字 節(jié)信息以及結(jié)尾的32k字節(jié)信息進行計算,得出對應的MD5值,然后將得出 的各MD5值首尾相連合成該視頻文件的內(nèi)容簽名作為文件標識,以該文件標 識唯一確定該;現(xiàn)頻文件(電影或MTV)。
服務端獲取該視頻文件(電影或MTV)的文件標識后,根據(jù)預先建立的 對應關系,獲得與該^L頻文件(電影或MTV)對應的字幕文件的文件標識。
步驟103、服務端根據(jù)獲得的字幕文件的文件標識向用戶提供字幕文件信
臺'
用戶通過視頻播放程序(如Real player)播放電影或者在線播放的電影無 字幕時,服務端根據(jù)獲得的該電影對應的字幕文件的文件標識,向用戶提供該 電影對應的字幕文件信息。
本實施例在預先建立一些對應關系后,服務端確定用戶當前播放的視頻文
件,獲取該視頻文件的文件標識,并根據(jù)對應關系獲得與該視頻文件對應的字
幕文件的文件標識,然后服務端根據(jù)獲得的字幕文件的文件標識向用戶提供字
幕文件信息。因此本實施例能夠?qū)崿F(xiàn)準確提供與視頻文件對應的字幕文件信 臺
方法實施例2、提供視頻文件對應的字幕文件的URL地址,供用戶下載視 頻文件對應的字幕文件。參見圖7所示,本實施例的步驟流程如下
本實施例中的流媒體文件為視頻文件,文本文件為字幕文件,當前新建任 務為下載視頻文件。
步驟201、服務端確定用戶當前下載的^L頻文件,例如服務端確定用戶當 前要下載的電影或MTV的名稱、文件類型等。
步驟202、服務端獲取該視頻文件的文件標識,并根據(jù)對應關系獲得與該
視頻文件對應的字幕文件的文件標識,并根據(jù)獲得的文本文件的文件標識得到
關聯(lián)的URL地址。
服務端可以通過4旦不限于MD5算法,分別對該^L頻文件(電影或MTV) 起始的32k字節(jié)信息和中間的32k字節(jié)信息進行計算,得出對應的MD5值, 然后再次用MD5算法對得出的兩個MD5值進行計算,得到內(nèi)容簽名,作為該 浮見頻文件的文件標識,以該文件標識唯一確定該禍》頻文件(電影或MTV)。
服務端獲取該視頻文件(電影或MTV)的文件標識后,根據(jù)預先建立的 對應關系,獲得與該;現(xiàn)頻文件對應的字幕文件的文件標識。
本實施例的對應關系中還關聯(lián)保存字幕文件的URL地址,服務端還可根 據(jù)獲得的字幕文件的文件標識,從對應關系中獲得該字幕文件的URL地址。
步驟203、服務端向用戶提供字幕文件的URL地址,用戶從該URL地址 下載字幕文件。
用戶下載視頻文件時,服務端還向用戶提供該視頻文件對應的字幕文件的 URL地址,提示用戶從該URL地址下載當前視頻文件對應的字幕文件。
或者,用戶已經(jīng)下載過視頻文件,但沒有下載該視頻文件對應的字幕文件, 用戶想要單獨下載該視頻文件對應的字幕文件時,服務端向用戶提供該視頻文 件對應的字幕文件的URL地址,供用戶下載該-觀頻文件對應的字幕文件。
本實施例在預先建立一些對應關系后,服務端確定用戶當前下載的視頻文 件,獲取該視頻文件的文件標識,并根據(jù)對應關系獲得與該視頻文件對應的字 幕文件的文件標識,由于對應關系中還關聯(lián)保存字幕文件的URL地址,服務 端還可根據(jù)獲得的字幕文件的文件標識,從對應關系中獲得與該字幕文件的 URL地址,然后向用戶^是供該URL地址,供用戶下載字幕文件。因此本實施 例能夠?qū)崿F(xiàn)準確提供與視頻文件對應的字幕文件信息。
方法實施例3、提供音頻文件對應的字幕文件的URL地址,供用戶下載音 頻文件對應的字幕文件。參見圖8所示,本實施例的步驟流程如下
本實施例中的流媒體文件為音頻文件,文本文件為字幕文件,當前新建任務為下載或播放音頻文件。
步驟301、服務端確定用戶當前下載或播放的音頻文件,例如用戶下載mp3 或wav等格式的歌曲等,服務端確定當前要下載的歌曲的名稱、文件類型等。
步驟302、服務端獲取該音頻文件的文件標識,并根據(jù)對應關系獲得與該 音頻文件對應的字幕文件的文件標識,并根據(jù)獲得的字幕文件的文件標識得到 關聯(lián)的URL地址。
服務端可以通過^f旦不限于MD5算法,對該音頻文件(歌曲)的所有二進 制數(shù)據(jù)內(nèi)容進行計算,得出對應的MD5值,即內(nèi)容簽名,作為該音頻文件的 文件標識,以該文件標識唯一確定該音頻文件(歌曲)。
服務端獲取該音頻文件(歌曲)的文件標識后,才艮據(jù)預先建立的對應關系, 獲得與該音頻文件(歌曲)對應的字幕文件(歌詞)的文件標識。由于對應關 系中還關聯(lián)字幕文件的URL地址,服務端還可從對應關系中獲得與該音頻文 件對應的字幕文件(歌詞)的URL地址。
步驟303、服務端向用戶提供該字幕文件的URL地址,供用戶下載字幕文件。
用戶下載歌曲時,服務端向用戶提供歌曲對應的歌詞的URL地址,提示 用戶從該URL地址下載歌詞。
或者,用戶已經(jīng)下載一首歌曲,沒有下載該歌曲對應的歌詞,但用戶希望 播放該歌曲時同步看到對應的歌詞,此時就需要下載該歌曲對應的歌詞。當用 戶播放該歌曲或欲下載該歌曲對應的歌詞時,服務端向用戶提供該歌曲對應的 歌詞的URL地址,供用戶下載該歌曲對應的歌詞。
本實施例在預先建立一些對應關系后,服務端確定用戶當前下載或播^L的 音頻文件,獲取該音頻文件的文件標識,并根據(jù)對應關系獲得與該音頻文件對 應的字幕文件的文件標識,由于對應關系中還關聯(lián)保存字幕文件的URL地址, 服務端還可從對應關系中獲得與該字幕文件的URL地址,然后向用戶提供該 字幕文件的URL地址,供用戶下載字幕文件。因此本實施例能夠?qū)崿F(xiàn)準確提
供與音頻文件對應的字幕文件信息。
下面以2個實施例來詳細描述本發(fā)明實施例的系統(tǒng)。
系統(tǒng)實施例1 、提供視頻文件對應的字幕文件的URL地址,用戶從該URL 地址下載字幕文件。
系統(tǒng)中的服務端,預先建立一些對應關系,將其保存在數(shù)據(jù)庫中。
服務端獲取視頻文件的相關信息,可直接獲取文件名稱和文件類型,并根 據(jù)文件頭的內(nèi)容獲取視頻文件的播放時長;服務端獲取字幕文件的相關信息, 可直接獲取文件名稱和文件類型,并根據(jù)字幕文件的內(nèi)容,獲取字幕文件的播 放時長。
當視頻文件和字幕文件的相關信息同時滿足以下兩個條件時,服務端可判 定視頻文件和字幕文件的相關信息相互匹配視頻文件的相關信息中的文件名 稱和字幕文件的相關信息中的文件名稱相同;視頻文件的相關信息中的播放時 長和字幕文件的相關信息中的播放時長相同。
服務端獲取相關信息互相匹配的視頻文件和字幕文件的文件標識,該文件 標識可為文件名或內(nèi)容簽名等。
當文件標識為內(nèi)容簽名時,服務端獲取文件標識包括以下因素(之后不再 贅述)
因素一、服務端采用能算出文件內(nèi)容的唯一標識的算法來計算內(nèi)容簽名, 例如,對每個二進制文件的內(nèi)容數(shù)據(jù)進行哈希運算,得到文件內(nèi)容的哈希值, 該文件內(nèi)容的哈希值可以唯一代表該二進制文件內(nèi)容信息。哈希算法可以釆用 信息-摘要算法,安全散列算法,安全散列算法等算法作為公式。
因素二、服務端選擇計算的對象。例如,服務端可以對文件的所有二進制 數(shù)據(jù)內(nèi)容進行計算;也可以任意選取文件中至少兩段二進制數(shù)據(jù)內(nèi)容進行計 算,而且選取的每段二進制數(shù)據(jù)內(nèi)容的長度任意,例如服務端可以對文件起始 20K字節(jié)信息、中間20K字節(jié)信息進行計算,也可以對文件起始20K字節(jié)信 息、中間20K字節(jié)信息以及結(jié)尾20K字節(jié)信息進行計算。
因素三、服務端對計算后的結(jié)果進行合成的方式。當服務端任意選取文件 中至少兩段二進制數(shù)據(jù)內(nèi)容進行計算時,對計算后得出的結(jié)果可以采用但不限
于以下方式進^亍合成例如服務端采用MD5算法計算,可以將計算后得出的 各MD5值首尾相連合成該文件的內(nèi)容簽名作為文件標識;也可以再以MD5 算法對前述計算后得出的結(jié)果再進行計算,得出內(nèi)容簽名,作為該文件的文件 標識。
服務端建立相關信息相互匹配的視頻文件和字幕文件的文件標識的對應 關系,并關聯(lián)保存字幕文件的URL地址。
系統(tǒng)中的終端,用于新建任務,例如用戶新建下載視頻文件的任務,也可 以新建播放視頻文件的任務。
系統(tǒng)中的服務端確定用戶當前下載或播放的^L頻文件,獲取該視頻文件的 文件標識,根據(jù)該視頻文件的文件標識,從對應關系中獲得該視頻文件對應的 字幕文件的文件標識,再根據(jù)該字幕文件的文件標識獲得字幕文件的URL地 址,并向用戶提供該URL地址,用戶從該URL地址下載當前視頻文件對應的 字幕文件。
本實施例在預先建立一些對應關系后,服務端確定用戶當前下載或播放的 視頻文件,獲取該視頻文件的文件標識,并根據(jù)對應關系獲得與該視頻文件對 應的字幕文件的文件標識,由于對應關系中還關聯(lián)保存字幕文件的URL地址, 服務端還可根據(jù)字幕文件的文件標識,從對應關系中獲得該字幕文件的URL 地址,然后向用戶提供該URL地址,用戶從該URL地址下載一見頻文件對應的 字幕文件。因此本實施例能夠?qū)崿F(xiàn)準確提供與視頻文件對應的字幕文件信息。
系統(tǒng)實施例2、提供音頻文件對應的字幕文件的URL地址,用戶從該URL 地址下載字幕文件。
系統(tǒng)中的服務端,預先建立一些對應關系,將其保存在數(shù)據(jù)庫中。
服務端獲取音頻文件的相關信息,可直接獲取文件名稱和文件類型,并根 據(jù)文件頭的內(nèi)容獲取音頻文件的播放時長;服務端獲取字幕文件的相關信息,
可直接獲取文件名稱和文件類型,并根據(jù)字幕文件的內(nèi)容,獲取字幕文件的播 放時長。
當音頻文件和字幕文件的相關信息同時滿足以下兩個條件時,服務端可判
定音頻文件和字幕文件的相關信息相互匹配音頻文件的相關信息中的文件名 稱和字幕文件的相關信息中的文件名稱相同;音頻文件的相關信息中的播放時 長和字幕文件的相關信息中的插-;改時長相同。
當文件標識為內(nèi)容簽名時,服務端按照上述計算相關信息互相匹配的視頻 文件和字幕文件的內(nèi)容簽名的方法,對相關信息互相匹配的音頻文件和字幕文
件進行計算,得出其內(nèi)容簽名作為文件標識,并關聯(lián)保存相關信息相互匹配的 音頻文件和字幕文件的文件標識的對應關系,并關聯(lián)保存字幕文件的URL地 址。
系統(tǒng)中的終端,用于新建任務,例如新建下載音頻文件的任務,也可以新 建播放音頻文件的任務。
系統(tǒng)中的服務端確定終端當前下載或播放的音頻文件,獲取該音頻文件的 文件標識,根據(jù)當前音頻文件的文件標識,從對應關系中獲得該音頻文件對應 的字幕文件的文件標識,再才艮據(jù)獲得的字幕文件的文件標識,從對應關系中獲 得字幕文件的URL地址,并向終端提供該URL地址,終端從該URL地址下 載當前音頻文件對應的字幕文件。
本實施例在預先建立一些對應關系后,服務端確定終端當前下載或播放的 音頻文件,獲取該音頻文件的文件標識,并根據(jù)對應關系獲得與該音頻文件對 應的字幕文件的文件標識,由于對應關系中還關聯(lián)保存字幕文件的URL地址, 服務端還可根據(jù)獲得的字幕文件的文件標識,從對應關系中獲得該字幕文件的 URL地址,然后服務端向終端提供該URL地址,終端從該URL地址下載音頻 文件對應的字幕文件。因此本實施例能夠?qū)崿F(xiàn)準確提供與音頻文件對應的字幕 文件信息。
下面以2個實施例來詳細描述本發(fā)明實施例的力良務端。
服務端實施例l、提供視頻文件對應的字幕文件,不包括第三獲取單元。
本實施例提供的服務端,參見圖4所示,包括獲取匹配單元、文件標識 獲取單元、對應關系建立單元、確定單元、第一獲取單元、第二獲取單元和提 供單元。
獲取匹配單元獲取視頻文件和字幕文件的相關信息,并匹配獲取的相關信 息。獲取視頻文件的相關信息時,可直接獲取文件名稱和文件類型,并根據(jù)視 頻文件文件頭的內(nèi)容獲取視頻文件的播放時長;獲取字幕文件的相關信息時, 可直接獲取文件名稱和文件類型,并根據(jù)字幕文件的內(nèi)容,獲取字幕文件的播 放時長。
當視頻文件和字幕文件的相關信息同時滿足以下兩個條件時,獲取匹配單 元可判定視頻文件和字幕文件的相關信息相互匹配視頻文件的相關信息中的 文件名稱和字幕文件的相關信息中的文件名稱相同;視頻文件的相關信息中的 播放時長和字幕文件的相關信息中的播放時長相同。
文件標識獲取單元獲取相關信息互相匹配的視頻文件和字幕文件的文件 標識,該文件標識可為文件名或內(nèi)容簽名等。
當文件標識為內(nèi)容簽名時,文件標識獲取單元計算文件標識包括以下因素 (之后不再贅述)
因素一、文件標識獲取單元采用能算出文件內(nèi)容的唯一標識的算法來計算 內(nèi)容簽名,或者,也可以是采用處理結(jié)果重復率極低,在可接受范圍內(nèi)的算法 來計算,例如,對每個二進制文件的內(nèi)容數(shù)據(jù)進行哈希運算,得到文件內(nèi)容的 哈希值,該文件內(nèi)容的哈希值可以唯一代表該二進制文件內(nèi)容信息。哈希算法 可以采用信息-摘要算法,安全散列算法,安全散列算法等算法作為公式。
因素二、文件標識獲取單元選擇計算的對象。例如,文件標識獲取單元可 以對文件的所有二進制數(shù)據(jù)內(nèi)容進行計算;也可以任意選取文件中至少兩段二 進制數(shù)據(jù)內(nèi)容進行計算,而且選取的每段二進制數(shù)據(jù)內(nèi)容的長度任意,例如文 件標識獲取單元可以對文件起始20K字節(jié)信息、中間20K字節(jié)信息進行計算,
也可以對文件起始20K字節(jié)信息、中間20K字節(jié)信息以及結(jié)尾20K字節(jié)信息 進行計算。
因素三、文件標識獲取單元對計算后的結(jié)果進行合成的方式。當文件標識 獲取單元任意選取文件中至少兩段二進制數(shù)據(jù)內(nèi)容進行計算時,對計算后得出 的結(jié)果可以采用但不限于以下方式進行合成例如文件標識獲取單元采用MD5 算法計算,可以將計算后得出的各MD5值首尾相連合成該文件的內(nèi)容簽名作 為文件標識;也可以再以MD5算法對前述計算后得出的結(jié)果再進行計算,得 出內(nèi)容簽名,作為該文件的文件標識。
對應關系建立單元建立相關信息相互匹配的-見頻文件和字幕文件的文件 標識的對應關系。
確定單元確定終端當前新建任務所指向的^L頻文件。
第 一獲取單元獲取該視頻文件的文件標識。
第二獲取單元根據(jù)對應關系建立單元預先建立的對應關系,獲取與與該視 頻文件對應的字幕文件的文件標識。
提供單元根據(jù)字幕文件的文件標識向終端提供該字幕文件信息。
本實施例的服務端中,獲取匹配單元獲取^見頻文件和字幕文件的相關信 息,并匹配相關信息;文件標識獲取單元獲取相關信息相互匹配的視頻文件和 字幕文件的文件標識;對應關系建立單元建立相關信息相互匹配的視頻文件和 字幕文件的文件標識的對應關系;確定單元確定用戶當前新建任務所指向的視 頻文件;第一獲取單元獲取該視頻文件的文件標識;第二獲取單元根據(jù)對應關 系建立單元預先建立的對應關系,獲取與與該視頻文件對應的字幕文件的文件 標識;提供單元向用戶提供該字幕文件的文件標識對應的字幕文件信息。因此 本實施例能夠?qū)崿F(xiàn)準確提供與視頻文件對應的字幕文件信息。
服務端實施例2、包括第三獲取單元,提供音頻文件對應的字幕文件的URL 地址,供用戶下載字幕文件。
本實施例提供的服務端,參見圖5所示,包括獲取匹配單元、文件標識
獲取單元、對應關系建立單元、確定單元、第一獲取單元、第二獲取單元、第 三獲取單元和提供單元。
獲取匹配單元獲取音頻文件和字幕文件的相關信息,并匹配獲取的相關信 息。獲取音頻文件的相關信息時,可直接獲取文件名稱和文件類型,并根據(jù)音
頻文件文件頭的內(nèi)容獲取音頻文件的播放時長;獲取字幕文件的相關信息時, 可直接獲取文件名稱和文件類型,并根據(jù)字幕文件的內(nèi)容,獲取字幕文件的播 放時長。
當音頻文件和字幕文件的相關信息同時滿足以下兩個條件時,獲取匹配單 元可判定音頻文件和字幕文件的相關信息相互匹配音頻文件的相關信息中的 文件名稱和字幕文件的相關信息中的文件名稱相同;音頻文件的相關信息中的 播放時長和字幕文件的相關信息中的播放時長相同。
當文件標識為內(nèi)容簽名時,文件標識獲取單元按照上述計算相關信息互相 匹配的視頻文件和字幕文件的文件標識的方法,對相關信息互相匹配的音頻文 件和字幕文件進行計算,得出其文件標識。
對應關系建立單元建立相關信息相互匹配的視頻文件和字幕文件的文件 標識的對應關系,還在對應關系中關聯(lián)保存字幕文件的URL地址。
確定單元確定終端當前新建任務所指向的音頻文件。
第 一獲取單元獲取該視頻文件的文件標識。
第二獲取單元根據(jù)對應關系建立單元預先建立的對應關系,獲取與與該視 頻文件對應的字幕文件的文件標識。
第三獲取單元才艮據(jù)第二獲取單元獲耳又的字幕文件的文件標識,從對應關系 建立單元預先建立的對應關系中獲取該字幕文件的URL地址,并發(fā)送到提供 單元。
提供單元向用戶提供該字幕文件的URL地址,供用戶下載音頻文件對應 的字幕文件信息。
本實施例的服務端中,獲取匹配單元獲取音頻文件和字幕文件的相關信
息,并匹配相關信息;文件標識獲取單元計算相關信息相互匹配的音頻文件和
字幕文件的文件標識;對應關系建立單元建立相關信息相互匹配的音頻文件和 字幕文件的文件標識的對應關系;確定單元確定用戶當前新建任務所指向的音 頻文件;第一獲取單元獲取該音頻文件的文件標識;第二獲取單元根據(jù)對應關 系建立單元預先建立的對應關系,獲取與與該音頻文件對應的字幕文件的文件 標識;第三獲取單元根據(jù)第二獲取單元獲取的字幕文件的文件標識,從對應關 系中獲取該字幕文件的URL地址,并發(fā)送到提供單元;提供單元向用戶提供 該字幕文件的URL地址,供用戶下載音頻文件對應的字幕文件。因此本實施 例能夠?qū)崿F(xiàn)準確提供與音頻文件對應的字幕文件信息。
綜上所述,本發(fā)明實施例在預先建立一些對應關系后,服務端確定用戶當 前新建任務所指向的視頻文件或音頻文件,獲取該文件的文件標識,并根據(jù)對 應關系獲得與該文件對應的字幕文件的文件標識,然后服務端根據(jù)獲得的字幕 文件的文件標識向用戶提供字幕文件信息。進一步,對應關系中還可以關聯(lián)保 存字幕文件的URL地址,服務端還可根據(jù)獲取的字幕文件的文件標識,從對 應關系中獲得該字幕文件的URL地址,然后向用戶"R供該字幕文件的URL地 址,供用戶下載視頻文件對應的字幕文件。因此本發(fā)明實施例能夠?qū)崿F(xiàn)準確提 供與視頻文件或音頻文件對應的字幕文件信息。
明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1、一種提供文本文件信息的方法,其特征在于,包括下列步驟確定終端當前新建任務所指向的流媒體文件;獲取該流媒體文件的文件標識,并根據(jù)對應關系獲得與該流媒體文件對應的文本文件的文件標識;根據(jù)獲得的文本文件的文件標識向終端提供文本文件信息。
2、 如權(quán)利要求1所述的方法,其特征在于,所述對應關系的建立包括 服務端獲取流媒體文件和文本文件的相關信息,并分別獲取所述相關信息相互 匹配的流々某體文件和文本文件的文件標識,以及建立所述對應關系。
3、 如權(quán)利要求2所述的方法,其特征在于,所述對應關系中還關聯(lián)保存 文本文件的統(tǒng)一資源定位符URL地址,以及服務端向終端提供文本文件信息時具體包括根據(jù)獲得的文本文件的文件 標識得到關聯(lián)的URL地址,并向終端提供該URL地址,終端從該URL地址 下載文本文件。
4、 如權(quán)利要求1所述的方法,其特征在于,流媒體文件和文本文件的相 關信息中包含的文件名稱和播放時長均相同,則判定流々某體文件的相關信息與 文本文件的相關信息相互匹配。
5、 如權(quán)利要求4所述的方法,其特征在于,服務端從流纟某體文件文件頭 的內(nèi)容中獲取流媒體文件的播放時長,從文本文件的內(nèi)容中獲取文本文件的播 放時長。
6、 如權(quán)利要求1所述的方法,其特征在于,所述文件標識為通過預定算 法對二進制文件的內(nèi)容凄t據(jù)進行計算后獲得的文件內(nèi)容簽名,該預定算法為對 不同的二進制文件的內(nèi)容數(shù)據(jù)進行處理得到不同的處理結(jié)果的算法。
7、 一種提供文本文件信息的系統(tǒng),其特征在于,包括 終端,用于新建任務;服務端,用于確定終端當前新建任務所指向的流士某體文件,獲取該流々某體 文件的文件標識,并#>據(jù)對應關系獲得與該流^/某體文件對應的文本文件的文件
8、 如權(quán)利要求7所述的系統(tǒng),其特征在于,服務端獲取流媒體文件和文 本文件的相關信息,分別獲取所述相關信息相互匹配的流媒體文件和文本文件 的文件標識,并建立其對應關系。
9、 如權(quán)利要求8所述的系統(tǒng),其特征在于,服務端還在建立的對應關系 中關聯(lián)保存文本文件的統(tǒng)一資源定位符URL地址,以及根據(jù)獲得的文本文件的文件標識得到關聯(lián)的URL地址,并向終端提供該 URL地址,終端從該URL地址下載文本文件。
10、 如權(quán)利要求7所述的系統(tǒng),其特征在于,服務端獲取的所述流媒體文 件和文本文件的相關信息中包含的文件名稱和播放時長均相同,則判定流媒體 文件的相關信息與文本文件的相關信息相互匹配。
11、 如權(quán)利要求IO所述的系統(tǒng),其特征在于,服務端從流々某體文件文件 頭的內(nèi)容中獲取流媒體文件的播放時長,從文本文件的內(nèi)容中獲取文本文件的 播放時長。
12、 如權(quán)利要求7所述的系統(tǒng),其特征在于,服務端通過預定算法對二進 制文件的內(nèi)容數(shù)據(jù)進行計算后獲得文件的內(nèi)容簽名作為所述文件標識,該預定 算法為對不同的二進制文件的內(nèi)容數(shù)據(jù)進行處理得到不同的處理結(jié)果的算法。
13、 一種提供文本文件信息的服務端,其特征在于,包括確定單元,用于確定終端當前新建任務所指向的流i某體文件; 第一獲取單元,用于獲取該流媒體文件的文件標識; 第二獲取單元,用于根據(jù)對應關系獲取與該流媒體文件對應的文本文件的 文件標識;提供單元,用于根據(jù)文本文件的文件標識向終端提供文本文件信息。
14、 如權(quán)利要求13所述的服務端,其特征在于,還包括 獲取匹配單元,用于獲取流々某體文件和文本文件的相關信息,并匹配所述 相關信息;文件標識獲取單元,用于獲取所述相關信息相互匹配的流媒體文件和文本 文件的文件標識;對應關系建立單元,用于建立所述相關信息相互匹配的流媒體文件和文本 文件的文件標識的對應關系。
15、 如權(quán)利要求14所述的服務端,其特征在于,還包括第三獲取單元; 所述對應關系建立單元還在所述對應關系中關聯(lián)保存文本文件的URL地址,第三獲取單元用于從所述對應關系中獲取流媒體文件對應的文本文件的 URL地址,并發(fā)送到所述提供單元,所述提供單元向終端提供文本文件的URL 地址,供終端下載文本文件。
16、 如權(quán)利要求13所述的服務端,其特征在于,所述獲取匹配單元獲取 的流媒體文件和文本文件的相關信息中包含的文件名稱和播J文時長均相同,則 判定流纟某體文件的相關信息與文本文件的相關信息相互匹配。
17、 如權(quán)利要求16所述的服務端,其特征在于,所述獲取匹配單元從流 媒體文件文件頭的內(nèi)容中獲取流々某體文件的播放時長,從文本文件的內(nèi)容中獲 取文本文件的播放時長。
18、 如權(quán)利要求13所述的服務端,其特征在于,所述文件標識獲取單元 通過預定算法對二進制文件的內(nèi)容數(shù)據(jù)進行計算后獲得文件的內(nèi)容簽名作為 所述文件標識,該預定算法為對不同的二進制文件的內(nèi)容數(shù)據(jù)進行處理得到不 同的處理結(jié)果的算法。
全文摘要
本發(fā)明公開了一種提供文本文件信息的方法、系統(tǒng)及服務端,屬于互聯(lián)網(wǎng)領域,以實現(xiàn)準確提供與流媒體文件對應的文本文件信息。方法包括確定終端當前新建任務所指向的流媒體文件;獲取該流媒體文件的文件標識,并根據(jù)對應關系獲得與該流媒體文件對應的文本文件的文件標識;根據(jù)獲得的文本文件的文件標識向終端提供文本文件信息。因此應用本發(fā)明能夠?qū)崿F(xiàn)準確提供與流媒體文件對應的文本文件信息。
文檔編號H04H60/74GK101179347SQ200710160608
公開日2008年5月14日 申請日期2007年12月21日 優(yōu)先權(quán)日2007年12月21日
發(fā)明者彬 李 申請人:深圳市迅雷網(wǎng)絡技術有限公司