專利名稱:在線視頻嗅探下載方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在線視頻嗅探下載方法及裝置,尤其涉及一種用于獲取動態(tài)生成 的視頻鏈接地址并下載該視頻的在線視頻嗅探下載方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種視頻網(wǎng)站越來越多,用戶可以通過視頻網(wǎng)站進行視 頻共享。然而,現(xiàn)有的視頻網(wǎng)站的視頻鏈接地址是一般是由Jav必cript動態(tài)產(chǎn)生的,通過 內(nèi)容提取系統(tǒng),如Spider這樣的工具對靜態(tài)頁面分析是無法得到動態(tài)產(chǎn)生的視頻鏈接真 實地址的,通常視頻鏈接的真實地址只有在播放器,如Flash加載后通過瀏覽器向服務(wù)器 發(fā)起請求時才能獲得。因此,現(xiàn)有的視頻網(wǎng)站大多只能通過相關(guān)網(wǎng)頁進行在線觀看,而不能 將其下載到本地。但是,在很多情況下,用戶是希望將視頻下載到本地的。例如,當用戶需要重復觀 看曾經(jīng)看過的視頻時,若能將該視頻下載到本地,則不僅觀看方便(無需再次查找),同時 也節(jié)約了網(wǎng)絡(luò)流量,避免了網(wǎng)絡(luò)擁塞;另外,若用戶是搜索引擎開放商,則在更多的時候不 僅需要視頻的鏈接地址,還需要下載該視頻,原因之一是視頻文件本身存儲于第三方網(wǎng)站 的服務(wù)器上,而第三方網(wǎng)站不會直接將視頻文件提交給搜索引擎(即使提交也存在作弊可 能),所以需要通過下載得到第三方視頻網(wǎng)站的視頻文件,原因之二是搜索引擎為得到更 多關(guān)于該視頻的信息,如視頻的清晰度等,需要下載得到第三方視頻網(wǎng)站的視頻文件。為解決上述的技術(shù)問題,中國專利申請第200910187783. 0號公開了一種在線視 頻自動下載的方法,該方法對被選擇的視頻網(wǎng)站和/或頻道進行監(jiān)控,當有更新的在線視 頻時,則判斷在線視頻地址是真實地址還是播放地址或播放鏈接,如果是真實地址,則直接 進行下載,如果是播放地址或者播放鏈接,則先通過播放地址或鏈接打開該在線視頻,對經(jīng) 過本地網(wǎng)卡的數(shù)據(jù)進行嗅探,提取該在線視頻的真實地址進行下載。然而,該專利申請所公 開的在線視頻自動下載方法,需要用戶打開某個播放頁面來獲取視頻鏈接,且只能一次打 開一個頁面,不然無法將播放頁和網(wǎng)卡分析的視頻鏈接對應(yīng)起來,操作繁瑣,且不能大規(guī)模 應(yīng)用,而對于搜索引擎開放商而言,能夠大規(guī)模應(yīng)用是很重要的。中國專利申請第200810180826. 5號公開了 一種針對視頻網(wǎng)站的廣域網(wǎng)爬蟲系 統(tǒng),其包括用于提取網(wǎng)頁中的所有超鏈接的超鏈接掃描器;用于分析并提取網(wǎng)頁中的指 向視頻的通用形式超鏈接的通用地址分析提取器;用于分析并提取網(wǎng)頁中的視頻的標識符 號的視頻標識提取器;用于將所述視頻標識提取器提取的視頻標識符號合成播放器所需的 網(wǎng)頁地址的播放地址合成器;用于在所述播放地址合成器合成的播放地址所指向的頁面中 提取視頻真實存放地址的視頻真實地址提取器;用于保存在所述通用地址分析提取器中被 提取的指向視頻的通用形式超鏈接的通用地址存儲庫;用于保存在所述視頻真實地址提取 器中被提取的視頻真實存放地址超鏈接的真實地址存儲庫;用于下載在所述真實地址存儲 庫中存儲的視頻真實存放地址超鏈接指向的視頻數(shù)據(jù)的視頻數(shù)據(jù)下載器;用于存儲在所述 視頻數(shù)據(jù)下載器中下載的數(shù)據(jù)的視頻數(shù)據(jù)存儲庫;用于向所述超鏈接掃描器提供需要處理的超鏈接的超鏈接喂食器。通過該針對視頻網(wǎng)站的廣域網(wǎng)爬蟲系統(tǒng)可以有效地解決爬蟲系 統(tǒng)無法采集廣域網(wǎng)中視頻網(wǎng)站數(shù)據(jù)的問題,可以為視頻爬蟲系統(tǒng)中的核心技術(shù)轉(zhuǎn)址功能提 供通用框架,可以為搭建針對廣域網(wǎng)視頻的搜索引擎系統(tǒng)的重要組成部分視頻數(shù)據(jù)采集系 統(tǒng)提供通用的搭建架構(gòu)。但是,該針對視頻網(wǎng)站的廣域網(wǎng)爬蟲系統(tǒng)存在以下問題通用性較差每個站點的標識來源和提取方法不同,每個站點的合成模板也不一 樣,不能適合所有站點;擴展性較差標識的生成方法和模板變化了需要重新挖掘新的模板;召回率有限不是所有站點都采用這種方法來發(fā)布標識,也不是所有站點都是通 過這種方法來生成視頻鏈接,很多視頻鏈接由網(wǎng)站的swf文件動態(tài)生成(有獨立的鏈接生 成算法);視頻鏈接失效問題很多站點生成的視頻鏈接和session有關(guān),會失效,這種類型 的視頻鏈接即使獲取到了,也無法下載。有鑒于此,需要本發(fā)明提供一種改進的在線視頻嗅探下載方法和裝置。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種改進的在線視頻嗅探下載方法,該在線視頻嗅探下載 方法可下載動態(tài)生成的視頻鏈接地址的視頻內(nèi)容。本發(fā)明的目的還在于提供一種實現(xiàn)上述在線視頻嗅探下載方法的視頻搜索裝置。為實現(xiàn)上述發(fā)明目的之一,本發(fā)明的一種在線視頻嗅探下載方法,包括以下步 驟一種在線視頻嗅探下載方法,其特征在于,所述在線視頻嗅探下載方法包括以下 步驟Si、瀏覽器自動提取URL地址并發(fā)出網(wǎng)絡(luò)請求打開網(wǎng)絡(luò)頁面;S2、在線視頻資源請求模塊通過在線視頻嗅探下載模塊向所述瀏覽器動態(tài)地請求 所述URL地址的在線視頻資源;S3、所述瀏覽器向服務(wù)器請求所述URL地址的在線視頻資源;S4、所述服務(wù)器返回與所述URL地址的在線視頻資源相應(yīng)的視頻播放地址至所述 瀏覽器;S5、所述瀏覽器將所述視頻播放地址返回至所述在線視頻嗅探下載模塊;S6、所述在線視頻嗅探下載模塊下載所述視頻播放地址上的在線視頻的全部或部 分原文件。作為本發(fā)明的進一步改進,在所述S5步驟和所述S6步驟間,還包括步驟由所述 在線視頻嗅探下載模塊將所述視頻播放地址返回至在線視頻資源請求模塊。作為本發(fā)明的進一步改進,所述S6步驟中,在“下載所述視頻播放地址上的在線 視頻的全部或部分原文件”同時,所述在線視頻嗅探下載模塊可播放所述視頻播放地址上 的所述在線視頻。作為本發(fā)明的進一步改進,在所述S6步驟后,還包括步驟存儲所述在線視頻的 全部或部分原文件。作為本發(fā)明的進一步改進,在所述Sl步驟和所述S2步驟間,還包括步驟
5
判斷所述網(wǎng)絡(luò)頁面是否包含在線視頻資源;若包括在線視頻資源則進入步驟S2。作為本發(fā)明的進一步改進,所述S6步驟后,還包括步驟判斷是否為分段下載的在線視頻的全部或部分原文件;若是,則合并所述在線視頻的全部或部分原文件。相應(yīng)地,作為實現(xiàn)上述另一目的,本發(fā)明的一種在線視頻嗅探下載裝置包括一種在線視頻嗅探下載裝置,其特征在于,所述在線視頻嗅探下載裝置包括瀏覽器,用于自動提取URL地址并打開網(wǎng)絡(luò)頁面;接收在線視頻資源請求,并將所 述在線視頻資源請求轉(zhuǎn)發(fā)至服務(wù)器;接收所述服務(wù)器返回的視頻播放地址,并將所述視頻 播放地址轉(zhuǎn)發(fā);在線視頻資源請求模塊,用于發(fā)出所述在線視頻資源請求;在線視頻嗅探下載模塊,用于接收所述在線視頻資源請求模塊發(fā)出的在線視頻資 源請求,并將該在線視頻資源請求轉(zhuǎn)發(fā)至瀏覽器;接收所述瀏覽器轉(zhuǎn)發(fā)的所述視頻播放地 址,并下載所述視頻播放地址上的在線視頻的原文件。作為本發(fā)明的進一步改進,所述在線視頻嗅探下載模塊還用于將所述視頻播放 地址返回至所述在線視頻資源請求模塊。作為本發(fā)明的進一步改進,所述在線資源請求模塊為一可加載于所述瀏覽器中的 播放器插件,用于播放所述視頻播放地址上的在線視頻。作為本發(fā)明的進一步改進,所述在線視頻嗅探下載裝置還包括網(wǎng)絡(luò)地址數(shù)據(jù)用于存儲URL地址,以便所述瀏覽器提取。作為本發(fā)明的進一步改進,所述瀏覽器為開源瀏覽器。作為本發(fā)明的進一步改進,所述瀏覽器、所述在線視頻資源請求模塊、在線視頻嗅 探下載模塊所述通過開源接口連接。作為本發(fā)明的進一步改進,所述視頻嗅探下載模塊是嵌入所述瀏覽器中的,所述 在線視頻嗅探下載模塊與所述瀏覽器打開頁面數(shù)量為1 1。作為本發(fā)明的進一步改進,所述視頻嗅探下載模塊包括動態(tài)鏈接庫,用于監(jiān)聽所述瀏覽器的所有的網(wǎng)絡(luò)請求,以及下載并存儲在線視頻 的全部或部分原文件;合并單元,用于合并分段下載的視頻。作為本發(fā)明的進一步改進,所述動態(tài)鏈接庫在監(jiān)聽到所述網(wǎng)絡(luò)請求時,自動加載 所述在線視頻嗅探模塊至所述瀏覽器。作為本發(fā)明的進一步改進,所述動態(tài)鏈接庫還能監(jiān)控所述在線視頻資源請求模塊 調(diào)用所述瀏覽器渲染的所述網(wǎng)絡(luò)頁面元素、所述在線視頻資源請求模塊調(diào)用所述網(wǎng)絡(luò)頁面 中的java script方法情況。作為本發(fā)明的進一步改進,所述動態(tài)鏈接庫還用于過濾網(wǎng)絡(luò)頁面中的圖片。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是1、本發(fā)明采用動態(tài)嗅探視頻鏈接的方法,通用性和擴展性都較好;2、本發(fā)明在視頻播放過程中將視頻下載完畢,不存在視頻失效的問題,召回率較 尚;
3、本發(fā)明自動用瀏覽器播放指定頁面,運行過程完全自動化,不需要人工參與;4、本發(fā)明能夠同時打開多個頁面,并可讓頁面和視頻鏈接能很好的對應(yīng),便于大 規(guī)模應(yīng)用。
圖1是視頻播放頁面示意圖;圖2是視頻播放系統(tǒng)示意圖;圖3是本發(fā)明在線視頻嗅探下載系統(tǒng)第一實施方式的模塊圖;圖4是本發(fā)明在線視頻嗅探下載系統(tǒng)第二實施方式的模塊圖;圖5是本發(fā)明在線視頻嗅探下載模塊包括的單元圖;圖6是本發(fā)明在線視頻嗅探下載方法第一實施方式的流程圖;圖7是本發(fā)明在線視頻嗅探下載方法第二實施方式的流程圖。
具體實施例方式以下將結(jié)合附圖所示的各實施方式對本發(fā)明進行詳細描述。但這些實施方式并不 限制本發(fā)明,本領(lǐng)域的普通技術(shù)人員根據(jù)這些實施方式所輕易做出的結(jié)構(gòu)、方法、或功能上 的變換均包含在本發(fā)明的保護范圍內(nèi)。本發(fā)明的核心思想是通過該在線視頻嗅探下載方法和裝置模擬用戶打開瀏覽器 并播放視頻的過程,從中嗅探出視頻的真實地址,并進行下載。如圖1所示,一般地,瀏覽器10均包括一地址欄11,當在所述瀏覽器地址欄11中 輸入一URL打開一視頻播放頁面時,多數(shù)瀏覽器10均會自動加載一播放器插件12,如Flash Player等視頻播放器插件,以播放所述視頻播放頁面中的在線視頻。如圖2所示,一般地,當在瀏覽器10地址欄11中輸入一 URL打開一視頻播放頁面 時,所述播放器插件12可通過與瀏覽器10的接口,向瀏覽器10請求在線視頻資源,從而由 瀏覽器10向服務(wù)器20請求所述在線視頻資源,比如,以Http的形式請求一在線電影,這 時,服務(wù)器20即會向瀏覽器10返回與所述請求相對應(yīng)的視頻播放地址,而瀏覽器10即會 調(diào)用所述播放器插件12的接口向所述播放器插件12寫入與所述請求相對應(yīng)的視頻播放地 址,比如上述在線電影的播放地址,從而可通過該播放器插件12播放該在線視頻。一般的, 該視頻播放地址即為該視頻的真實地址,即是通過該地址,可下載到該在線視頻的原文件。如圖3所示,在本發(fā)明的第一實施方式中,在線視頻嗅探下載系統(tǒng)包括在線視頻 嗅探下載裝置和服務(wù)器300,所述在線視頻嗅探下載裝置包括瀏覽器101、在線視頻資源 請求模塊103、在線視頻嗅探下載模塊105。其中,所述瀏覽器101用于自動提取URL地址并打開視頻播放頁面,同時,接收所 述在線視頻資源請求模塊103發(fā)出的在線視頻資源請求,比如,以Http的形式請求一在線 電影,并將該在線視頻資源請求轉(zhuǎn)發(fā)至服務(wù)器300 ;另外,所述瀏覽器還用于接收所述服務(wù) 器300返回的視頻播放地址,比如上述在線電影的播放地址,并將該視頻播放地址轉(zhuǎn)發(fā)至 所述在線視頻資源請求模塊103。優(yōu)選地,在所述瀏覽器101和在線視頻資源請求模塊103 的中間插有在線視頻嗅探下載模塊105,即是將所述在線視頻嗅探下載模塊105插入到所 述在線視頻資源請求模塊103與瀏覽器101的接口中,使得在線視頻資源請求模塊103的接口與在線視頻嗅探下載模塊105的第一接口對接,該在線視頻嗅探下載模塊105的第二 接口與瀏覽器101的接口對接。所述在線視頻資源請求模塊103用于發(fā)出在線視頻資源請求至所述在線視頻嗅 探下載模塊105,并通過該在線視頻嗅探下載模塊105將該在線視頻資源請求轉(zhuǎn)發(fā)至所述 瀏覽器101 ;另外,所述在線視頻資源請求模塊103還用于接收由瀏覽器返回的視頻播放地 址,優(yōu)選地,所述瀏覽器將該視頻播放地址返回至在線視頻嗅探下載模塊105,并由該在線 視頻嗅探下載模塊105返回至所述在線視頻資源請求模塊103。值得一提的是在本發(fā)明 最佳實施方式中,所述在線視頻資源請求模塊103為一可加載于所述瀏覽器101中的播放 器插件,如Flash Player等視頻播放器插件,以播放所述視頻播放地址上的在線視頻。所述在線視頻嗅探下載模塊105用于接收所述在線視頻資源請求模塊103發(fā)出的 在線視頻資源請求,并將該在線視頻資源請求轉(zhuǎn)發(fā)至瀏覽器101 ;另外,所述在線視頻嗅探 下載模塊105還用于接收所述瀏覽器101返回的視頻播放地址,并將所述視頻播放地址返 回至所述在線視頻資源請求模塊103。值得一提的是在本發(fā)明中,所述在線視頻嗅探下載 模塊105還用于在得到所述在線視頻播放地址后,下載該在線視頻的全部或部分原文件。優(yōu)選地,在本發(fā)明的最佳實施方式中,所述瀏覽器101為開源瀏覽器。瀏覽器101、 在線視頻資源請求模塊103、在線視頻嗅探下載模塊105接口均是開源接口,通用性和擴展 性都較好。因上述的在線視頻嗅探裝置是在視頻播放過程中將視頻下載完畢,故不存在視頻 失效的問題(提前拿到視頻播放地址,但在下載時視頻播放地址過期),召回率較高。值得一提的是在本發(fā)明中,所述在線視頻嗅探下載模塊105是嵌入所述瀏覽器 101中的,且對應(yīng)所述瀏覽器101的頁面設(shè)置,即是當所述瀏覽器101可同時打開多個頁面 時,每一個頁面都對應(yīng)到一個單獨的在線視頻嗅探下載模塊105,因該打開頁面與所述在線 視頻嗅探下載模塊105是1 1的關(guān)系,故可讓頁面和視頻鏈接能很好的對應(yīng),便于大規(guī)模 應(yīng)用。如圖4所示,為本發(fā)明第二實施方式中,在線視頻嗅探下載系統(tǒng)包括在線視頻嗅 探下載裝置和服務(wù)器300,所述在線視頻嗅探下載裝置包括網(wǎng)絡(luò)地址數(shù)據(jù)200、瀏覽器 201、在線視頻資源請求模塊203、在線視頻嗅探下載模塊205。其中,所述網(wǎng)絡(luò)地址數(shù)據(jù)200用于存儲URL地址,優(yōu)選地,該URL地址為各個視頻 播放頁面的URL地址。值得一提的是該網(wǎng)絡(luò)地址數(shù)據(jù)200可通過數(shù)據(jù)庫的形式存在,也 可通過數(shù)據(jù)文本的形式存在,在本發(fā)明中,只要是能夠讓瀏覽器201讀取得到其中的URL地 址,無論用怎樣的方式存在均可。在此不再贅述。所述瀏覽器201用于自動提取URL地址并打開視頻播放頁面,值得一提的是在 本實施方式中,所述接收URL地址,即是主動的從網(wǎng)絡(luò)地址數(shù)據(jù)200中讀取所存儲的URL 地址,即可實現(xiàn)自動用瀏覽器播放指定頁面,運行過程完全自動化,不需要人工參與;同時, 所述瀏覽器用于接收所述在線視頻資源請求模塊203發(fā)出的在線視頻資源請求,比如,以 Http的形式請求一在線電影,并將該在線視頻資源請求轉(zhuǎn)發(fā)至服務(wù)器300 ;另外,所述瀏覽 器還用于接收所述服務(wù)器300返回的視頻播放地址,比如上述在線電影的播放地址,并將 該視頻播放地址轉(zhuǎn)發(fā)至所述在線視頻資源請求模塊203。優(yōu)選地,在所述瀏覽器201和在線 視頻資源請求模塊203的中間插有在線視頻嗅探下載模塊205,即是將所述在線視頻嗅探下載模塊205插入到所述在線視頻資源請求模塊203與瀏覽器201的接口中,使得在線視 頻資源請求模塊203的接口與在線視頻嗅探下載模塊205的第一接口對接,該在線視頻嗅 探下載模塊205的第二接口與瀏覽器201的接口對接。所述在線視頻資源請求模塊203用于發(fā)出在線視頻資源請求至所述在線視頻嗅 探下載模塊205,并通過該在線視頻嗅探下載模塊205將該在線視頻資源請求轉(zhuǎn)發(fā)至所述 瀏覽器201 ;另外,所述在線視頻資源請求模塊203還用于接收由瀏覽器返回的視頻播放地 址,優(yōu)選地,所述瀏覽器將該視頻播放地址返回至在線視頻嗅探下載模塊105,并由該在線 視頻嗅探下載模塊205返回至所述在線視頻資源請求模塊203。值得一提的是在本發(fā)明 最佳實施方式中,所述在線視頻資源請求模塊203為一可加載于所述瀏覽器201中的播放 器插件,如Flash Player等視頻播放器插件,以播放所述視頻播放地址上的在線視頻。所述在線視頻嗅探下載模塊205用于接收所述在線視頻資源請求模塊203發(fā)出的 在線視頻資源請求,并將該在線視頻資源請求轉(zhuǎn)發(fā)至瀏覽器201 ;另外,所述在線視頻嗅探 下載模塊205還用于接收所述瀏覽器201返回的視頻播放地址,并將所述視頻播放地址返 回至所述在線視頻資源請求模塊203。值得一提的是在本發(fā)明中,所述在線視頻嗅探下載 模塊205還用于在得到所述在線視頻播放地址后,下載該在線視頻的全部或部分原文件。優(yōu)選地,在本發(fā)明的最佳實施方式中,所述瀏覽器201為開源瀏覽器。瀏覽器201、 在線視頻資源請求模塊203、在線視頻嗅探下載模塊205接口均是開源接口,通用性和擴展 性都較好。因上述的在線視頻嗅探裝置是在視頻播放過程中將視頻下載完畢,故不存在視頻 失效的問題(提前拿到視頻播放地址,但在下載時視頻播放地址過期),召回率較高。值得一提的是在本發(fā)明中,所述在線視頻嗅探下載模塊205是嵌入所述瀏覽器 201中的,且對應(yīng)所述瀏覽器201的頁面設(shè)置,所述瀏覽器201可同時打開多個頁面,且每一 個頁面都對應(yīng)到一個單獨的在線視頻嗅探下載模塊205,因該頁面與所述在線視頻嗅探下 載模塊205是1 1的關(guān)系,故可讓頁面和視頻鏈接能很好的對應(yīng),便于大規(guī)模應(yīng)用。如圖5所示,上述本發(fā)明的第一實施方式和第二實施方式的在線視頻嗅探下載模 塊包括動態(tài)鏈接庫1051、合并單元1053。其中,動態(tài)鏈接庫1051用于監(jiān)聽所有的網(wǎng)絡(luò)請求,以及下載并存儲在線視頻的全 部或部分原文件,另外所述動態(tài)鏈接庫1051還用于過濾視頻播放網(wǎng)頁中的圖片。其可監(jiān)聽 瀏覽器的所有網(wǎng)絡(luò)請求,并在監(jiān)聽到網(wǎng)絡(luò)請求時,自動加載所述在線視頻嗅探下載模塊至 所述瀏覽器。值得一提的是所述動態(tài)鏈接庫1051除了能監(jiān)控瀏覽器在HTTP上的請求之 外,還能監(jiān)控在線視頻資源請求模塊調(diào)用瀏覽器渲染的頁面元素,在線視頻資源請求模塊 調(diào)用頁面中的java script方法情況等。一般地,瀏覽器都會包括一網(wǎng)絡(luò)請求模塊,該網(wǎng)絡(luò) 請求模塊是用于處理瀏覽器所有的網(wǎng)絡(luò)請求的。通過在所述網(wǎng)絡(luò)請求模塊中植入回調(diào)函 數(shù),從而使得所述網(wǎng)絡(luò)請求模塊可回調(diào)所述動態(tài)鏈接庫。該回調(diào)包括了請求回調(diào)和響應(yīng)回 調(diào),一次請求回調(diào)和對應(yīng)至少一次響應(yīng)回調(diào),例如,讓視頻是一段下載的,則一次請求回調(diào) 對應(yīng)一次響應(yīng)回調(diào);當視頻時分段下載的,則一次請求回調(diào)對應(yīng)多次響應(yīng)回調(diào)。合并單元1053用于合并分段下載的視頻。如果視頻是分段進行下載的,即是一次 請求回調(diào)對應(yīng)多次響應(yīng)回調(diào)時,可通過此單元對分段下載的視頻進行合并,一般地,分段下 載的視頻是通過URL來進行合并的。
如圖6所示,在本發(fā)明的第一實施方式中,本發(fā)明的在線視頻嗅探下載方法,包括 以下步驟Si、瀏覽器自動提取URL地址并打開視頻播放頁面;S3、在線視頻資源請求模塊通過在線視頻嗅探下載模塊向瀏覽器動態(tài)地請求所述 URL地址的在線視頻資源;S5、瀏覽器向服務(wù)器請求所述URL地址的在線視頻資源;S7、服務(wù)器返回與所述URL地址的在線視頻資源相應(yīng)的視頻播放地址至瀏覽器;S9、瀏覽器將所述視頻播放地址返回至所述在線視頻嗅探下載模塊;優(yōu)選地,在此步驟之后,可由所述在線視頻嗅探下載模塊將所述視頻播放地址返 回至在線視頻資源請求模塊;S11、在線視頻嗅探下載模塊下載所述視頻播放地址上的在線視頻的全部或部分 原文件,優(yōu)選地,在下載所述視頻播放地址上的在線視頻的全部或部分原文件同時,所述在 線視頻嗅探下載模塊可播放所述視頻播放地址上的所述在線視頻;S13、存儲所述在線視頻的全部或部分原文件。如圖7所示,在本發(fā)明的第二實施方式中,本發(fā)明的在線視頻嗅探下載方法,包括 以下步驟S100、瀏覽器自動提取URL地址,發(fā)出網(wǎng)絡(luò)請求打開網(wǎng)絡(luò)頁面;S101、判斷所述網(wǎng)絡(luò)頁面是否包含在線視頻資源;若包括在線視頻資源則進入步驟S102、若不包括在線視頻資源則忽略本次網(wǎng)絡(luò)請 求;S102、在瀏覽器中加載所述在線視頻嗅探下載模塊;S103、在線視頻資源請求模塊通過在線視頻嗅探下載模塊向瀏覽器動態(tài)地請求所 述URL地址的在線視頻資源;S104、瀏覽器向服務(wù)器請求所述URL地址的在線視頻資源;S105、服務(wù)器返回與所述URL地址的在線視頻資源相應(yīng)的視頻播放地址至瀏覽 器;S106、瀏覽器將所述視頻播放地址返回至所述在線視頻嗅探下載模塊;優(yōu)選地,在此步驟之后,可由所述在線視頻嗅探下載模塊將所述視頻播放地址返 回至在線視頻資源請求模塊;S107、在線視頻嗅探下載模塊下載所述視頻播放地址上的在線視頻的全部或部分 原文件,優(yōu)選地,在下載所述視頻播放地址上的在線視頻的全部或部分原文件同時,所述在 線視頻嗅探下載模塊可播放所述視頻播放地址上的所述在線視頻;S108、判斷是否為分段下載在線視頻的全部或部分原文件;若是,則進入步驟S109,若否,則進入步驟SllO ;S109、合并所述在線視頻的全部或部分原文件,并進行存儲;S110、直接存儲所述在線視頻的全部或部分原文件。應(yīng)當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一 個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當將說 明書作為一個整體,各實施例中的技術(shù)方案也可以經(jīng)適當組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。 上文所列出的一系列的詳細說明僅僅 是針對本發(fā)明的可行性實施方式的具體說 明,它們并非用以限制本發(fā)明的保護范圍,凡未脫離本發(fā)明技藝精神所作的等效實施方式 或變更均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1. 一種在線視頻嗅探下載方法,其特征在于,所述在線視頻嗅探下載方法包括以下步驟51、瀏覽器自動提取URL地址并發(fā)出網(wǎng)絡(luò)請求打開網(wǎng)絡(luò)頁面;52、在線視頻資源請求模塊通過在線視頻嗅探下載模塊向所述瀏覽器動態(tài)地請求所述 URL地址的在線視頻資源;53、所述瀏覽器向服務(wù)器請求所述URL地址的在線視頻資源;54、所述服務(wù)器返回與所述URL地址的在線視頻資源相應(yīng)的視頻播放地址至所述瀏覽器;55、所述瀏覽器將所述視頻播放地址返回至所述在線視頻嗅探下載模塊;56、所述在線視頻嗅探下載模塊下載所述視頻播放地址上的在線視頻的全部或部分原 文件。
2.根據(jù)權(quán)利要求1所述的在線視頻嗅探下載方法,其特征在于,在所述S5步驟和所述 S6步驟間,還包括步驟由所述在線視頻嗅探下載模塊將所述視頻播放地址返回至在線視 頻資源請求模塊。
3.根據(jù)權(quán)利要求2所述的在線視頻嗅探下載方法,其特征在于,所述S6步驟中,在“下 載所述視頻播放地址上的在線視頻的全部或部分原文件”同時,所述在線視頻嗅探下載模 塊可播放所述視頻播放地址上的所述在線視頻。
4.根據(jù)權(quán)利要求1所述的在線視頻嗅探下載方法,其特征在于,在所述S6步驟后,還包 括步驟存儲所述在線視頻的全部或部分原文件。
5.根據(jù)權(quán)利要求1至4中任意一項所述的在線視頻嗅探下載方法,其特征在于,在所述 Sl步驟和所述S2步驟間,還包括步驟判斷所述網(wǎng)絡(luò)頁面是否包含在線視頻資源; 若包括在線視頻資源則進入步驟S2。
6.根據(jù)權(quán)利要求1至4中任意一項所述的在線視頻嗅探下載方法,其特征在于,所述 S6步驟后,還包括步驟判斷是否為分段下載的在線視頻的全部或部分原文件; 若是,則合并所述在線視頻的全部或部分原文件。
7.—種在線視頻嗅探下載裝置,其特征在于,所述在線視頻嗅探下載裝置包括瀏覽器,用于自動提取URL地址并打開網(wǎng)絡(luò)頁面;接收在線視頻資源請求,并將所述在 線視頻資源請求轉(zhuǎn)發(fā)至服務(wù)器;接收所述服務(wù)器返回的視頻播放地址,并將所述視頻播放 地址轉(zhuǎn)發(fā);在線視頻資源請求模塊,用于發(fā)出所述在線視頻資源請求;在線視頻嗅探下載模塊,用于接收所述在線視頻資源請求模塊發(fā)出的在線視頻資源請 求,并將該在線視頻資源請求轉(zhuǎn)發(fā)至瀏覽器;接收所述瀏覽器轉(zhuǎn)發(fā)的所述視頻播放地址,并 下載所述視頻播放地址上的在線視頻的原文件。
8.根據(jù)權(quán)利要求7所述的在線視頻嗅探下載裝置,其特征在于,所述在線視頻嗅探下 載模塊還用于將所述視頻播放地址返回至所述在線視頻資源請求模塊。
9.根據(jù)權(quán)利要求8所述的在線視頻嗅探下載裝置,其特征在于,所述在線資源請求模 塊為一可加載于所述瀏覽器中的播放器插件,用于播放所述視頻播放地址上的在線視頻。
10.根據(jù)權(quán)利要求9所述的在線視頻嗅探下載裝置,其特征在于,所述在線視頻嗅探下 載裝置還包括網(wǎng)絡(luò)地址數(shù)據(jù)用于存儲URL地址,以便所述瀏覽器提取。
11.根據(jù)權(quán)利要求7至9中任意一項所述的在線視頻嗅探下載裝置,其特征在于,所述 瀏覽器為開源瀏覽器。
12.根據(jù)權(quán)利要求11所述的在線視頻嗅探下載裝置,其特征在于,所述瀏覽器、所述在 線視頻資源請求模塊、在線視頻嗅探下載模塊所述通過開源接口連接。
13.根據(jù)權(quán)利要求7所述的在線視頻嗅探下載裝置,其特征在于,所述視頻嗅探下載 模塊是嵌入所述瀏覽器中的,所述在線視頻嗅探下載模塊與所述瀏覽器打開頁面數(shù)量為1 Io
14.根據(jù)權(quán)利要求7或14所述的在線視頻嗅探下載裝置,其特征在于,所述視頻嗅探下 載模塊包括動態(tài)鏈接庫,用于監(jiān)聽所述瀏覽器的所有的網(wǎng)絡(luò)請求,以及下載并存儲在線視頻的全 部或部分原文件;合并單元,用于合并分段下載的視頻。
15.根據(jù)權(quán)利要求14所述的在線視頻嗅探下載裝置,其特征在于,所述動態(tài)鏈接庫在 監(jiān)聽到所述網(wǎng)絡(luò)請求時,自動加載所述在線視頻嗅探模塊至所述瀏覽器。
16.根據(jù)權(quán)利要求15所述的在線視頻嗅探下載裝置,其特征在于,所述動態(tài)鏈接庫還 能監(jiān)控所述在線視頻資源請求模塊調(diào)用所述瀏覽器渲染的所述網(wǎng)絡(luò)頁面元素、所述在線視 頻資源請求模塊調(diào)用所述網(wǎng)絡(luò)頁面中的java script方法情況。
17.根據(jù)權(quán)利要求14所述的在線視頻嗅探下載裝置,其特征在于,所述動態(tài)鏈接庫還 用于過濾網(wǎng)絡(luò)頁面中的圖片。
全文摘要
本發(fā)明提供一種在線視頻嗅探下載方法,包括瀏覽器自動提取URL地址并發(fā)出網(wǎng)絡(luò)請求打開網(wǎng)絡(luò)頁面;在線視頻資源請求模塊通過在線視頻嗅探下載模塊向所述瀏覽器動態(tài)地請求所述URL地址的在線視頻資源;所述瀏覽器向服務(wù)器請求所述URL地址的在線視頻資源;所述服務(wù)器返回與所述URL地址的在線視頻資源相應(yīng)的視頻播放地址至所述瀏覽器;所述瀏覽器將所述視頻播放地址返回至所述在線視頻嗅探下載模塊;所述在線視頻嗅探下載模塊下載所述視頻播放地址上的在線視頻的全部或部分原文件。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是通用性和擴展性都較好;不存在視頻失效的問題,召回率較高;運行過程完全自動化,不需要人工參與;便于大規(guī)模應(yīng)用。
文檔編號H04L29/08GK102098327SQ20101058926
公開日2011年6月15日 申請日期2010年12月15日 優(yōu)先權(quán)日2010年12月15日
發(fā)明者譚國強 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司