多媒體信息更新方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種多媒體信息更新方法及裝置。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,人們通過網(wǎng)絡(luò)觀看視頻或收聽音頻變得越來越普遍。 由于視頻和音頻等多媒體文件每天都在不定時更新,為了增強用戶體驗度,還需在第一時 間內(nèi)抓取更新的多媒體信息。其中,多媒體信息可包括更新多媒體文件的簡介信息和播放 地址信息等等。然而,對于多媒體文件搜索引擎來說,由于對數(shù)據(jù)進行一輪全量更新需要花 費較長時間,因此,如何在保證數(shù)據(jù)覆蓋率的同時快速地對多媒體信息進行更新,成為了本 領(lǐng)域技術(shù)人員較為關(guān)注的一個問題。
[0003] W視頻文件為例,現(xiàn)有技術(shù)通常采取H種方式對視頻文件的視頻信息進行更 新。第一種方式為全量更新方式。目P,直接根據(jù)所有視頻文件的抓LOJniform Resource Locator,統(tǒng)一資源定位符)抓取新添加的視頻信息,并根據(jù)新添加的視頻信息對原始視頻 信息進行更新。第二種方式為站點更新方式。目P,W站點為單位對新添加的視頻信息進行 抓取。首先,根據(jù)不同站點的質(zhì)量為每個站點分配一定權(quán)重;在爬蟲程序根據(jù)URL抓取數(shù)據(jù) 之前,對各個站點進行打分;之后,基于打分數(shù)值的高低順序,依次對各個站點下的視頻信 息進行更新。第H種方式為隊列更新方式。目P,W U化為單位對新添加的視頻信息進行抓 取。首先,在爬蟲程序根據(jù)U化抓取數(shù)據(jù)之前,基于各個U化的因素(比如,站點質(zhì)量、U化 模式、頁面質(zhì)量、等待時間)對各個U化進行打分;之后,依據(jù)打分數(shù)值的高低順序,將各個 U化放入一個優(yōu)先級隊列中;最終,爬蟲程序不斷從該隊列中取出U化,并根據(jù)取出的U化對 視頻信息進行更新。
[0004] 在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在W下問題:
[0005] 針對第一種方式,在一輪數(shù)據(jù)更新過程中很多視頻文件可能暫無更新,但送些數(shù) 據(jù)的m?L也會被進行相應(yīng)處理,甚至基于該U化進行數(shù)據(jù)抓取。而盲目的數(shù)據(jù)抓取不但增 加了更新時間,而且存在因?qū)Ψ椒?wù)器的訪問量過大而被對方站點封禁的缺陷。針對第 二種方式,由于目前互聯(lián)網(wǎng)已經(jīng)越來越重視版權(quán)管理,所W有很多多媒體文件是獨家的,而 該種方式對于獨播多媒體文件不能及時進行更新。針對第H種方式,由于影響U化分數(shù)的 因素較多,而打分方式不能做到對所有因素進行覆蓋,所W同樣存在數(shù)據(jù)更新量大、更新時 間長的缺陷。
【發(fā)明內(nèi)容】
[0006] 為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種多媒體信息更新方法及裝 置。所述技術(shù)方案如下:
[0007] -方面,提供了一種多媒體信息更新方法,所述方法包括:
[0008] 對于每一個多媒體信息集合,當所述多媒體信息集合中包括歷史多媒體信息時, 判斷所述歷史多媒體信息的更新時間是否滿足更新時間規(guī)則;
[0009] 當所述歷史多媒體信息滿足更新時間規(guī)則時,根據(jù)所述歷史多媒體信息的更新時 間,計算所述多媒體信息集合的第一預(yù)測更新時間;
[0010] 確定第一預(yù)測更新時間小于當前時間的指定多媒體信息集合;
[0011] 根據(jù)所述指定多媒體信息集合的地址信息,獲取更新的多媒體信息。
[0012] 另一方面,提供了一種多媒體信息更新裝置,所述裝置包括:
[0013] 更新時間規(guī)則判斷模塊,用于對于每一個多媒體信息集合,當所述多媒體信息集 合中包括歷史多媒體信息時,判斷所述歷史多媒體信息的更新時間是否滿足更新時間規(guī) 則;
[0014] 預(yù)測更新時間計算模塊,用于當所述歷史多媒體信息滿足更新時間規(guī)則時,根據(jù) 所述歷史多媒體信息的更新時間,計算所述多媒體信息集合的第一預(yù)測更新時間;
[0015] 多媒體信息集合確定模塊,用于確定第一預(yù)測更新時間小于當前時間的指定多媒 體信息集合;
[0016] 第一多媒體信息獲取模塊,用于根據(jù)所述指定多媒體信息集合的地址信息,獲取 更新的多媒體信息。
[0017] 本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0018] 對于每一個多媒體信息集合來說,當多媒體信息集合中包括歷史多媒體信息時, 判斷歷史多媒體信息的更新時間是否滿足更新時間規(guī)則;當歷史多媒體信息滿足更新時間 規(guī)則時,根據(jù)歷史多媒體信息的更新時間,計算多媒體信息集合的第一預(yù)測更新時間,并確 定第一預(yù)測更新時間小于當前時間的指定多媒體信息集合;之后,根據(jù)指定多媒體信息集 合的地址信息,獲取更新的多媒體信息,由于在每一輪的更新過程中,基于歷史多媒體信息 對多媒體信息集合的更新時間進行預(yù)測,并根據(jù)預(yù)測得到的更新時間對多媒體信息集合進 行更新,可有效降低數(shù)據(jù)更新量和數(shù)據(jù)更新時間。
【附圖說明】
[0019] 為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可W根據(jù)送些附圖獲得其他 的附圖。
[0020] 圖1是本發(fā)明實施例提供的一種多媒體信息更新方法所涉及的實施環(huán)境的結(jié)構(gòu) 示意圖;
[0021] 圖2是本發(fā)明實施例提供的一種多媒體信息更新方法的流程圖;
[0022] 圖3是本發(fā)明實施例提供的一種多媒體信息更新方法的流程圖;
[0023] 圖4是本發(fā)明實施例提供的一種多媒體信息更新裝置結(jié)構(gòu)示意圖;
[0024] 圖5是本發(fā)明實施例提供的一種終端的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方 式作進一步地詳細描述。
[0026] 在對本發(fā)明實施例做詳細地解釋說明之前,先對本發(fā)明實施例的應(yīng)用場景予W說 明。
[0027] 圖I是本發(fā)明實施例提供的一種多媒體信息更新方法所涉及的實施環(huán)境的結(jié)構(gòu) 示意圖。參見圖1,W多媒體文件為視頻文件為例,則一個視頻文件被發(fā)布在視頻網(wǎng)站后,女口 果能夠被終端安裝的爬蟲程序快速抓取到,則可大幅增強用戶的體驗度,可為視頻網(wǎng)站挽 留大量的用戶。
[0028] 其中,終端可每隔一定時間通過爬蟲程序自動對全網(wǎng)多媒體信息進行一輪更新, 具體為對于每一個多媒體信息集合,當多媒體信息集合中包括歷史多媒體信息時,判斷歷 史多媒體信息的更新時間是否滿足更新時間規(guī)則;當歷史多媒體信息滿足更新時間規(guī)則 時,根據(jù)歷史多媒體信息的更新時間,計算多媒體信息集合的第一預(yù)測更新時間;確定第一 預(yù)測更新時間小于當前時間的指定多媒體信息集合;根據(jù)指定多媒體信息集合的地址信 息,獲取更新的多媒體信息。服務(wù)器中不斷有更新的多媒體信息出現(xiàn)。終端從服務(wù)器上通 過抓取網(wǎng)頁的形式對本地的多媒體信息進行更新。
[0029] 圖2是本發(fā)明實施例提供的一種多媒體信息更新方法的流程圖。參見圖2,本發(fā)明 實施例提供的方法流程包括:
[0030] 201、對于每一個多媒體信息集合,當多媒體信息集合中包括歷史多媒體信息時, 判斷歷史多媒體信息的更新時間是否滿足更新時間規(guī)則。
[0031] 202、當歷史多媒體信息滿足更新時間規(guī)則時,根據(jù)歷史多媒體信息的更新時間, 計算多媒體信息集合的第一預(yù)測更新時間。
[0032] 203、確定第一預(yù)測更新時間小于當前時間的指定多媒體信息集合。
[0033] 204、根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息。
[0034] 本發(fā)明實施例提供的方法,對于每一個多媒體信息集合來說,當多媒體信息集合 中包括歷史多媒體信息時,判斷歷史多媒體信息的更新時間是否滿足更新時間規(guī)則;當歷 史多媒體信息滿足更新時間規(guī)則時,根據(jù)歷史多媒體信息的更新時間,計算多媒體信息集 合的第一預(yù)測更新時間,并確定第一預(yù)測更新時間小于當前時間的指定多媒體信息集合; 之后,根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息,由于在每一輪的更新 過程中,基于歷史多媒體信息對多媒體信息集合的更新時間進行預(yù)測,并根據(jù)預(yù)測得到的 更新時間對多媒體信息集合進行更新,可有效降低數(shù)據(jù)更新量和數(shù)據(jù)更新時間。
[0035] 可選地,第一預(yù)測更新時間包括預(yù)測更新日期,根據(jù)歷史多媒體信息的更新時間, 計算多媒體信息集合的第一預(yù)測更新時間,包括:
[0036] 獲取每一項歷史多媒體信息的更新日期;
[0037] 統(tǒng)計更新日期坐落在第一預(yù)設(shè)時長中每一天的比例;
[0038] 計算有多媒體信息更新的天數(shù);
[003引根據(jù)比例和天數(shù),計算多媒體信息集合的預(yù)測更新日期。
[0040] 可選地,第一預(yù)測更新時間包括第一預(yù)測更新時刻,根據(jù)歷史多媒體信息的更新 時間,計算多媒體信息集合的第一預(yù)測更新時間,包括:
[0041] 獲取每一項歷史多媒體信息的更新時刻;
[0042] 根據(jù)更新時刻,預(yù)測多媒體信息集合的第二預(yù)測更新時刻;
[0043] 確定當前的更新時間修正值;
[0044] 根據(jù)第二預(yù)測更新時刻和當前的更新時間修正值,計算第一預(yù)測更新時刻。
[0045] 可選地,根據(jù)指定多媒體信息集合的地址信息,獲取更新的多媒體信息之后,該方 法還包括:
[0046] 獲取修正時間步長和當前的更新時間修正值;
[0047] 當?shù)谝活A(yù)測更新時刻小于指定更新時刻時,根據(jù)當前的更新時間修正值和修正時 間步長之和,重置當前的更新時間修正值的大小,得到新的更新時間修正值;或,
[0048] 當?shù)谝活A(yù)測更新時刻等于指定更新時刻時,根據(jù)當前的更新時間修正值和修正時 間步長之差,重置當前的更新時間修正值的大小,得到新的更新時間修正值;
[0049] 其中,指定更新時刻為指定多媒體信息集合的實際更新時刻。
[0050] 可選地,判斷歷史多媒體信息的更新時間是否滿足更新時間規(guī)則,包括:
[0051] 根據(jù)歷史多媒體信息的更新時間,判斷歷史多媒體信息之間的更新時間間隔是否 大于預(yù)設(shè)時間闊值;
[0052] 如果歷史多媒體信息之間的更新時間間隔大于預(yù)設(shè)時間闊值,則判斷歷史多媒體 信息的更新時間滿足更新時間規(guī)則。
[0053] 可選地,判斷歷史多媒體信息的更新時間是否滿足更新時間規(guī)則之后,該方法還 包括:
[0054] 當歷史多媒體信息的更新時間不滿足更新時間規(guī)則時,每隔第二預(yù)設(shè)時長獲取多 媒體信息集合的更新數(shù)據(jù);
[0055] 在數(shù)據(jù)更新時長達到第H預(yù)設(shè)時長后,根據(jù)第H預(yù)設(shè)時長內(nèi)每一個指定多媒體信 息的更新時間,統(tǒng)計多媒體信息集合的第二預(yù)測更新時