專利名稱::一種訂閱下載的方法及裝置的制作方法
技術領域:
:本發(fā)明涉及計算機及網(wǎng)絡通信領域,特別是涉及訂閱下載的方法及裝置。
背景技術:
:互聯(lián)網(wǎng)已稱為人們日常生活中獲得信息的主要途徑之一,其實現(xiàn)方式主要包括下載和訂閱。下載的形式包括瀏覽網(wǎng)頁時對網(wǎng)頁的下載及通過下載工具對文件的下載等。通過下載可獲得已存在的資源,用戶若搜索不到需要的資源,則只能不斷的重復嘗試搜索,直到搜索到資源才能進行下載。對于目前不存在的資源的獲取,可采用訂閱的方式。一種典型的訂閱方式是RSS,其是在線共享內容的一種簡易方式(也叫聚合內容,ReallySimpleSyndication)。通常在時效性比較強的內容上使用RSS訂閱能更快速獲取信息,網(wǎng)站提供RSS輸出,有利于讓用戶獲取網(wǎng)站內容的最新更新。網(wǎng)絡用戶可以在客戶端借助于支持RSS的新聞聚合工具軟件,在不打開網(wǎng)站內容頁面的情況下閱讀支持RSS輸出的網(wǎng)站內容。RSS新聞訂閱包括新聞欄目訂閱(如國內、國際、財經(jīng)、汽車等)、關鍵詞新聞訂閱(如股票)和地區(qū)欄目(如北京)訂閱。以關鍵詞新聞訂閱為例,其基本實現(xiàn)方式是用戶輸入與訂閱內容有關的關鍵詞或指定訂閱的類別(如體育)等,網(wǎng)絡側周期性將包含有用戶輸入的關鍵詞的資源發(fā)送給用戶所在的客戶端。但目前的訂閱只能實現(xiàn)期刊和文字類資源的訂閱。對于非文字類的資源的訂閱,如軟件、視頻文件等,目前尚無有效的解決方案。
發(fā)明內容本發(fā)明實施例提供一種訂閱下載的方法及裝置,用于實現(xiàn)非文字類信息的訂閱下載。一種訂閱下載的方法,獲得資源,并為該資源設置資源關鍵詞;所述方法還包括以下步驟將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配;在匹配成功時,向所述用戶發(fā)送所述資源關^t建詞對應的資源或對應的資源的相關信息。一種用于訂閱下載的裝置,包括設置模塊,用于為獲得的資源設置資源關鍵詞;匹配模塊,用于將所迷資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配;接口模塊,用于在匹配成功時,向所述用戶發(fā)送所述資源關4定詞對應的資源或對應的資源的相關信息。一種系統(tǒng),包括客戶端,用于獲得用戶輸入的訂閱關鍵詞并發(fā)送;服務器,用于為獲得的資源設置資源關鍵詞,以及將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配,在匹配成功時,向所述用戶發(fā)送所述資源關鍵詞對應的資源或對應的資源的相關信息。本發(fā)明實施例通過資源關鍵詞建立了訂閱關鍵詞與資源的聯(lián)系,實現(xiàn)了非文字類資源的訂閱。圖1為本發(fā)明實施例中裝置的主要結構圖2為本發(fā)明實施例中裝置的具體結構圖3為本發(fā)明實施例中系統(tǒng)的結構圖4為本發(fā)明實施例中訂閱下載的主要方法流程圖5為本發(fā)明實施例中訂閱下載的詳細方法流程圖。具體實施例方式由于非文字類的資源不能直接用于與用戶輸入的訂閱關鍵詞進行比較,所以本發(fā)明實施例為非文字類的資源(以下簡稱資源)預先設置資源關鍵詞,通過將資源關鍵詞與用戶輸入的訂閱關鍵詞的比較,確定用戶需要的資源并向用戶推送該資源或資源的相關信息。實現(xiàn)了非文字類資源的訂閱。參見圖1,本實施例中用于訂閱下載的裝置包括設置模塊101、匹配模塊102和接口才莫塊103。設置模塊101用于為獲得的資源設置資源關鍵詞。設置模塊101可通過接口模塊103獲得資源。匹配模塊102用于將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配。該匹配包括模糊匹配或完全匹配。模糊匹配例如,"導火"與"導火"、"導火索,,和"引導,,都可以匹配成功,其中,"導火,,與"導火"屬于完全匹配。當匹配不成功(即完全不匹配)時,周期性重復該匹配過程,比如每天重復一次??赡艽嬖谶@種情況,對于某個用戶的某個訂閱關4定詞,多次周期性重復仍匹配不成功,則終止匹配。具體實現(xiàn)時,可為匹配次lt沒置一個門限值,例如匹配10次后停止,或者為時間設置一個門限^t,例如一年內都匹配不成功,則達到一年時匹配4亭止。接口模塊103用于在匹配成功時,向所述用戶發(fā)送所述資源關鍵詞對應的資源或對應的資源的相關信息。相關信息包括用于下載所述資源的鏈接地址,如統(tǒng)一資源定位地址、IP地址等。資源關鍵詞與資源是多對多的關系,當匹配成功的資源關鍵詞為多個且對應多個資源時,接口模塊103可將這些資源或資源的相關信息均發(fā)送給用戶,或者由匹配模塊102選擇其中的部分資源通過接口模塊103發(fā)送給用戶。具體是匹配模塊102中的基本匹配單元用于將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行模糊匹配;匹配模塊102中的高級匹配單元用于在基本匹配單元匹配成功時,進一步確定所述資源關鍵詞與用戶輸入的訂閱關鍵詞的匹配程度,確定匹配程度最高的一個或幾個資源關鍵詞,由接口模塊103將資源關鍵詞對應的資源或對應的資源的相關信息發(fā)送給用戶。確定的確定匹配程度的方式有多種,如將匹配一致的詞的長度LA與資源關鍵詞的長度LB的比值LA/LB確定為匹配程度;或者,將LA/(LA+LB)確定為匹配程度等,匹配程度越接近0.5,表示匹配程度越高。為了提高網(wǎng)絡的文明程度,需要對用戶輸入的訂閱關鍵詞進行過濾,因此所述裝置包括分詞過濾模塊104,參見圖2所示,分詞過濾模塊104通過接口模塊103獲得用戶輸入的訂閱關鍵詞,并按照詞性對訂閱關鍵詞進行分詞,然后將分詞后的訂閱關鍵詞與標準詞庫中的標準詞進行比較,過濾掉非法的詞(包括色情的、暴力的和反動的等)。分詞過濾模塊104中的分詞功能與匹配模塊102結合使用,即分詞過濾模塊104對訂閱關鍵詞進行分詞,例如得到王二(歌手)、我(歌曲名)、mp3(格式);匹配模塊102根據(jù)"王二"到包含歌手名字的數(shù)據(jù)庫中進行匹配,在匹配成功時,再根據(jù)"mp3"到"王二"對應的歌曲格式庫中查找歌曲"我"。視頻類和軟件類等資源也可應用該匹配方式。所述裝置還可包括用于存儲資源、資源的相關信息、訂閱關鍵詞和資源關鍵詞等的存儲模塊105。所述裝置是一種邏輯整體,在具體應用中,該裝置可整體位于一個實體中,如位于服務器或客戶端內,該裝置中的各模塊也可位于不同的實體內,如設置模塊101和匹配模塊102位于客戶端,接口模塊103位于服務器。鑒于該裝置的多種存在形式,本實施例提供一種用于訂閱下載的系統(tǒng),參見圖3所示,該系統(tǒng)包括服務器301和客戶端302。當前述裝置整體位于服務器301時客戶端302用于提供用戶訂閱的操作界面,用戶通過該客戶端302提交訂閱關鍵詞,然后接收服務器301發(fā)送的用戶訂閱的資源,或接收資源的相關信息,通過該資源的相關信息下載該資源??蛻舳?02可以有多個。服務器301通過自身的接口模塊獲得某客戶端提供的資源或資源的相關信息,該動作可以是客戶端主動,也可以是服務器301主動;為該資源設置資源關鍵詞,并建立資源與資源關鍵詞的對應關系;以及對客戶端302提交的訂閱關鍵詞進行過濾,若過濾不通過(即發(fā)現(xiàn)非法詞),則通過客戶端302提示用戶重新輸入,若過濾通過,則在獲得新資源時或周期性的,將資源關4定詞與訂閱關鍵詞進行匹配,并將匹配成功的資源關鍵詞對應的資源或對應的資源的相關信息發(fā)送給客戶端302。服務器301可由多個服務器構成。當前述裝置的部分位于服務器301部分位于客戶端302時客戶端302用于獲得資源并提供用戶的輸入為該資源設置資源關鍵詞,以及向服務器301提供該資源及對應的資源關鍵詞。客戶端302還用于提供用戶訂閱的操作界面,用戶通過該客戶端302提交訂閱關鍵詞,客戶端302過濾和保存該過濾通過的訂閱關鍵詞,周期性的或每次接入網(wǎng)絡時,從服務器301處獲得資源關鍵詞,并將其與本地的訂閱關鍵詞進行匹配,以及向服務器301返回匹配成功的關鍵詞,然后接收服務器301發(fā)送的用戶訂閱的資源,或接收資源的相關信息,通過該資源的相關信息下載該資源??蛻舳?02可以有多個。服務器301用于接收客戶端302提供的資源關鍵詞,還可接收對應的資源,同時獲得客戶端302的地址(可作為資源的相關信息);以及根據(jù)客戶端302發(fā)送的匹配成功的資源關鍵詞,查找對應的資源或資源的相關信息,并發(fā)送給客戶端302。由于資源關鍵詞與資源是多對多關系,在建立對應關系時,為了節(jié)省存儲空間,服務器301可根據(jù)預設的算法對資源進行處理,得到相應的內容簽名(cid),使內容相同而對應的資源關鍵詞不同的多個資源對應同一內容簽名,再由該內容簽名對應不同的資源關鍵詞,其對應關系參見表l所示。通過一個應用實例來簡述獲得cid的過程,例如,提取資源的前、中、后各32k字節(jié)的數(shù)據(jù),采用哈希算法對提取的數(shù)據(jù)進行計算,得到的值做為該資源的唯一標識,即得到該資源的cid。表1<table>complextableseeoriginaldocumentpage9</column></row><table>以上是本實施例對裝置和系統(tǒng)的結構描述,下面通過流程的描述來詳細介紹訂閱下載的實現(xiàn)過程。參見圖4,本實施例中訂閱下載的主要方法流程如下步驟401:獲得資源,并為該資源設置資源關鍵詞。步驟402:獲得用戶輸入的訂閱關鍵詞。步驟403:周期性的,或者發(fā)現(xiàn)某用戶接入網(wǎng)絡時,或者有新資源時,將所述資源關鍵詞與該用戶輸入的訂閱關鍵詞進行匹配。步驟404:在匹配成功時,向所述用戶發(fā)送所述資源關^:詞對應的資源或對應的資源的相關信息。匹配不成功時結束本次流程,可周期性重復步驟403。其中,步驟401與步驟402是兩個獨立的操作,無嚴格的執(zhí)行先后。下面結合一個示例來對訂閱下載過程進行詳細描述,參見圖5所示,具體流程如下步驟501:第一客戶端將自身的地址及資源(或資源的描述)發(fā)送給服務器301。例如關于資源1,第一客戶端地址是100.100.100.100,資源描述是"美國電視劇"六人行"第2季第3集(中文字幕),,;以及,關于資源2,第一客戶端地址是101.101.101.101,資源描述是"美國電視劇"六人行,,第2季全集(中文字幕)"。步驟502:服務器301為收到的資源設置資源關4定詞,如關于資源1,資源關鍵詞為"六人行"第2季第3集或為"六人行";如關于資源2,資源關鍵詞為"六人行,,第2季全集或為"六人行"。服務器301可同時建立資源關鍵詞("六人行,,)、資源相關信息(100.100.100.100)、資源描述("美國電視劇"六人行"第2季第3集(中文字幕)")和資源的對應關系。服務器301可進一步將該資源及資源關鍵詞歸入影視類。步驟503:第二客戶端獲得用戶輸入的訂閱關4建詞,同時獲得用戶指定的資源范圍(如影視),并提交給服務器301,例如訂閱關鍵詞為"六人行,,第2季。步驟504:服務器301對訂閱關鍵詞(如"六人行"第2季)進行分詞,如得到"六人行,,和第2季。步驟505:服務器301對分詞后的訂閱關鍵詞("六人行,,和第2季)進行過濾,并且未發(fā)現(xiàn)非法詞語。步驟506:服務器301周期性的將訂閱關鍵詞與同類(影視類)的資源關鍵詞進行匹配。例如,將""六人行,,第2季,,與""六人行"第2季第3集"進行模糊匹配,將""六人行"第2季,,與""六人行"第2季全集"進行模糊匹配。步驟507:步驟506中的兩次匹配均匹配成功,服務器301可以直接向第二客戶端推送兩個資源關^;詞對應的資源,這種方式較適用于完全匹配成功的情況下,推送資源較為準確。為了尊重用戶的選擇,服務器301也可以將兩個資源關鍵詞對應的資源的相關信息發(fā)送給第二客戶端。為了減少對用戶的干擾,提高資源推送的精確度,可繼續(xù)步驟508。步驟508:當訂閱關鍵詞與多個資源關鍵詞匹配成功時,服務器301分別確定匹配程度,確定匹配程度最高的資源關鍵詞。例如,采用LA/(LA+LB)方式,不計算標點,""六人行"第2季"與""六人行,,第2季第3集"的匹配程度為6/(6+9),""六人行,,第2季,,與""六人行"第2季全集"的匹配程度為6/(6+8),則資源關鍵詞""六人行"第2季全集"的匹配程度較高。步驟509:服務器301確定的資源關鍵詞對應的資源或資源的相關信息發(fā)送給第二客戶端。其中,步驟501和502、步驟503-505、步驟506-509這三個環(huán)節(jié)可重復執(zhí)行。當訂閱關鍵詞與所有資源關鍵詞匹配均不成功時,服務器301周期性重復步驟506,直到達到預設的關于時間或次數(shù)的門限值為止。第一客戶端和第二客戶端可均為前述的客戶端302。若服務器301發(fā)送的是資源的相關信息,則用戶可通過第二客戶端根據(jù)資源的相關信息實現(xiàn)資源的下載。服務器301可記錄本次向第二客戶端發(fā)送的資源(或資源關鍵詞等),如本次發(fā)送的是""六人行"第2季第3集",在下次發(fā)送資源時,不再發(fā)送已發(fā)送過的資源,如下次可向第二客戶端推薦""六人行,,第2季第4集",不再推薦""六人行,,第2季第3集",以提高用戶體驗。服務器301還可將訂閱關鍵詞確定為資源關鍵詞,并與所述資源關鍵詞對應相同的資源。例如,將""六人行"第2季,,也作為資源關鍵詞,對應""六人行,,第2季第3集"和""六人行,,第2季全集"對應的資源。用于實現(xiàn)本發(fā)明實施例的軟件可以存儲于軟盤、硬盤、光盤和閃存等存儲介質。本發(fā)明實施例通過資源關鍵詞建立了訂閱關鍵詞與資源的聯(lián)系,實現(xiàn)了非文字類資源的訂閱。并且,本發(fā)明實施例采用直接推送訂閱資源的方式減少了用戶的操作,或者通過推送資源相關信息的方式尊重用戶的選擇并實現(xiàn)了訂閱資源的下載。明的精神和范圍。這樣,倘若對本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內,則本發(fā)明也意圖包含這些改動和變型在內。權利要求1、一種訂閱下載的方法,其特征在于,獲得資源,并為該資源設置資源關鍵詞;所述方法還包括以下步驟將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配;在匹配成功時,向所述用戶發(fā)送所述資源關鍵詞對應的資源或對應的資源的相關信息。2、如權利要求1所述的方法,其特征在于,將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配前,對用戶輸入的訂閱關鍵詞進行過濾。3、如權利要求1所述的方法,其特征在于,還包括步驟獲得用戶指定的資源范圍;當所述資源關鍵詞屬于該資源范圍時,將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配。4、如權利要求1所述的方法,其特征在于,所述匹配包括模糊匹配或完全匹配。5、如權利要求4所述的方法,其特征在于,當所述資源關^t建詞與用戶輸入的訂閱關4定詞完全匹配時,向所述用戶發(fā)送所述資源;當所述資源關鍵詞與用戶輸入的訂閱關鍵詞非完全匹配且匹配成功時,向所述用戶發(fā)送所述資源的相關信息。6、如權利要求4所述的方法,其特征在于,當所述資源關鍵詞與用戶輸入的訂閱關鍵詞非完全匹配且匹配成功時,將用戶輸入的訂閱關鍵詞確定為資源關鍵詞,并與匹配成功的資源關鍵詞對應相同的資源。7、如權利要求1至6中任一項所述的方法,其特征在于,當用戶輸入的訂閱關鍵詞與多個所述資源關鍵詞匹配成功且多個所述資源關鍵詞對應多個資源時,將多個資源或多個資源的相關信息發(fā)送給所述用戶,或者,根據(jù)用戶輸入的訂閱關鍵詞與多個所述資源關鍵詞的匹配程度,將匹配程度最高的資源關鍵詞對應的資源或對應的資源的相關信息發(fā)送給所述用戶。8、如權利要求1所述的方法,其特征在于,所述資源的相關信息包括用于下載所述資源的鏈接地址。9、如權利要求1所述的方法,其特征在于,記錄向所述用戶發(fā)送的所述資源的標識,在下次向所述用戶發(fā)送資源時根據(jù)記錄的標識不發(fā)送該記錄的資源。10、一種用于訂閱下載的裝置,其特征在于,包括設置模塊,用于為獲得的資源設置資源關鍵詞;匹配模塊,用于將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配;接口模塊,用于在匹配成功時,向所述用戶發(fā)送所述資源關^:詞對應的資源或對應的資源的相關信息。11、如權利要求10所述的裝置,其特征在于,所述裝置為服務器或客戶端。12、一種系統(tǒng),其特征在于,包括客戶端,用于獲得用戶輸入的訂閱關鍵詞并發(fā)送;服務器,用于為獲得的資源設置資源關鍵詞,以及將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配,在匹配成功時,向所述用戶發(fā)送所述資源關鍵詞對應的資源或對應的資源的相關信息。全文摘要本發(fā)明公開了一種訂閱下載的方法,用于實現(xiàn)非文字類信息的訂閱下載。所述方法為獲得資源,并為該資源設置資源關鍵詞;將所述資源關鍵詞與用戶輸入的訂閱關鍵詞進行匹配;在匹配成功時,向所述用戶發(fā)送所述資源關鍵詞對應的資源或對應的資源的相關信息。本發(fā)明還公開了一種相應的裝置和系統(tǒng)。文檔編號G06F17/30GK101183394SQ20071030186公開日2008年5月21日申請日期2007年12月18日優(yōu)先權日2007年12月18日發(fā)明者楊建軍,羅志靈申請人:深圳市迅雷網(wǎng)絡技術有限公司