獲取資源的下載鏈接的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了獲取資源的下載鏈接的方法及系統(tǒng),其中,所述方法包括:獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑;當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。通過本發(fā)明,可以利用用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,獲取與用戶瀏覽網(wǎng)頁相關的資源的下載鏈接并呈現(xiàn)給用戶,使所獲取的下載鏈接契合用戶的真實需求,提高了獲取資源的下載鏈接的效率,進而提高了用戶進行資源下載的效率。
【專利說明】獲取資源的下載鏈接的方法及系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及計算機網(wǎng)絡【技術領域】,具體涉及獲取資源的下載鏈接的方法及系統(tǒng)?!颈尘凹夹g】
[0002]隨著計算機網(wǎng)絡的飛速發(fā)展和計算機設備的普及,越來越多的用戶通過互聯(lián)網(wǎng)獲取各種信息和各種所需的資源,網(wǎng)絡下載成為用戶獲取互聯(lián)網(wǎng)資源的主要手段之一。為了更好滿足用戶不斷提高的下載需求,互聯(lián)網(wǎng)上出現(xiàn)了大量以資源下載為主要服務的網(wǎng)絡站點,很多綜合類門戶網(wǎng)站也會提供網(wǎng)絡資源的下載服務。這些站點中有的專門提供某一類資源的下載服務,如專門提供文檔資料、音/視頻、軟件等類別中的某一類下載服務的站點,有的則提供了相對全面的多類別綜合下載服務,下載服務和網(wǎng)絡資源的不斷增加,為用戶在互聯(lián)網(wǎng)上獲取各種資源提供了便利。當然,還有一些網(wǎng)站可能并不是專門提供下載服務的網(wǎng)站,但是偶爾也會有些資源可供下載。例如,某論壇網(wǎng)站,其主要服務是為用戶提供交流平臺,但也可能有些用戶上傳一些資料等文件,可以供其他用戶下載。
[0003]通常,用戶在網(wǎng)絡上下載所需的資源,需要先定位到目標網(wǎng)絡資源,然后才能根據(jù)目標網(wǎng)絡資源的網(wǎng)絡位置進行下載。定位目標網(wǎng)絡資源的手段有多種,例如使用搜索引擎,以所需資源的關鍵詞或者目標下載站點的信息進行檢索,通過搜索引擎提供的搜索結(jié)果到達目標資源的下載頁面;或者輸入地址訪問下載站點或者下載頁面,進而獲取所需資源的下載鏈接。但在這些目標資源的下載頁面中,有的需要通過輸入驗證碼或需要登錄等方式才能獲取的資源下載鏈接;有的則出于增加點擊率,將資源的下載鏈接設計在了當前下載頁面的下級子頁面中;甚至為了推廣產(chǎn)品等目的,有的下載頁面中包含虛假的資源下載鏈接誤導用戶點擊;這些都給用戶從下載頁面中獲取真實有效的資源下載鏈接造成了不便。
[0004]此外,在現(xiàn)有技術中,能夠在下載頁面中提供與用戶所需資源具有一定相關度的其他資源的鏈接,在一定程度上起到了方便了用戶的作用。但頁面中所提供的這些其他資源,其與用戶所需資源的相關度的確定往往比較機械,例如對于軟件類的資源,僅僅從軟件功能分類的角度去確定相關度,且頁面中所提供的多數(shù)甚至全部的相關的資源,往往僅限于該網(wǎng)站內(nèi)的資源,導致多數(shù)時候這些相關資源不能很好地滿足用戶的真實需求。另外,現(xiàn)有技術手段中提供的資源鏈接,依賴與網(wǎng)站的頁面的結(jié)構(gòu)布局,資源鏈接作為一種網(wǎng)絡鏈接,其正確性與站點的結(jié)構(gòu)是相關的,一旦站點改版路徑改變,資源鏈接也就相應的會發(fā)生改變,這將直接影響到向用戶提供的資源鏈接的正確性。當資源鏈接發(fā)生改變,則需要重新分析站點的結(jié)構(gòu)才能將錯誤的資源鏈接排除或修正,而完成這種排除或修正資源鏈接的工作,需要付出的很多的工作量和成本。
[0005]綜上,迫切需要本領域技術人員解決的問題就在于,如何獲取資源的下載鏈接,使所獲取的下載鏈接契合用戶的真實需求,提高用戶下載資源的效率。
【發(fā)明內(nèi)容】
[0006]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的獲取資源的下載鏈接的方法及相應的獲取資源的下載鏈接的系統(tǒng)。
[0007]依據(jù)本發(fā)明的一個方面,提供了一種獲取資源的下載鏈接的方法,包括:
[0008]獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0009]根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑;
[0010]當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
[0011]可選地,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括:
[0012]獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0013]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0014]根據(jù)獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0015]可選地,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括:
[0016]通過瀏覽器程序,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0017]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0018]根據(jù)瀏覽器程序獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0019]可選地,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括:
[0020]獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;所述跳轉(zhuǎn)方式用于標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接;
[0021]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0022]根據(jù)所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0023]可選地,所述獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,包括:
[0024]在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,由瀏覽器程序獲取所述用戶標識信息,并將所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志;
[0025]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0026]根據(jù)所述跳轉(zhuǎn)日志中記錄的所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0027]可選地,所述瀏覽器程序?qū)@取到的所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址、以及相應的下載鏈接記錄為日志,并上傳至服務器端;
[0028]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0029]由服務器端根據(jù)接收到的所述日志,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0030]可選地,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括:
[0031]獲取用戶從預定范圍的網(wǎng)頁為起始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0032]所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0033]根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳
轉(zhuǎn)路徑。
[0034]可選地,所述根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑,包括:
[0035]根據(jù)所述跳轉(zhuǎn)行為中,以所述預定范圍內(nèi)的網(wǎng)頁起始經(jīng)過次數(shù)小于預置閾值的跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
[0036]可選地,還包括:
[0037]以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0038]所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括:
[0039]當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0040]可選地,所述預置的判定方法為特征閾值判定,用于判定的特征為以下的至少一種:
[0041]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接的平均路徑長度;
[0042]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù);
[0043]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0044]由所述預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0045]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0046]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接對應文件的文件類型;
[0047]所述以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括:
[0048]對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0049]或,
[0050]根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
[0051]可選地,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括:
[0052]統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當所述跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
[0053]可選地,還包括:
[0054]以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0055]所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括:
[0056]當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0057]可選地,所述預置的判定方法為特征閾值判定,用于判定的特征為以下的至少一種:
[0058]由同一網(wǎng)頁通過不同的跳轉(zhuǎn)路徑上到達同一下載鏈接時,由該網(wǎng)頁到達該下載鏈接的平均路徑長度;
[0059]跳轉(zhuǎn)路徑上一網(wǎng)頁到達下載鏈接,該下載鏈接被下載的下載次數(shù);
[0060]由一網(wǎng)頁到達一下載鏈接,該下載鏈接被下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0061]由一網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0062]由一網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0063]通過網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,該下載鏈接對應文件的文件類型;
[0064]所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括:
[0065]對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0066]或,
[0067]根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
[0068]可選地,所述預置的判斷方法還包括預置模板判定,所述方法,包括:[0069]利用預置的判斷模板對所述跳轉(zhuǎn)路徑上的網(wǎng)頁,以及對應的所述下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)所述判定結(jié)果對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,所述預置的判斷模板包括:預置的判斷用戶訪問網(wǎng)頁和下載鏈接的URL相關度的正則表達式模板。
[0070]可選地,所述以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括:
[0071]對所述下載鏈接進行有效性檢測,如果檢測所述下載鏈接為有效鏈接,則將該下載鏈接確定為過濾后得到的下載鏈接。
[0072]可選地,還包括:
[0073]檢測所述下載鏈接的鏈接類型,所述鏈接類型用于指示所述下載鏈接是否為特定下載工具的專用鏈接;
[0074]如果檢測到所述下載鏈接類型為所述專用鏈接,則在將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型。
[0075]可選地,所述將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括:
[0076]將所述跳轉(zhuǎn)路徑上的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式呈現(xiàn)給用戶。
[0077]根據(jù)本發(fā)明的另一方面,提供了一種獲取資源的下載鏈接的系統(tǒng),包括:
[0078]信息獲取單元,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0079]路徑生成單元,用于根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑;
[0080]鏈接獲取及顯示單元,用于當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
[0081]可選地,所述信息獲取單元,包括:
[0082]第一信息獲取子單元,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0083]所述路徑生成單元,包括:
[0084]第一路徑生成子單元,用于根據(jù)獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0085]可選地,所述信息獲取單元,包括:
[0086]第二信息獲取子單元,用于通過瀏覽器程序,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0087]所述路徑生成單元,包括:
[0088]第二路徑生成子單元,用于根據(jù)通過瀏覽器程序獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0089]可選地,所述信息獲取單元,包括:
[0090]第三信息獲取子單元,用于獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;所述跳轉(zhuǎn)方式用于標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接;
[0091]所述路徑生成單元,包括:
[0092]第三路徑生成子單元,用于根據(jù)所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0093]可選地,所述第三信息獲取子單元,具體用于:
[0094]在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,通過瀏覽器程序獲取所述用戶標識信息,并將所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志;
[0095]所述第三路徑生成子單元,具體用于:
[0096]根據(jù)所述跳轉(zhuǎn)日志中記錄的所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0097]可選地,通過所述瀏覽器程序?qū)@取到的所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址、以及相應的下載鏈接記錄為日志,并上傳至服務器端第三路徑生成子單元;
[0098]所述第三路徑生成子單元位于服務器端,具體用于:
[0099]在服務器端根據(jù)接收到的所述日志,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0100]可選地,所述信息獲取單元,包括:
[0101]第四信息獲取子單元,用于獲取用戶從預定范圍的網(wǎng)頁為起始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0102]所述路徑生成單元,包括:
[0103]第四路徑生成子單元,用于根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
[0104]可選地,所述第四路徑生成子單元,具體用于:
[0105]根據(jù)所述跳轉(zhuǎn)行為中,以所述預定范圍內(nèi)的網(wǎng)頁起始經(jīng)過次數(shù)小于預置閾值的跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
[0106]可選地,其特征在于,還包括:
[0107]篩選單元,以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0108]所述鏈接獲取及顯示單元,具體用于:
[0109]當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0110]可選地,所述預置的判定方法為特征閾值判定,所述系統(tǒng)還包括:第一特征獲取單元,用于獲取以下用于判定的特征的至少一種:
[0111]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接的平均路徑長度;
[0112]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù);[0113]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0114]由所述預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0115]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0116]以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接對應文件的文件類型;
[0117]所述篩選單元,具體用于:
[0118]對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0119]或,
[0120]根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
[0121]可選地,所述信息獲取單元,包括:
[0122]第五信息獲取子單元,用于統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當所述跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
[0123]可選地,其特征在于還包括:
[0124]過濾單元,用于以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0125]所述鏈接獲取及顯示單元用于:當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將經(jīng)過過濾單元過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0126]可選地,所述預置的判定方法為特征閾值判定,所述系統(tǒng)還包括:第二特征獲取單元,用于獲取以下至少一種特征:
[0127]由同一網(wǎng)頁通過不同的跳轉(zhuǎn)路徑上到達同一下載鏈接時,由該網(wǎng)頁到達該下載鏈接的平均路徑長度;
[0128]跳轉(zhuǎn)路徑上一網(wǎng)頁到達下載鏈接,該下載鏈接被下載的下載次數(shù);
[0129]由一網(wǎng)頁到達一下載鏈接,該下載鏈接被下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0130]由一網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0131]由一網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0132]通過網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,該下載鏈接對應文件的文件類型;
[0133]所述過濾單元,具體用于:[0134]對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0135]或,
[0136]根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接權(quán)值。
[0137]可選地,所述預置的判定方法還包括預置模板判定,所述過濾單元,用于:
[0138]利用預置的判斷模板對所述用戶訪問網(wǎng)頁,以及對應的下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)所述判定結(jié)果對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,所述預置的判斷模板包括:預置的判斷用戶訪問網(wǎng)頁和下載鏈接的URL相關度的正則表達式模板。
[0139]可選地,所述過濾單元,包括:
[0140]有效性檢測子單元,用于對所述下載鏈接進行有效性檢測,如果檢測所述下載鏈接為有效鏈接,則將該下載鏈接確定為過濾后得到的下載鏈接。
[0141]可選地,還包括:
[0142]鏈接類型檢測單元,用于檢測所述下載鏈接的鏈接類型,所述鏈接類型用于指示所述下載鏈接是否為特定下載工具的專用鏈接;
[0143]所述鏈接獲取及顯示單元,用于:
[0144]如果檢測到所述下載鏈接類型為所述專用鏈接,則在將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型。
[0145]可選地,所述鏈接獲取及顯示單元,用于:
[0146]將所述跳轉(zhuǎn)路徑上的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式呈現(xiàn)給用戶。
[0147]根據(jù)本發(fā)明的獲取資源的下載鏈接的方法可以在用戶瀏覽網(wǎng)頁的過程中,特別是通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的過程中,收集到達所訪問下載鏈接跳轉(zhuǎn)行為,跳轉(zhuǎn)行為實際上反映了用戶訪問下載鏈接的過程,利用收集到的這些下載過程的信息,生成下載鏈接過程的訪問下載鏈接的跳轉(zhuǎn)路徑,相當于生成了從頁面到達網(wǎng)絡資源的鏈式路徑數(shù)據(jù),在用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁地址時,根據(jù)跳轉(zhuǎn)路徑得到與用戶訪問的地址相關的下載鏈接并呈現(xiàn),由于獲得的與用戶訪問的網(wǎng)頁地址相關的下載鏈接以用戶日常的下載行為和過程為基礎,所得到的相關下載鏈接更加符合瀏覽網(wǎng)頁者的下載需求,同時所得到的下載鏈接可以并不局限于本網(wǎng)頁或網(wǎng)頁所在網(wǎng)站內(nèi)的下載鏈接,并將該網(wǎng)頁相關的真實有效的下載鏈接呈現(xiàn)給用戶。而且,獲得的與用戶訪問的網(wǎng)頁相關的下載鏈接以用戶日常的下載行為和過程為基礎,而不是依賴與網(wǎng)站的頁面的結(jié)構(gòu)布局,一旦出現(xiàn)失效鏈接,可以很容易地從獲取到用戶對鏈接的日常訪問中體現(xiàn)出來,從而降低了排除或修正失效資源鏈接的工作成本。解決了通過頁面進行下載的效率較低的問題,取得了獲取更加符合用戶需要的下載鏈接,豐富了用戶的下載選擇,排除了虛假鏈接的干擾,提高了通過頁面進行下載的效率的有益效果。
[0148]進一步的,通過本發(fā)明的獲取資源的下載鏈接的方法,可以通過瀏覽器程序,獲取用戶標識信息,并記錄用戶標識信息對應的用戶訪問下載鏈接過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接。進而,根據(jù)用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的過程,并獲取用戶通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的跳轉(zhuǎn)行為,從而根據(jù)獲取的數(shù)據(jù),準確地還原了用戶通過網(wǎng)頁跳轉(zhuǎn)方式訪問下載鏈接的過程,為根據(jù)跳轉(zhuǎn)行為生成跳轉(zhuǎn)路徑打好基礎。
[0149]再進一步的,本發(fā)明獲取資源的下載鏈接的方法,還可以依據(jù)獲得的多種特征對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,進而將過濾后得到的下載鏈接呈現(xiàn)給用戶,使得與用戶瀏覽的網(wǎng)頁地址有較高相關性的下載鏈接能夠得到優(yōu)先呈現(xiàn),提高了所呈現(xiàn)的鏈接地址與用戶需求的匹配度。以及,
[0150]在依據(jù)獲得的多種特征對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,可以使用特征閾值的判定方法,基于所獲取到的用于判定的特征,對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,進而將過濾后得到的下載鏈接呈現(xiàn)給用戶,同時,特征閾值的判定方法還可以與預置的判斷模板結(jié)合使用,對用戶訪問網(wǎng)頁地址,以及下載鏈接的URL進行相關度判斷,進一步提高了對相關下載鏈接進行過濾的有效性,進一步提高了所呈現(xiàn)的鏈接地址與用戶需求的匹配度。
[0151]上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0152]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:
[0153]圖1是根據(jù)本發(fā)明一個實施例的獲取資源的下載鏈接的方法流程圖;
[0154]圖2是根據(jù)本發(fā)明一個實施例的訪問下載鏈接的跳轉(zhuǎn)路徑的示意圖;
[0155]圖3是根據(jù)本發(fā)明一個實施例的獲取資源的下載鏈接的系統(tǒng)結(jié)構(gòu)示意圖。
【具體實施方式】
[0156]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0157]如圖1所示,是根據(jù)本發(fā)明一個實施例的獲取資源的下載鏈接的方法,該方法可以包括以下步驟:
[0158]SlOl:獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0159]要獲取網(wǎng)絡上的可下載的資源,首先需要獲得資源的網(wǎng)絡地址,即下載鏈接,而要獲取資源的下載鏈接,可以通過瀏覽網(wǎng)站網(wǎng)頁,根據(jù)其中提供的下載地址來獲得。在傳統(tǒng)的獲取方式中,用戶可以通過搜索引擎,輸入所需資源的關鍵詞,通過搜索引擎給出的搜索結(jié)果,來到達包含所需資源鏈接信息的網(wǎng)頁;或者也可以根據(jù)記憶或者地址收藏來訪問目標網(wǎng)絡資源的下載站點/頁面。這些訪問方式中,大多數(shù)情況下用戶都需要通過多步操作,通過網(wǎng)頁間的跳轉(zhuǎn)的方式訪問多個頁面,才能到達和獲取資源的下載鏈接。
[0160]在本發(fā)明實施例提供的方法中,首先可以獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,具體在獲取的過程中,可以通過具有信息收集功能的瀏覽器程序,來收集通過網(wǎng)頁跳轉(zhuǎn)訪問資源的下載鏈接過程中的跳轉(zhuǎn)行為;也可以通過具有相關功能的瀏覽器插件,或者在操作系統(tǒng)上安裝的監(jiān)控程序來實現(xiàn)等等,具體實現(xiàn)獲取跳轉(zhuǎn)行為的手段可以有多種,本發(fā)明實施例對此并沒有限制。
[0161]而所要獲取的通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,可以包括兩方面的信息:通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中所訪問各網(wǎng)頁,以及相應的下載鏈接。這里的所訪問網(wǎng)頁可以以對應的網(wǎng)頁地址來表示,跳轉(zhuǎn)行為可以僅包括一個網(wǎng)頁,也可以包括多個網(wǎng)頁,具體情況可以根據(jù)通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的實際過程來確定,例如在某個用戶打開的網(wǎng)頁中直接包含了所需的目標下載鏈接并對該下載鏈接進行了訪問,則所獲取的網(wǎng)頁可以只包含這一個網(wǎng)頁;而如果用戶是通過一系列的網(wǎng)頁跳轉(zhuǎn)才訪問到某個下載鏈接,則所獲取的網(wǎng)頁可以包括整個過程中所訪問的各個網(wǎng)頁。在實際應用中,后者是更經(jīng)常出現(xiàn)的情況,即用戶是通過多個網(wǎng)頁間的多次跳轉(zhuǎn)才最終進行資源下載,這種情況下,可以獲取通過多次跳轉(zhuǎn)訪問下載鏈接的過程中所訪問的各個網(wǎng)頁,以及相應的下載鏈接。
[0162]具體在獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為的過程中,可以首先獲取用戶標識信息,以及用戶標識信息對應用戶每次通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式、所訪問各網(wǎng)頁的地址、以及相應的下載鏈接;再根據(jù)用戶標識信息、每次網(wǎng)頁跳轉(zhuǎn)的跳轉(zhuǎn)時間以及跳轉(zhuǎn)方式,各網(wǎng)頁地址,和對應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程。其中跳轉(zhuǎn)方式用來標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接。這個過程實際上是利用上述的標識信息、跳轉(zhuǎn)時間,跳轉(zhuǎn)方式,網(wǎng)頁地址,下載鏈接等信息,對用戶的通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程進行還原的過程,獲取的用戶標識用于在還原該過程時對不同的用戶進行區(qū)分,標識信息可以通過客戶端程序來獲取,如現(xiàn)有很多瀏覽器軟件都提供了登錄功能,可以根據(jù)將用戶在瀏覽器軟件上的登錄的用戶信息作為用戶標識信息,也可以根據(jù)用戶機器的硬件信息,如硬盤、CPU之類的硬件生成唯一的用戶標識信息,不需要進行登錄;而跳轉(zhuǎn)時間信息,則反映了用戶所訪問之間的順序,即先訪問了那個網(wǎng)頁,進而通過該網(wǎng)頁又跳轉(zhuǎn)到了哪個網(wǎng)頁,所訪問的網(wǎng)頁被訪問的先后順序,可以通過訪問時間來體現(xiàn),根據(jù)上述標識信息、跳轉(zhuǎn)時間,跳轉(zhuǎn)方式,將用戶訪問通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接過程中所訪問的網(wǎng)頁地址、下載鏈接串聯(lián)起來,就還原了用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,從而獲取了用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
[0163]具體在獲取標識信息、跳轉(zhuǎn)時間,跳轉(zhuǎn)方式,將用戶訪問通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接過程中所訪問的網(wǎng)頁地址、下載鏈接等信息時,可以在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的行為時,由瀏覽器程序獲取用戶標識信息,并將用戶標識信息,以及用戶標識信息對應的用戶訪問下載鏈接過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志。進而,根據(jù)日志中所記錄的跳轉(zhuǎn)日志,用戶標識信息,以及用戶標識信息對應的用戶訪問下載鏈接過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的過程,并獲取用戶通過網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的跳轉(zhuǎn)行為。
[0164]獲取跳轉(zhuǎn)行為的操作,在不同的系統(tǒng)中,也可以有不同的實現(xiàn)方式,例如可以由瀏覽器端和服務器端來配合完成,具體的,可以由瀏覽器端將用戶標識信息,網(wǎng)頁跳轉(zhuǎn)信息(包括跳轉(zhuǎn)時間和跳轉(zhuǎn)方式),所訪問的網(wǎng)頁地址以及下載鏈接等信息上傳到服務器端,由服務器端對這些信息進行組織和分析。具體瀏覽器端收集和上傳上述信息時,可以將上述收集到的信息保存為日志文件,進而將包括上述信息的日志文件傳輸?shù)椒掌鞫诉M行分析。需要說明的是,在瀏覽器端收集到信息中,可能部分信息并不是必需的,例如如果用戶某次打開瀏覽器程序只是為了瀏覽信息,期間并不涉及對網(wǎng)絡資源的下載,如用戶進行了類似于這樣的操作:
[0165]打開瀏覽器程序,瀏覽頁面A,跳轉(zhuǎn)并瀏覽頁面B,又跳轉(zhuǎn)到并瀏覽頁面C,關閉瀏覽器程序。
[0166]這樣的一系列操作更只是為了瀏覽網(wǎng)頁信息,其中并沒有訪問任何下載鏈接,對于瀏覽器程序收集到的類似這樣信息,可以在瀏覽器端上傳數(shù)據(jù)到服務器端前將這些與訪問下載鏈接無關的信息過濾掉,保留過濾后的信息。當然,在實際應用中,為了減輕瀏覽器端的壓力,也可以由服務器端對瀏覽器端上傳的數(shù)據(jù)中的這些與下載無關的數(shù)據(jù)進行過濾。
[0167]此外,在獲取跳轉(zhuǎn)行為的過程中,也可以獲取用戶通過跳轉(zhuǎn)次數(shù)小于預置閾值的網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,具體可以是統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,才獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。這是因為通過網(wǎng)頁跳轉(zhuǎn)的方式訪問一個下載鏈接的過程中,所經(jīng)歷的跳轉(zhuǎn)次數(shù)越多,則起始的頁面與最終訪問的下載鏈接之間的聯(lián)系更傾向于越??;反之,所經(jīng)歷的跳轉(zhuǎn)次數(shù)越少,則起始的頁面與最終訪問的下載鏈接之間的聯(lián)系更傾向于越緊密;如果需要經(jīng)歷相當多的次數(shù)跳轉(zhuǎn)才能到達一個下載鏈接,比如五十次,則可以認為起始的頁面與最終訪問的下載鏈接之間已經(jīng)接近于沒有聯(lián)系了。所以可以僅獲取用戶通過跳轉(zhuǎn)次數(shù)小于預置閾值的網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,如一次訪問下載鏈接經(jīng)過了 5次跳轉(zhuǎn):
[0168]從網(wǎng)頁I開始跳轉(zhuǎn)到網(wǎng)頁2,跳轉(zhuǎn)到網(wǎng)頁3,......一直跳轉(zhuǎn)到網(wǎng)頁5,由網(wǎng)頁5跳轉(zhuǎn)
到下載鏈接A。如果預置的跳轉(zhuǎn)次數(shù)的閾值為3次,則在這個過程中可以只獲取最后3次跳轉(zhuǎn)所經(jīng)過的網(wǎng)頁地址,即網(wǎng)頁3的地址、網(wǎng)頁4的地址、網(wǎng)頁5的地址、以及下載鏈接A,所到達的下載鏈接以及其他相關信息。
[0169]S102:根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑;
[0170]在步驟SlOl中獲取到的跳轉(zhuǎn)行為是一種用戶的下載過程信息,反映了通過一次或多次網(wǎng)頁跳轉(zhuǎn)訪問下載鏈接的過程,可以根據(jù)跳轉(zhuǎn)行為生成訪問下載鏈的跳轉(zhuǎn)路徑,將這種跳轉(zhuǎn)的過程以計算機數(shù)據(jù)的形式表示,以將收集到的跳轉(zhuǎn)行為進行有效的組織和利用。所生成的跳轉(zhuǎn)路徑可以存儲為特定數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)庫。通過一次或多次跳轉(zhuǎn)訪問下載鏈接的過程,可以抽象為由一系列受訪問網(wǎng)頁地址和下載鏈接組成的一條鏈式數(shù)據(jù),每一次從一個頁面開始到達一個下載鏈接,都可以作為一條鏈式數(shù)據(jù),可以將這些鏈式的數(shù)據(jù)以數(shù)據(jù)庫的形式組織存儲。在Sioi中,不排除獲取到的跳轉(zhuǎn)行為是單一用戶的跳轉(zhuǎn)行為的情況,單一用戶對應的跳轉(zhuǎn)行為,也可以用來反映該用戶的瀏覽習慣,可以用來作為向該用戶推薦下載鏈接的依據(jù),但在實際應用中,所獲取到的跳轉(zhuǎn)行為更傾向于是多個用戶所組成的用戶群體的跳轉(zhuǎn)行為,通過綜合用戶群體的跳轉(zhuǎn)行為生成的資源下載跳轉(zhuǎn)路徑,更加能反映一個網(wǎng)頁與從這個網(wǎng)頁進行跳轉(zhuǎn)所到達的下載資源之間的關系緊密程度。
[0171]如前所述,所要獲取的跳轉(zhuǎn)行為至少可以包括兩方面的信息:通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中所訪問各網(wǎng)頁的網(wǎng)頁,以及相應的下載鏈接,則根據(jù)跳轉(zhuǎn)行為生成訪問下載鏈接的跳轉(zhuǎn)路徑的過程中,可以根據(jù)獲取到的用戶訪問的各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。而在根據(jù)跳轉(zhuǎn)行為生成的跳轉(zhuǎn)路徑中,至少存在兩個對應的節(jié)點:對應于所訪問網(wǎng)頁的網(wǎng)頁節(jié)點;以及,對應于下載鏈接的下載鏈接節(jié)點。在通過跳轉(zhuǎn)進行資源下載的過程中,如果涉及到兩次以上的網(wǎng)頁跳轉(zhuǎn),則跳轉(zhuǎn)行為中包括了多個網(wǎng)頁,對應的,所生成的跳轉(zhuǎn)路徑中,可以包含多個對應的網(wǎng)頁節(jié)點,分別對應于跳轉(zhuǎn)過程中所訪問的各個網(wǎng)頁。
[0172]在資源下載跳轉(zhuǎn)路徑中,包括了網(wǎng)頁節(jié)點和下載鏈接節(jié)點,這些節(jié)點對應的網(wǎng)頁或下載鏈接,可以以其在網(wǎng)絡上的鏈接地址作為唯一的標識信息,因此網(wǎng)絡地址也可以作為跳轉(zhuǎn)路徑中各個節(jié)點的表達形式,其中,網(wǎng)頁可以以其對應的統(tǒng)一資源定位符URL表示,而下載鏈接除了以URL形式表示,還有一些專有的特殊形式,如某些下載軟件專有的下載鏈接表達形式。跳轉(zhuǎn)路徑可以表達為類似于如下示例中的形式:
[0173]網(wǎng)頁URLOl -網(wǎng)頁URL02 -…-網(wǎng)頁URL (η)-下載鏈接。
[0174]此外,還可以將網(wǎng)頁地址或下載鏈接轉(zhuǎn)化為其他數(shù)據(jù)形式,例如轉(zhuǎn)化為鏈接或地址對應的MD5值,進而利用各鏈接或地址對應的MD5值來表達跳轉(zhuǎn)路徑,進一步提高了數(shù)據(jù)的安全性,易于實現(xiàn)檢索,此時,跳轉(zhuǎn)路徑可以表達為類似于如下示例中的形式:
[0175]URLOl 的 MD5 - URL02 的 MD5 -…-URL (η)的 MD5 -下載鏈接的 MD5。
[0176]在實際應用中跳轉(zhuǎn)行為所體現(xiàn)的下載過程之間還經(jīng)常表現(xiàn)出更為復雜的關系,表現(xiàn)在跳轉(zhuǎn)路徑上時,跳轉(zhuǎn)路徑上的節(jié)點可能同時也是另外一條跳轉(zhuǎn)路徑上的節(jié)點,同一個節(jié)點在不同的同時位于不同的跳轉(zhuǎn)路徑上時可能對應不同的下載鏈接節(jié)點等等,而使用樹狀或者網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)來表達或存儲這種更為復雜的關系,則更為貼近實際應用場景,同時也更利于計算機存儲和對數(shù)據(jù)進行索引。下面結(jié)合附圖進行更清楚的舉例說明,以使讀者對根據(jù)跳轉(zhuǎn)行為生成跳轉(zhuǎn)路徑這一過程有更清楚的了解。
[0177]參見附圖2,其中PageA代表一個頁面地址Α,以此類推;Source_Sl代表下載鏈接SI,以此類推。通過圖2可以看出,通過從同一頁面地址A進行跳轉(zhuǎn)訪問下載鏈接,先后生成了 3條跳轉(zhuǎn)路徑,分別為:
[0178]PageA - PageB - PageC - Source_Sl;
[0179]PageA - PageD - PageE - Source_S2;
[0180]PageA - PageB - PageF - PageG - Source_S3。
[0181]可見,從同一頁面地址A可以通過不同的跳轉(zhuǎn)路徑訪問到至少3個不同的下載鏈接。在其中第一條跳轉(zhuǎn)路徑中的節(jié)點PageB,又同時位于兩條跳轉(zhuǎn)路徑中,并且以PageB為起點又可以形成另外兩條分別能夠到達資源SI和S3跳轉(zhuǎn)路徑:[0182]PageB - PageC - Source_SI;
[0183]PageB - PageF - PageG - Source_S3。
[0184]可見,圖2中使用的樹狀的數(shù)據(jù)結(jié)構(gòu)很好地表達或存儲這種更為復雜的關系。
[0185]需要說明的是,以上各示例是為了闡述資源下載跳轉(zhuǎn)路徑的表達形式,使讀者對資源下載跳轉(zhuǎn)路徑及其生成過程有更清晰的了解,在實際應用中,資源下載跳轉(zhuǎn)路徑還可以有其他的計算機表達形式,以上示例不應當被理解為對本發(fā)明的限制。此外,如前所述,跳轉(zhuǎn)行為可以是通過瀏覽器程序獲取到的,用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載過程中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,那么在根據(jù)跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑的過程中,就可以根據(jù)瀏覽器程序獲取到的用戶訪問的各網(wǎng)頁地址以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0186]S103:當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)
給用戶。
[0187]當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,可以將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。具體在呈現(xiàn)時,可以采用操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式,也可以在瀏覽器的內(nèi)容瀏覽區(qū)域開辟一塊單獨的區(qū)塊來呈現(xiàn)下載鏈接。
[0188]訪問下載鏈接的跳轉(zhuǎn)路徑可以反映頁面與通過跳轉(zhuǎn)能夠訪問的下載鏈接之間的關聯(lián)關系,但有些情況下,如下載鏈接要經(jīng)過比較多次數(shù)的跳轉(zhuǎn)才能訪問,則可能兩者的關聯(lián)性不強,又如同一個頁面可能對應于多個下載鏈接,每個下載鏈接的受關注度并不相同,因此,在根據(jù)跳轉(zhuǎn)行為,生成跳轉(zhuǎn)路徑后,還可以在網(wǎng)頁所在的跳轉(zhuǎn)路徑上,以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,將過濾后得到的下載鏈接對應的下載鏈接,確定為該網(wǎng)頁的相關下載鏈接。通過對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,得到與用戶所訪問的網(wǎng)頁的相關度相對較高的下載鏈接。
[0189]在以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,可以有不同的實現(xiàn)方式,下面對這些不同的實現(xiàn)方式進行介紹。
[0190]首先,預置的判定方法可以是特征閾值判定,具體實現(xiàn)時,首先可以獲取以下用于判定的特征中的至少一種:
[0191]用戶訪問網(wǎng)頁所在的跳轉(zhuǎn)路徑上,由該網(wǎng)頁到達下載鏈接的平均路徑長度;
[0192]用戶訪問網(wǎng)頁所在的跳轉(zhuǎn)路徑上,由該網(wǎng)頁到達下載鏈接,該下載鏈接被所有用戶下載的下載次數(shù);
[0193]用戶訪問網(wǎng)頁所在的跳轉(zhuǎn)路徑上,由該網(wǎng)頁到達下載鏈接,該鏈接被所有用戶下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接被下載的總的下載次數(shù)的下載次數(shù)比;
[0194]由用戶訪問網(wǎng)頁開始跳轉(zhuǎn)而訪問下載鏈接的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0195]用戶訪問網(wǎng)頁所在的跳轉(zhuǎn)路徑上,由該網(wǎng)頁到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0196]用戶訪問網(wǎng)頁所在的跳轉(zhuǎn)路徑上,由該網(wǎng)頁到達一下載鏈接,訪問該下載鏈接對應文件的文件類型;
[0197]下面對上述的用于判定的特征進行詳細介紹。[0198]由一網(wǎng)頁到達一個下載鏈接的過程中,不同的用戶或者同一用戶在不同的時間條件下,所經(jīng)過的跳轉(zhuǎn)路徑以及跳轉(zhuǎn)路徑的長度可能是不一樣的,而跳轉(zhuǎn)路徑的長度能反映出網(wǎng)頁與下載鏈接之間聯(lián)系的緊密程度。
[0199]可以在通過統(tǒng)計同一網(wǎng)頁到達同一下載鏈接的不同跳轉(zhuǎn)路徑的長度,來獲取平均跳轉(zhuǎn)路徑長度。一個下載鏈接被用戶下載的下載次數(shù),可以反映出該下載鏈接受用戶關注的程度,下載鏈接的被下載次數(shù),可以通過統(tǒng)計用戶對對應資源的下載次數(shù)來獲得,具體的可以在用戶下載時統(tǒng)計,也可以根據(jù)該下載鏈接在所有跳轉(zhuǎn)路徑中出現(xiàn)的次數(shù)來確定。在同一個網(wǎng)頁同時對應有多個不同的下載鏈接時,還可以計算各個下載鏈接被所有用戶下載的次數(shù)占該網(wǎng)頁能夠到達的所有下載鏈接被下載總次數(shù)的下載次數(shù)比例,這個比例也可以反映出該網(wǎng)頁相關的下載鏈接中,每個鏈接的受關注程度。
[0200]用戶通過一個網(wǎng)頁進行跳轉(zhuǎn),可以根據(jù)跳轉(zhuǎn)是否下載行為分為下載跳轉(zhuǎn)和瀏覽跳轉(zhuǎn),如果用戶通過一個網(wǎng)頁進行下載跳轉(zhuǎn)的次數(shù)比較多,則該頁面更可能是與下載行為相關度較高的頁面,因此可以通過統(tǒng)計由一網(wǎng)頁出發(fā)跳轉(zhuǎn)而訪問下載鏈接的次數(shù),占所有跳轉(zhuǎn)次數(shù)的比例,來確定該網(wǎng)頁與用戶下載的相關度,進而為確定該頁面與對應下載鏈接的相關度確定提供參考。
[0201]對一些下載鏈接進行訪問時,有時需要提供用戶認證信息才能被允許訪問,而需要用戶認證信息才能訪問的下載鏈接,無疑會增加用戶的下載難度,因此,是否需要用戶認證信息才能訪問下載鏈接也可以作為對下載鏈接進行過濾的特征之一。此外,下載鏈接對應文件的文件類型也可以作為用于判定的特征對下載鏈接進行過濾,在一個提供軟件服務的站點中,比較這些軟件安裝文件的文件類型,可能是后綴名是.exe,.msi等的文件,比一個以.pdf為后綴名的軟件說明文檔更加符合用戶的需求。
[0202]在獲取用于判定的特征中的至少一種后,可以利用獲取到的用于判定的特征,通過特征閾值判定的方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,具體實現(xiàn)時,可以有不同的實現(xiàn)方式,如:
[0203]可以對各用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接,將過濾后得到的下載鏈接呈現(xiàn)給用戶;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接。例如使用上述的前三個用于判定的特征對下載鏈接進行過濾時,可以平均路徑長度、下載次數(shù)、跳轉(zhuǎn)次數(shù)比分別設置閾值,只有同時符合這三個特征分別對應的閾值的情況下,才將該下載鏈接確定為過濾后得到的下載鏈接。
[0204]或者,也可以根據(jù)至少一種用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接呈現(xiàn)給用戶;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。在獲取了其中一種或幾種用于判定的特征后,可以根據(jù)獲取到的用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,如果是根據(jù)多種用于判定的特征去計算權(quán)值,還可以為各個用于判定的特征分配一定的權(quán)重比例,進而綜合多種用于判定的特征更加準確的判斷網(wǎng)頁與下載鏈接的相關度。最后將達到預置權(quán)值閾值的下載鏈接,確定為該網(wǎng)頁的相關下載鏈接。[0205]其次,在以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,預置的判定方法還可以是預置模板判定,這種方法是利用預置的判斷模板對用戶訪問網(wǎng)頁地址,以及所述下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)所述判定結(jié)果對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,預置的判斷模板包括:預置的判斷用戶訪問網(wǎng)頁地址和下載鏈接的URL相關度的正則表達式模板。
[0206]網(wǎng)頁所屬站點如果與相關下載鏈接所屬站點如果是同一站點,則一般認為網(wǎng)頁與相關下載鏈接的相關度較高,例如一般情況下,用戶通過提供下載服務的站點尋找所需下載資源時,一般都會優(yōu)先下載該網(wǎng)站內(nèi)的資源,而后才會選擇再跳轉(zhuǎn)到其他網(wǎng)站進行下載;由于一般的網(wǎng)頁和下載鏈接都可以以URL表示,因此可以基于URL對網(wǎng)頁與對應下載鏈接進行相關度判斷,產(chǎn)生一判斷結(jié)果,如果判斷結(jié)果是網(wǎng)頁跟下載鏈接屬于同一站點,則確定該下載鏈接與當前訪問的網(wǎng)頁相關度較高,反之則較低。根據(jù)這一結(jié)果,可以在過濾時,僅將相關度較高的下載鏈接確定為過濾后得到的下載鏈接,也可以為相關度較高的下載鏈接較高的權(quán)值,反之則賦予以較低權(quán)值。判斷網(wǎng)頁與對應下載鏈接是否位于同一站點時,可以利用預置的判斷模板對所述網(wǎng)頁與對應下載鏈接進行相關度判斷,其中,預置的判斷模板可以是判斷網(wǎng)頁地址以及對應下載鏈接相關度的正則表達式模板。如當頁面地址符合正則“http: //www.0nlinedown.net/soft/.*,,,同時下載鏈接符合正則 “http: //*.0nlinedown.net/down/.*”時,則認為下載鏈接與該頁面相關度較高。
[0207]再者,在以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,還可以結(jié)合使用上述的特征閾值判定的方法和預置模板判定的方法,如可以先通過特征閾值判定的方法得到對下載鏈接的過濾的下載鏈接集合,再用閾值模板判定的方法對下載鏈接集合再進行一次過濾。
[0208]此外,一些網(wǎng)頁上可能存在一些已經(jīng)失效的鏈接,如頁面中引用了其它站點的下載鏈接,如果該引用其它站點上的鏈接已經(jīng)失效,這個引用也就失效了,因此還可以對下載鏈接進行有效性檢測;進而在網(wǎng)頁所在的跳轉(zhuǎn)路徑上,以預置條件對跳轉(zhuǎn)路徑上被檢測為有效的下載鏈接進行過濾,將過濾后得到的有效的下載鏈接作為該網(wǎng)頁的相關下載資源并呈現(xiàn)給用戶。當然,這種對下載鏈接的有效性的檢測可以單獨使用,或結(jié)合前述的三種對下載鏈接進行過濾的方法中的任意一種來使用。
[0209]進一步的,在確定了網(wǎng)頁的相關下載鏈接后,當用戶訪問某網(wǎng)頁時,可以將該網(wǎng)頁的相關下載鏈接呈現(xiàn)給用戶。具體在呈現(xiàn)時,可以以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式將下載鏈接展現(xiàn)在用戶的顯示器上,便于用戶查看。此外,一些下載鏈接還可能是特定下載工具的專用鏈接類型,例如下載工具迅雷、emule電驢等下載工具都有各自的專用鏈接類型,此時還可以首先檢測所述下載鏈接的鏈接類型,即檢測相關鏈接否為特定下載工具的專用鏈接,如果下載鏈接是特定下載工具的專用鏈接,則將該網(wǎng)頁的相關下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型,用戶可以根據(jù)顯示的鏈接類型調(diào)用專用鏈接對應的下載工具,進一步方便了用戶對鏈接對應的資源進行下載。
[0210]在另一種實施方式下,在獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,可以預先設定一定范圍的目標網(wǎng)頁,僅在用戶訪問這些預定范圍內(nèi)的目標網(wǎng)頁,并以這些目標網(wǎng)頁為起始通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載時,獲取用戶從預定范圍的網(wǎng)頁開始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。因為在全網(wǎng)的所有網(wǎng)頁中,存在一部分可能觸發(fā)資源下載行為的頁面,即通過這些網(wǎng)頁觸發(fā)的資源下載行為的幾率較高,如下載站點的下載頁面,可能觸發(fā)下載行為的博客網(wǎng)頁、新聞網(wǎng)頁等;同時也存在通過網(wǎng)頁跳轉(zhuǎn)觸發(fā)資源下載的可能性相對較低的網(wǎng)頁。因此,可以將觸發(fā)資源下載行為的可能性較高的網(wǎng)頁收集起來,作為預定范圍的目標頁面,進而僅在用戶訪問這些預定范圍的網(wǎng)頁,并以這些網(wǎng)頁為起始通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載時,對其跳轉(zhuǎn)行為進行收集。
[0211]在這種實現(xiàn)方式下,在根據(jù)跳轉(zhuǎn)行為生成訪問下載鏈接的跳轉(zhuǎn)路徑的過程中,就可以根據(jù)跳轉(zhuǎn)行為,生成以預定范圍的網(wǎng)頁為起點的訪問下載鏈接的跳轉(zhuǎn)路徑。當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,將跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,可以是在用戶訪問跳轉(zhuǎn)路徑上的任意網(wǎng)頁時,也可以只在用戶訪問跳轉(zhuǎn)路徑上的起點對應的網(wǎng)頁時,將跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
[0212]與之前實施例的實現(xiàn)方式類似,具體在實現(xiàn)本實施例時,可以獲取用戶通過預定范圍的網(wǎng)頁為起點進行跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,進而根據(jù)獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。具體實現(xiàn)時,可以通過瀏覽器程序獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接。還可以獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;根據(jù)用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。具體實現(xiàn)時,也可以以瀏覽器記錄日志的方式記錄這些數(shù)據(jù)。
[0213]如前所述,通過網(wǎng)頁跳轉(zhuǎn)的方式訪問一個下載鏈接的過程中,所經(jīng)歷的跳轉(zhuǎn)次數(shù)越多,則起始的頁面與最終訪問的下載鏈接之間的聯(lián)系更傾向于越??;反之則起始的頁面與最終訪問的下載鏈接之間的聯(lián)系更傾向于越緊密。在獲取跳轉(zhuǎn)行為的過程中,可以獲取用戶從預定范圍的網(wǎng)頁為起始,且經(jīng)過跳轉(zhuǎn)次數(shù)小于預置閾值的網(wǎng)頁跳轉(zhuǎn),最終進行資源下載的跳轉(zhuǎn)行為。即可以統(tǒng)計用戶從預定范圍的網(wǎng)頁開始跳轉(zhuǎn),并最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,才獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
[0214]類似的,當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,同樣可以用一定的預置判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾,當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。其中,預置的判斷方法可以是特征閾值判定,此時,可以獲取至少一種如下用于判定的特征:
[0215]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接的平均路徑長度;
[0216]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,并進行下載的下載次數(shù);
[0217]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;[0218]由預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0219]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0220]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,訪問該下載鏈接對應文件的文件類型。
[0221]獲取了以上用于判定的特征的一種或幾種后,在對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,可以對各用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,只有在所有特征都符合對應的特征閾值時,才將該下載鏈接確定為過濾后得到的下載鏈接;
[0222]或者也可以根據(jù)至少一種用于判定的特征,計算跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將權(quán)值或所有權(quán)值的和達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值(和)。
[0223]此外,本實施例中,以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾時,同樣也可以結(jié)合使用特征閾值判定以及模板判定的方法,以及對下載鏈接進行有效性檢測,具體進行判定和檢測的方法可以參考前述的實施方式。在當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,將跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,具體的呈現(xiàn)方式同樣可以參考前述的實施方式,在此就不再贅述了。
[0224]通過上述步驟得到的網(wǎng)頁的相關下載鏈接,取自于通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,并借助于生成的跳轉(zhuǎn)路徑,通過過濾最終得到的網(wǎng)頁對應的下載鏈接更加符合用戶的下載需求,使用戶在瀏覽頁面時,不必進行多次跳轉(zhuǎn)就能得到和使用該頁面相關的下載鏈接,提高了用戶通過網(wǎng)頁進行下載的效率。同時,由于獲得的與用戶訪問的網(wǎng)頁相關的下載鏈接以用戶日常的下載行為和過程為基礎,而不是依賴于從網(wǎng)站自身的頁面的結(jié)構(gòu)布局進行抽取,一旦出現(xiàn)失效鏈接,可以很容易地從獲取到用戶對鏈接的日常訪問中體現(xiàn)出來,并自動降低失效鏈接降低獲得推薦的幾率直至將其剔除,從而降低了排除或修正失效資源鏈接的工作成本。
[0225]與本發(fā)明實施例提供的獲取資源的下載鏈接的方法相對應,本發(fā)明實施例還提供了一種獲取資源的下載鏈接的系統(tǒng),參見圖3,該系統(tǒng)具體可以包括:
[0226]信息獲取單元301,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0227]路徑生成單元302,用于根據(jù)跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑;
[0228]鏈接獲取及顯示單元303,用于當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,將跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
[0229]其中,信息獲取單元301,可以包括:
[0230]第一信息獲取子單元,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0231]在這種實現(xiàn)方式下路徑生成單元302可以包括:
[0232]第一路徑生成子單元,用于根據(jù)獲取到的用戶訪問的各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0233]跳轉(zhuǎn)路徑可以由至少一個網(wǎng)頁節(jié)點,以及一個下載鏈接節(jié)點組成;其中,網(wǎng)頁節(jié)點至少可以包括:通過其他頁面跳轉(zhuǎn)而直接或間接到達的,且包含下載鏈接的網(wǎng)頁對應的網(wǎng)頁節(jié)點。
[0234]在另一種實現(xiàn)方式下,信息獲取單元301可以包括:
[0235]第二信息獲取子單元,用于通過瀏覽器程序,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;
[0236]在這種實現(xiàn)方式下,路徑生成單元302可以包括:
[0237]第二路徑生成子單元,用于根據(jù)通過瀏覽器程序獲取到的用戶訪問的各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0238]在另一種實現(xiàn)方式下,信息獲取單元301可以包括:
[0239]第三信息獲取子單元,用于獲取用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;其中的跳轉(zhuǎn)方式用于標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接;
[0240]在這種實現(xiàn)方式下,路徑生成單元302可以包括:
[0241]第三路徑生成子單元,用于根據(jù)用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0242]其中第三信息獲取子單元,具體還可以用于:
[0243]在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,通過瀏覽器獲取用戶標識信息,并將用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志;
[0244]此時,第三路徑生成子單元,具體可以用于:根據(jù)跳轉(zhuǎn)日志中記錄的用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0245]在這種實現(xiàn)方式下,可以通過瀏覽器程序?qū)@取到的用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址、以及相應的下載鏈接記錄為日志,并上傳至服務器端第三路徑生成子單元;
[0246]其中,第三信息獲取子單元可以位于服務器端,具體可以用于:
[0247]在服務器端根據(jù)接收到的日志,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
[0248]在又一種實現(xiàn)方式下,信息獲取單元301可以包括:
[0249]第四信息獲取子單元,用于獲取用戶從預定范圍的網(wǎng)頁為起始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為;
[0250]對應的,路徑生成單元302,可以包括:
[0251]第四路徑生成子單元,用于根據(jù)所述跳轉(zhuǎn)行為,生成以預定范圍的網(wǎng)頁為起始的訪問下載鏈接的跳轉(zhuǎn)路徑。
[0252]在這種實施方式下,第四路徑生成子單元,具體可以用于:
[0253]根據(jù)跳轉(zhuǎn)行為中,以所述預定范圍內(nèi)的網(wǎng)頁起始經(jīng)過次數(shù)小于預置閾值的跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,生成以預定范圍的網(wǎng)頁為起始的訪問下載鏈接的跳轉(zhuǎn)路徑。
[0254]在這種實施方式下,該系統(tǒng)還可以包括:
[0255]篩選單元,以預置的判定方法對跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0256]此時,鏈接獲取及顯示單元303具體可以用于:
[0257]當用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0258]在這種實施方式下,預置的判定方法可以是特征閾值判定,系統(tǒng)還可以包括第一特征獲取單元,第一特征獲取單元用于獲取以下用于判定的特征的至少一種:
[0259]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接的平均路徑長度;
[0260]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,并進行下載的下載次數(shù);
[0261]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0262]由預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0263]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0264]以預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達下載鏈接,訪問該下載鏈接對應文件的文件類型;
[0265]在這種實施方式下,篩選單元具體可以用于:
[0266]對各用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0267]或,
[0268]根據(jù)至少一種上述用于判定的特征,計算跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
[0269]在另一種實現(xiàn)方式下,信息獲取單元301可以包括:
[0270]第五信息獲取子單元,用于統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),并在跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
[0271]此外,該系統(tǒng)還可以包括:[0272]過濾單元,用于以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;
[0273]此時鏈接獲取及顯示單元303可以在用戶訪問跳轉(zhuǎn)路徑上的網(wǎng)頁時將經(jīng)過過濾單元過濾后得到的下載鏈接呈現(xiàn)給用戶。
[0274]預置的判定方法可以是特征閾值判定,此時,該系統(tǒng)還可以包括第二特征獲取單元,用于獲取以下至少一種特征:
[0275]由同一網(wǎng)頁通過不同的跳轉(zhuǎn)路徑上到達同一下載鏈接時,由該網(wǎng)頁到達該下載鏈接的平均路徑長度;
[0276]跳轉(zhuǎn)路徑上一網(wǎng)頁到達下載鏈接,該下載鏈接被下載的下載次數(shù);
[0277]由一網(wǎng)頁到達一下載鏈接,該下載鏈接被下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比;
[0278]由一網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比;
[0279]由一網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息;
[0280]通過網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,該下載鏈接對應文件的文件類型
[0281]在這種實現(xiàn)方式下,過濾單元具體可以用于:
[0282]對各用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接;
[0283]或,
[0284]根據(jù)至少一種用于判定的特征,計算跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接權(quán)值。
[0285]在另一種實現(xiàn)方式下,預置的判定方法還可以是預置模板判定,此時過濾單元,具體可以用于:利用預置的判斷模板對用戶訪問網(wǎng)頁,以及對應的下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)判定結(jié)果對跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,預置的判斷模板包括:預置的判斷用戶訪問網(wǎng)頁和下載鏈接的URL相關度的正則表達式模板。
[0286]這里,過濾單元還可以包括有效性檢測子單元,用于對下載鏈接進行有效性檢測,如果檢測下載鏈接為有效鏈接,則將該下載鏈接確定為過濾后得到的下載鏈接。
[0287]在另一種實現(xiàn)方式下,該獲取資源的下載鏈接的系統(tǒng)還可以包括:
[0288]鏈接類型檢測單元,用于檢測下載鏈接的鏈接類型,其中,鏈接類型用于指示下載鏈接是否為特定下載工具的專用鏈接;鏈接獲取及顯示單元303可以用于:如果檢測到下載鏈接類型為專用鏈接,則在將跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型。
[0289]此外,鏈接獲取及顯示單元303,還可以用于:
[0290]將跳轉(zhuǎn)路徑上的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式呈現(xiàn)給用戶。
[0291]通過上述獲取資源的下載鏈接的系統(tǒng)得到的網(wǎng)頁的相關下載鏈接,其數(shù)據(jù)取自于用戶通過網(wǎng)頁跳轉(zhuǎn)進行資源下載的過程,根據(jù)跳轉(zhuǎn)行為生成訪問下載鏈接的跳轉(zhuǎn)路徑,通過過濾最終得到的網(wǎng)頁對應的下載鏈接更加符合用戶的下載需求,使用戶在瀏覽頁面時,不必進行多次跳轉(zhuǎn)就能得到該頁面相關的下載鏈接,提高了用戶通過網(wǎng)頁獲取鏈接進而進行下載的效率。
[0292]通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)。基于這樣的理解,本發(fā)明的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。
[0293]本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置或系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的裝置及系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。
[0294]以上對本發(fā)明所提供的獲取資源的下載鏈接的方法及系統(tǒng),進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本發(fā)明的思想,在【具體實施方式】及應用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限制。
【權(quán)利要求】
1.一種獲取資源的下載鏈接的方法,其特征在于,包括: 獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為; 根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑; 當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括: 獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接; 所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括: 通過瀏覽器程序,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接; 所述根據(jù)所述跳轉(zhuǎn)行為, 生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)瀏覽器程序獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括: 獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;所述跳轉(zhuǎn)方式用于標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接; 所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,包括: 在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,由瀏覽器程序獲取所述用戶標識信息,并將所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志; 所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)所述跳轉(zhuǎn)日志中記錄的所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述瀏覽器程序?qū)@取到的所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址、以及相應的下載鏈接記錄為日志,并上傳至服務器端; 所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 由服務器端根據(jù)接收到的所述日志,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括: 獲取用戶從預定范圍的網(wǎng)頁為起始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為; 所述根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑,包括: 根據(jù)所述跳轉(zhuǎn)行為中,以所述預定范圍內(nèi)的網(wǎng)頁起始經(jīng)過次數(shù)小于預置閾值的跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳 轉(zhuǎn)路徑。
9.根據(jù)權(quán)利要求7或8所述的方法,其特征在于,還包括: 以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾; 所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括: 當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述預置的判定方法為特征閾值判定,用于判定的特征為以下的至少一種: 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接的平均路徑長度; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù); 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比; 由所述預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接對應文件的文件類型; 所述以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括:對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接; 或, 根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
11.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,所述獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,包括: 統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當所述跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
12.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,還包括: 以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾; 所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括: 當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
13.根據(jù)權(quán)利要求12所·述的方法,其特征在于,所述預置的判定方法為特征閾值判定,用于判定的特征為以下的至少一種: 由同一網(wǎng)頁通過不同的跳轉(zhuǎn)路徑上到達同一下載鏈接時,由該網(wǎng)頁到達該下載鏈接的平均路徑長度; 跳轉(zhuǎn)路徑上一網(wǎng)頁到達下載鏈接,該下載鏈接被下載的下載次數(shù); 由一網(wǎng)頁到達一下載鏈接,該下載鏈接被下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比; 由一網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比; 由一網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息; 通過網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,該下載鏈接對應文件的文件類型; 所述當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括: 對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接; 或, 根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
14.根據(jù)權(quán)利要求13所述的方法,其特征在于,所述預置的判斷方法還包括預置模板判定,所述方法,包括: 利用預置的判斷模板對所述跳轉(zhuǎn)路徑上的網(wǎng)頁,以及對應的所述下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)所述判定結(jié)果對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,所述預置的判斷模板包括:預置的判斷用戶訪問網(wǎng)頁和下載鏈接的URL相關度的正則表達式模板。
15.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾,包括: 對所述下載鏈接進行有效性檢測,如果檢測所述下載鏈接為有效鏈接,則將該下載鏈接確定為過濾后得到的下載鏈接。
16.根據(jù)權(quán)利要求1-15任一項所述的方法,其特征在于,還包括: 檢測所述下載鏈接的鏈接類型,所述鏈接類型用于指示所述下載鏈接是否為特定下載工具的專用鏈接; 如果檢測到所述下載鏈接類型為所述專用鏈接,則在將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型。
17.根據(jù)權(quán)利要求1-15任一項所述的方法,其特征在于,所述將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶,包括: 將所述跳轉(zhuǎn)路徑上的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式呈現(xiàn)給用戶。
18.一種獲取資源的下載鏈接的系統(tǒng),其特征在于,包括: 信息獲取單元,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為; 路徑生成單元,用于根據(jù)所述跳轉(zhuǎn)行為,生成訪問下載鏈接的跳轉(zhuǎn)路徑; 鏈接獲取及顯示單元,用于當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述信息獲取單元,包括: 第一信息獲取子單元,用于獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接; 所述路徑生成單元,包括: 第一路徑生成子單元,用于根據(jù)獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于,所述信息獲取單元,包括: 第二信息獲取子單元,用于通過瀏覽器程序,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為中,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接; 所述路徑生成單元,包括: 第二路徑生成子單元,用于根據(jù)通過瀏覽器程序獲取到的用戶訪問的所述各網(wǎng)頁地址,以及相應的下載鏈接,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
21.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述信息獲取單元,包括:第三信息獲取子單元,用于獲取用戶標識信息,以及所述用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間及跳轉(zhuǎn)方式,所訪問的各網(wǎng)頁地址,以及相應的下載鏈接;所述跳轉(zhuǎn)方式用于標識跳轉(zhuǎn)的目標是另一個網(wǎng)頁,或者是一個下載鏈接; 所述路徑生成單元,包括: 第三路徑生成子單元,用于根據(jù)所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述第三信息獲取子單元,具體用于: 在產(chǎn)生通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為時,通過瀏覽器程序獲取所述用戶標識信息,并將所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接記錄為跳轉(zhuǎn)日志; 所述第三路徑生成子單元,具體用于: 根據(jù)所述跳轉(zhuǎn)日志中記錄的所述用戶標識信息,以及用戶標識信息對應的用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中,每次跳轉(zhuǎn)的跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址,以及相應的下載鏈接,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
23.根據(jù)權(quán)利要求22 所述的系統(tǒng),其特征在于,通過所述瀏覽器程序?qū)@取到的所述用戶標識信息、跳轉(zhuǎn)時間、跳轉(zhuǎn)方式、所訪問的各網(wǎng)頁地址、以及相應的下載鏈接記錄為日志,并上傳至服務器端第三路徑生成子單元; 所述第三路徑生成子單元位于服務器端,具體用于: 在服務器端根據(jù)接收到的所述日志,還原對應用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程,生成訪問下載鏈接的跳轉(zhuǎn)路徑。
24.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述信息獲取單元,包括: 第四信息獲取子單元,用于獲取用戶從預定范圍的網(wǎng)頁為起始,通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為; 所述路徑生成單元,包括: 第四路徑生成子單元,用于根據(jù)所述跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
25.根據(jù)權(quán)利要求24所述的系統(tǒng),其特征在于,所述第四路徑生成子單元,具體用于: 根據(jù)所述跳轉(zhuǎn)行為中,以所述預定范圍內(nèi)的網(wǎng)頁起始經(jīng)過次數(shù)小于預置閾值的跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為,生成以所述預定范圍的網(wǎng)頁為起始的所述訪問下載鏈接的跳轉(zhuǎn)路徑。
26.根據(jù)權(quán)利要求24或25所述的系統(tǒng),其特征在于,還包括: 篩選單元,以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾; 所述鏈接獲取及顯示單元,具體用于: 當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,根據(jù)過濾的結(jié)果,將過濾后得到的下載鏈接呈現(xiàn)給用戶。
27.根據(jù)權(quán)利要求26所述的系統(tǒng),其特征在于,所述預置的判定方法為特征閾值判定,所述系統(tǒng)還包括:第一特征獲取單元,用于獲取以下用于判定的特征的至少一種: 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接的平均路徑長度; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù); 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,并進行下載的下載次數(shù),與由該起始網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比; 由所述預定范圍的網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該起始網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息; 以所述預定范圍的網(wǎng)頁為起始的跳轉(zhuǎn)路徑上,由該起始網(wǎng)頁到達所述下載鏈接,訪問該下載鏈接對應文件的文件類型; 所述篩選單元,具體用于: 對各所述用于判定的 特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接; 或, 根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接的權(quán)值。
28.根據(jù)權(quán)利要求18-23任一項所述的系統(tǒng),其特征在于,所述信息獲取單元,包括: 第五信息獲取子單元,用于統(tǒng)計用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的過程中網(wǎng)頁跳轉(zhuǎn)的次數(shù),當所述跳轉(zhuǎn)的次數(shù)小于預置的次數(shù)閾值時,獲取用戶通過網(wǎng)頁跳轉(zhuǎn)最終進行資源下載的跳轉(zhuǎn)行為。
29.根據(jù)權(quán)利要求18-23任一項所述的系統(tǒng),其特征在于,還包括: 過濾單元,用于以預置的判定方法對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾; 所述鏈接獲取及顯示單元用于:當用戶訪問所述跳轉(zhuǎn)路徑上的網(wǎng)頁時,將經(jīng)過過濾單元過濾后得到的下載鏈接呈現(xiàn)給用戶。
30.根據(jù)權(quán)利要求29所述的系統(tǒng),其特征在于,所述預置的判定方法為特征閾值判定,所述系統(tǒng)還包括:第二特征獲取單元,用于獲取以下至少一種特征: 由同一網(wǎng)頁通過不同的跳轉(zhuǎn)路徑上到達同一下載鏈接時,由該網(wǎng)頁到達該下載鏈接的平均路徑長度; 跳轉(zhuǎn)路徑上一網(wǎng)頁到達下載鏈接,該下載鏈接被下載的下載次數(shù); 由一網(wǎng)頁到達一下載鏈接,該下載鏈接被下載的下載次數(shù),與由該網(wǎng)頁到達的所有下載鏈接并進行下載的總的下載次數(shù)的下載次數(shù)比; 由一網(wǎng)頁開始跳轉(zhuǎn)而進行資源下載的次數(shù),與由該網(wǎng)頁開始的不區(qū)分目的的所有跳轉(zhuǎn)的跳轉(zhuǎn)次數(shù)比; 由一網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,訪問該下載鏈接是否需要提供用戶認證信息; 通過網(wǎng)頁跳轉(zhuǎn)到達一下載鏈接,該下載鏈接對應文件的文件類型; 所述過濾單元,具體用于: 對各所述用于判定的特征分別設置預置對應的特征閾值;當獲取到的下載鏈接對應的特征符合對應的特征閾值要求時,將該下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,在所有特征同時符合對應的特征閾值時,將該下載鏈接確定為過濾后得到的下載鏈接; 或, 根據(jù)至少一種所述用于判定的特征,計算所述跳轉(zhuǎn)路徑上的下載鏈接的權(quán)值,將所述權(quán)值達到預置權(quán)值閾值的下載鏈接確定為過濾后得到的下載鏈接;其中,當使用至少兩個所述用于判定的特征時,計算下載鏈接的對應于每個特征的權(quán)值并進行累計,得到該下載鏈接權(quán)值。
31.根據(jù)權(quán)利要求30所述的系統(tǒng),其特征在于,所述預置的判定方法還包括預置模板判定,所述過濾單元,用于: 利用預置的判斷模板對所述用戶訪問網(wǎng)頁,以及對應的下載鏈接的URL進行相關度判斷,并產(chǎn)生一判斷結(jié)果,根據(jù)所述判定結(jié)果對所述跳轉(zhuǎn)路徑上的下載鏈接進行過濾;其中,所述預置的判斷模板·包括:預置的判斷用戶訪問網(wǎng)頁和下載鏈接的URL相關度的正則表達式模板。
32.根據(jù)權(quán)利要求29所述的系統(tǒng),其特征在于,所述過濾單元,包括: 有效性檢測子單元,用于對所述下載鏈接進行有效性檢測,如果檢測所述下載鏈接為有效鏈接,則將該下載鏈接確定為過濾后得到的下載鏈接。
33.根據(jù)權(quán)利要求18-32任一項所述的系統(tǒng),其特征在于,還包括: 鏈接類型檢測單元,用于檢測所述下載鏈接的鏈接類型,所述鏈接類型用于指示所述下載鏈接是否為特定下載工具的專用鏈接; 所述鏈接獲取及顯示單元,用于: 如果檢測到所述下載鏈接類型為所述專用鏈接,則在將所述跳轉(zhuǎn)路徑上的下載鏈接呈現(xiàn)給用戶的同時,顯示該鏈接的鏈接類型。
34.根據(jù)權(quán)利要求18-32任一項所述的系統(tǒng),其特征在于,所述鏈接獲取及顯示單元,用于: 將所述跳轉(zhuǎn)路徑上的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式呈現(xiàn)給用戶。
【文檔編號】G06F17/30GK103530365SQ201310476120
【公開日】2014年1月22日 申請日期:2013年10月12日 優(yōu)先權(quán)日:2013年10月12日
【發(fā)明者】田樂逍, 胡又歡, 肖鏡輝 申請人:北京搜狗信息服務有限公司, 北京搜狗科技發(fā)展有限公司