專利名稱:一種為手機用戶終端提供個性網頁內容的方法和網標系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及通信系統(tǒng),尤其是一種為用戶手機終端提供個性網頁內容的方法和網標系統(tǒng)。
背景技術:
隨著移動通信技術的發(fā)展和智能手機的普及,用戶通過手機上網瀏覽互聯(lián)網網頁、進行網頁搜索已變得非常普及。針對通過手機瀏覽網頁的用戶,如果網站能對來訪用戶進行辨別,并對用戶的需求愛好信息都能夠有了解,就可根據(jù)用戶需求優(yōu)化用戶在網站內尋找信息的流程,調整網站的內容分布,甚至可以根據(jù)每位的用戶不同需求愛好提供個性化的網頁內容,而這無疑可以極大提高網站的競爭力。同時,個性化的網頁內容提供,也可優(yōu)化站內廣告的展示,提 高廣告點擊為網站增加更多收入。目前,網站采用在手機用戶終端存儲Cookie的方式對來訪用戶進行識別,然后通過調取該用戶在當前網的過往歷史記錄,以分析用戶的需求愛好信息,但是這種方法卻存在很大的缺陷其一、如果有的手機不支持Cookie存儲或用戶選擇不保存Cookie都將導致網站無法對來訪用戶進行識別;其二、網站雖然可以對來訪用戶進行識別,但是卻只能獲取該用戶在本網的歷史記錄信息,而無法獲取用戶訪問全網的歷史記錄信息,導致獲取的歷史記錄數(shù)據(jù)有限,分析出的用戶的需求也不準確;其三、如果當前訪問用戶為新用戶,則網站無法獲取該用戶的任何歷史記錄信息。
發(fā)明內容
本發(fā)明的一個目的是基于可穩(wěn)定以及可全面獲取手機終端用戶的歷史訪問記錄,提供一種為手機用戶終端提供個性網頁內容的方法,該方法包括
對用戶向移動網關發(fā)出的請求數(shù)據(jù)進行獲取;請求數(shù)據(jù)包括RADIUS協(xié)議數(shù)據(jù)和HTTP網址請求數(shù)據(jù);
對RADIUS協(xié)議數(shù)據(jù)進行分析,識別用戶終端手機號,對用戶進行區(qū)分,根據(jù)該用戶終端是否為首次識別進行如下處理
若該用戶終端為首次識別,以用戶終端手機號對用戶進行區(qū)分記錄保存,根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后,對獲取的用戶請求資源進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù);用戶標簽包括用戶的訪問習慣、興趣和關注的關鍵字信息;
若該用戶終端為非首次識別,調取該用戶目錄下的用戶標簽插入用戶HTTP網址請求數(shù)據(jù)中后發(fā)送給目標網站,目標網站根據(jù)用戶標簽對用戶請求資源進行個性化內容提供;獲取該用戶請求資源,進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù);
將用戶請求資源通過移動網關返回給用戶。
進一步,對RADIUS協(xié)議數(shù)據(jù)進行分析,識別用戶終端手機號,對用戶進行區(qū)分具體為 對RADIUS協(xié)議數(shù)據(jù)進行分析,在識別出用戶終端手機號后,先對手機號碼進行3DES加密形成偽碼,再對偽碼進行加密生成用戶唯一區(qū)別ID。進一步,對獲取的用戶請求資源進行特征信息提取包括通過URL特征分析、SVM文本分析和主題詞提取,生成包括用戶的訪問習慣、興趣和關注的關鍵字信息。本發(fā)明的另一個目的是基于可穩(wěn)定以及可全面獲取手機終端用戶的歷史訪問記錄,提供一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),該網標系統(tǒng)包括
業(yè)務服務器單元,用于接收獲取用戶向移動網關發(fā)出的請求數(shù)據(jù)中的HTTP網址請求數(shù)據(jù),以及根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后發(fā)送給移動網關;RADIUS協(xié)議數(shù)據(jù)監(jiān)聽分析單元,用于對用戶向移動網關發(fā)出的請求數(shù)據(jù)中的RADIUS協(xié)議數(shù)據(jù)進行監(jiān)聽獲取,分析識別出用戶終端手機號,對用戶進行區(qū)分;
計算存儲單元,對獲取的用戶請求資源進行特征信息提取,記錄保存在已存有該用戶的目錄下,作為生成用戶標簽的依據(jù);所述用戶標簽包括用戶的訪問習慣、興趣和關注的關鍵字信息;
用戶標簽插入單元,用于當業(yè)務服務器單元根據(jù)HTTP網址請求訪問目標網站時,將用戶標簽插入HTTP網址請求中。進一步,該網標系統(tǒng)還包括
加密單元,用于對識別出的用戶終端手機號進行加密,生成用戶唯一區(qū)別ID。進一步,計算存儲單元包括
URL特征分析和SVM文本分析模塊,用于對獲取的用戶請求資源進行URL特征分析和SVM文本分析,生成用戶的訪問習慣信息和興趣信息;
主題詞提取模塊,用于對獲取的用戶請求資源進行主題詞提取,生成用戶關注的關鍵字信息;
存儲模塊,用于保存用戶唯一區(qū)別ID,以及該ID下包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽。進一步,RADIUS協(xié)議數(shù)據(jù)監(jiān)聽分析單元采用分光監(jiān)聽的方式對RADIUS協(xié)議數(shù)據(jù)進行監(jiān)聽。本發(fā)明的有益效果是本發(fā)明一種為手機用戶終端提供個性網頁內容的方法,通過對手機用戶終端的手機號碼進行獲取,作為區(qū)別用戶的唯一標識,以及在對網站返回的該用戶請求資源獲取后進行特征信息提取,以形成包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽,當已生成用戶標簽的用戶再發(fā)送HTTP網址請求時,就將已存儲在該用戶目錄下的用戶標簽插入到用戶HTTP網址請求中,被請求的目標網站根據(jù)用戶標簽對該用戶提供個性化頁面內容。該方法對可以穩(wěn)定而且全面地獲取用戶的歷史訪問記錄,通過計算分析,從而形成精準的用戶需求愛好信息,便捷實現(xiàn)網站對手機用戶終端提供個性網頁內容。本發(fā)明的另一個有益效果是本發(fā)明一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),作為移動網關和目標網站的中間數(shù)據(jù)處理系統(tǒng),對用戶向移動網關發(fā)出的請求數(shù)據(jù)進行獲取,監(jiān)聽獲取請求數(shù)據(jù)中的RADIUS協(xié)議數(shù)據(jù),識別用戶終端手機號,對用戶進行區(qū)分,以及獲取網站返回 的該用戶請求資源并進行特征信息提取,以形成包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽,當已生成用戶標簽的用戶再發(fā)送HTTP網址請求時,就將已存儲在該用戶目錄下的用戶標簽插入到用戶HTTP網址請求中,被請求的目標網站根據(jù)用戶標簽對該用戶提供個性化頁面內容。該網標系統(tǒng)可以穩(wěn)定而且全面地獲取用戶的歷史訪問記錄,通過計算分析,形成用戶標簽信息,便捷實現(xiàn)網站根據(jù)用戶標簽對手機用戶終端提供個性網頁內容。
下面結合附圖對本發(fā)明的具體實施方式
作進一步說明
圖I是實施例一提供的本發(fā)明一種為手機用戶終端提供個性網頁內容的方法的步驟
圖2是實施例二提供的本發(fā)明一種為手機用戶終端提供個性網頁內容的網標系統(tǒng)的結構框 圖3是實施例三提供的本發(fā)明一種為手機用戶終端提供個性網頁內容的網標系統(tǒng)的結構框 圖4是實施例四提供的本發(fā)明一種為手機用戶終端提供個性網頁內容的網標系統(tǒng)的結構框圖。
具體實施例方式參照圖1,實施例一提供的一種為手機用戶終端提供個性網頁內容的方法包括
對用戶向移動網關發(fā)出的請求數(shù)據(jù)進行獲??;
對RADIUS協(xié)議數(shù)據(jù)進行分析,識別用戶終端手機號,對用戶進行區(qū)分,根據(jù)該用戶終端是否為首次識別進行如下處理
若該用戶終端為首次識別,以用戶終端手機號對用戶進行區(qū)分記錄保存,根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后,對獲取的用戶請求資源進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù);
若該用戶終端為非首次識別,調取該用戶目錄下的用戶標簽插入用戶HTTP網址請求數(shù)據(jù)中后發(fā)送給目標網站,所述目標網站根據(jù)用戶標簽對用戶請求資源進行個性化內容提供;獲取該用戶請求資源,進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù);
將用戶請求資源通過移動網關返回給用戶。在本實施例中,請求數(shù)據(jù)包括RADIUS協(xié)議數(shù)據(jù)和HTTP網址請求數(shù)據(jù)。由于用戶的手機號碼涉及個人的隱私信息,如果直接對用戶的手機號碼進行明碼顯示存儲,如果數(shù)據(jù)遭到泄露,將會嚴重威脅到個人隱私安全。因此,對RADIUS協(xié)議數(shù)據(jù)進行分析,在識別出用戶終端手機號后,先對手機號碼進行3DES加密形成偽碼,再對偽碼進行加密生成用戶唯一區(qū)別ID。如此,經過采用如此高強度的加密算法,就足以保護用戶的隱私安全。對獲取的用戶請求資源進行特征信息的提取包括通過URL特征分析、SVM文本分析和主題詞提取,生成包括用戶的訪問習慣、興趣和關注的關鍵字信息。由于用戶通過移動網關發(fā)出的頁面請求和因特網返回的請求資源都會進行記錄,從而形成完整的用戶請求/應答日志。通過定時采用URL特征分析對日志進行統(tǒng)計,就可得到用戶上網時間、頻度、愛好網站等訪問記錄,而定期采用SVM文本分析對應答內容進行分類就可得知用戶的興趣,從而得到頁面的興趣類標簽。由于手機互聯(lián)網中資訊內容類別較為集中,所以興趣類標簽的類別個數(shù)是比較有限的,常見的興趣類標簽如標簽I電腦、通信、網絡,標簽2體育、運動,標簽3媒體、傳播,標簽4醫(yī)藥、保健,標簽5休閑娛樂,標簽6社會等。但是采用SVM文本分析得到的興趣類標簽的范圍還是很大,對用戶的興趣捕獲顯得不夠精確。因此在采用SVM文本分析的同時,進行主題詞提取技術以及基于時間的熱度評價算法,抓獲用戶關注的關鍵字信息,從而對采用SVM文本分析得到的興趣類標簽再進行進一步的細化,如標簽I電腦、通信、網絡下可細分為電腦、互聯(lián)網、家電和電子產品、手機、數(shù)碼產品、游戲電玩、手機游戲,而對其中的手機類下又可進一步細分為手機軟件、MP3、MP4和數(shù)碼相機因此,通過對用戶請求/應答日志采用URL特征分析、SVM文本分析和主題詞提取,將形成包括用戶訪問習慣、興趣和關注的關鍵字信息的用戶標簽,而且由于用戶請求/應答日志的內容是包含用戶所登錄的全網記錄,該用戶標簽的信息將非常全面,同時,即便該用戶是首次登錄某第三方網站,第三方網站通過插入到HTTP請求中的用戶標簽,也可獲知該用戶的用戶訪問習慣、興趣和關注的重點,從而對返回的網站內容作個性化提供。參照圖2,實施例二提供的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),該網標系統(tǒng)包括
業(yè)務服務器單元,用于接收獲取用戶向移動網關發(fā)出的請求數(shù)據(jù)中的HTTP網址請求數(shù)據(jù),以及根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后發(fā)送給移動網關;RADIUS協(xié)議數(shù)據(jù)監(jiān)聽分析單元,用于對用戶向移動網關發(fā)出的請求數(shù)據(jù)中的RADIUS協(xié)議數(shù)據(jù)進行監(jiān)聽獲取,分析識別出用戶終端手機號,對用戶進行區(qū)分;
計算存儲單元,對獲取的用戶請求資源進行特征信息提取,記錄保存在已存有該用戶的目錄下,作為生成用戶標簽的依據(jù);用戶標簽包括用戶的訪問習慣、興趣和關注的關鍵字信息;
用戶標簽插入單元,用于當業(yè)務服務器單元根據(jù)HTTP網址請求訪問目標網站時,將用戶標簽插入HTTP網址請求中。在本實施例中,系統(tǒng)通過對用戶向移動網關發(fā)出的請求數(shù)據(jù)中的RADIUS協(xié)議數(shù)據(jù)采用分光監(jiān)聽的方式進行監(jiān)聽獲取,獲得手機用戶終端的手機號,并以此作為用戶的唯一識別ID,對用戶進行區(qū)分。由于手機號碼的確定性和穩(wěn)定性,從而也就保證了系統(tǒng)識別用戶的準確性。同時,系統(tǒng)作為移動網關和目標網站之間的中介,對移動網關發(fā)過來的HTTP網址請求進行轉發(fā),通過訪問因特網,獲取目標網站返回的請求資源發(fā)送給移動網關,從而就可以形成保存在系統(tǒng)內的基于全網歷史訪問記錄的用戶請求/應答日志。請求/應答日志的建立與不斷更新,使得對該用戶日志內容特征信息的提取也更加豐富,由此形成的用戶標簽也就得到不斷完善,使得反映出的用戶的訪問習慣、興趣和關注的關鍵字等信息也更加精確。而系統(tǒng)通過將該用戶標簽插入到HTTP網址請求中訪問目標網站后,目標網站就可基于該標簽為用戶提供給個性化的網頁內容。參照圖3,實施例三提供的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),在本實施例中,該系統(tǒng)還包括加密單元,用于對識別出的用戶終端手機號進行加密,生成用戶唯一區(qū)別ID。由于用戶的手機號碼涉及個人的隱私信息,如果直接對用戶的手機號碼進行明碼顯示存儲,如果數(shù)據(jù)遭到泄露,將會嚴重威脅到個人隱私安全。因此,需要設置一加密單元對用戶手機號碼進行高強度的加密,加密單元可采用AES或3DES等算法進行加密。參照圖4,實施例四提供的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),在本實施例中計算存儲單元包括
URL特征分析和SVM文本分析模塊,用于對獲取的用戶請求資源進行URL特征分析和SVM文本分析,生成用戶的訪問習慣信息和興趣信息;
主題詞提取模塊,用于對獲取的用戶請求資源進行主題詞提取,生成用戶關注的關鍵字信息;
存儲模塊,用于保存用戶唯一區(qū)別ID,以及該ID下包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽。
網標系統(tǒng)中計算存儲單元通過URL特征分析和SVM文本分析模塊以及主題詞提取模塊對形成的用戶請求/應答日志進行定期分析計算,從而對形成的包含有用戶訪問習慣信息、興趣信息和關注的關鍵字等信息的用戶標簽進行不斷完善,使得目標網站根據(jù)插入HTTP網址請求的用戶標簽而提供的個性化網頁內容也更加精確。與此同時,網站根據(jù)用戶標簽信息優(yōu)化用戶在網站內尋找信息的流程,根據(jù)進入本網站用戶標簽的分布調整網站本身的內容資源,甚至是發(fā)展方向,以及通過用戶標簽優(yōu)化站內廣告展示,提高廣告點擊,從而增加網站收入。以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領域的技術人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權利要求所限定的范圍內。
權利要求
1.一種為手機用戶終端提供個性網頁內容的方法,其特征在于該方法包括 對用戶向移動網關發(fā)出的請求數(shù)據(jù)進行獲取;所述請求數(shù)據(jù)包括RADIUS協(xié)議數(shù)據(jù)和HTTP網址請求數(shù)據(jù); 對RADIUS協(xié)議數(shù)據(jù)進行分析,識別用戶終端手機號,對用戶進行區(qū)分,根據(jù)該用戶終端是否為首次識別進行如下處理 若該用戶終端為首次識別,以用戶終端手機號對用戶進行區(qū)分記錄保存,根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后,對獲取的用戶請求資源進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù);所述用戶標簽包括用戶的訪問習慣、興趣和關注的關鍵字信息; 若該用戶終端為非首次識別,調取該用戶目錄下的用戶標簽插入用戶HTTP網址請求數(shù)據(jù)中后發(fā)送給目標網站,所述目標網站根據(jù)用戶標簽對用戶請求資源進行個性化內容提供;獲取該用戶請求資源,進行特征信息提取,記錄保存在該用戶目錄下,作為生成用戶標簽的依據(jù); 將用戶請求資源通過移動網關返回給用戶。
2.根據(jù)權利要求I所述的一種為手機用戶終端提供個性網頁內容的方法,其特征在于所述對RADIUS協(xié)議數(shù)據(jù)進行分析,識別用戶終端手機號,對用戶進行區(qū)分具體為 對RADIUS協(xié)議數(shù)據(jù)進行分析,在識別出用戶終端手機號后,先對手機號碼進行3DES加密形成偽碼,再對偽碼進行加密生成用戶唯一區(qū)別ID。
3.根據(jù)權利要求I所述的一種為手機用戶終端提供個性網頁內容的方法,其特征在于所述對獲取的用戶請求資源進行特征信息提取包括通過URL特征分析、SVM文本分析和主題詞提取,生成包括用戶的訪問習慣、興趣和關注的關鍵字信息。
4.一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),其特征在于該網標系統(tǒng)包括 業(yè)務服務器單元,用于接收獲取用戶向移動網關發(fā)出的請求數(shù)據(jù)中的HTTP網址請求數(shù)據(jù),以及根據(jù)HTTP網址請求數(shù)據(jù)訪問目標網站獲取用戶請求資源后發(fā)送給移動網關;RADIUS協(xié)議數(shù)據(jù)監(jiān)聽分析單元,用于對用戶向移動網關發(fā)出的請求數(shù)據(jù)中的RADIUS協(xié)議數(shù)據(jù)進行監(jiān)聽獲取,分析識別出用戶終端手機號,對用戶進行區(qū)分; 計算存儲單元,對獲取的用戶請求資源進行特征信息提取,記錄保存在已存有該用戶的目錄下,作為生成用戶標簽的依據(jù);所述用戶標簽包括用戶的訪問習慣、興趣和關注的關鍵字信息; 用戶標簽插入單元,用于當業(yè)務服務器單元根據(jù)HTTP網址請求訪問目標網站時,將用戶標簽插入HTTP網址請求中。
5.根據(jù)權利要求4所述的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),其特征在于該網標系統(tǒng)還包括 加密單元,用于對識別出的用戶終端手機號進行加密,生成用戶唯一區(qū)別ID。
6.根據(jù)權利要求4所述的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),其特征在于所述計算存儲單元包括 URL特征分析和SVM文本分析模塊,用于對獲取的用戶請求資源進行URL特征分析和SVM文本分析,生成用戶的訪問習慣信息和興趣信息;主題詞提取模塊,用于對獲取的用戶請求資源進行主題詞提取,生成用戶關注的關鍵字信息; 存儲模塊,用于保存用戶唯一區(qū)別ID,以及該ID下包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽。
7.根據(jù)權利要求4所述的一種為手機用戶終端提供個性網頁內容的網標系統(tǒng),其特征在于所述RADIUS協(xié)議數(shù)據(jù)監(jiān)聽分析單元采用分光監(jiān)聽的方式對RADIUS協(xié)議數(shù)據(jù)進行監(jiān)聽。
全文摘要
本發(fā)明公開了一種為手機用戶終端提供個性網頁內容的方法和網標系統(tǒng),方法為通過對手機用戶終端的手機號碼進行獲取,作為區(qū)別用戶的唯一標識,以及在對網站返回的該用戶請求資源獲取后進行特征信息提取,以形成包含有用戶的訪問習慣信息、興趣信息和關注的關鍵字信息的用戶標簽,當已生成用戶標簽的用戶再發(fā)送HTTP網址請求時,就將已存儲在該用戶目錄下的用戶標簽插入到用戶HTTP網址請求中,被請求的目標網站根據(jù)用戶標簽對該用戶提供個性化頁面內容。采用本發(fā)明可以穩(wěn)定而且全面地獲取用戶的歷史訪問記錄,通過計算分析,從而形成精準的用戶需求愛好信息,便捷實現(xiàn)網站對手機用戶終端提供個性網頁內容,適用于移動通信領域。
文檔編號H04L29/08GK102624890SQ201210058299
公開日2012年8月1日 申請日期2012年3月8日 優(yōu)先權日2012年3月8日
發(fā)明者李恩澤 申請人:廣州銘信網標網絡科技有限公司