一種瀏覽器歷史記錄的管理方法及終端的制作方法
【技術領域】
[0001] 本發(fā)明涉及信息管理領域,尤其涉及一種瀏覽器歷史記錄的管理方法及終端。
【背景技術】
[0002] 隨著無線通訊技術和互聯(lián)網(wǎng)技術的飛速發(fā)展,在終端上使用瀏覽器上網(wǎng)的用戶越 來越多,并且瀏覽器具有歷史記錄功能,能夠記錄用戶訪問過的網(wǎng)站,使得用戶在需要回顧 自己訪問過的網(wǎng)站時,可以直接在歷史記錄中查找,方便用戶的使用。
[0003] 目前,對瀏覽器的歷史網(wǎng)頁記錄的查詢可以按照訪問時間來查詢,終端可以記錄 用戶每次訪問網(wǎng)站的時間,按照時間先后順序?qū)⒂脩羲L問的歷史網(wǎng)頁排序,當用戶需要 查詢歷史網(wǎng)頁時,可以按照排好的順序,查看自己想要查找的歷史網(wǎng)頁。但是隨著用戶使用 瀏覽器的時間越來越長,瀏覽器記錄的數(shù)據(jù)越來越多,當用戶需要查找較長時間前看過的 網(wǎng)頁時,用戶很難記住瀏覽時間,就算回想起一個大概的時間,也需要花較多時間去在這個 時段中去查找,也就是說,當用戶想要查詢之前瀏覽過的網(wǎng)頁時,不能準確快速地找到自己 想要的歷史網(wǎng)頁。
[0004] 所以,現(xiàn)有技術中存在對瀏覽器的歷史記錄查詢效率低的技術問題。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明實施例期望提供一種瀏覽器歷史記錄的管理方法及終端,以提 高通過對瀏覽器的歷史記錄查詢效率,以使用戶能夠快速準確地查詢到所要查詢的歷史網(wǎng) 頁。
[0006] 為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:
[0007] 第一方面,本發(fā)明實施例提供一種瀏覽器歷史記錄的管理方法,所述方法包括:在 所有的歷史網(wǎng)頁中,確定出N個純文本頁面,其中,N為大于等于2的整數(shù);獲得所述N個純 文本頁面中第i個純文本頁面的關注度參數(shù),其中,所述關注度參數(shù)用于表征用戶對所述 第i個純文本頁面的關注程度,i為大于1且小于等于N的整數(shù);根據(jù)所述關注度參數(shù),對 所述N個純文本頁面對應的網(wǎng)頁標識進行排序。
[0008] 進一步地,所述在所有的歷史網(wǎng)頁中,確定出N個純文本頁面,包括:獲得每個歷 史網(wǎng)頁中具有鏈接屬性的文本的長度與具有非鏈接屬性的文本的長度之間的比值;將N個 所述比值滿足預設條件的所述歷史網(wǎng)頁確定為所述N個純文本頁面。
[0009] 進一步地,在所述在所有的歷史網(wǎng)頁中,確定出N個純文本頁面之前,所述方法還 包括:獲得當前瀏覽網(wǎng)頁中具有鏈接屬性的文本的長度與具有非鏈接屬性的文本的長度之 間的比值;當所述比值滿足所述預設條件時,對所述當前瀏覽網(wǎng)頁添加純文本頁面標識; 所述在所有的歷史網(wǎng)頁中,確定出N個純文本頁面,包括:將帶有所述純文本頁面標識的N 個所述歷史網(wǎng)頁確定為所述N個純文本頁面。
[0010] 進一步地,所述獲得所述N個純文本頁面中第i個純文本頁面的關注度參數(shù),包 括:基于相鄰兩次瀏覽操作之間的時長,確定出有效瀏覽操作組,其中,所述有效瀏覽操作 組是在預設操作時長內(nèi)對所述第i個純文本頁面進行的所述相鄰兩次瀏覽操作;基于所述 有效瀏覽操作組,獲得所述第i個純文本頁面的總有效瀏覽時長及獲得所述第i個純文本 頁面的總有效瀏覽高度,其中,所述總有效瀏覽時長用于表征所述用戶對所述第i個純文 本頁面的有效關注時長的總和,所述總有效瀏覽高度用于表征所述用戶對所述第i個純文 本頁面的有效關注區(qū)域的總和;根據(jù)所述總有效瀏覽時長和所述總有效瀏覽高度,獲得所 述第i個純文本頁面的關注度參數(shù)。
[0011] 進一步地,所述獲得所述第i個純文本頁面的總有效瀏覽高度,包括:獲得相鄰兩 次所述有效瀏覽操作組的高度的偏移量,其中,所述有效瀏覽操作組的高度為所述有效瀏 覽操作組在所述第i個純文本頁面上與所述第i個純文本頁面的瀏覽窗口的初始位置之間 的距離;根據(jù)所述偏移量和所述瀏覽窗口的高度值,確定所述有效瀏覽操作組的有效高度, 其中,所述有效高度為在所述第i個純文本頁面上所述用戶進行所述有效瀏覽操作組時的 有效關注區(qū)域;根據(jù)所述有效高度,獲得所述第i個純文本頁面的總有效瀏覽高度。
[0012] 進一步地,所述獲得所述第i個純文本頁面的關注度參數(shù),包括:獲得所述N個純 文本頁面中前i個純文本頁面的平均關注度值,其中,所述平均關注度值用于表征所述用 戶對所述前i個純文本頁面的平均關注程度;根據(jù)時間衰減因子的配置值和所述前i個純 文本頁面的平均關注度值,獲得所述關注度參數(shù),其中,所述時間衰減因子用于表征所述第 i個純文本頁面的優(yōu)先級,所述時間衰減因子大于等于0。
[0013] 進一步地,所述獲得所述N個純文本頁面中前i個純文本頁面的平均關注度值,包 括:基于所述N個純文本頁面中前i-Ι個純文本頁面的平均關注度值,獲得所述前i個純文 本頁面的平均關注度值。
[0014] 進一步地,所述前i個純文本頁面的平均關注度值具體由以下公式獲得:
[0015]
[0016]其中,Ei為所述前i個純文本頁面的平均關注度值;Eii為所述前i-Ι個純文本頁 面的平均關注度值為所述總有效瀏覽時長和所述總有效瀏覽高度的比值。
[0017] 進一步地,所述關注度參數(shù)具體由以下公式獲得:
[0018] V, =A,X(1-τ) + (T-Ts) / (TN-TS)XE,Xτ
[0019] 其中,t為所述第i個純文本頁面的關注度參數(shù)A為所述第i個純文本頁面的 總有效瀏覽時長和所述總有效瀏覽高度的比值;τ為所述時間衰減因子;T為所述用戶瀏 覽網(wǎng)頁時的時間;TS為所述用戶設置的有效時間;ΤΝ為所述用戶發(fā)起歷史記錄查找的時間; Ei為所述第i個純文本頁面的平均關注度值。
[0020] 第二方面,本發(fā)明實施例提供一種終端,所述終端包括:確定單元、獲得單元及排 序單元;其中,所述確定單元,用于在所有的歷史網(wǎng)頁中,確定出N個純文本頁面,其中,N為 大于等于2的整數(shù);所述獲得單元,用于獲得所述N個純文本頁面中第i個純文本頁面的關 注度參數(shù),其中,所述關注度參數(shù)用于表征用戶對所述第i個純文本頁面的關注程度,i為 大于0且小于等于N的整數(shù);所述排序單元,用于根據(jù)所述關注度參數(shù),對所述N個純文本 頁面對應的網(wǎng)頁標識進行排序。
[0021] 進一步地,所述確定單元,具體用于獲得每個歷史網(wǎng)頁中具有鏈接屬性的文本的 長度與具有非鏈接屬性的文本的長度的比值;將N個所述比值滿足預設條件的所述歷史網(wǎng) 頁確定為所述N個純文本頁面。
[0022] 進一步地,所述確定單元,具體用于在所述所有的歷史網(wǎng)頁中,確定出N個純文本 頁面之前,獲得當前瀏覽網(wǎng)頁中具有鏈接屬性的文本的長度與具有非鏈接屬性的文本的長 度之間的比值;當所述比值滿足所述預設條件時,對所述當前瀏覽網(wǎng)頁添加純文本頁面標 識;還用于將帶有所述純文本頁面標識的N個所述歷史網(wǎng)頁確定為所述N個純文本頁面。
[0023] 進一步地,所述獲得單元包括:確定子單元、第一獲得子單元及第二獲得子單元; 其中,所述確定子單元,用于基于相鄰兩次瀏覽操作之間的時長,確定出有效瀏覽操作組, 其中,所述有效瀏覽操作組是在預設操作時長內(nèi)對所述第i個純文本頁面進行的所述相鄰 兩次瀏覽操作;所述第一獲得子單元,用于基于所述有效瀏覽操作組,獲得所述第i個純文 本頁面的總有效瀏覽時長及獲得所述第i個純文本頁面的總有效瀏覽高度,其中,所述總 有效瀏覽時長用于表征所述用戶對所述第i個純文本頁面的有效關注時長的總和,所述總 有效瀏覽高度用于表征所述用戶對所述第i個純文本頁面的有效關注區(qū)域的總和;所述第 二獲得子單元,用于根據(jù)所述總有效瀏覽時長和所述總有效瀏覽高度,獲得所述第i個純 文本頁面的關注度參數(shù)。
[0024] 進一步地,所述第一獲得子單元,具體用于獲得所述有效瀏覽操作組的高度的偏 移量,根據(jù)所述偏移量和所述瀏覽窗口的高度值,確定所述有效瀏覽操作組的有效高度;根 據(jù)所述有效高度,獲得所述第i個純文本頁面的總有效瀏覽高度;其中,所述有效瀏覽操作 組的高度為所述有效瀏覽操作組在所述第i個純文本頁面上與所述第i個純文本頁面的瀏 覽窗口的初始位置之間的距離。
[0025] 進一步地,所述第二獲得子單元,具體用于獲得所述N個純文本頁面中前i個純文 本頁面的平均關注度值;根據(jù)時間衰減因子的配置值和所述前i個純文本頁面的平均關注 度值,獲得所述關注度