專利名稱:基于關(guān)注度的同源信息搜索引擎聚合顯示方法及相關(guān)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機網(wǎng)絡(luò)技術(shù),特別是利用計算機在互聯(lián)網(wǎng)或企業(yè)內(nèi)部網(wǎng)上提供搜索服務(wù)的搜索引擎技術(shù)。本發(fā)明還涉及一種獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng)及網(wǎng)站內(nèi)容風格自適應(yīng)裝置與方法。
背景技術(shù):
目前在Internet上存在著大量的“相同(或類似)來源的網(wǎng)頁或網(wǎng)絡(luò)服務(wù)”,例如1由同一個人或組織寫作的被大量復(fù)制的文章、觀點、信息網(wǎng)頁;2由同一個人或組織采訪(或發(fā)布)的被大量復(fù)制的新聞報道網(wǎng)頁;3由同一個人或組織在BBS論壇發(fā)言帖子的轉(zhuǎn)貼;5由同一個人或組織產(chǎn)生的不同數(shù)據(jù)格式、壓縮比例的多媒體文件;6由同一個人或組織產(chǎn)生的可執(zhí)行程序、數(shù)據(jù)、設(shè)計文件;7其他方式產(chǎn)生的并被廣泛復(fù)制的信息內(nèi)容。這些“相同(或類似)來源的網(wǎng)頁或網(wǎng)絡(luò)服務(wù)”在目前的搜索引擎搜索結(jié)果中被一一列舉,占據(jù)大量篇幅,內(nèi)容卻雷同,不便查詢者的瀏覽。
目前各種搜索引擎和網(wǎng)頁排行服務(wù)系統(tǒng),均僅僅采用了點擊流量和網(wǎng)頁停留時間的方式來衡量網(wǎng)頁的熱門程度,而采取的方法主要1)搜索引擎類依靠查詢者對搜索結(jié)果的點擊來計算網(wǎng)頁的熱門程度,例如google、百度。2)ALEXA網(wǎng)站排行類依靠內(nèi)嵌在瀏覽器上的工具條軟件,把用戶對超級鏈接的點擊和網(wǎng)頁停留時間發(fā)送回服務(wù)器(參數(shù)包括當前網(wǎng)頁地址、頁面打開時間),但是不包含其他評估方法。Alexa工作原理可參見http://www.singtaonet.com/it/it sp/t20051110 43674.html,http://www.people.com.cn/GB/it/8219/41552/41597/3109586.html。
目前各種網(wǎng)站可以劃分為如下類別類別一全部網(wǎng)站內(nèi)容對任何用戶在同一時刻均具有同樣風格與內(nèi)容(例如新聞網(wǎng)站)。
類別二可以根據(jù)用戶的設(shè)定顯示不同的風格與內(nèi)容(例如google的新聞網(wǎng)站)。
但是這些網(wǎng)站,不能在實時根據(jù)用戶的不同狀態(tài)給出不同的顯示風格與內(nèi)容。
發(fā)明內(nèi)容
為了改進上述問題的不足,本發(fā)明提供這樣一種搜索方法,其能把因內(nèi)容相同而對搜索者具有相同使用價值的搜索結(jié)果聚合成一條記錄,即標題搜索結(jié)果,根據(jù)需要再展開查看其他結(jié)果的裝置和方法,從而避免“標題搜索結(jié)果”由于頻繁被點擊而導致目標服務(wù)器訪問量過大而癱瘓的,把“標題搜索結(jié)果”點擊自動分散到其他搜索結(jié)果目標上的裝置與方法。本發(fā)明還提供了這樣一種系統(tǒng),其利用能夠和網(wǎng)絡(luò)上的統(tǒng)計服務(wù)器配合的網(wǎng)絡(luò)瀏覽器,將用戶的全部操作行為換算成對該網(wǎng)頁的評分,并發(fā)送回統(tǒng)計服務(wù)器,作為對網(wǎng)頁的關(guān)注程度的評分,從而可以作為搜索引擎的排名方法和工具。本發(fā)明還提供這樣一種方法利用各種可能獲得的、有助于判斷用戶所處環(huán)境和狀態(tài)的信息,在同一時刻、同一個網(wǎng)站內(nèi)、甚至時同一個頁面內(nèi),向不同狀態(tài)的用戶提供不同的顯示風格和內(nèi)容。
為了實現(xiàn)上述目的,一種將同源信息站點搜索引擎聚合顯示的搜索方法,其包括下列步驟(1)查詢者通過Web瀏覽器或應(yīng)用軟件訪問搜索引擎,并輸入需要查詢的關(guān)鍵詞;(2)由搜索引擎找到全部符合條件的目標站點作為原始搜索結(jié)果;(3)由“同源信息處理模塊”查詢“成為標題搜索結(jié)果”的權(quán)力采購者的賬戶信息,并結(jié)合其他判斷規(guī)則在原始搜索結(jié)果中選取用來作為“標題搜索結(jié)果”的對象;(4)由搜索引擎Web服務(wù)器或應(yīng)用服務(wù)器只將選中的“標題搜索結(jié)果”作為搜索結(jié)果展示給查詢者,并為其提供一個帶有“展開查看細節(jié)或其他信息”含義的“按鈕;(5)查詢者還可按動與之對應(yīng)的“按鈕”,搜索引擎再向其展示在(2)中找到的原始搜索結(jié)果。
“同源信息處理模塊”有多個“(相應(yīng)信息種類的)同源信息處理模塊”組成,例如“同源網(wǎng)頁處理模塊”、“同源多媒體處理模塊”、“同源圖片處理模塊”、“同源文檔處理模塊”、“同源軟件處理模塊”、“同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊”、“同源GIS信息處理模塊”、”同價值網(wǎng)絡(luò)服務(wù)處理模塊”、“同價值商業(yè)信息處理模塊”等。
所述“同源信息處理模塊”包括如下步驟(1)首先由“信息種類判斷模塊”對網(wǎng)絡(luò)搜索器收到的信息進行種類判斷;(2)將相同種類的信息集中發(fā)送到“(相應(yīng)信息種類的)同源信息處理模塊”;(3)將由“(相應(yīng)信息種類的)同源信息處理模塊”處理后的搜索信息歸檔進入“非同源(相應(yīng)信息種類的)結(jié)果信息庫”或“同源(相應(yīng)信息種類的)結(jié)果信息庫”。
(4)由系統(tǒng)把“非同源(相應(yīng)信息種類的)結(jié)果信息庫”和“同源(相應(yīng)信息種類的)結(jié)果信息庫”發(fā)布到Web服務(wù)器上,供查詢者查詢。作為另一中實現(xiàn)方法,也可以根據(jù)這兩個數(shù)據(jù)庫直接向查詢者提供基于動態(tài)網(wǎng)頁的查詢服務(wù)。
所述由“同源網(wǎng)頁處理模塊”處理網(wǎng)頁信息的步驟如下所示(1)在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時候,首先由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞是否近期已經(jīng)被其他人查詢過,如果被查詢過,并且結(jié)果已經(jīng)在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布,則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將具有相同來源的網(wǎng)頁聚合成一條搜索結(jié)果,點擊“同源網(wǎng)頁”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的搜索結(jié)果網(wǎng)頁,完成整個查詢過程;(2)如果在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時候,由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞近期沒有被其他人查詢過,并且也沒有相應(yīng)的查詢結(jié)果在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布則A.啟動“網(wǎng)頁搜索器”搜索“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,并獲取這些網(wǎng)頁的內(nèi)容;B.如果“網(wǎng)頁搜索器”在“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”中沒有找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,則返回查詢者“沒有符合條件網(wǎng)頁”的結(jié)果,并且將該搜索關(guān)鍵詞加入到下一輪更新“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的任務(wù)中,如果在更新過程中找到了符合條件的網(wǎng)頁地址則根據(jù)其是否具有同源網(wǎng)頁而選擇入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”或“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”,這樣如果再有人搜索同樣的關(guān)鍵詞是就可以找到結(jié)果;
(3)由“網(wǎng)頁內(nèi)容分離器”將找到的網(wǎng)頁內(nèi)容及超級鏈接目標分解成多媒體、圖片、文字、超級鏈接等種類;(4)分別由各種內(nèi)容判決器產(chǎn)生判決結(jié)果A.由“多媒體內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同多媒體文件程度SMS(Same Media Score)”;B.由“圖片內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同圖片的程度SPS(Same Photo Score)”;C.由“文字內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同文字的程度STS(Same Text Score)”;D.由“鏈接內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同超級連接的程度SHS(Same Hyperlinks Score)”;(5)從“同源網(wǎng)頁判決規(guī)則庫”分別獲取“多媒體判決權(quán)重SMP”、“圖片判決權(quán)重SPP”、“文字判決權(quán)重STP”、“鏈接判決權(quán)重SHP”并分別與第(4)步生成的“相同多媒體文件程度SMS”、“相同圖片的程度SPS”、“相同文字的程度STS”、“相同超級連接的程度SHS”做數(shù)學乘法;(6)將第(5)步獲得的數(shù)學乘法結(jié)果做加法,獲得網(wǎng)頁的“同源程度SSS(SameSourc Score)”,同源程度SSS=(SMS*SMP)+(SPS*SPP)+(STS*STP)+(SHS*SHP);(7)判斷該網(wǎng)頁的“同源程度SSS”是否超出門限,如果超出門限則判定為與其它網(wǎng)頁的“同源網(wǎng)頁”,如果沒有超出門限則判定為“非同源網(wǎng)頁”;(8)將第(7)步產(chǎn)生的“非同源網(wǎng)頁”由“非同源網(wǎng)頁處理模塊”入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;將第(7)步產(chǎn)生的“同源網(wǎng)頁”由“同源網(wǎng)頁處理模塊”入“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;(9)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給查詢用戶;(10)作為第(9)步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。
所述由“同源信息處理模塊”也可包括如下步驟(1)在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要查找的文件或網(wǎng)絡(luò)服務(wù);(2)判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將符合搜索條件并具有相同來源的文件或網(wǎng)絡(luò)服務(wù)的獲取入口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第(3)步開始;(3)返回查詢者“沒有符合條件的結(jié)果”的提示;(4)將該搜索關(guān)鍵詞加入到下一輪更新“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程;(5)“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程A.由搜索器搜索網(wǎng)頁新出現(xiàn)的目標文件或服務(wù)入口,通過軟件進入該入口獲取該文件或網(wǎng)絡(luò)服務(wù);B.由“內(nèi)容判決器”判斷新找到的信息“與當前“同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源信息索引數(shù)據(jù)庫”的該類別;如果”否”則由“內(nèi)容判決器”判斷它“與當前非同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的信息和與之同源的并已經(jīng)存貯在‘非同源信息索引數(shù)據(jù)庫’中的信息,新建一個類別并全部轉(zhuǎn)移到‘同源信息索引數(shù)據(jù)庫’”;D.如果“否”則“為當前的信息新建一個類別,并存入‘非同源信息索引數(shù)據(jù)庫’”;(6)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者;(7)作為第(6)步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。
所述由同源信息處理模塊處理文檔時,“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程為A.由“文檔搜索器”搜索網(wǎng)頁新出現(xiàn)的文檔文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù);B.由“文字內(nèi)容判決器”和“圖片內(nèi)容判決器”判斷新找到的文檔內(nèi)容“與當前‘同源文檔索引數(shù)據(jù)庫’的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源文檔索引數(shù)據(jù)庫”的該類別;如果“否”則由“文檔內(nèi)容判決器”判斷它“與當前非同源文檔索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”;C.如果“是”則“為當前的文檔和與之同源的并已經(jīng)存貯在‘非同源文檔索引數(shù)據(jù)庫’中的文檔,新建一個類別并全部轉(zhuǎn)移到‘同源文檔索引數(shù)據(jù)庫_;如果“否”則“為當前的文檔新建一個類別,并存入‘非同源文檔索引數(shù)據(jù)庫’”;所述相關(guān)內(nèi)容判決器模塊包括如下步驟(1)接收“被判斷對象”可以接收多個來源的多媒體,并記錄被判斷對象的數(shù)量InputQuantity;(2)查找“被判斷對象”既定的可參與比對的屬性,記錄當前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity;(3)輸入當前屬性在判斷過程中的“權(quán)重”值Power;(4)計算被全部“被判斷對象”在當前屬性上的吻合度PSame=SameQuantity*Power;(5)返回(1)對下一個“屬性”執(zhí)行(1)~(4),得到該屬性的PSame,直至獲得部屬性的PSame值;(6)計算并返回“被判斷對象”的相同內(nèi)容程度值SameMediaPower=(全部Psame值的數(shù)學累加值)/InputQuantity。
內(nèi)容判決器模塊為文字內(nèi)容判決器時,其包括如下步驟(1)找出文字內(nèi)容中具有相同的單詞或句子的部分的總計長度值SameLenth;(2)找出輸入的多個文字內(nèi)容中,長度最短的輸入文字的長度值MinLenth;(3)返回文字相似程度值SameTextPower=SameLenth/MinLenth。
內(nèi)容判決器模塊為鏈接內(nèi)容判決器時,其包括如下步驟(1)接收“被判斷對象”多個超級鏈接的URL地址;(2)統(tǒng)計“被判斷對象”相似程度SameURLPower=在被判斷的每個超級鏈接所指向的頁面上均出現(xiàn)過的目標URL地址數(shù)量;(3)返回SameURLPower。
內(nèi)容判決器模塊為商業(yè)信息內(nèi)容判決器時,其包括如下步驟(1)比對參與比對的商業(yè)信息是否是相同的產(chǎn)品或服務(wù),如果“不是”返回“不一致”,如果“是”進入第(2)步。
(2)判斷參與比對的商業(yè)信息是否具有地理位置敏感性,如果“不是”返回判斷結(jié)果“一致”,如果“是”則進行第(3)步。
(3)判斷參與比對的商業(yè)信息的提供者是否處于相同的城市或區(qū)域,如果“不是”返回判斷結(jié)果“不一致”,如果是返回判斷結(jié)果“一致”。
“標題搜索結(jié)果”選擇的具體實現(xiàn)方法如下(1)計算每個“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率權(quán)值PWnPWn=TP*PageFocus/(RespDelay-K)n該搜索結(jié)果為第n條當(RespDelay-K)小于等于零時,(RespDelay-K)應(yīng)取值為1PageFocus網(wǎng)頁關(guān)注度值RespDelay網(wǎng)頁服務(wù)響應(yīng)延遲K服務(wù)響應(yīng)常數(shù),建議K設(shè)置為50毫秒(ms)。
TP標題搜索結(jié)果權(quán)力(2)統(tǒng)計求和全部原始“同源搜索結(jié)果”的概率權(quán)值PWn的總和PWall全部概率權(quán)值;(3)計算每條“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率Pn=PWn/Pwall;(4)按照Pn值的概率,隨著搜索者的訪問動作,動態(tài)地隨機選擇“標題搜索結(jié)果”,呈現(xiàn)給搜索者。
所述“標題搜索結(jié)果”的概率權(quán)值PWn的計算方法還可以是a.PWn=(TP+PageFocus)/(RespDelay-K)或,b.PWn=(TP+PageFocus)/RespDelay/K或,c.PWn=TP*PageFocus/RespDelay/K。
所述“同源信息處理模塊”A.可以內(nèi)嵌在搜索引擎中;B.可以放置在“搜索引擎”和“搜索引擎搜索結(jié)果Web服務(wù)器”之間;C.也可以作為預(yù)處理模塊放置在“搜索引擎”和被搜索站點之間。
所述展開查看細節(jié)或其他信息含義的按鈕可為超級連接或各種軟件界面控件。
一種獲取網(wǎng)頁用戶搜索結(jié)果關(guān)注度的系統(tǒng),包括PageFocus網(wǎng)絡(luò)服務(wù)器、PageFocus網(wǎng)絡(luò)瀏覽器及網(wǎng)頁計分服務(wù)器,PageFocus網(wǎng)絡(luò)服務(wù)器包括PageFocus瀏覽器ID注冊服務(wù)器、PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器、PageFocus瀏覽器在線升級服務(wù)器及數(shù)據(jù)加解密模塊;PageFocus網(wǎng)絡(luò)瀏覽器包括PageFocus瀏覽器ID注冊模塊、關(guān)注分值PageFocus計算模塊。
其工作步驟如下(1)“PageFocus網(wǎng)絡(luò)瀏覽器”,每個瀏覽器均在安裝時具備全球唯一的ID標識號,或在使用時主動尋找網(wǎng)絡(luò)上的“PageFocus瀏覽器ID注冊服務(wù)器”以獲得全球唯一的ID標識號;(2)“PageFocus網(wǎng)絡(luò)瀏覽器”具備具有常規(guī)網(wǎng)絡(luò)瀏覽器,并將用戶對瀏覽器的操作和對網(wǎng)頁的操作按照權(quán)重轉(zhuǎn)換成網(wǎng)頁的“關(guān)注分值PageFocus”并形成“PageFocus數(shù)據(jù)包”,以加密方式通過網(wǎng)絡(luò)協(xié)議傳遞至本搜索引擎的“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”;(3)“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”在收到全球的每一個“PageFocus網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”后將其內(nèi)部包含的“關(guān)注分值PageFocus”累加到相應(yīng)的網(wǎng)頁上;(4)“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”上包含的全球每一個網(wǎng)頁的“關(guān)注分值PageFocus”,這些信息可以通過各種處理方法形成搜索引擎對網(wǎng)頁排行依據(jù)、搜索引擎在具有相同內(nèi)容搜索結(jié)果中選擇可以作為“標題搜索結(jié)果”的依據(jù)、也可以直接公布出來作為“網(wǎng)頁熱門程度排行榜”的服務(wù)。
所述PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器可以采用數(shù)學對數(shù)或科學計數(shù)法記錄得分。
所述PageFocus數(shù)據(jù)包可以在瀏覽器徹底關(guān)閉該網(wǎng)頁時形成,也可以定時形成,也可以累計到某個分值時再形成。
所述關(guān)注分值PageFocus按照下表所列權(quán)重形成
注釋1表格中的權(quán)重值是實施例,其它數(shù)值也可采用,均為本發(fā)明的范圍。
所述文字閱讀速度的計算步驟如下A.鼠標滾輪滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次滾動的文字行數(shù)/滾動時間間隔;B.鍵盤翻頁文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次翻頁的文字行數(shù)/翻頁時間間隔;C.窗體滾動條滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次滾動的文字行數(shù)/滾動時間間隔。
所述PageFocus數(shù)據(jù)包包含PageFocus瀏覽器ID、網(wǎng)頁URL及網(wǎng)頁PageFocus得分值字段。
具備“同源網(wǎng)頁”的每一個網(wǎng)頁在參與搜索引擎提供的網(wǎng)頁排名過程中,可以使用每一個“同源網(wǎng)頁”獲得的用戶關(guān)注度PageFocus分值的總和作為排名的依據(jù),即A在“同源網(wǎng)頁”的“標題搜索結(jié)果”在參與搜索引擎結(jié)果排名時可以采用每一個“同源網(wǎng)頁”獲得的用戶關(guān)注度PageFocus的總和作為排名依據(jù);B“同源網(wǎng)頁”內(nèi)的每一個網(wǎng)頁在參與搜索引擎結(jié)果排名時也可以采用其從屬的“同源網(wǎng)頁”的每一個網(wǎng)頁獲得的用戶關(guān)注度PageFocus的總和作為排名依據(jù)。
一種自動判斷用戶狀態(tài)并提供恰當?shù)木W(wǎng)頁風格與內(nèi)容的方法,其包括如下步驟(1)在“網(wǎng)站服務(wù)器集群入口”收到用戶首次訪問本網(wǎng)站網(wǎng)頁的請求后,首先在訪問協(xié)議里在或IP層協(xié)議里獲取其IP地址;(2)根據(jù)IP地址在“IP地址屬性數(shù)據(jù)庫”中查詢其IP地址是“工作場合IP地址”還是“私人或休閑場合的IP地址”,若是“工作場合IP地址”則進行第(3)步,若是“私人或休閑場合的IP地址”則進行第(4)步;(3)獲取“工作場合IP地址”所處的地理位置,并得到該地理區(qū)域的行政時間,若是該IP地址所屬區(qū)域正處于工作時間,則將其訪問分配到“工作風格服務(wù)器”上向其提供適合工作場合使用的頁面服務(wù),否則進行第(4)步;(4)則將其訪問分配到“個人和休閑風格服務(wù)器”上向其提供適合個人和休閑狀態(tài)使用的頁面服務(wù)。
通過上述方案,可把內(nèi)容相同而對搜索者具有相同使用價值的搜索結(jié)果聚合成一條記錄,即標題搜索結(jié)果,根據(jù)需要再展開查看其他結(jié)果的裝置和方法。設(shè)計了避免“標題搜索結(jié)果”由于頻繁被點擊而導致目標服務(wù)器訪問量過大而癱瘓,把“標題搜索結(jié)果”點擊自動分散到其他搜索結(jié)果目標上的裝置。本發(fā)明除了具備現(xiàn)有搜索引擎外,還具備搜索各種“多媒體”、“文檔”、“軟件”、“軟件硬件源代碼或設(shè)計文件”、“數(shù)據(jù)或數(shù)據(jù)庫”、“信息”的各種網(wǎng)絡(luò)服務(wù),例如文件共享、FTP服務(wù)、P2P服務(wù)等的功能。
利用能夠和網(wǎng)絡(luò)上的統(tǒng)計服務(wù)器配合的網(wǎng)絡(luò)瀏覽器,將用戶的全部操作行為換算成對該網(wǎng)頁的評分,并發(fā)送回統(tǒng)計服務(wù)器,作為對網(wǎng)頁的關(guān)注程度的評分,從而可以作為搜索引擎的排名工具。
通過網(wǎng)站內(nèi)容風格自適應(yīng)方法,用戶可以1.周1~5的早上9:00~18:00屬于工作時間,處于工作狀態(tài)的人需要看到簡潔、相對嚴謹?shù)娘L格和盡量與工作狀態(tài)相關(guān)內(nèi)容。
2.周1~5的晚上18:00~早上9:00和周6~7的全天,屬于休閑時間,處于休閑狀態(tài)的人需要看到活波、熱鬧、休閑的風格和內(nèi)容。
3.處于工作場所人需要看到簡潔、相對嚴謹?shù)娘L格和盡量與工作狀態(tài)相關(guān)內(nèi)容。
4.處于家庭和休閑場所的人需要看到活波、熱鬧、休閑的風格和內(nèi)容。
5.處于其它環(huán)境或狀態(tài)的人需要看到與當時的環(huán)境和狀態(tài)相適應(yīng)的的風格和內(nèi)容。
附圖簡要說明
圖1為同源信息站點搜索引擎聚合顯示方法的系統(tǒng)工作結(jié)構(gòu)圖;圖2為同源信息處理模塊內(nèi)部結(jié)構(gòu)圖;圖3為同源網(wǎng)頁處理模塊流程圖;圖4為同源多媒體處理模塊流程圖;圖5為同源圖片處理模塊流程圖;圖6為同源文檔處理模塊流程圖;圖7為同源軟件處理模塊流程圖;圖8為同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊流程圖;圖9為同源GIS信息處理模塊流程圖;
圖10為同價值網(wǎng)絡(luò)服務(wù)處理模塊流程圖;圖11為同價值商業(yè)信息處理模塊流程圖;圖12為獲取網(wǎng)頁用戶關(guān)注度系統(tǒng)結(jié)構(gòu)圖;圖13為不具備內(nèi)容和風格自適應(yīng)技術(shù)的現(xiàn)有常規(guī)搜索引擎網(wǎng)站系統(tǒng);圖14為本發(fā)明具備內(nèi)容和風格自適應(yīng)技術(shù)的的搜索引擎網(wǎng)站系統(tǒng)。
具體實施例方式
現(xiàn)結(jié)合附圖對本發(fā)明做進一步的說明。
圖1為同源信息站點搜索引擎聚合顯示方法的系統(tǒng)工作結(jié)構(gòu)圖。第1步由查詢者通過Web瀏覽器或應(yīng)用軟件訪問搜索引擎,并輸入需要查詢的關(guān)鍵詞。第2步由搜索引擎找到全部符合條件的目標站點作為“原始搜索結(jié)果”。第3步由“同源信息處理模塊”查詢“成為標題搜索結(jié)果”權(quán)力采購者的賬戶信息,并結(jié)合其他判斷規(guī)則在“原始搜索結(jié)果”中選取用來作為“標題搜索結(jié)果”的對象A“同源信息處理模塊”可以內(nèi)嵌在搜索引擎中;“同源信息處理模塊”可以放置在“搜索引擎”和“搜索引擎搜索結(jié)果Web服務(wù)器”之間;C“同源信息處理模塊”也可以作為預(yù)處理模塊放置在“搜索引擎”和被搜索站點之間。第4步由搜索引擎Web服務(wù)器或應(yīng)用服務(wù)器只將選中的“標題搜索結(jié)果”作為搜索結(jié)果展示給查詢者,并為其提供一個帶有“展開查看細節(jié)或其他信息”含義的“按鈕(包括超級連接或各種軟件界面控件)”。第5步只有查詢者還希望進一步展開某條“標題搜索結(jié)果”,并按動與之對應(yīng)的“按鈕”時,搜索引擎再向其展示在“第2步”中找到的“原始搜索結(jié)果”。
圖2為同源信息處理模塊內(nèi)部結(jié)構(gòu)圖?!巴葱畔⑻幚砟K”定義為1)主要用來判斷按照搜索關(guān)鍵詞找到的一組信息節(jié)點中是否有多個節(jié)點只是一個或多個同信息源的重復(fù)站點(這些站點對查詢者具有相同搜索價值或使用價值,通常不必全部直接展現(xiàn)給查詢者),并且將這些重復(fù)站點聚合成一條搜索結(jié)果發(fā)給查詢者,只有查詢者需要其他同等價值的站點時才將這些搜索結(jié)果呈現(xiàn)出來。2)和現(xiàn)有搜索引擎主要集中于網(wǎng)頁的搜索不同,“同源信息處理模塊”除了需要處理“Html網(wǎng)頁”外還能夠處理各種“多媒體”、“文檔”、“軟件”、“軟件硬件源代碼或設(shè)計文件”、“數(shù)據(jù)或數(shù)據(jù)庫”、“信息”的各種網(wǎng)絡(luò)服務(wù),例如文件共享、FTP服務(wù)、P2P服務(wù)等。
“同源信息處理模塊”采用模塊化結(jié)構(gòu),可以根據(jù)需要逐步開發(fā)和實施其中的每一個模塊,并且具備擴展能力,同時每一個模塊也可以進一步加強其自動判斷的準確性,其中包括1“信息種類判斷模塊”判斷信息的種類,并將同類型信息集中發(fā)送到相應(yīng)類型信息的處理模塊,如下列模塊。
2“同源網(wǎng)頁處理模塊”用來判斷并處理找到的屬于同一來源并對查詢者具有相同價值的網(wǎng)頁,例如Html,ASP,JSP,PHP,BBS論壇的內(nèi)容等。
3“同源多媒體處理模塊”用來判斷并處理找到的屬于同一來源,并對查詢者具有相同價值的多媒體文件或網(wǎng)絡(luò)服務(wù),例如.MP3,.AVI,.WMV.MPEG,.WAV,.RM等各種視頻文件,以及各種基于流媒體技術(shù)的視頻服務(wù)接入端口。
4“同源圖片處理模塊”用來判斷并處理找到的屬于同一來源或具有相同內(nèi)容的,并對查詢者具有相同價值的圖片,例如.GIF,.JPG,.BMP,.PNG等。
5“同源文檔處理模塊”用來判斷并處理找到的屬于同一來源、具有相同或相關(guān)內(nèi)容,并對查詢者具有相同價值的各種格式文檔文件或網(wǎng)絡(luò)服務(wù),例如“.Doc”,“.Txt”,“.Pdf”,“.XLS”,“.PPT”等。
6“同源軟件處理模塊”能夠判斷并處理找到的計算機應(yīng)用軟件安裝程序?qū)儆谕蛔髡叩耐卉浖鼈兛梢允沁m應(yīng)不同或相同操作系統(tǒng)的,相同或不同版本的軟件安裝程序。
7“同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊”用來判斷并處理找到的屬于同一來源或具有相同內(nèi)容的,并對查詢者具有相同價值的,已知格式的數(shù)據(jù)文件或數(shù)據(jù)庫文件,例如.DAT,.XLS,.MDF,.DBF等。
8“同源GIS信息處理模塊”用來判斷并處理找到的屬于同一來源或具有相同內(nèi)容的,并對查詢者具有相同價值的數(shù)字地圖文件或服務(wù)。
9“同價值網(wǎng)絡(luò)服務(wù)處理模塊”用來判斷并處理找到的屬于同一來源或具有相同內(nèi)容的,并對查詢者具有相同價值的網(wǎng)絡(luò)服務(wù),例如相同文件的FTP下載服務(wù),同時轉(zhuǎn)播一個電視臺的IPTV服務(wù),同時提供1GB容量的郵件服務(wù)等。
10“同價值商業(yè)信息處理模塊”用來判斷并處理找到的屬于同一來源或具有相同內(nèi)容的,處于相同地理或行政區(qū)域的,并對查詢者具有相同價值的,通過網(wǎng)絡(luò)發(fā)布自己的商業(yè)產(chǎn)品或服務(wù)的廣告內(nèi)容,例如在同一個街區(qū)提供的雞蛋出售信息,在同一個街區(qū)提供的理發(fā)服務(wù)出售信息,在同一個城市可以使用的電話通訊服務(wù)等?!靶畔⒎N類判斷模塊”“信息種類判斷模塊”主要用于在搜集到的信息中,分類出其類型,并送至相應(yīng)的信息處理模塊。
“信息種類判斷模塊”處理的信息來源主要有3種形式(1)網(wǎng)頁形式信息來自于網(wǎng)站的網(wǎng)頁內(nèi)容,同時網(wǎng)頁中還含有指向特定文件類型的超級鏈接,例如“http://www.008.org.cn/up/the_quiet_american.mp3”(2)網(wǎng)絡(luò)服務(wù)形式包括各種網(wǎng)絡(luò)服務(wù)器提供的網(wǎng)絡(luò)服務(wù)入口,例如FTP文件下載服務(wù)、各種P2P(Pear To Pear)軟件(例如BT下載、eMule下載)的種子服務(wù),新聞服務(wù)器服務(wù)等。對于網(wǎng)絡(luò)服務(wù)入口的獲知可以有兩種途徑A.網(wǎng)頁上可以查到的網(wǎng)絡(luò)服務(wù)通過解析網(wǎng)頁內(nèi)容可以獲知的網(wǎng)絡(luò)服務(wù)入口。
B.直接由網(wǎng)絡(luò)服務(wù)提供者向本搜索引擎提交其網(wǎng)絡(luò)服務(wù)入口或內(nèi)容。
(3)數(shù)據(jù)或數(shù)據(jù)庫形式由搜索引擎直接向網(wǎng)絡(luò)提供信息錄入服務(wù),由網(wǎng)絡(luò)用戶提交自己的信息,最終形成數(shù)據(jù)文件或數(shù)據(jù)庫形式的信息,在本搜索引擎被查詢時,從中提取信息來滿足查詢者的要求。
“網(wǎng)頁形式”信息的種類判斷方法如下網(wǎng)頁本身就可以直接作為“網(wǎng)頁”輸出給“同源網(wǎng)頁處理模塊”進行處理,另外,“信息種類判斷模塊”按照網(wǎng)頁語法(例如Html、Java、JSP、ASP、ASPX、PHP等等語言)針對“超級鏈接”的語法,可直接解析出其指向的文件類型,根據(jù)不同的文件類型可以區(qū)分出其信息類型,詳見下表
舉例1.網(wǎng)頁中含有“http://xxx/xxx/song.mp3”超級鏈接,即可判斷其目標為“多媒體”類型信息。
2.網(wǎng)頁中含有“http://xxx/xxx/song.rar”超級鏈接,找到該目標文件后解壓縮,發(fā)現(xiàn)里面只含有”song.mp3”仍可判斷目標為“多媒體”類型信息。
3.網(wǎng)頁中含有“http://xxx/xxx/song.rar”超級鏈接,找到該目標文件后解壓縮,發(fā)現(xiàn)里面含有的文件和目錄的文件個數(shù)、每個文件的名稱和大小均與某種已知軟件的安裝盤相同,即可判斷其為“軟件”類型信息。
“網(wǎng)絡(luò)服務(wù)形式”信息的種類判斷方法如下第1步作為普通用戶訪問該服務(wù),以獲取其內(nèi)容。
第2步將獲得的內(nèi)容按照下表進行分類。
第3步如果獲得的是壓縮格式文件,則需要展開其內(nèi)容后在按照第2步進行分類。
“數(shù)據(jù)或數(shù)據(jù)庫形式”信息的種類判斷方法如下第1步訪問數(shù)據(jù)文件或數(shù)據(jù)庫,以獲取其內(nèi)容。
第2步如果從數(shù)據(jù)文件或數(shù)據(jù)庫中獲得的信息是文件則直接進行“第4步”。
第3步如果從數(shù)據(jù)文件或數(shù)據(jù)庫中獲得的信息是存放文件的位置,則需要訪問該位置以獲得目標文件。
第4步將獲得的內(nèi)容按照下表進行分類。
第5步如果獲得的是壓縮格式文件,則需要展開其內(nèi)容后在按照4步進行分類?!巴淳W(wǎng)頁處理模塊”圖3為“同源網(wǎng)頁處理模塊”流程圖?!巴淳W(wǎng)頁處理模塊”主要功能將根據(jù)搜索關(guān)鍵詞找到的,具有相同主要內(nèi)容的網(wǎng)頁,以一條“標題搜索結(jié)果”形式展現(xiàn)給查詢者,并且通過“展開”含義按鈕可以看到全部查詢到的具有相同主要內(nèi)容的網(wǎng)頁的查詢結(jié)果。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間。
“同源信息處理模塊”處理流程如下第1步在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時候,首先由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞是否近期已經(jīng)被其他人查詢過,如果被查詢過,并且結(jié)果已經(jīng)在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布,則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將具有相同來源的網(wǎng)頁聚合成一條搜索結(jié)果,點擊“同源網(wǎng)頁”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的搜索結(jié)果網(wǎng)頁,完成整個查詢過程。
第2步如果在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時候,由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞近期沒有被其他人查詢過,并且也沒有相應(yīng)的查詢結(jié)果在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布則啟動“網(wǎng)頁搜索器”搜索“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,并獲取這些網(wǎng)頁的內(nèi)容。
如果“網(wǎng)頁搜索器”在“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”中沒有找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,則返回查詢者“沒有符合條件網(wǎng)頁”的結(jié)果,并且將該搜索關(guān)鍵詞加入到下一輪更新“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的任務(wù)中,如果在更新過程中找到了符合條件的網(wǎng)頁地址則根據(jù)其是否具有同源網(wǎng)頁而選擇入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”或“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”,這樣如果再有人搜索同樣的關(guān)鍵詞是就可以找到結(jié)果。
第3步由“網(wǎng)頁內(nèi)容分離器”將找到的網(wǎng)頁內(nèi)容及超級鏈接目標分解成多媒體、圖片、文字、超級鏈接等種類。
第4步分別由各種內(nèi)容判決器產(chǎn)生判決結(jié)果A.由“多媒體內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同多媒體文件程度SMS”(Same Media Score)(多媒體的定義包括Flash類、視頻/音頻文件的播放服務(wù)或文件服務(wù)、IPTV/衛(wèi)星直播/音視頻監(jiān)控/表演/人工應(yīng)答等實時信息的播放服務(wù)或文件服務(wù),其他多媒體服務(wù))。
B.由“圖片內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同圖片的程度SPS”(Same Photo Score)。
C.由“文字內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同文字的程度STS”(Same Text Score)。
D.由“鏈接內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同超級連接的程度SHS”(Same Hyperlinks Score)。
第5步從“同源網(wǎng)頁判決規(guī)則庫”分別獲取“多媒體判決權(quán)重SMP”、“圖片判決權(quán)重SPP”、“文字判決權(quán)重STP”、“鏈接判決權(quán)重SHP”并分別與第4步生成的“相同多媒體文件程度SMS”、“相同圖片的程度SPS”、“相同文字的程度STS”、“相同超級連接的程度SHS”做數(shù)學乘法。
第6步將“第5步”獲得的數(shù)學乘法結(jié)果做加法,獲得網(wǎng)頁的“同源程度SSS(Same Sourc Score)”,同源程度SSS=(SMS*SMP)+(SPS*SPP)+(STS*STP)+(SHS*SHP)第7步判斷該網(wǎng)頁的“同源程度SSS”是否超出門限,如果超出門限則判定為與其它網(wǎng)頁的“同源網(wǎng)頁”,如果沒有超出門限則判定為“非同源網(wǎng)頁”。
第8步將“第7步”產(chǎn)生的“非同源網(wǎng)頁”由“非同源網(wǎng)頁處理模塊”入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;將“第7步”產(chǎn)生的“同源網(wǎng)頁”由“同源網(wǎng)頁處理模塊”入“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”。
第9步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M2”標記)。
作為第9步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“網(wǎng)頁內(nèi)容分類器”可通過軟件實現(xiàn),直接根據(jù)“Html語法”,“ASP/ASPX語法”,“PHP”,“JSP”等各種網(wǎng)頁上使用的語法解析出每一個內(nèi)容的類型。
“同源多媒體處理模塊”圖4為“同源多媒體處理模塊”流程圖。對于符合搜索條件的多媒體文件或服務(wù),“同源多媒體處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源多媒體索引數(shù)據(jù)庫”和“同源多媒體索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間。
“同源多媒體處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是多媒體文件或服務(wù)(例如,關(guān)鍵詞中含有“.MP3”表示需要尋找的是.MP3文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的多媒體的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件多媒體”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源多媒體索引數(shù)據(jù)庫”和“非同源多媒體索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源多媒體索引數(shù)據(jù)庫”和“非同源多媒體索引數(shù)據(jù)庫”的更新過程A.由“多媒體搜索器”搜索網(wǎng)頁新出現(xiàn)的多媒體文件或服務(wù)入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“多媒體內(nèi)容判決器”判斷新找到的多媒體內(nèi)容“與當前“同源多媒體索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源多媒體索引數(shù)據(jù)庫”的該類別;如果“否”則由“多媒體內(nèi)容判決器”判斷它“與當前非同源多媒體索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的多媒體和與之同源的并已經(jīng)存貯在‘非同源多媒體索引數(shù)據(jù)庫’中的多媒體,新建一個類別并全部轉(zhuǎn)移到‘同源多媒體索引數(shù)據(jù)庫’”;如果“否”則“為當前的多媒體新建一個類別,并存入‘非同源多媒體索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同源圖片處理模塊”圖5為同源圖片處理模塊流程圖。對于符合搜索條件的圖片文件或鏈接,“同源圖片處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源圖片索引數(shù)據(jù)庫”和“同源圖片索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間。“同源圖片處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是圖片文件或鏈接(例如,關(guān)鍵詞中含有“.JPG”表示需要尋找的是.JPG文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的圖片的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件圖片”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源圖片索引數(shù)據(jù)庫”和“非同源圖片索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源圖片索引數(shù)據(jù)庫”和“非同源圖片索引數(shù)據(jù)庫”的更新過程A.由“圖片搜索器”搜索網(wǎng)頁新出現(xiàn)的圖片文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“圖片內(nèi)容判決器”判斷新找到的圖片內(nèi)容“與當前“同源圖片索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源圖片索引數(shù)據(jù)庫”的該類別;如果“否”則由“圖片內(nèi)容判決器”判斷它“與當前非同源圖片索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”
C.如果“是”則“為當前的圖片和與之同源的并已經(jīng)存貯在‘非同源圖片索引數(shù)據(jù)庫’中的圖片,新建一個類別并全部轉(zhuǎn)移到‘同源圖片索引數(shù)據(jù)庫’”;如果“否”則“為當前的圖片新建一個類別,并存入‘非同源圖片索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同源文檔處理模塊”圖6為同源文檔處理模塊流程圖。同源文檔處理模塊”支持常見文檔格式“.Txt”,“.Doc”,“.PPT”,“.PDF”,“.XLS”等等。對于符合搜索條件的文檔文件或鏈接,“同源文檔處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源文檔索引數(shù)據(jù)庫”和“同源文檔索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間?!巴次臋n處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是文檔文件或鏈接(例如,關(guān)鍵詞中含有“.PDF”表示需要尋找的是.PDF文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的文檔的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件文檔”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源文檔索引數(shù)據(jù)庫”和“非同源文檔索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源文檔索引數(shù)據(jù)庫”和“非同源文檔索引數(shù)據(jù)庫”的更新過程A.由“文檔搜索器”搜索網(wǎng)頁新出現(xiàn)的文檔文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“文字內(nèi)容判決器”和“圖片內(nèi)容判決器”判斷新找到的文檔內(nèi)容“與當前‘同源文檔索引數(shù)據(jù)庫’的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源文檔索引數(shù)據(jù)庫”的該類別;如果“否”則由“文檔內(nèi)容判決器”判斷它“與當前非同源文檔索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的文檔和與之同源的并已經(jīng)存貯在‘非同源文檔索引數(shù)據(jù)庫’中的文檔,新建一個類別并全部轉(zhuǎn)移到‘同源文檔索引數(shù)據(jù)庫’”;如果“否”則“為當前的文檔新建一個類別,并存入‘非同源文檔索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同源軟件處理模塊”圖7為同源軟件處理模塊流程圖。對于符合搜索條件的軟件文件或鏈接,“同源軟件處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源軟件索引數(shù)據(jù)庫”和“同源軟件索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間?!巴窜浖幚砟K”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是軟件文件或鏈接(例如,關(guān)鍵詞中含有“.EXE”表示需要尋找的是.EXE文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的軟件的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件軟件”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源軟件索引數(shù)據(jù)庫”和“非同源軟件索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源軟件索引數(shù)據(jù)庫”和“非同源軟件索引數(shù)據(jù)庫”的更新過程A.由“軟件搜索器”搜索網(wǎng)頁新出現(xiàn)的軟件文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“軟件內(nèi)容判決器”判斷新找到的軟件內(nèi)容“與當前“同源軟件索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源軟件索引數(shù)據(jù)庫”的該類別;如果“否”則由“軟件內(nèi)容判決器”判斷它“與當前非同源軟件索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的軟件和與之同源的并已經(jīng)存貯在‘非同源軟件索引數(shù)據(jù)庫’中的軟件,新建一個類別并全部轉(zhuǎn)移到‘同源軟件索引數(shù)據(jù)庫’”;如果“否”則“為當前的軟件新建一個類別,并存入‘非同源軟件索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊”圖8為同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊流程圖。對于符合搜索條件的軟件文件或鏈接,“同源數(shù)據(jù)處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源數(shù)據(jù)索引數(shù)據(jù)庫”和“同源數(shù)據(jù)索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間?!巴磾?shù)據(jù)處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過數(shù)據(jù)根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是數(shù)據(jù)文件或鏈接(例如,關(guān)鍵詞中含有“.DBF”表示需要尋找的是..DBF文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的數(shù)據(jù)的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件數(shù)據(jù)”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源數(shù)據(jù)索引數(shù)據(jù)庫”和“非同源數(shù)據(jù)索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源數(shù)據(jù)索引數(shù)據(jù)庫”和“非同源數(shù)據(jù)索引數(shù)據(jù)庫”的更新過程A.由“數(shù)據(jù)搜索器”搜索網(wǎng)頁新出現(xiàn)的數(shù)據(jù)文件或鏈接入口,通過數(shù)據(jù)進入該入口獲取該文件或服務(wù)。
B.由“數(shù)據(jù)內(nèi)容判決器”判斷新找到的數(shù)據(jù)內(nèi)容“與當前“同源數(shù)據(jù)索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源數(shù)據(jù)索引數(shù)據(jù)庫”的該類別;如果“否”則由“數(shù)據(jù)內(nèi)容判決器”判斷它“與當前非同源數(shù)據(jù)索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的數(shù)據(jù)和與之同源的并已經(jīng)存貯在‘非同源數(shù)據(jù)索引數(shù)據(jù)庫’中的數(shù)據(jù),新建一個類別并全部轉(zhuǎn)移到‘同源數(shù)據(jù)索引數(shù)據(jù)庫’”;如果“否”則“為當前的數(shù)據(jù)新建一個類別,并存入‘非同源數(shù)據(jù)索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同源GIS信息處理模塊”圖9為“同源GIS信息處理模塊”流程圖。對于符合搜索條件的GIS信息文件或鏈接,“同源GIS信息處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同源信息處理模塊”將處理結(jié)果分類別放置在“非同源GIS信息索引數(shù)據(jù)庫”和“同源GIS信息索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間。“同源GIS信息處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是GIS信息文件或鏈接(例如,關(guān)鍵詞中含有“.JPG”表示需要尋找的是.JPG文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的GIS信息的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件GIS信息”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同源GIS信息索引數(shù)據(jù)庫”和“非同源GIS信息索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同源GIS信息索引數(shù)據(jù)庫”和“非同源GIS信息索引數(shù)據(jù)庫”的更新過程A.由“GIS信息搜索器”搜索網(wǎng)頁新出現(xiàn)的GIS信息文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“GIS信息內(nèi)容判決器”判斷新找到的GIS信息內(nèi)容“與當前“同源GIS信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源GIS信息索引數(shù)據(jù)庫”的該類別;如果“否”則由“GIS信息內(nèi)容判決器”判斷它“與當前非同源GIS信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的GIS信息和與之同源的并已經(jīng)存貯在‘非同源GIS信息索引數(shù)據(jù)庫’中的GIS信息,新建一個類別并全部轉(zhuǎn)移到‘同源GIS信息索引數(shù)據(jù)庫’”;如果“否”則“為當前的GIS信息新建一個類別,并存入‘非同源GIS信息索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同價值網(wǎng)絡(luò)服務(wù)處理模塊”圖10為“同價值網(wǎng)絡(luò)服務(wù)處理模塊”流程圖。對于符合搜索條件的網(wǎng)絡(luò)服務(wù),“同價值網(wǎng)絡(luò)服務(wù)處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同價值信息處理模塊”將處理結(jié)果分類別放置在“非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”和“同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間?!巴瑑r值網(wǎng)絡(luò)服務(wù)處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是網(wǎng)絡(luò)服務(wù)文件或鏈接(例如,關(guān)鍵詞中含有“.JPG”表示需要尋找的是.JPG文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的網(wǎng)絡(luò)服務(wù)的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同價值文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件網(wǎng)絡(luò)服務(wù)”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”和”非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”和“非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”的更新過程A.由“網(wǎng)絡(luò)服務(wù)搜索器”搜索網(wǎng)頁新出現(xiàn)的網(wǎng)絡(luò)服務(wù)文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“網(wǎng)絡(luò)服務(wù)內(nèi)容判決器”判斷新找到的網(wǎng)絡(luò)服務(wù)內(nèi)容“與當前“同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”的該類別;如果“否”則由“網(wǎng)絡(luò)服務(wù)內(nèi)容判決器”判斷它“與當前非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的網(wǎng)絡(luò)服務(wù)和與之同價值的并已經(jīng)存貯在‘非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫’中的網(wǎng)絡(luò)服務(wù),新建一個類別并全部轉(zhuǎn)移到‘同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫’”;如果“否”則“為當前的網(wǎng)絡(luò)服務(wù)新建一個類別,并存入‘非同價值網(wǎng)絡(luò)服務(wù)索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同價值網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同價值網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同價值商業(yè)信息處理模塊”圖11為“同價值商業(yè)信息處理模塊”流程圖。對于符合搜索條件的商業(yè)信息,“同價值商業(yè)信息處理模塊”均采用Html網(wǎng)頁中的超級鏈接方式提供給被查詢者。為最大化地提高本系統(tǒng)的工作性能,我們采用了如下技術(shù)采用了網(wǎng)頁發(fā)布技術(shù),使用“搜索結(jié)果網(wǎng)頁發(fā)布器”將搜索結(jié)果提前發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,直接響應(yīng)已經(jīng)被查詢過的搜索要求,避免根據(jù)請求動態(tài)從數(shù)據(jù)庫生成動態(tài)網(wǎng)頁的大量計算。
“同價值信息處理模塊”將處理結(jié)果分類別放置在“非同價值商業(yè)信息索引數(shù)據(jù)庫”和“同價值商業(yè)信息索引數(shù)據(jù)庫”中,并定期由“搜索結(jié)果網(wǎng)頁發(fā)布器”發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,避免了重復(fù)計算和減少了計算等待時間?!巴瑑r值商業(yè)信息處理模塊”處理流程如下第1步在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的是商業(yè)信息文件或鏈接(例如,關(guān)鍵詞中含有“.JPG”表示需要尋找的是.JPG文件而不是含有該文字的網(wǎng)頁)。
第2步判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果(見圖“M1”標記),該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的商業(yè)信息的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同價值文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第3步開始。
第3步返回查詢者“沒有符合條件商業(yè)信息”的結(jié)果。
第4步將該搜索關(guān)鍵詞加入到下一輪更新“同價值商業(yè)信息索引數(shù)據(jù)庫”和“非同價值商業(yè)信息索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程。
第5步“同價值商業(yè)信息索引數(shù)據(jù)庫”和“非同價值商業(yè)信息索引數(shù)據(jù)庫”的更新過程A.由“商業(yè)信息搜索器”搜索網(wǎng)頁新出現(xiàn)的商業(yè)信息文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù)。
B.由“商業(yè)信息內(nèi)容判決器”判斷新找到的商業(yè)信息內(nèi)容“與當前“同價值商業(yè)信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同價值商業(yè)信息索引數(shù)據(jù)庫”的該類別;如果“否”則由“商業(yè)信息內(nèi)容判決器”判斷它“與當前非同價值商業(yè)信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”C.如果“是”則“為當前的商業(yè)信息和與之同價值的并已經(jīng)存貯在‘非同價值商業(yè)信息索引數(shù)據(jù)庫’中的商業(yè)信息,新建一個類別并全部轉(zhuǎn)移到‘同價值商業(yè)信息索引數(shù)據(jù)庫’”;如果“否”則“為當前的商業(yè)信息新建一個類別,并存入‘非同價值商業(yè)信息索引數(shù)據(jù)庫’”;。
第6步由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同價值網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同價值網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者(見圖“M2”標記)。
作為第6步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。(見圖“M3”標記)。
“同價值商業(yè)信息處理模塊”的特點在于能夠根據(jù)商品或服務(wù)特點、供應(yīng)與查詢者的分布自動判斷多個商業(yè)信息目標是否對查詢者具有相同的使用價值,從而作為將其聚合成一條“標題搜索結(jié)果”的依據(jù),以及查詢結(jié)果排序的依據(jù)。
內(nèi)容判決器可以在各種“同源(同價值)信息處理模塊”中通用。
“內(nèi)容判決器”具體實現(xiàn)方案“多媒體內(nèi)容判決器”具體實現(xiàn)方案1輸入可以接收多個來源的多媒文件(如果是播放服務(wù)就將起錄制成文件,或從播放服務(wù)器上獲取媒體文件信息)。
2處理進行多媒體內(nèi)容吻合度比對。
3返回計算輸入多媒體中具有的相同內(nèi)容程度值SameMediaPower。
具體實現(xiàn)方法第1步接收“被判斷對象”可以接收多個來源的多媒體。并記錄被判斷對象的數(shù)量InputQuantity。
第2步查找“被判斷對象”在下表中可參與比對的屬性,記錄當前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity(例如,5個被判斷對象中,有3個對象的屬性具有相同的值,則該屬性的SameQuantity=3)第3步輸入當前屬性在判斷過程中的“權(quán)重”值(從下表中查到)Power第4步計算被全部“被判斷對象”在當前屬性上的吻合度PSame=SameQuantity*Power第5步返回“第1步”對下一個“屬性”執(zhí)行“第1步”~“第4步”,得到該屬性的PSame。直至獲得部屬性的的PSame值。
第6步計算并返回“被判斷對象”的相同內(nèi)容程度值SameMediaPower=(全部Psame值的數(shù)學累加值)/InputQuantity。
視頻文件或播放服務(wù)判斷內(nèi)容
注釋1.本發(fā)明在于采用“權(quán)重”值計算每種屬性的比對重要性的方法,而不僅僅是表中所列具體數(shù)值,表中“權(quán)重”具體數(shù)值僅為典型值,根據(jù)實際需要改變其具體數(shù)值仍然屬于本發(fā)明范疇。
2.根據(jù)實際情況,某些屬性值可能為“空(Null)”,計算過程中屬性值為“空”時不應(yīng)被視作屬性相等。
音頻文件判斷內(nèi)容
注釋
1本發(fā)明在于采用“權(quán)重”值計算每種屬性的比對重要性的方法,而不僅僅是表中所列具體數(shù)值,表中“權(quán)重”具體數(shù)值僅為典型值,根據(jù)實際需要改變其具體數(shù)值仍然屬于本發(fā)明范疇。
2根據(jù)實際情況,某些屬性值可能為“空(Null)”,計算過程中屬性值為“空”時不應(yīng)被視作屬性相等。
Flash文件判斷內(nèi)容
注釋1.本發(fā)明在于采用“權(quán)重”值計算每種屬性的比對重要性的方法,而不僅僅是表中所列具體數(shù)值,表中“權(quán)重”具體數(shù)值僅為典型值,根據(jù)實際需要改變其具體數(shù)值仍然屬于本發(fā)明范疇。
2.根據(jù)實際情況,某些屬性值可能為“空(Null)”,計算過程中屬性值為“空”時不應(yīng)被視作屬性相等。
“圖片內(nèi)容判決器”具體實現(xiàn)方案1輸入可以接收多個來源的圖片。
2處理進行圖片內(nèi)容吻合度比對。
3返回計算輸入圖片中具有的相同內(nèi)容程度值SamePicPower。
具體實現(xiàn)方法第1步接收“被判斷對象”可以接收多個來源的圖片。并記錄被判斷對象的數(shù)量InputQuantity。
第2步查找“被判斷對象”在下表中可參與比對的屬性,記錄當前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity(例如,5個被判斷對象中,有3個對象的屬性具有相同的值,則該屬性的SameQuantity=3)第3步輸入當前屬性在判斷過程中的“權(quán)重”值(從下表中查到)Power第4步計算被全部“被判斷對象”在當前屬性上的吻合度PSame=SameQuantity*Power第5步返回“第1步”對下一個“屬性”執(zhí)行“第1步”~“第4步”,得到該屬性的PSame。直至獲得部屬性的的PSame值。
第6步計算并返回“被判斷對象”的相同內(nèi)容程度值SamePicPower=(全部Psame值的數(shù)學累加值)/InputQuantity。
根據(jù)圖片各種屬性以及圖像識別軟件對于相似程度的判斷。
注釋1.本發(fā)明在于采用“權(quán)重”值計算每種屬性的比對重要性的方法,而不僅僅是表中所列具體數(shù)值,表中“權(quán)重”具體數(shù)值僅為典型值,根據(jù)實際需要改變其具體數(shù)值仍然屬于本發(fā)明范疇。
2.根據(jù)實際情況,某些屬性值可能為“空(Null)”,計算過程中屬性值為“空”時不應(yīng)被視作屬性相等。
“文字內(nèi)容判決器”具體實現(xiàn)方案“文字內(nèi)容判決器”,可通過軟件實現(xiàn)1輸入可以接收多個來源的文字,作為“被判斷對象”。
2處理進行圖片內(nèi)容吻合度比對。
3返回“被判斷對象”之間的一致程度值SameTextPower。
實現(xiàn)方法第1步找出輸入的多個圖片中文字內(nèi)容中,具有相同的單詞或句子的部分的總計長度值SameLenth。
第2步找出輸入的多個文字內(nèi)容中,長度最短的輸入文字的長度值,MinLenth。
第3步返回文字相似程度值SameTextPower=SameLenth/MinLenth
按照此方法找到的文字中長度最長文字的通常是同一篇文章分頁數(shù)量少或含有大量廣告和外部超級鏈接的,而長度最短的文字通常是同一篇文章被分成更多頁數(shù)或含有最少廣告和外部超級鏈接的。
“鏈接內(nèi)容判決器”具體實現(xiàn)方案“鏈接內(nèi)容判決器”,可通過軟件實現(xiàn)用來比對多個網(wǎng)頁上所含有的超級鏈接是否具有共同特征。
1輸入多組超級鏈接的Url地址(每組超級鏈接通常是從一個網(wǎng)頁上獲得的全部超級鏈接)。
2處理進行各組間超級鏈接Url地址吻合度計算3返回各組間具有相同超級鏈接數(shù)。
實現(xiàn)方法第1步接收“被判斷對象”多組超級鏈接的URL地址。
第2步統(tǒng)計“被判斷對象”相似程度SameURLPower=在每組超級鏈接均出現(xiàn)過的URL地址數(shù)量。
第3步返回SameURLPower。
“軟件內(nèi)容判決器”具體實現(xiàn)方案“軟件內(nèi)容判決器”,用來比對輸入的多個軟件是否是同種軟件。
1輸入可以接收多個來源的軟件。
2處理進行軟件內(nèi)容吻合度比對。
3返回軟件內(nèi)容吻合度數(shù)值。
具體實現(xiàn)方法第1步接收“被判斷對象”多個輸入的文件或目錄。并記錄被判斷對象的數(shù)量InputQuantity。
第2步查找“被判斷對象”在下表中可比對的屬性,記錄當前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity(例如,5個被判斷對象中,有3個對象的屬性具有相同的值,則該屬性的SameQuantity=3)
第3步輸入當前屬性在判斷過程中的“權(quán)重”值(從下表中查到)Power第4步計算被全部“被判斷對象”在當前屬性上的吻合度PSame=SameQuantity*Power。
第5步返回“第1步”對下一個“屬性”執(zhí)行“第1步”~“第4步”,得到該屬性的PSame。直至獲得部屬性的的PSame值。
第6步計算并返回“被判斷對象”的吻合值SameSoftPower=(全部Psame值的數(shù)學累加值)/InputQuantity。
注釋1.本發(fā)明在于采用“權(quán)重”值計算每種屬性的比對重要性的方法,而不僅僅是表中所列具體數(shù)值,表中“權(quán)重”具體數(shù)值僅為典型值,根據(jù)實際需要改變其具體數(shù)值仍然屬于本發(fā)明范疇。
2.根據(jù)實際情況,某些屬性值可能為“空(Null)”,計算過程中屬性值為“空”時不應(yīng)被視作屬性相等。
“數(shù)據(jù)或數(shù)據(jù)庫內(nèi)容判決器”具體實現(xiàn)方案逐一比對不同數(shù)據(jù)庫文件內(nèi)的每條數(shù)據(jù)記錄內(nèi)容是否相等,返回參與比對的數(shù)據(jù)庫一致程度值SameDBPower是否超過門限。
SameDBPower=字段名稱相同并且數(shù)值相等的記錄數(shù)/參與比對的數(shù)據(jù)庫擁有該字段的最少記錄個數(shù)。
SameDBPower反映了相同內(nèi)容記錄數(shù)相對擁有最少記錄數(shù)的數(shù)據(jù)庫的比例,SameDBPower取值為0~1。
“數(shù)據(jù)或數(shù)據(jù)庫內(nèi)容判決器”具體實現(xiàn)方案對于數(shù)據(jù)文件可采用如下實現(xiàn)步驟
第1步在參與比對的多個數(shù)據(jù)文件中,隨機選取一個文件作為“比對標準”。
第2步進行其它文件與“比對標準”的一致性的粗略比較文件長度、文件校驗和、標題、主題、版本、作者、類別、關(guān)鍵字、備注等文件屬性信息。
第3步如果一致則判定為“粗略一致”,這樣的判斷結(jié)果可以直接作為“數(shù)據(jù)或數(shù)據(jù)庫內(nèi)容判決器”的輸出。
第4步如需進一步的比對,在獲得“粗略一致”的輸入文件中,進行第5步。
第5步精細比較文件屬性信息和文件中每一個字節(jié)的逐一比對。全部特征均吻合的文件可以判定為“完全一致”,作為“數(shù)據(jù)或數(shù)據(jù)庫內(nèi)容判決器”的輸出。
對于數(shù)據(jù)庫文件可采用如下實現(xiàn)步驟第1步對輸入的數(shù)據(jù)庫文件根據(jù)文件名后綴和文件屬性判斷是否符合同種數(shù)據(jù)庫格式。
第2步對于同種數(shù)據(jù)庫格式進行第3步,對于不同種數(shù)據(jù)庫格式直接第4步第3步同種格式數(shù)據(jù)庫粗略比較文件長度、文件校驗和、標題、主題、版本、作者、類別、關(guān)鍵字、備注等文件屬性信息。上述特征不完全符合作為“不一致”判斷結(jié)果輸出,對于完全符合的數(shù)據(jù)庫文件進行第4步。
第4步數(shù)據(jù)庫精細比較(本步驟適應(yīng)各種不同的數(shù)據(jù)庫文件參與內(nèi)容比對)。按照每種數(shù)據(jù)庫文件的格式逐一提取其“數(shù)據(jù)庫表”,判斷其“數(shù)據(jù)庫表”結(jié)構(gòu)是否一致不一致作為“不一致”輸出,一致的數(shù)據(jù)庫文件進行第5步。
第5步逐一比對參與比對的數(shù)據(jù)庫文件的每條記錄的內(nèi)容遇到記錄內(nèi)容相同的情況為計數(shù)器“SameRecNum字段名稱相同并且數(shù)值相等的記錄數(shù)”加1。
第6步計算“SameDBPower數(shù)據(jù)庫一致程度值”=“SameRecNum字段名稱相同并且數(shù)值相等的記錄數(shù)”/“參與比對的數(shù)據(jù)庫擁有該字段的最少記錄個數(shù)”。(SamneDBPower反映了相同內(nèi)容記錄數(shù)相對擁有最少記錄數(shù)的數(shù)據(jù)庫的比例,SameDBPower取值為0~1)。
第7步判斷“SameDBPower數(shù)據(jù)庫一致程度值”是否超過門限,超過門限則輸出“一致”作為判斷結(jié)果,否則輸出“不一致”作為判斷結(jié)果。
“GIS信息內(nèi)容判決器”“GIS信息內(nèi)容判決器”,可通過軟件實現(xiàn)1輸入可以接收多個來源的數(shù)字地圖,作為“被判斷對象”。
2處理進行數(shù)字地圖的覆蓋范圍的吻合度比對。
3返回“被判斷對象”之間的一致程度值SameMapPower(取值0~1)。
實現(xiàn)方法第1步按照數(shù)字地圖的格式打開參加比對的數(shù)字地圖文件。
第2步找到數(shù)字地圖的西北角和東南角(也可以是其它形式的地圖對角)的經(jīng)緯度。
第3步比對參加比對的數(shù)字地圖的西北角和東南角的經(jīng)度、緯度誤差,計算地圖覆蓋區(qū)域的一致性值SameMapPower假設(shè)“地圖1”和“地圖2”參與比對則SameMapPower=兩副地圖重疊區(qū)域的面積/兩副地圖中最小地圖的面積。
第4步返回SameMapPower值。
第5步判斷SameMapPower是否超過門限(例如門限值=0.8),是則判定為相同的地圖,不是則判定為不相同的地圖。
“網(wǎng)絡(luò)服務(wù)內(nèi)容判決器”“網(wǎng)絡(luò)服務(wù)內(nèi)容判決器”的FTP服務(wù)內(nèi)容判決第1步采用相應(yīng)的FTP協(xié)議登陸參與比對的服務(wù),并獲取其內(nèi)部的文件。
第2步在獲取FTP服務(wù)的文件后,首先根據(jù)文件名后綴判斷文件類型是否一致,若不一致返回“不一致”作為輸出,若文件類型一致,進行第3步。
第3步根據(jù)文件類型采用“多媒體內(nèi)容判決器”、“圖片內(nèi)容判決器”、“文字內(nèi)容判決器”、“軟件內(nèi)容判決器”、“數(shù)據(jù)或數(shù)據(jù)庫內(nèi)容判決器”或“GIS信息內(nèi)容判決器”判決其文件內(nèi)容是否一致,并返回其判斷結(jié)果。
Email網(wǎng)站提供的郵箱服務(wù)內(nèi)容判決Email網(wǎng)站提供的郵箱服務(wù)信息主要是通過軟件搜索各個網(wǎng)站的網(wǎng)頁,并從網(wǎng)頁標簽中解析出郵箱的大小、收費情況、是否支持POP協(xié)議等信息。
第1步將郵箱尺寸劃分成相應(yīng)的等級,(例如10MB~25MB、25MB~100MB、100MB~300MB、300MB~1GB、1GB~100GB等),然后判斷參與比對的郵箱是否在同一個級別里,如果“不是”則返回“不一致”,如果“是”則進行第2步。
第2步比對“收費情況”是否一致,如果“不是”則返回“不一致”,如果“是”則進行第3步。
第3步比對支持POP協(xié)議條件是否一致,如果“不是”則返回“不一致”,如果“是”則返回“一致”。
“商業(yè)信息內(nèi)容判決器”在網(wǎng)頁上發(fā)布的產(chǎn)品或服務(wù)出售信息是否相同,并在相同的自然地理范圍內(nèi)、相同的行政地理范圍、相同的距離范圍內(nèi)。
第1步比對參與比對的商業(yè)信息是否是相同的產(chǎn)品或服務(wù),如果“不是”返回“不一致”,如果“是”進入第2步。
第2步判斷參與比對的商業(yè)信息是否具有地理位置敏感性(例如生活消費類商品、需要到現(xiàn)場服務(wù)的服務(wù)具有地理位置敏感性,例如冰激凌、家教服務(wù)等),如果“不是”返回判斷結(jié)果“一致”,如果“是”則進行第3步。
第3步判斷參與比對的商業(yè)信息的提供者是否處于相同的城市或區(qū)域,如果“不是”返回判斷結(jié)果“不一致”,如果是返回判斷結(jié)果“一致”。
“獲取網(wǎng)頁用戶關(guān)注度子系統(tǒng)”圖12為獲取網(wǎng)頁用戶關(guān)注度子系統(tǒng)結(jié)構(gòu)圖。該搜索引擎能夠和與之配套的網(wǎng)絡(luò)瀏覽器(或兼容該搜索引擎能夠和與之配套的網(wǎng)頁瀏覽器之間通訊協(xié)議的其他第三方瀏覽器)的協(xié)同工作方式,由網(wǎng)絡(luò)瀏覽器采集用戶對每個網(wǎng)頁的關(guān)注程度,并上報給搜索引擎,作為搜索引擎進行搜索結(jié)果排名或選擇“標題搜索結(jié)果”的依據(jù)。本方法和裝置還可以單獨于搜索引擎之外,獨立形成能夠提供“網(wǎng)頁熱門程度排行榜”的Web查詢系統(tǒng),并可以進行收費業(yè)務(wù)或作為交換條件換取其他利益。
本系統(tǒng)主要包含兩大部分“PageFocus網(wǎng)絡(luò)服務(wù)器”和“PageFocus網(wǎng)絡(luò)瀏覽器”。
“PageFocus網(wǎng)絡(luò)服務(wù)器”構(gòu)造“PageFocus網(wǎng)絡(luò)服務(wù)器”通過“PageFocus網(wǎng)絡(luò)瀏覽器”獲取全球用戶對每一個網(wǎng)頁的關(guān)注程度,并形成該網(wǎng)頁的“關(guān)注分值PageFocus”數(shù)據(jù)庫,做為網(wǎng)頁的熱門程度的衡量值。
“PageFocus網(wǎng)絡(luò)服務(wù)器”由下列組成(1)“PageFocus瀏覽器ID注冊服務(wù)器”為正在網(wǎng)絡(luò)上使用的“PageFocus網(wǎng)絡(luò)瀏覽器”分配全球唯一的ID標識號。
(2)“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”接收全球正在運行的“PageFocus網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”內(nèi)包含的對于一個或多個網(wǎng)頁的“關(guān)注分值PageFocus”。ID號用來區(qū)分不同的瀏覽用戶。
(3)“PageFocus瀏覽器在線升級服務(wù)器”用來向全球“PageFocus網(wǎng)絡(luò)瀏覽器”提供在線升級服務(wù)。
(4)“數(shù)據(jù)加解密模塊”用來在“PageFocus網(wǎng)絡(luò)服務(wù)器”和“PageFocus網(wǎng)絡(luò)瀏覽器”之間傳遞加密數(shù)據(jù),放置被攻擊或竊取信息。
“PageFocus網(wǎng)絡(luò)瀏覽器”構(gòu)造“PageFocus網(wǎng)絡(luò)瀏覽器”通過網(wǎng)絡(luò)向“PageFocus網(wǎng)絡(luò)服務(wù)器”匯報當前用戶對于某個網(wǎng)頁的關(guān)注程度。
“PageFocus網(wǎng)絡(luò)瀏覽器”由下列組成(1)“關(guān)注分值PageFocus計算模塊”根據(jù)用戶對“PageFocus網(wǎng)絡(luò)瀏覽器”的操作,計算用戶對某網(wǎng)頁的關(guān)注程度,并形成“PageFocus數(shù)據(jù)包”向“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”匯報。
(2)“PageFocus瀏覽器ID注冊模塊”與“PageFocus瀏覽器ID注冊服務(wù)器”通訊以獲得全球唯一的標識ID,作為區(qū)分不同用戶的依據(jù)。
(3)“PageFocus瀏覽器在線升級模塊”與“PageFocus瀏覽器在線升級服務(wù)器”通訊,以保持當前用戶計算機上的“PageFocus瀏覽器”是最新版本。
本裝置包含本發(fā)明創(chuàng)造的”PageFocus網(wǎng)絡(luò)瀏覽器”、“PageFocus瀏覽器ID注冊服務(wù)器”和“網(wǎng)頁計分服務(wù)器”,具體實現(xiàn)方法如下第1步開發(fā)一個特殊的“PageFocus網(wǎng)絡(luò)瀏覽器”,每個瀏覽器均在安裝時具備全球唯一的ID標識號,或在使用時主動尋找網(wǎng)絡(luò)上的“PageFocus瀏覽器ID注冊服務(wù)器”以獲得全球唯一的ID標識號。
第2步“PageFocus網(wǎng)絡(luò)瀏覽器”具備具有常規(guī)網(wǎng)絡(luò)瀏覽器(例如微軟公司的IE瀏覽器)的全部功能。
第3步“PageFocus網(wǎng)絡(luò)瀏覽器”還具備將用戶對瀏覽器的操作和對網(wǎng)頁的操作按照下表所列權(quán)重轉(zhuǎn)換成網(wǎng)頁的“關(guān)注分值PageFocus”并形成“PageFocus數(shù)據(jù)包”,以加密方式通過網(wǎng)絡(luò)協(xié)議傳遞至本搜索引擎的“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”。
第4步“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”在收到全球的每一個“PageFocus網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”后將其內(nèi)部包含的“關(guān)注分值PageFocus”累加到相應(yīng)的網(wǎng)頁上。
第5步“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”上包含的全球每一個網(wǎng)頁的“關(guān)注分值PageFocus”,這些信息可以通過各種處理方法形成搜索引擎對網(wǎng)頁排行依據(jù)、搜索引擎在具有相同內(nèi)容搜索結(jié)果中選擇可以作為“標題搜索結(jié)果”的依據(jù)、也可以直接公布出來作為“網(wǎng)頁熱門程度排行榜”的服務(wù)。
“PageFocus網(wǎng)絡(luò)瀏覽器”計算“關(guān)注分值PageFocus”的方法由于“PageFocus網(wǎng)絡(luò)瀏覽器”具有普通瀏覽器的全部功能,故此可以在用戶使用瀏覽器的時候,按照下表采集其操作行為,并按照每種行為的“權(quán)重”對該網(wǎng)頁進行“關(guān)注分值PageFocus”計分,并在瀏覽器徹底關(guān)閉該網(wǎng)頁的時候形成一條關(guān)于該網(wǎng)頁“關(guān)注分值PageFocus”的分值記錄,以“PageFocus數(shù)據(jù)包”的形式發(fā)給“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”。
注釋1.用本評分標準雖然可能有誤判,但是通過網(wǎng)絡(luò)上的大量操作可以獲得統(tǒng)計上的準確性。
2.表中所列“權(quán)重”具體數(shù)值,僅為典型值,本發(fā)明在于通過瀏覽器為頁面打分,任何其他“權(quán)重項目”和“權(quán)重”的改變,均屬本發(fā)明范疇。
3.采用用戶對網(wǎng)頁投票的方式是基于對于網(wǎng)民公德的充分信任,故此其“權(quán)重”對整體得分的數(shù)學乘法,而不是數(shù)學加法。
4.由于每個網(wǎng)頁均可能得到大量的PageFocus得分,可能導致軟件變量的溢出,故此在“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”可以采用“數(shù)學對數(shù)”或“科學計數(shù)法”記錄得分。
5.為本方法的其他途徑,除了在瀏覽器徹底關(guān)閉該網(wǎng)頁時可以形成“PageFocus數(shù)據(jù)包”外,還可以用其他任意規(guī)則來確定“PageFocus數(shù)據(jù)包”的時機,例如定時,累計到某個分值等等,這些方法均屬于本發(fā)明范疇。
6.表中“每行文字閱讀速度”的詳細計算方法A.鼠標滾輪滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次滾動的文字行數(shù)/滾動時間間隔。
B.鍵盤翻頁文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次翻頁的文字行數(shù)/翻頁時間間隔。
C.窗體滾動條滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度)*每次滾動的文字行數(shù)/滾動時間間隔。
“PageFocus數(shù)據(jù)包”的形成方法“PageFocus數(shù)據(jù)包”的內(nèi)容
注釋每個“PageFocus數(shù)據(jù)包”可以包含多個網(wǎng)頁的得分記錄。每條網(wǎng)頁得分記錄還可以添加其他的屬性,但是為了提高效率,表中僅僅列出最重要的內(nèi)容,在表中添加其他屬性也屬本發(fā)明范疇?!癙ageFocus數(shù)據(jù)包”發(fā)送時機的選擇了減少發(fā)送“PageFocus數(shù)據(jù)包”占用的帶寬和給服務(wù)器端帶來的壓力,可以采取如下幾個方案之一當某個網(wǎng)頁被徹底從瀏覽器關(guān)閉時發(fā)送“PageFocus數(shù)據(jù)包”。
當瀏覽器被徹底關(guān)閉時發(fā)送“PageFocus數(shù)據(jù)包”。
瀏覽器將“PageFocus數(shù)據(jù)包”以文件形式保留在本地計算機,積累到特定數(shù)量、或特定長度、或特定時間周期時再發(fā)送。
“標題搜索結(jié)果”選擇算法本算法主要用于如何在原始搜索結(jié)果中選擇可以用來作為“標題搜索結(jié)果”的“同源搜索結(jié)果”。本算法需要解決如下問題1.通過網(wǎng)絡(luò)使用者行為和網(wǎng)頁內(nèi)容判斷網(wǎng)頁的內(nèi)容質(zhì)量,質(zhì)量高的優(yōu)先顯示。
2.避免某一搜索結(jié)果因成為“標題搜索結(jié)果”而承受過多的點擊流量,導致網(wǎng)站處理速度變慢甚至崩潰。
3.避免某一搜索結(jié)果因成為“標題搜索結(jié)果”而承受過多的點擊流量導致服務(wù)響應(yīng)速度變慢,而降低訪問者的使用體驗好感。
4.使成為“標題搜索結(jié)果”作為一種權(quán)力,可以提供給需要的網(wǎng)站,這些網(wǎng)站可以購買這種權(quán)力。
5.每個“同源搜索結(jié)果”的原始結(jié)果均有機會按照某種概率成為“標題搜索結(jié)果”。
“標題搜索結(jié)果”選擇方法在于,在“同源搜索結(jié)果”中選擇“標題搜索結(jié)果”時,同時考慮了“搜索結(jié)果內(nèi)容質(zhì)量”、“加權(quán)值”和“服務(wù)響應(yīng)延遲”三個要素,即內(nèi)容質(zhì)量高的優(yōu)先顯示、有加權(quán)的優(yōu)先顯示、網(wǎng)絡(luò)服務(wù)好的優(yōu)先顯示;而在排列全部“同源搜索結(jié)果”時則仍然按照這種原則,而“加權(quán)值”可以向本發(fā)明的系統(tǒng)運營者購買。“標題搜索結(jié)果”選擇的具體實現(xiàn)方法如下第1步計算每個“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率權(quán)值PWn(該搜索結(jié)果為第n條)PWn=TP*PageFocus/(RespDelay-K)注釋1當(RespDelay-K)小于等于零時,(RespDelay-K)應(yīng)取值為1。
注釋2公式中變量含義如下A.PageFocus網(wǎng)頁關(guān)注度值是該搜索結(jié)果根據(jù)本發(fā)明中“獲取網(wǎng)頁用戶關(guān)注度的方法與裝置”所獲得的“PageFocus值”。
B.RespDelay網(wǎng)頁服務(wù)響應(yīng)延遲是該搜索結(jié)果在向搜索者提供服務(wù)訪問時的響應(yīng)延遲。(由于訪問體驗取決于網(wǎng)站的響應(yīng)延遲,反應(yīng)越慢,體驗越差)。
C.K服務(wù)響應(yīng)常數(shù)是可以定義的常數(shù),建議使用50毫秒(ms),低于K值的服務(wù)響應(yīng)延遲將不被察覺,不影響使用體驗,從而可以忽略。
D.TP標題搜索結(jié)果權(quán)力作為一種加權(quán),任何人都可以和本發(fā)明系統(tǒng)的運營者通過各種交換條件而獲取“TP標題搜索結(jié)果權(quán)力”。
E.作為本公式的其它實現(xiàn)算法,還可以有如下其它形式a.PWn=(TP+PageFocus)/(RespDelay-K)b.PWn=(TP+PageFocus)/RespDelay/Kc.PWn=TP*PageFocus/RespDelay/K第2步統(tǒng)計求和全部原始“同源搜索結(jié)果”的概率權(quán)值PWn的總和PWall全部概率權(quán)值。
第3步計算每條“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率Pn=PWn/PWall。
第4步按照Pn值的概率,隨著搜索者的訪問動作,動態(tài)地隨機選擇“標題搜索結(jié)果”,呈現(xiàn)給搜索者。
網(wǎng)站內(nèi)容風格自適應(yīng)的裝置與方法本發(fā)明的內(nèi)容在于利用各種可能獲得的、有助于判斷用戶所處環(huán)境和狀態(tài)的信息,使處于不同工作或生活休閑狀態(tài)的用戶在無需任何操作、注冊、設(shè)定或Cookie設(shè)定的前提下,訪問相同頁面URL地址時看到不同的風格,其中包括1.利用用戶的IP地址判斷其所處的國家或區(qū)域,再結(jié)合通過本網(wǎng)站時間便可以計算出訪問者的當?shù)匦姓^(qū)域時間,通過他的時間可以判斷他處于工作狀態(tài)還是休閑狀態(tài)。
2.通過用戶的IP地址,可以查詢到該IP地址的屬性家庭、工作場所。根據(jù)其所處場所提供適合其所處環(huán)境的風格和內(nèi)容。
3.通過用戶的IP地址可以獲知其所處的地理位置,在查詢商業(yè)信息時,可以自動將距離他最近的供應(yīng)商排列在最前面。
舉例如下同一時刻,不同的用戶訪問本網(wǎng)站內(nèi)相同URL的一個網(wǎng)頁時看到的內(nèi)容是不同的A.工作狀態(tài)和環(huán)境中的用戶看到的是莊重、簡介、不含休閑消遣娛樂信息的頁面。
B.休閑狀態(tài)和環(huán)境中的用戶看到的是熱鬧、可含有休閑消遣娛樂信息、可含有個人消費廣告信息的頁面。
本發(fā)明可以部分或全部地被應(yīng)用到搜索引擎以外的網(wǎng)站系統(tǒng),均屬本發(fā)明范疇。
目前各個大型網(wǎng)站,為了滿足大流量的訪問,均采用了服務(wù)器集群,甚至在區(qū)域建立本地服務(wù)分系統(tǒng),來分流用戶訪問。但是目前的服務(wù)器集群的重要特征就是每個集群成員均提供完全相同的內(nèi)容。如圖13前來訪問的用戶被“網(wǎng)站服務(wù)器集群入口”設(shè)備,部分任何特征地,直接分配到某個具有相同內(nèi)容的服務(wù)器集群成員服務(wù)器上。
如圖14,而本發(fā)明的裝置對上述結(jié)構(gòu)做了部分改動,在“網(wǎng)站服務(wù)器集群入口”收到訪問用戶后,根據(jù)其訪問網(wǎng)站時發(fā)過來的IP地址等各種用戶屬性信息判斷其是否處于工作狀態(tài),并根據(jù)其是否處于工作狀態(tài)向其提供不同風格和內(nèi)容的信息服務(wù)。
自動判斷用戶狀態(tài)并提供恰當?shù)木W(wǎng)頁風格與內(nèi)容的方法第1步首先將服務(wù)器集群劃分成“工作風格”和“個人和休閑風格”兩大類,無論是靜態(tài)頁面還是動態(tài)頁面,在向這兩類服務(wù)器更新相同的內(nèi)容的時候,自動產(chǎn)生兩類風格,以便不同工作或生活休閑狀態(tài)的用戶在訪問相同頁面URL地址時看到不同的風格。
第2步在“網(wǎng)站服務(wù)器集群入口”收到用戶首次訪問本網(wǎng)站網(wǎng)頁的請求后,首先在訪問協(xié)議里(或IP層協(xié)議里)獲取其IP地址。
第3步根據(jù)IP地址在“IP地址屬性數(shù)據(jù)庫”中查詢其IP地址是“工作場合IP地址”還是“私人或休閑場合的IP地址”,若是“工作場合IP地址”則進行第4步,若是“私人或休閑場合的IP地址”則進行第5步。
第4步獲取“工作場合IP地址”所處的地理位置,并得到該地理區(qū)域的行政時間,若是該IP地址所屬區(qū)域正處于工作時間(周1~5的8:00~20:00)則將其訪問分配到服務(wù)器集群中的“工作風格服務(wù)器”上向其提供適合工作場合使用的頁面服務(wù),否則進行第5步。
第5步則將其訪問分配到服務(wù)器集群中的“個人和休閑風格服務(wù)器”上向其提供適合個人和休閑狀態(tài)使用的頁面服務(wù)。
權(quán)利要求
1.一種同源信息站點搜索引擎聚合顯示方法,其包括下列步驟(1)查詢者通過Web瀏覽器或應(yīng)用軟件訪問搜索引擎,并輸入需要查詢的關(guān)鍵詞;(2)由搜索引擎找到全部符合條件的目標站點作為原始搜索結(jié)果;(3)由“同源信息處理模塊”查詢標題搜索結(jié)果權(quán)力采購者的賬戶信息,并結(jié)合其它判斷規(guī)則在原始搜索結(jié)果中選取用來作為標題搜索結(jié)果的對象;(4)由搜索引擎Web服務(wù)器或應(yīng)用服務(wù)器只將選中的標題搜索結(jié)果作為搜索結(jié)果展示給查詢者,并為其提供一個帶有展開查看細節(jié)或其它信息含義的按鈕;(5)查詢者還可按動與之對應(yīng)的按鈕,搜索引擎再向其展示在(2)中找到的原始搜索結(jié)果。
2.根據(jù)權(quán)利要求1所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述“同源信息處理模塊”包括如下步驟(1)由信息種類判斷模塊對網(wǎng)絡(luò)搜索器收到的信息進行種類判斷;(2)將相同種類的信息集中發(fā)送到相應(yīng)的“同源信息處理模塊”;(3)將由信息處理模塊處理后的搜索信息返回Web服務(wù)器。
3.根據(jù)權(quán)利要求2所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述由“同源信息處理模塊”處理網(wǎng)頁信息的步驟如下所示(1)在搜索引擎搜索部分接收需要查詢的關(guān)鍵詞的時候,首先由搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器判斷該關(guān)鍵詞是否近期已經(jīng)被其它人查詢過,如果被查詢過,并且結(jié)果已經(jīng)在搜索引擎搜索結(jié)果Web服務(wù)器上發(fā)布,則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將具有相同來源的網(wǎng)頁聚合成一條搜索結(jié)果,點擊“同源網(wǎng)頁”按鈕后,可以在搜索引擎搜索結(jié)果Web服務(wù)器上看到另一個包括全部搜索結(jié)果的搜索結(jié)果網(wǎng)頁,完成整個查詢過程;(2)如果在搜索引擎搜索部分接收需要查詢的關(guān)鍵詞的時候,由搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器判斷該關(guān)鍵詞近期沒有被其它人查詢過,并且也沒有相應(yīng)的查詢結(jié)果在搜索引擎搜索結(jié)果Web服務(wù)器上發(fā)布則A.啟動“網(wǎng)頁搜索器”搜索“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,并獲取這些網(wǎng)頁的內(nèi)容;B.如果“網(wǎng)頁搜索器”在“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”中沒有找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,則返回查詢者“沒有符合條件網(wǎng)頁”的結(jié)果,并且將該搜索關(guān)鍵詞加入到下一輪更新“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的任務(wù)中,如果在更新過程中找到了符合條件的網(wǎng)頁地址則根據(jù)其是否具有同源網(wǎng)頁而選擇入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”或“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”,這樣如果再有人搜索同樣的關(guān)鍵詞是就可以找到結(jié)果;(3)由“網(wǎng)頁內(nèi)容分離器”將找到的網(wǎng)頁內(nèi)容及超級鏈接目標分解成多媒體、圖片、文字、超級鏈接等種類;(4)分別由各種內(nèi)容判決器產(chǎn)生判決結(jié)果A.由“多媒體內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同多媒體文件程度SMS(Same Media Score)”;B.由“圖片內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同圖片的程度SPS(Same Photo Score)”;C.由“文字內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同文字的程度STS(Same Text Score)”;D.由“鏈接內(nèi)容判決器”產(chǎn)生目標網(wǎng)頁所含“相同超級連接的程度SHS(Same Hyperlinks Score)”;(5)從“同源網(wǎng)頁判決規(guī)則庫”分別獲取“多媒體判決權(quán)重SMP”、“圖片判決權(quán)重SPP”、“文字判決權(quán)重STP”、“鏈接判決權(quán)重SHP”并分別與第(4)步生成的“相同多媒體文件程度SMS”、“相同圖片的程度SPS”、“相同文字的程度STS”、“相同超級連接的程度SHS”做數(shù)學乘法;(6)將第(5)步獲得的數(shù)學乘法結(jié)果做加法,獲得網(wǎng)頁的“同源程度SSS(Same Sourc Score)”,同源程度SSS=(SMS*SMP)+(SPS*SPP)+(STS*STP)+(SHS*SHP);(7)判斷該網(wǎng)頁的“同源程度SSS”是否超出門限,如果超出門限則判定為與其它網(wǎng)頁的“同源網(wǎng)頁”,如果沒有超出門限則判定為“非同源網(wǎng)頁”;(8)將第(7)步產(chǎn)生的“非同源網(wǎng)頁”由“非同源網(wǎng)頁處理模塊”入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;將第(7)步產(chǎn)生的“同源網(wǎng)頁”由“同源網(wǎng)頁處理模塊”入“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;(9)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給查詢用戶;(10)作為第(9)步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。
4.根據(jù)權(quán)利要求2所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述“同源信息處理模塊”包括如下步驟(1)在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要找的文件或服務(wù);(2)判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎?”,如果搜索的目標已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將符合搜索條件具有相同來源的多媒體的獲取接口聚合成一條“標題搜索結(jié)果”,點擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程;如果搜索的目標沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第(3)步開始;(3)返回查詢者沒有符合條件的結(jié)果;(4)將該搜索關(guān)鍵詞加入到下一輪更新“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個數(shù)據(jù)庫的更新過程;(5)“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程A.由搜索器搜索網(wǎng)頁新出現(xiàn)的目標文件或服務(wù)入口,通過軟件進入該入口獲取該文件或服務(wù);B.由“內(nèi)容判決器”判斷新找到的信息“與當前“同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源信息索引數(shù)據(jù)庫”的該類別;如果“否”則由“內(nèi)容判決器”判斷它“與當前非同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”;C.如果“是”則“為當前的信息和與之同源的并已經(jīng)存貯在‘非同源信息索引數(shù)據(jù)庫’中的信息,新建一個類別并全部轉(zhuǎn)移到‘同源信息索引數(shù)據(jù)庫’”;如果“否”則“為當前的信息新建一個類別,并存入‘非同源信息索引數(shù)據(jù)庫’”;(6)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者;(7)作為第(6)步的另一種實現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。
5.根據(jù)權(quán)利要求4所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述由“同源信息處理模塊”處理文檔時,“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程為(1)由“文檔搜索器”搜索網(wǎng)頁新出現(xiàn)的文檔文件或鏈接入口,通過軟件進入該入口獲取該文件或服務(wù);(2)由“文字內(nèi)容判決器”和“圖片內(nèi)容判決器”判斷新找到的文檔內(nèi)容“與當前‘同源文檔索引數(shù)據(jù)庫’的內(nèi)容屬于同一內(nèi)容嗎?”如果“是”則將它作為一個新的元素歸入“同源文檔索引數(shù)據(jù)庫”的該類別;如果“否”則由“文檔內(nèi)容判決器”判斷它“與當前非同源文檔索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎?”;(3)如果“是”則“為當前的文檔和與之同源的并已經(jīng)存貯在‘非同源文檔索引數(shù)據(jù)庫’中的文檔,新建一個類別并全部轉(zhuǎn)移到‘同源文檔索引數(shù)據(jù)庫’”;如果“否”則“為當前的文檔新建一個類別,并存入‘非同源文檔索引數(shù)據(jù)庫’”。
6.根據(jù)權(quán)利要求3、4或5任一項權(quán)利要求所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述相關(guān)內(nèi)容判決器模塊包括如下步驟(1)接收“被判斷對象”可以接收多個來源的多媒體,并記錄被判斷對象的數(shù)量InputQuantity;(2)查找“被判斷對象”既定的可參與比對的屬性,記錄當前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity;(3)輸入當前屬性在判斷過程中的“權(quán)重”值Power;(4)計算被全部“被判斷對象”在當前屬性上的吻合度PSame=SameQuantity*Power;(5)返回(1)對下一個“屬性”執(zhí)行(1)~(4),得到該屬性的PSame,直至獲得部屬性的PSame值;(6)計算并返回“被判斷對象”的相同內(nèi)容程度值SameMediaPower=(全部Psame值的數(shù)學累加值)/InputQuantity。
7.根據(jù)權(quán)利要求3、4或5任一項權(quán)利要求所述的一項權(quán)利要求所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,內(nèi)容判決器模塊為文字內(nèi)容判決器時,其包括如下步驟(1)找出文字內(nèi)容中具有相同的單詞或句子的部分的總計長度值SameLenth;(2)找出輸入的多個文字內(nèi)容中,長度最短的輸入文字的長度值MinLenth;(3)返回文字相似程度值SameTextPower=SameLenth/MinLenth。
8.根據(jù)權(quán)利要求3、4任一項權(quán)利要求所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,內(nèi)容判決器模塊為鏈接內(nèi)容判決器時,其包括如下步驟(1)接收“被判斷對象”多組超級鏈接的URL地址;(2)統(tǒng)計“被判斷對象”相似程度SameURLPower=在每組超級鏈接均出現(xiàn)過的URL地址數(shù)量;(3)返回SameURLPower。
9.根據(jù)權(quán)利要求4所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,內(nèi)容判決器模塊為商業(yè)信息內(nèi)容判決器時,其包括如下步驟(1)比對參與比對的商業(yè)信息是否是相同的產(chǎn)品或服務(wù),如果“不是”返回“不一致”,如果“是”進入第(2)步;(2)判斷參與比對的商業(yè)信息是否具有地理位置敏感性,如果“不是”返回判斷結(jié)果“一致”,如果“是”則進行第(3)步;(3)判斷參與比對的商業(yè)信息的提供者是否處于相同的城市或區(qū)域,如果“不是”返回判斷結(jié)果“不一致”,如果是返回判斷結(jié)果“一致”。
10.根據(jù)權(quán)利要求1所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,“標題搜索結(jié)果”選擇的具體實現(xiàn)方法如下(1)計算每個“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率權(quán)值PWnPWn=TP*PageFocus/(RespDelay-K)n該搜索結(jié)果為第n條當(RespDelay-K)小于等于零時,(RespDelay-K)應(yīng)取值為1PageFocus網(wǎng)頁關(guān)注度值RespDelay網(wǎng)頁服務(wù)響應(yīng)延遲K服務(wù)響應(yīng)常數(shù)小于本值的服務(wù)延誤將不被察覺,例如K設(shè)置為50毫秒TP標題搜索結(jié)果權(quán)力(2)統(tǒng)計求和全部原始“同源搜索結(jié)果”的概率權(quán)值PWn的總和PWall全部概率權(quán)值;(3)計算每條“同源搜索結(jié)果”成為“標題搜索結(jié)果”的概率Pn=PWn/Pwall;(4)按照Pn值的概率,隨著搜索者的訪問動作,動態(tài)地隨機選擇“標題搜索結(jié)果”,呈現(xiàn)給搜索者。
11.根據(jù)權(quán)利要求10所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述“標題搜索結(jié)果”的概率權(quán)值PWn的計算方法還可以是a.PWn=(TP+PageFocus)/(RespDelay-K)或,b.PWn=(TP+PageFocus)/RespDelay/K或,c.PWn=TP*PageFocus/RespDelay/K。
12.根據(jù)權(quán)利要求1所述的同源信息站點搜索引擎聚合顯示方法,其特征在于,所述“同源信息處理模塊”(1)可以內(nèi)嵌在搜索引擎中;(2)可以放置在“搜索引擎”和“搜索引擎搜索結(jié)果Web服務(wù)器”之間;(3)也可以作為預(yù)處理模塊放置在“搜索引擎”和被搜索站點之間。
13.根據(jù)權(quán)利要求1所述的同源信息站點搜索引擎聚合顯示方法,所述展開查看細節(jié)或其它信息含義的按鈕可為超級連接或各種軟件界面控件。
14.一種獲取權(quán)利要求1所述搜索方法生成結(jié)果而必須具備的網(wǎng)頁用戶關(guān)注度PageFocus的系統(tǒng),包括PageFocus網(wǎng)絡(luò)服務(wù)器、PageFocus網(wǎng)絡(luò)瀏覽器,其特征在于(1)PageFocus網(wǎng)絡(luò)服務(wù)器包括PageFocus瀏覽器ID注冊服務(wù)器、PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器、PageFocus瀏覽器在線升級服務(wù)器及數(shù)據(jù)加解密模塊;(2)PageFocus網(wǎng)絡(luò)瀏覽器包括PageFocus瀏覽器ID注冊模塊、關(guān)注分值PageFocus計算模塊。
15.根據(jù)權(quán)利要求14所述的獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng),其工作步驟如下(1)“PageFocus網(wǎng)絡(luò)瀏覽器”,每個瀏覽器均在安裝時具備全球唯一的ID標識號,或在使用時主動尋找網(wǎng)絡(luò)上的“PageFocus瀏覽器ID注冊服務(wù)器”以獲得全球唯一的ID標識號;(2)“PageFocus網(wǎng)絡(luò)瀏覽器”具備具有常規(guī)網(wǎng)絡(luò)瀏覽器,并將用戶對瀏覽器的操作和對網(wǎng)頁的操作,以及網(wǎng)頁內(nèi)容特征按照權(quán)重轉(zhuǎn)換成網(wǎng)頁的“關(guān)注分值PageFocus”并形成“PageFocus數(shù)據(jù)包”,以加密方式通過網(wǎng)絡(luò)協(xié)議傳遞至本搜索引擎的“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”;(3)“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”在收到全球的每一個“PageFocus網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”后將其內(nèi)部包含的“關(guān)注分值PageFocus”累加到相應(yīng)的網(wǎng)頁上;(4)“PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器”上包含的全球每一個網(wǎng)頁的“關(guān)注分值PageFocus”,這些信息可以通過各種處理方法形成搜索引擎對網(wǎng)頁排行依據(jù)、搜索引擎在具有相同內(nèi)容搜索結(jié)果中選擇可以作為“標題搜索結(jié)果”的依據(jù)、也可以直接公布出來作為“網(wǎng)頁熱門程度排行榜”的服務(wù)。
16.根據(jù)權(quán)利要求15所述的獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng),其特征在于,PageFocus數(shù)據(jù)包可以在瀏覽器徹底關(guān)閉該網(wǎng)頁時形成,也可以定時形成,也可以累計到某個分值時再形成,以減少PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計服務(wù)器的計算壓力。
17.根據(jù)權(quán)利要求15所述的獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng),其特征在于,所述關(guān)注分值PageFocus按照下表所列權(quán)重形成
18.根據(jù)權(quán)利要求15所述的獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng),其特征在于,所述PageFocus數(shù)據(jù)包包含PageFocus瀏覽器ID、網(wǎng)頁URL及網(wǎng)頁PageFocus得分值字段。
19.根據(jù)權(quán)利要求15或17所述的獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng),其特征在于,具備“同源網(wǎng)頁”的每一個網(wǎng)頁在參與搜索引擎提供的網(wǎng)頁排名過程中,可以使用每一個“同源網(wǎng)頁”獲得的用戶關(guān)注度PageFocus分值的總和作為排名的依據(jù),即A在“同源網(wǎng)頁”的“標題搜索結(jié)果”在參與搜索引擎結(jié)果排名時可以采用每一個“同源網(wǎng)頁”獲得的用戶關(guān)注度PageFocus的總和作為排名依據(jù);B“同源網(wǎng)頁”內(nèi)的每一個網(wǎng)頁在參與搜索引擎結(jié)果排名時也可以采用其從屬的“同源網(wǎng)頁”的每一個網(wǎng)頁獲得的用戶關(guān)注度PageFocus的總和作為排名依據(jù)。
20.一種自動判斷用戶狀態(tài)并提供恰當?shù)木W(wǎng)頁風格與內(nèi)容的方法,其包括如下步驟(1)首先將服務(wù)器集群劃分成“工作風格”和“個人和休閑風格”兩大類,無論是靜態(tài)頁面還是動態(tài)頁面,在向這兩類服務(wù)器更新相同的內(nèi)容的時候,自動產(chǎn)生兩類風格,以便不同場合的用戶在訪問相同頁面URL地址時看到不同的風格;(2)在“網(wǎng)站服務(wù)器集群入口”收到用戶首次訪問本網(wǎng)站網(wǎng)頁的請求后,首先在訪問協(xié)議里(或IP層協(xié)議里)獲取其IP地址;(3)根據(jù)IP地址在“IP地址屬性數(shù)據(jù)庫”中查詢其IP地址是“工作場合IP地址”還是“私人或休閑場合的IP地址”,若是“工作場合IP地址”則進行第(4)步,若是“私人或休閑場合的IP地址”則進行第(5)步;(4)獲取“工作場合IP地址”所處的地理位置,并得到該地理區(qū)域的行政時間,若是該IP地址所屬區(qū)域正處于工作時間(周1~5的8:00~20:00)則將其訪問分配到服務(wù)器集群中的“工作風格服務(wù)器”上向其提供適合工作場合使用的頁面服務(wù),否則進行第(5)步;(5)則將其訪問分配到服務(wù)器集群中的“個人和休閑風格服務(wù)器”上向其提供適合個人和休閑狀態(tài)使用的頁面服務(wù)。
全文摘要
本發(fā)明涉及一種基于關(guān)注度的同源信息搜索引擎聚合顯示方法及系統(tǒng)。搜索引擎找到全部符合條件的目標站點作為原始搜索結(jié)果;依據(jù)內(nèi)容質(zhì)量、顯示加權(quán)權(quán)力采購者的賬戶信息和服務(wù)質(zhì)量等要素,將原始搜索結(jié)果聚合成一條標題搜索結(jié)果;只將標題搜索結(jié)果作為搜索結(jié)果展示給查詢者,當其需要時才為其展開查看全部搜索結(jié)果。本系統(tǒng)采用統(tǒng)計服務(wù)器配合網(wǎng)絡(luò)瀏覽器,將用戶的全部操作行為換算成對該網(wǎng)頁的關(guān)注程度評分值PageFocus,并發(fā)送回統(tǒng)計服務(wù)器來代表其內(nèi)容質(zhì)量,從而可以作為搜索引擎的選擇“標題搜索結(jié)果”和進行結(jié)果顯示排名的方法。本發(fā)明還涉及一種能夠自動判斷用戶狀態(tài)并提供恰當?shù)木W(wǎng)頁風格與內(nèi)容的方法。
文檔編號G06F17/30GK101025737SQ20061000790
公開日2007年8月29日 申請日期2006年2月22日 優(yōu)先權(quán)日2006年2月22日
發(fā)明者王東 申請人:王東