亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)頁(yè)信息分類方法、系統(tǒng)及應(yīng)用該分類的服務(wù)系統(tǒng)的制作方法

文檔序號(hào):6574192閱讀:151來(lái)源:國(guó)知局
專利名稱:一種網(wǎng)頁(yè)信息分類方法、系統(tǒng)及應(yīng)用該分類的服務(wù)系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息索引的存儲(chǔ)方式,特別是涉及一種網(wǎng)頁(yè)信息分類方法、系 統(tǒng)及應(yīng)用該分類的服務(wù)系統(tǒng)。
技術(shù)背景信息索引的存儲(chǔ)方式是指對(duì)信息建立索引的方式,如目錄索引、關(guān)鍵詞索 引、分類索引、標(biāo)簽索引等,不同于信息的存儲(chǔ)方式,信息的存儲(chǔ)方式是指信 息以文本、數(shù)據(jù)表等方式存儲(chǔ)。目前對(duì)網(wǎng)頁(yè)信息的搜索,都是建立在網(wǎng)頁(yè)信息的有效歸類基礎(chǔ)上,即對(duì)網(wǎng) 頁(yè)信息建立的索引方式不同,所提供的搜索服務(wù)和搜索質(zhì)量也不同。例如,常 用的兩種搜索方式一一基于關(guān)鍵詞的搜索與基于分類的搜索,在信息到達(dá)用戶 的距離、對(duì)用戶的要求、查詢效果等方面存在著差異。其中,所述信息到達(dá)用 戶的距離是指有效的、可靠的信息到達(dá)最終用戶的距離,所述距離表達(dá)了用戶 獲取信息的難易程度和需要的步驟多少?;陉P(guān)鍵詞的搜索,即基于關(guān)鍵詞的信息索引方式,是對(duì)網(wǎng)頁(yè)的關(guān)鍵詞設(shè) 置了關(guān)鍵詞索引,并根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行信息檢索,然后將檢索結(jié)果按照各種排序規(guī)則,如時(shí)間、網(wǎng)頁(yè)級(jí)別(pagerank)等排序輸出供用戶參考,例 如google等搜索引擎。使用關(guān)鍵詞搜索的方法,首先,信息到達(dá)用戶的距離比較近,用戶輸入關(guān) 鍵詞,在查詢結(jié)果中選擇自己滿意的信息,由于按照各種排序規(guī)則輸出查詢結(jié) 果,所以用戶需要的頁(yè)面通常在前10條信息中出現(xiàn)。其次,對(duì)用戶的要求較 高,用戶檢索帶有很強(qiáng)的目的性,需要預(yù)先選擇關(guān)鍵詞,而關(guān)鍵詞的選取至關(guān) 重要,因?yàn)椴樵冑|(zhì)量在很大程度上依賴于關(guān)鍵詞選取的好壞。再次,從查詢效 果來(lái)看,關(guān)鍵詞搜索為用戶提供了方便、快捷的信息檢索,已經(jīng)成為一種普及 使用的信息檢索方法。但是,關(guān)鍵詞受上下文影響存在多義性,會(huì)影響對(duì)用戶 查詢目的的估計(jì)。而且,隨著信息的不斷增加,查詢的準(zhǔn)確性以及對(duì)用戶查詢 目的的推測(cè)都會(huì)受到很大影響?;诜诸惖乃阉?,即基于分類的信息索引方式,是按照人工預(yù)定的分類體 系對(duì)網(wǎng)頁(yè)信息進(jìn)行一次性的分類,每一個(gè)網(wǎng)頁(yè)信息都會(huì)判別且僅判別一次確定其分類,終身不變。用戶可以在確定的分類下輸入關(guān)鍵詞檢索,排除其他無(wú)關(guān) 類別,從而獲得更加準(zhǔn)確、滿意的搜索結(jié)果。與關(guān)鍵詞搜索相比較,首先,信息到達(dá)用戶的距離更近,因?yàn)檫x擇類別后 再進(jìn)行檢索去掉了無(wú)關(guān)頁(yè)面信息,所以在搜索結(jié)果頁(yè)面的前io條信息中出現(xiàn) 用戶所需信息的概率大大提高。其次,對(duì)用戶的要求更高,用戶不僅要選擇關(guān) 鍵詞,還需要明確搜索的領(lǐng)域,進(jìn)一步增加了用戶操作的難度。再次,查詢的 準(zhǔn)確性大大提高,因?yàn)樵谛畔㈩悇e上進(jìn)行了細(xì)分,對(duì)于某種檢索,只需在用戶 確定的類別下進(jìn)行檢索即可,極大減少了無(wú)關(guān)的搜索結(jié)果。但是,由于所述分 類是一種靜態(tài)分類,分類的數(shù)目有限,分類不夠細(xì)致,所以在信息量大量增加 的情況下,搜索的質(zhì)量還是不夠理想,不能快速、準(zhǔn)確地為用戶提供所需信息。 發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種網(wǎng)頁(yè)信息分類方法、系統(tǒng)及應(yīng)用該 分類的服務(wù)系統(tǒng),以解決現(xiàn)有信息索引方式提供的搜索服務(wù),對(duì)用戶要求高、 搜索結(jié)果不準(zhǔn)確、搜索質(zhì)量有待提高的問(wèn)題。為解決上述技術(shù)問(wèn)題,根據(jù)本發(fā)明提供的具體實(shí)施例,公開(kāi)了以下技術(shù)方案一種網(wǎng)頁(yè)信息分類方法,包括 以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始分類;如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值,則對(duì)該類別進(jìn)行分裂,所述分裂 包括按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚 為一個(gè)類別;剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類;所述方法還包括標(biāo)注所述聚類后的類別名稱。其中,所述分裂過(guò)程中,標(biāo)注名稱的類別縱向分裂為各個(gè)子類;孤立網(wǎng)頁(yè) 類橫向分裂。優(yōu)選的,所述方法還包括確認(rèn)所述分裂結(jié)果的有效性。 所述方法還包括每個(gè)分類稱為一個(gè)結(jié)點(diǎn),跟蹤記錄所述樹(shù)型結(jié)構(gòu)中所有 結(jié)點(diǎn)的分裂頻度。所述方法還包括新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息進(jìn)行遂層匹配,歸 到最底層的子類或孤立網(wǎng)頁(yè)類中。所迷方法還包括根據(jù)用戶提交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān)鍵詞集合, 比較所述關(guān)鍵詞集合與對(duì)應(yīng)每個(gè)類別的特征集合的相似度,將相似度最大的分 類對(duì)應(yīng)用戶的興趣點(diǎn)。所述方法還包括將對(duì)應(yīng)用戶興趣點(diǎn)分類下的新添加信息,異步推送給用 戶。其中,通過(guò)電子郵件、短信、信件、報(bào)表方式將網(wǎng)頁(yè)信息異步推送給用戶。 優(yōu)選的,用戶 一次性提交對(duì)應(yīng)多個(gè)興趣點(diǎn)的關(guān)鍵詞或關(guān)鍵詞組合。所述方法還包括判斷熱點(diǎn)分類,對(duì)用戶提交的搜索關(guān)鍵詞,或者新添加 到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息,優(yōu)先匹配所述熱點(diǎn)分類。其中,執(zhí)行以下判斷 步驟將預(yù)定時(shí)間段內(nèi)進(jìn)行多次分裂的類別判定為熱點(diǎn)分類,或者,將預(yù)定時(shí) 間段內(nèi)新標(biāo)注的類別判定為熱點(diǎn)分類。所述方法還包括根據(jù)所述分類結(jié)果和用戶提交的搜索關(guān)鍵詞,逐層給出 分類提示;或者,根據(jù)所述分類結(jié)果,以及用戶提交的關(guān)鍵詞與分類的組合信 息,直接顯示對(duì)應(yīng)類別下的網(wǎng)頁(yè)集合。所述方法還包括將同一分類或近似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),并互相 推薦各自的網(wǎng)頁(yè)內(nèi)容。所述方法還包括建立關(guān)鍵詞-分類-廣告或信息排名三者之間的對(duì)應(yīng)關(guān) 系,并根據(jù)用戶輸入的關(guān)鍵詞和選定的分類,展示相應(yīng)的廣告或信息排名。一種網(wǎng)頁(yè)信息分類系統(tǒng),包括動(dòng)態(tài)分類樹(shù),用于以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始分類; 聚類單元,用于執(zhí)行聚類操作,如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值, 則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度,將相似度達(dá)到預(yù) 設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類; 控制單元,用于根據(jù)聚類單元的執(zhí)行結(jié)果改變動(dòng)態(tài)分類樹(shù)的形態(tài)。 所述分類系統(tǒng)還包括人工判別單元,用于標(biāo)注所述聚類后的類別名稱; 其中,所述聚類單元在執(zhí)行聚類時(shí),標(biāo)注名稱的類別縱向分裂為各個(gè)子類; 孤立網(wǎng)頁(yè)類橫向分裂。所述分類系統(tǒng)還包括網(wǎng)頁(yè)歸類單元,用于將新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息進(jìn)行逐層匹配,歸到最底層的子類或孤立網(wǎng)頁(yè)類中。所述分類系統(tǒng)還包括日志單元,用于跟蹤記錄動(dòng)態(tài)分類樹(shù)中所有結(jié)點(diǎn)的分裂頻度,其中每個(gè)分類稱為一個(gè)結(jié)點(diǎn)。一種應(yīng)用月l務(wù)系統(tǒng),包括信息分類子系統(tǒng),包括動(dòng)態(tài)分類樹(shù),用于以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始 分類;聚類單元,用于執(zhí)行聚類操作,如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值, 則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度,將相似度達(dá)到預(yù) 設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類;控制單元, 用于根據(jù)聚類單元的執(zhí)行結(jié)果改變動(dòng)態(tài)分類樹(shù)的形態(tài);查詢單元,用于查詢所述動(dòng)態(tài)分類樹(shù),并根據(jù)查詢結(jié)果提供相應(yīng)的應(yīng)用服務(wù);應(yīng)用層單元,用于響應(yīng)各種服務(wù)命令,調(diào)用所述查詢單元。 所述應(yīng)用服務(wù)系統(tǒng)還包括興趣點(diǎn)推測(cè)單元,用于響應(yīng)應(yīng)用層單元的調(diào)用, 根據(jù)用戶提交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān)鍵詞集合,比較所述關(guān)鍵詞集合與 對(duì)應(yīng)每個(gè)類別的特征集合的相似度,將相似度最大的分類對(duì)應(yīng)用戶的興趣點(diǎn)。 所述應(yīng)用服務(wù)系統(tǒng)還包括異步推送單元,用于根據(jù)興趣點(diǎn)推測(cè)單元的推 測(cè)結(jié)果,將對(duì)應(yīng)用戶興趣點(diǎn)分類下的新添加信息,異步推送給用戶。其中,所 述異步推送單元通過(guò)電子郵件、短信、信件、報(bào)表方式將網(wǎng)頁(yè)信息異步推送給 用戶。所述應(yīng)用服務(wù)系統(tǒng)還包括熱點(diǎn)推測(cè)單元,用于響應(yīng)應(yīng)用層單元的調(diào)用, 判斷熱點(diǎn)分類,對(duì)用戶提交的搜索關(guān)鍵詞,或者新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng) 頁(yè)信息,優(yōu)先匹配所述熱點(diǎn)分類。其中,所述熱點(diǎn)推測(cè)單元將預(yù)定時(shí)間段內(nèi)進(jìn) 行多次分裂的類別判定為熱點(diǎn)分類;或者,將預(yù)定時(shí)間段內(nèi)新標(biāo)注的類別判定 為熱點(diǎn)分類。所述應(yīng)用服務(wù)系統(tǒng)還包括分類提示單元,用于響應(yīng)應(yīng)用層單元的調(diào)用, 根據(jù)所述分類結(jié)果和用戶提交的搜索關(guān)鍵詞,逐層給出分類提示。所述應(yīng)用服務(wù)系統(tǒng)還包括興趣點(diǎn)關(guān)聯(lián)單元,用于將同一分類或近似分類 下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),并響應(yīng)應(yīng)用層單元的調(diào)用,互相推薦各自的網(wǎng)頁(yè)內(nèi)容。所述應(yīng)用服務(wù)系統(tǒng)還包括網(wǎng)頁(yè)屬性分析單元,用于建立關(guān)鍵詞-分類-廣告或信息排名三者之間的對(duì)應(yīng)關(guān)系,并根據(jù)用戶輸入的關(guān)鍵詞和選定的分 類,展示相應(yīng)的廣告或信息排名。根據(jù)本發(fā)明提供的具體實(shí)施例,公開(kāi)了以下技術(shù)效果由于對(duì)網(wǎng)頁(yè)信息的分類索引是一種動(dòng)態(tài)建立的過(guò)程,即頂層分類(不限于 一層)按照人工預(yù)定的分類體系進(jìn)行一次性的分類,然后隨著各個(gè)類別中網(wǎng)頁(yè) 信息的不斷添加,當(dāng)任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值,則對(duì)該類別進(jìn)行分裂, 按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè) 類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類。因此,信息的分類在廣度和深度上更 加全面、深入,可以支持更多的應(yīng)用服務(wù)。首先,其效果體現(xiàn)在所述動(dòng)態(tài)分類索引所提供的搜索服務(wù)上。第一,當(dāng)在 大量信息中搜索用戶需要的信息時(shí),更細(xì)致的分類縮小并精確了查找范圍,從 而大幅度提高了搜索效果,搜索的準(zhǔn)確性和搜索結(jié)果的質(zhì)量進(jìn)一步提高。第二, 與基于靜態(tài)分類的搜索相比,由于提供了更加全面、深入的逐層分類提示,可 以引導(dǎo)用戶逐層選擇直到在最底層的分類中查找到所需信息,因此降低了對(duì)用 戶的搮作要求。第三,信息到達(dá)用戶的距離非常近,由于分類的細(xì)致程度提高, 所以搜索結(jié)果頁(yè)面中前IO條信息中出現(xiàn)用戶所需信息的概率大大提高。其次,其效果體現(xiàn)在信息的異步推送服務(wù)上。與按照關(guān)鍵詞推送的方式相 比,本發(fā)明結(jié)合所述動(dòng)態(tài)分類體系,提供了按照用戶興趣點(diǎn)的異步推送。根據(jù) 用戶提交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān)鍵詞集合,計(jì)算所述關(guān)鍵詞集合與對(duì)應(yīng) 每個(gè)類別的特征集合的相似度并加以比較,將相似度最大的分類對(duì)應(yīng)用戶的興 趣點(diǎn),然后將對(duì)應(yīng)用戶興趣點(diǎn)分類下的新添加信息,以電子郵件、短信等異步 通訊方式推送給用戶,為用戶提供一次提交查詢、定期獲得查詢結(jié)果的服務(wù)。 而且,用戶可以一次性提交對(duì)應(yīng)多個(gè)興趣點(diǎn)的關(guān)鍵詞或關(guān)鍵詞組合。所述基于 用戶興趣點(diǎn)的異步推送,由于是對(duì)更細(xì)致的分類進(jìn)行興趣匹配,所以比關(guān)鍵詞 推送的信息更加符合用戶的需求。再次,其效果體現(xiàn)在基于熱點(diǎn)信息探測(cè)的應(yīng)用服務(wù)上。由于網(wǎng)頁(yè)信息的分 類是一個(gè)動(dòng)態(tài)變化的過(guò)程,所以通過(guò)跟蹤記錄各個(gè)分類的分裂頻度,可以推測(cè) 出近期的熱點(diǎn)新聞。判斷熱點(diǎn)信息的方式有兩種 一種是在一個(gè)時(shí)期內(nèi)分裂次 數(shù)最多、變化最明顯的分類即為熱點(diǎn);另一種是在一個(gè)時(shí)期內(nèi)由于網(wǎng)頁(yè)信息的 快速添加而新聚合成的分類即為熱點(diǎn)。當(dāng)用戶輸入關(guān)鍵詞搜索信息時(shí),可以優(yōu) 先按照所述熱點(diǎn)分類匹配和估計(jì)用戶的搜索期望。而且,還能夠進(jìn)行查詢的容錯(cuò)處理,如果用戶輸入的搜索關(guān)鍵詞出現(xiàn)部分錯(cuò)誤,由于優(yōu)先按照熱點(diǎn)分類匹 配,所以錯(cuò)誤的搜索關(guān)鍵詞并不影響搜索結(jié)果。再次,其效果體現(xiàn)在相同興趣點(diǎn)的信息推送服務(wù)上。在所述細(xì)致的分類體 系中,將同一分類或近似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),并主動(dòng)互相推薦各自的 網(wǎng)頁(yè)內(nèi)容。由于分類的細(xì)致性,并且在動(dòng)態(tài)分類過(guò)程中對(duì)自動(dòng)聚類的信息進(jìn)行 了有效性確認(rèn),所以建立關(guān)聯(lián)關(guān)系的網(wǎng)頁(yè)信息都具有更高的相似度,并對(duì)應(yīng)相 同的用戶興趣點(diǎn)。由此,通過(guò)興趣點(diǎn)建立了用戶關(guān)聯(lián)。最后,其效果體現(xiàn)在網(wǎng)頁(yè)屬性分析的應(yīng)用服務(wù)上。在用戶通過(guò)購(gòu)買關(guān)鍵詞進(jìn)行廣告招:放或竟價(jià)排名等應(yīng)用中,由于網(wǎng)頁(yè)信息分類更加精確,所以能夠提 供按照信息所屬的各層分類購(gòu)買關(guān)鍵詞,避免用戶購(gòu)買多個(gè)關(guān)鍵詞。


圖1是本發(fā)明實(shí)施例所述網(wǎng)頁(yè)信息動(dòng)態(tài)分類過(guò)程的步驟流程圖; 圖2. 1、2. 2、 2. 3和2. 4是圖1所述實(shí)施例中分類體系的生長(zhǎng)分裂示意圖; 圖3是本發(fā)明實(shí)施例所述網(wǎng)頁(yè)的歸類流程圖; 圖4是本發(fā)明實(shí)施例所述一種信息分類系統(tǒng)的結(jié)構(gòu)圖; 圖5是本發(fā)明實(shí)施例所述一種應(yīng)用服務(wù)系統(tǒng)的總體框架圖。
具體實(shí)施方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。本發(fā)明實(shí)施例提供的網(wǎng)頁(yè)信息動(dòng)態(tài)分類方法,是一種全新的信息索引存儲(chǔ) 方式,由于信息索引的存儲(chǔ)方式?jīng)Q定了所提供的應(yīng)用服務(wù),所以本發(fā)明在信息 索引所支持的各種應(yīng)用中是一次根本性改變,并且擴(kuò)大了應(yīng)用范圍。其中,所 述網(wǎng)頁(yè)信息包括各種互聯(lián)網(wǎng)可以展示的文本、圖片、視頻、音頻等。通過(guò)動(dòng)態(tài)分類過(guò)程建立起來(lái)的分類體系,是一種層次性的多級(jí)索引存儲(chǔ)方 式,其頂層分類(不限于一層)按照人工預(yù)定的分類體系進(jìn)行一次性的分類, 然后隨著各個(gè)類別中網(wǎng)頁(yè)信息的不斷添加,當(dāng)任一類別下的信息數(shù)目達(dá)到預(yù)設(shè) 值,則對(duì)該類別進(jìn)行分裂,按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,將相似度達(dá)到 預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類。孤立網(wǎng)頁(yè) 類中的網(wǎng)頁(yè)信息,當(dāng)滿足聚類條件時(shí),將分裂為各個(gè)分類。其中,所述頂層分類并不限于一層,初始建立的分類體系可能已經(jīng)包含多層分類??傊?,所述分 裂、聚類的過(guò)程循環(huán)進(jìn)4f,隨著網(wǎng)頁(yè)信息的不斷變化而生成新的分類,所述分 類體系 一直處于動(dòng)態(tài)變化的過(guò)程中。參照?qǐng)D1,是本發(fā)明實(shí)施例所述網(wǎng)頁(yè)信息動(dòng)態(tài)分類過(guò)程的步驟流程圖。下面將以某網(wǎng)站網(wǎng)頁(yè)的動(dòng)態(tài)分類為實(shí)施例,并結(jié)合圖2.1、 2.2、 2. 3和2. 4中分 類體系的生長(zhǎng)分裂示意圖,詳細(xì)說(shuō)明動(dòng)態(tài)分類過(guò)程。步驟IOI,建立初始分類。參見(jiàn)圖2.1,對(duì)網(wǎng)站內(nèi)的全部網(wǎng)頁(yè),按照人工 選擇的幾個(gè)分類,通常盡可能選擇正交的分類,或者是系統(tǒng)設(shè)計(jì)者感興趣的分 類,分為軍事、政治、娛樂(lè)、教育、未標(biāo)記五類。其中,將不屬于任何一個(gè)分 類的網(wǎng)頁(yè)設(shè)為一個(gè)單獨(dú)的類別,稱為未具名類,即所述的未標(biāo)記類別;而已經(jīng) 命名的子類稱為具名類。所述按照人工方式確定的初始分類中,分類的層次可 能是一層,也可能是多層。因?yàn)榛ヂ?lián)網(wǎng)不斷地產(chǎn)生各種各樣表達(dá)用戶的興趣和關(guān)注的網(wǎng)頁(yè),這些網(wǎng)頁(yè) 都會(huì)按照所述分類索引方式的要求,在具名類或未具名類下進(jìn)行歸類。歸類的 過(guò)程中,當(dāng)滿足一定條件時(shí),分類體系就要進(jìn)行相應(yīng)的改變,下面的步驟描述 的是其中一種變化方式。步驟102,具名類縱向生長(zhǎng)。所述分類體系的改變是通過(guò)預(yù)先設(shè)定的分裂 閾值而決定的,即對(duì)每個(gè)類別設(shè)置一個(gè)分裂閾值,當(dāng)任一類別下的信息數(shù)目達(dá) 到分裂閾值時(shí),所述類別分裂為多個(gè)分類。分裂后的各個(gè)子類內(nèi)部的網(wǎng)頁(yè)間相 似度最大,各子類之間的相似度足夠低,而且子類內(nèi)至少包含預(yù)先設(shè)定的最少 網(wǎng)頁(yè)個(gè)數(shù)。分裂的過(guò)程是按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,通過(guò)比較網(wǎng)頁(yè) 的特征集合,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為 一個(gè)孤立網(wǎng)頁(yè)類。例如,網(wǎng)頁(yè)A和網(wǎng)頁(yè)B各有20個(gè)特征,其中18個(gè)特征一致, 則將他們歸為一個(gè)分類,依次類推,得到一組具有相同或相近特征的分類。所 述聚類操作,可以采用本領(lǐng)域技術(shù)人員所熟知的各種方法。分裂閾值可以根據(jù)不同分類的特性設(shè)置,例如娛樂(lè)類由于新聞?shì)^多、話 題集中,所以?shī)蕵?lè)類的分裂閾值就比較高,比如l萬(wàn)條新聞嘗試一次分裂;而 軍事類新聞比較少,話題比較分歉,所以分裂的閾值就比較低,比如l千條新 聞嘗試一次分裂。參見(jiàn)圖2. 2,布支設(shè)娛樂(lè)類是信息數(shù)目增加最快的分類,當(dāng)增加到某個(gè)閾值 如1000條時(shí),達(dá)到該分類所含信息數(shù)目最大許可的范圍,可以理解為在所述 分類下可能產(chǎn)生了多個(gè)話題,此時(shí)執(zhí)行一次聚類算法,將緊密相似的網(wǎng)頁(yè)作為 一個(gè)類別。如圖所示,分為2個(gè)聚類和1個(gè)未聚類。其中,未聚類可以理解為 在所述聚類過(guò)程中的一些孤立點(diǎn),這些孤立點(diǎn)隨著新的網(wǎng)頁(yè)的到來(lái),可能會(huì)繼 續(xù)分裂。本發(fā)明所述實(shí)施例中,對(duì)于具名類的分裂,所述過(guò)程稱為分類的一次 生長(zhǎng),即在原有分類下生成多個(gè)子類,所述子類包括具名類和未具名類。步驟103,未具名類橫向分裂。對(duì)于所述未標(biāo)記或未聚類等孤立網(wǎng)頁(yè)信息, 其分裂過(guò)程同具名類的分裂過(guò)程一樣,隨著新信息的添加,達(dá)到閾值后,也是 按照網(wǎng)頁(yè)間的相似度進(jìn)行聚類操作。但與步驟102中具名類的生長(zhǎng)不同,未具 名類分裂后水平增加若干分類,即取代原有未具名類的位置。參見(jiàn)圖1 3所示, 原來(lái)的未聚類消失,轉(zhuǎn)換為2個(gè)聚類和1個(gè)未聚類。步驟104,對(duì)聚類標(biāo)注名稱。分類體系完成一次分裂操作后,自動(dòng)聚成一 個(gè)新的類別,就需要對(duì)所述新生成的類別標(biāo)注名稱。所述過(guò)程可以通過(guò)系統(tǒng)自 動(dòng)完成,例如每個(gè)分類對(duì)應(yīng)一個(gè)特征集合,可以按照特征集合中各個(gè)特征的權(quán) 重值,從特征集合中選擇一個(gè)權(quán)值最大的特征詞作為分類名稱,當(dāng)然也可以按 照其他方法選擇特征詞。優(yōu)選的,在確定名稱前,系統(tǒng)還可以先進(jìn)行聚類過(guò)程 的校驗(yàn),通過(guò)各種方式確認(rèn)自動(dòng)聚類的有效性,即新類別中是否存在不適合分 在這個(gè)類別中的網(wǎng)頁(yè)信息,然后再對(duì)有效的分類命名。但是,機(jī)器系統(tǒng)對(duì)自動(dòng)聚類的校驗(yàn)和命名不可能完全符合人的要求,所以 名稱標(biāo)注的準(zhǔn)確性不高。本發(fā)明優(yōu)選的,加入人工干預(yù)的手段,分配專員按照 有意義、有價(jià)值、符合人的興趣點(diǎn)和關(guān)注點(diǎn)的要求,確認(rèn)一次有價(jià)值的聚類。 尤其在一些專業(yè)性較強(qiáng)的特殊分類中,還需要通過(guò)專家來(lái)確認(rèn)自動(dòng)聚類的有效 性,并由專家來(lái)標(biāo)注名稱。如果自動(dòng)聚類后的信息對(duì)瀏覽網(wǎng)站的人并沒(méi)有太大 的瀏覽價(jià)值,或者不符合大眾的關(guān)注方向,即為一次無(wú)意義的聚類,則根據(jù)各 種策略進(jìn)行放棄。上述動(dòng)態(tài)分類過(guò)程中,每一次分裂都是一次聚類的結(jié)果,具名類分裂使分 類體系變深,未具名類分裂使分類體系變寬。分類體系的縱向分裂和橫向分裂 是兩種或者同時(shí)執(zhí)行。本發(fā)明所提供的基于動(dòng)態(tài)分類的信息索引方式,比靜態(tài)分類的結(jié)果在分類 廣度和深度上更加全面、深入,不僅降低了用戶的使用難度,還縮小并精確了 查找范圍,從而大幅度提高了信息搜索的準(zhǔn)確性。而且,信息到達(dá)用戶的距離非常近,搜索結(jié)果頁(yè)面中前10條信息中出現(xiàn)用戶所需信息的概率大大提高。所述動(dòng)態(tài)分類體系還支持分類結(jié)果的各種粒度,可以支持更多的應(yīng)用。所 述分類的粒度是對(duì)一種連續(xù)或者離散的變量概化的描述,比如地理位置的描述,由大洲、國(guó)家、地區(qū)、省市到鄉(xiāng)村等等,粒度由大到小;再比如年齡,可 以有少年6-12、青少年12-18、青年18-25等粒度的劃分。由于分類體系是在 人工參與的情況下監(jiān)控分裂閾值,所以分類的粒度可以任意掌握,支持各種粒 度的查詢應(yīng)用。圖1所示的流程是從動(dòng)態(tài)分類的整體進(jìn)行說(shuō)明,下面將從對(duì)網(wǎng)頁(yè)的具體處 理來(lái)說(shuō)明網(wǎng)頁(yè)的歸類過(guò)程,所述歸類表示一個(gè)網(wǎng)頁(yè)對(duì)所述分類體系逐層匹配的 過(guò)程。參照?qǐng)D3所示,流程如下步驟301,當(dāng)新添加一個(gè)網(wǎng)頁(yè)信息時(shí),首先通過(guò)4爪取工具抓取頁(yè)面內(nèi)容。步驟302,對(duì)4爪取的內(nèi)容進(jìn)行結(jié)構(gòu)化處理,通過(guò)分詞、相同網(wǎng)頁(yè)濾重等操 作,抽取網(wǎng)頁(yè)的特征元素構(gòu)成特征集合。步驟303,從分類體系的頂層分類開(kāi)始匹配所屬類別,比較網(wǎng)頁(yè)特征集合 與分類特征集合的相似度,當(dāng)屬于某個(gè)分類時(shí),繼續(xù)執(zhí)行步驟304。步驟304,如果所屬分類具有子類,則繼續(xù)在子類中按照相似度進(jìn)行匹配, 直到最底層的分類。所述網(wǎng)頁(yè)歸類過(guò)程不同于靜態(tài)分類中僅對(duì)網(wǎng)頁(yè)判別 一次的歸類過(guò)程,而是 一個(gè)逐層進(jìn)行多次匹配的過(guò)程,當(dāng)某個(gè)網(wǎng)頁(yè)歸到一個(gè)類別時(shí),還需要考慮是否 歸到其子類中更加合適,如果是,繼續(xù)往分類體系的深處歸類,直到在最底層 的分類中,如果所述網(wǎng)頁(yè)和該類的任何子類都不相似,則歸到未具名子類中, 一次歸類過(guò)程才結(jié)束。優(yōu)選的,網(wǎng)頁(yè)歸類過(guò)程還可以人工參與,人工添加新的網(wǎng)頁(yè)信息。如果管 理維護(hù)人員擁有足夠的領(lǐng)域知識(shí),且熟知所述分類體系結(jié)構(gòu),當(dāng)編輯得到一個(gè) 網(wǎng)頁(yè)時(shí),就可以一次性將該網(wǎng)頁(yè)存放在最優(yōu)的分類中。如前所述,信息索引的存儲(chǔ)方式?jīng)Q定了所支持的應(yīng)用服務(wù),下面結(jié)合本發(fā) 明所支持的各種應(yīng)用服務(wù)來(lái)說(shuō)明動(dòng)態(tài)分類體系的效果。其一 ,由于所述分類體系中各個(gè)分類大多反映了人的興趣點(diǎn),如招聘信息、新聞搜索、知識(shí)查詢、資料下載等類別,所以本發(fā)明能夠有效支持基于興趣點(diǎn) 的異步推送,為用戶提供一次提交查詢、定期獲得查詢結(jié)果的服務(wù)。其中,所述異步表示時(shí)間上緊湊性不強(qiáng)的通訊方式。所述異步推送過(guò)程是根據(jù)用戶提 交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成的關(guān)鍵詞集合,計(jì)算所述關(guān)鍵詞集合與對(duì)應(yīng)每個(gè) 類別的特征集合的相似度并加以比較,將相似度最大的分類對(duì)應(yīng)用戶的興趣 點(diǎn),如果以后出現(xiàn)該類別的信息,將通過(guò)電子郵件發(fā)送到用戶的email郵箱, 實(shí)現(xiàn)用戶一次提交關(guān)鍵詞,系統(tǒng)轉(zhuǎn)換為興趣點(diǎn),按照興趣點(diǎn)推送信息。而且,用戶可以 一次性提交對(duì)應(yīng)多個(gè)興趣點(diǎn)的關(guān)鍵詞或關(guān)鍵詞組合,例如, 用戶提交"西湖,釣魚(yú),谷歌,李開(kāi)富,收購(gòu),姚明,NBA,麥迪"多個(gè)關(guān)鍵 詞,系統(tǒng)通過(guò)比較,發(fā)現(xiàn)"西湖,釣魚(yú)"、"谷歌,李開(kāi)富,收購(gòu)"、"姚明,NBA, 麥迪"分別對(duì)應(yīng)系統(tǒng)已有的三個(gè)分類,于是,將用戶的興趣點(diǎn)確定在所述三個(gè) 分類中,用戶通過(guò)電子郵件、短信、信件、報(bào)表等異步通訊方式實(shí)現(xiàn)對(duì)興趣點(diǎn) 的長(zhǎng)期關(guān)注。具體實(shí)現(xiàn)過(guò)程是用戶登錄異步推送頁(yè)面—提交關(guān)鍵詞或關(guān)鍵詞組合—系 統(tǒng)通過(guò)相似度的計(jì)算和比較推測(cè)用戶關(guān)注的分類,提示用戶進(jìn)行分類興趣的注 冊(cè)—發(fā)現(xiàn)分類中的新信息,采用各種異步通訊方式推送—用戶接收推送結(jié)果。 與按照關(guān)鍵詞異步推送的方式相比,所述基于用戶興趣點(diǎn)的異步推送,由于是 對(duì)更細(xì)致的分類進(jìn)行興趣匹配,所以比關(guān)鍵詞推送的信息更加符合用戶的需 求。而按照關(guān)鍵詞存儲(chǔ)的索引包含的信息范圍太廣泛,具有相同關(guān)鍵詞的網(wǎng)頁(yè) 內(nèi)容可能記載了完全不相關(guān)的信息,上例中用戶輸入的8個(gè)搜索關(guān)鍵詞也許對(duì) 應(yīng)8個(gè)分類,所以推送給用戶的信息就不能很好地反映用戶的興趣點(diǎn)或關(guān)注 點(diǎn)。其二,在分類體系的動(dòng)態(tài)變化過(guò)程中,通過(guò)跟蹤記錄各個(gè)分類的分裂頻度 (即類的活躍度),可以推測(cè)出近期的熱點(diǎn)新聞。判斷熱點(diǎn)信息的方式有兩種 一種是在一個(gè)時(shí)期內(nèi)分裂次數(shù)最多、變化最明顯的分類即為熱點(diǎn),例如,在一 個(gè)時(shí)期內(nèi)變化最明顯的分類即為熱點(diǎn)分類,如在娛樂(lè)的大類中,l周執(zhí)行了5次縱向生長(zhǎng)和5次橫向分裂,很顯然娛樂(lè)是熱點(diǎn);另一種是在一個(gè)時(shí)期內(nèi)由于網(wǎng)頁(yè)信息的快速添加而新聚合成的分類即為熱點(diǎn),例如,近期通過(guò)人工標(biāo)注的 分類是黃健翔跳槽,那么這就是近期熱點(diǎn)。通過(guò)所述兩種方法,系統(tǒng)可以自動(dòng)獲知熱點(diǎn),并且主動(dòng)推送用戶,具有主 動(dòng)性。應(yīng)用在搜索引擎服務(wù)中,當(dāng)用戶輸入關(guān)鍵詞搜索信息時(shí),可以優(yōu)先按照 所述熱點(diǎn)分類匹配和估計(jì)用戶的搜索期望。例如,用戶在黃健翔跳槽期間查詢 關(guān)鍵詞"黃健翔,,或者"重慶衛(wèi)視",那么系統(tǒng)可以按照當(dāng)前熱點(diǎn)推測(cè)出用戶 的查詢目的,優(yōu)先在屬于黃健翔跳槽的這個(gè)分類中給予查詢結(jié)果。應(yīng)用在網(wǎng)頁(yè) 歸類過(guò)程中,對(duì)于新添加到分類體系中的網(wǎng)頁(yè)信息,優(yōu)先對(duì)熱點(diǎn)類別或應(yīng)用中 特別關(guān)注的類別進(jìn)行匹配,從而獲得較高的歸類效率。此夕卜,優(yōu)先匹配基于興趣點(diǎn)分類的熱點(diǎn)信息還具有查詢?nèi)蒎e(cuò)的功能。例如, 用戶需要查詢一個(gè)人的信息,輸入關(guān)鍵詞組合"北師大,國(guó)企,副總",但是 要查詢的這個(gè)人應(yīng)聘的是外企的副總,關(guān)鍵詞出現(xiàn)部分錯(cuò)誤。在傳統(tǒng)的信息索 引方式中,由于用戶輸入錯(cuò)誤,導(dǎo)致系統(tǒng)查詢被誤導(dǎo),很難搜索出用戶想要的 結(jié)果。但是如果結(jié)合基于興趣點(diǎn)分類的熱點(diǎn)信息,因?yàn)榻诔霈F(xiàn)了大量含有"北 師大,副總"的網(wǎng)頁(yè),則可以推測(cè)出可能的查詢?yōu)?北師大,副總",而且系 統(tǒng)剛剛分裂出"北師大,副總,杜穎穎"這個(gè)子類,結(jié)合所述子類即可正確估 計(jì)用戶的搜索目的,從而得到的搜索結(jié)果不受錯(cuò)誤搜索關(guān)鍵詞的影響。其三,與基于靜態(tài)分類的搜索相比,由于分類在廣度和深度上更加全面、 深入,支持各種粒度的分類查詢,所以提供的逐層分類提示可以引導(dǎo)用戶不斷 精確搜索,快速查找到需要的信息,避免每次在大搜索中查找。例如,用戶查 詢"火箭",系統(tǒng)將包含"火箭"的所有分類給出分類提示[科研,體育,娛樂(lè)], 用戶選擇體育,搜索結(jié)果全部為體育類,系統(tǒng)繼續(xù)給出分類提示[籃球,臺(tái)球], 用戶選擇臺(tái)球,搜索結(jié)果全部為臺(tái)球類,用戶選擇臺(tái)球類,出現(xiàn)火箭奧沙利文 的4言息。除上述逐次給予用戶分類提示的方式外,優(yōu)選的,對(duì)于高級(jí)用戶,允許直 接給出所述分類體系的整體分類目錄,這樣用戶不必逐次選擇,在所述整體目 錄中進(jìn)行一次性選擇,就可以直接定位到所需要的類別中。優(yōu)選的,更便捷的一種方式是在某些特殊應(yīng)用中,還允許用戶提交"關(guān)鍵詞+分類"的組合,系統(tǒng)根據(jù)所述組合信息,查找到分類目錄,然后直接將 指定目錄下的全部網(wǎng)頁(yè)顯示。用戶通過(guò)輸入快捷搜索詞,即能直接得到自己需 要的網(wǎng)頁(yè)集合。其四,由于按照興趣點(diǎn)的分類,能夠支持用戶興趣點(diǎn)關(guān)聯(lián)的應(yīng)用。在所述 細(xì)致的分類體系中,將同一分類或近似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),在需要建 立網(wǎng)頁(yè)關(guān)聯(lián)的應(yīng)用中,主動(dòng)互相推薦各自的網(wǎng)頁(yè)內(nèi)容。由于分類的細(xì)致性,并 且在動(dòng)態(tài)分類過(guò)程中對(duì)自動(dòng)聚類的信息進(jìn)行了有效性確認(rèn),所以建立關(guān)聯(lián)關(guān)系 的網(wǎng)頁(yè)信息都具有更高的相似度,并對(duì)應(yīng)相同的用戶興趣點(diǎn)。例如,用戶發(fā)表 一篇對(duì)公交降價(jià)的評(píng)論,系統(tǒng)自動(dòng)將其歸類在公交P務(wù)價(jià)的類別中,并且推送近 期發(fā)表的關(guān)于公交降價(jià)的其他博客給該用戶,通過(guò)興趣點(diǎn)把博客用戶關(guān)聯(lián)起 來(lái)。通常,建立了興趣點(diǎn)關(guān)聯(lián)的信息都屬于同一個(gè)分類,但在某些情況下,也 可能屬于不同的、但相近似的分類中。其五,由于分類的細(xì)致性,可以對(duì)用戶提供網(wǎng)頁(yè)屬性分析的服務(wù)。比如某 個(gè)網(wǎng)頁(yè)所屬的分類分別為體育類、臺(tái)球類、火箭等等,用戶了解所述屬性可以 按照類別進(jìn)行關(guān)鍵詞投放。例如,對(duì)某個(gè)關(guān)鍵詞的竟價(jià)排名,購(gòu)買用戶在購(gòu)買關(guān)鍵詞時(shí)可以針對(duì)關(guān)鍵:詞所屬的其中 一個(gè)類別,如果搜索用戶的查詢企圖是所 述類別,則優(yōu)先將某個(gè)網(wǎng)址排名靠前,從而避免用戶購(gòu)買多個(gè)關(guān)鍵詞。而在傳 統(tǒng)的關(guān)鍵詞購(gòu)買方式中,由于信息建立了關(guān)鍵詞索引,所以用戶需要購(gòu)買多個(gè) 關(guān)鍵詞,才能達(dá)到針對(duì)類別購(gòu)買的效果。再如,目前的廣告投放都是按照關(guān)鍵詞投放,即根據(jù)大類投放,比如體育 類。而本發(fā)明具有各種粒度大小的分類,購(gòu)買關(guān)鍵詞的用戶可以任意選擇需要 的類進(jìn)行投放。比如^t殳關(guān)于體育類的臺(tái)球類的奧沙利文類,那么只有奧沙利文 的球迷可能會(huì)打開(kāi)這些頁(yè)面,這時(shí)就可以看到投放的廣告。同樣,按照類別購(gòu) 買關(guān)鍵詞進(jìn)行廣告投放,可以避免用戶購(gòu)買多個(gè)關(guān)鍵詞。針對(duì)上述實(shí)施例中所述的動(dòng)態(tài)分類方法,本發(fā)明提供了一種信息分類系 統(tǒng),參照?qǐng)D4所示,所述系統(tǒng)包括動(dòng)態(tài)分類樹(shù)401、聚類單元402、人工判別 單元403、控制單元404、網(wǎng)頁(yè)歸類單元405和日志單元406。動(dòng)態(tài)分類樹(shù)401是一種信息索引的存儲(chǔ)結(jié)構(gòu),以樹(shù)型結(jié)構(gòu)存儲(chǔ)分類索引, 其中每個(gè)分類稱為一個(gè)結(jié)點(diǎn)。動(dòng)態(tài)分類樹(shù)401的頂層分類是對(duì)網(wǎng)頁(yè)信息的初始分類,即按照人工預(yù)定的分類體系進(jìn)行一次性的分類;余下的分類是動(dòng)態(tài)聚類 的結(jié)果,即隨著各個(gè)類別中網(wǎng)頁(yè)信息的不斷添加,對(duì)達(dá)到分裂閾值的類別進(jìn)行 聚類,生成新的類別。而聚類過(guò)程中的一些孤立網(wǎng)頁(yè)歸為一個(gè)未聚類,這些孤 立點(diǎn)隨著新的網(wǎng)頁(yè)的到來(lái),可能會(huì)繼續(xù)分裂。每一次分裂都是一次聚類的結(jié)果, 對(duì)于具名類的分裂,動(dòng)態(tài)分類樹(shù)401變深;對(duì)于未具名類的分裂,動(dòng)態(tài)分類樹(shù) 401變寬。所述分裂閾值隨類別的不同而設(shè)置不同。聚類單元402用于執(zhí)行所述聚類操作,當(dāng)任一類別下的信息數(shù)目達(dá)到分裂 閾值時(shí),按照網(wǎng)頁(yè)間的相似度,通過(guò)比較網(wǎng)頁(yè)的特征集合,將相似度達(dá)到預(yù)設(shè) 量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)未聚類。聚類后形成的各個(gè) 子類內(nèi)部的網(wǎng)頁(yè)間相似度最大,各子類之間的相似度足夠低,而且子類內(nèi)至少 包含預(yù)先設(shè)定的最少網(wǎng)頁(yè)個(gè)數(shù)。人工判別單元403用于對(duì)聚類后的類別標(biāo)注名稱,生成具名類,可以由系 統(tǒng)自動(dòng)完成,也可以通過(guò)人工方式完成。本發(fā)明優(yōu)選的,由人工確認(rèn)自動(dòng)聚類 的有效性,即確認(rèn)一次聚類是否有意義、有價(jià)值,是否符合人的興趣點(diǎn)和關(guān)注 點(diǎn),否則根據(jù)各種策略進(jìn)行放棄,然后再對(duì)有效的分類命名。因此,通過(guò)人工 審核的分類通常反映了人的興趣點(diǎn)??刂茊卧?04用于從整體上控制動(dòng)態(tài)分類樹(shù)401的變化,當(dāng)任一類別下的 信息數(shù)目達(dá)到分裂闞值時(shí),觸發(fā)聚類單元402執(zhí)行聚類操作,并根據(jù)聚類單元 402的執(zhí)行結(jié)果改變動(dòng)態(tài)分類樹(shù)401的形態(tài)。具體過(guò)程是當(dāng)人工判別單元403 完成名稱標(biāo)注后,控制單元404根據(jù)人工判別單元403的結(jié)果改變動(dòng)態(tài)分類樹(shù) 401的形態(tài),完成一次形態(tài)的調(diào)整。分類系統(tǒng)中還包括了網(wǎng)頁(yè)歸類單元405,用于將互聯(lián)網(wǎng)不斷產(chǎn)生的各種各 樣表達(dá)用戶興趣和關(guān)注點(diǎn)的網(wǎng)頁(yè),按照所述分類索引方式的要求進(jìn)行合理歸 類。在建立初始分類時(shí),網(wǎng)頁(yè)信息是按照靜態(tài)分類中的歸類方式,僅判別一次 后歸到最匹配的類別中。但是在隨后的聚類過(guò)程中,新添加到動(dòng)態(tài)分類樹(shù)401 中的網(wǎng)頁(yè)按照從上到下逐層匹配的方式進(jìn)行多次匹配后,歸到最底層的具名類 或未具名類中。例如,當(dāng)某個(gè)網(wǎng)頁(yè)歸到一個(gè)頂層類別時(shí),如果該分類還有下一層子分類,則繼續(xù)往動(dòng)態(tài)分類樹(shù)401的深處進(jìn)行類別匹配,直到在最底層的分 類中,如果所述網(wǎng)頁(yè)和該類的任何子類都不相似,則歸到未具名子類中。優(yōu)選的,在整個(gè)動(dòng)態(tài)變化過(guò)程中,還部署了日志單元406來(lái)跟蹤記錄動(dòng)態(tài) 分類樹(shù)401中所有結(jié)點(diǎn)的分裂頻度,通過(guò)判斷一個(gè)時(shí)期內(nèi)變化最明顯的分類和 新聚合成的分類,推測(cè)出近期的熱點(diǎn)新聞。所述信息分類系統(tǒng)能夠自動(dòng)識(shí)別出 熱點(diǎn)信息,準(zhǔn)確性高,具有很大的應(yīng)用價(jià)值。基于上述信息分類系統(tǒng)和建立在動(dòng)態(tài)分類基礎(chǔ)上的各種應(yīng)用服務(wù),本發(fā)明 還提供了一種應(yīng)用所述分類系統(tǒng)的服務(wù)系統(tǒng),參照?qǐng)D5,是本發(fā)明實(shí)施例所述 一種應(yīng)用服務(wù)系統(tǒng)的總體框架圖。所述系統(tǒng)包括三個(gè)子系統(tǒng),具體包括動(dòng)態(tài)分 類樹(shù),抓取層501,分析層502,歸類層503,執(zhí)行層504,人工判別層505, 查詢層506和應(yīng)用層507。其中,所述抓取層501、分析層502和歸類層503 屬于信息歸類子系統(tǒng),所述執(zhí)行層504和人工判別層505屬于上述的信息分類 子系統(tǒng),所述查詢層506和應(yīng)用層507屬于應(yīng)用子系統(tǒng),下面分別說(shuō)明。信息歸類子系統(tǒng)主要完成網(wǎng)頁(yè)信息的初始?xì)w類,其中抓取層501負(fù)責(zé)信息 抓取,通過(guò)抓取工具4爪取頁(yè)面內(nèi)容;分析層502負(fù)責(zé)信息結(jié)構(gòu)化處理,通過(guò)分 詞、相同網(wǎng)頁(yè)濾重等^t喿作,抽取網(wǎng)頁(yè)的特征元素構(gòu)成特征集合;歸類層503 負(fù)責(zé)根據(jù)網(wǎng)頁(yè)的特征集合和已有分類樹(shù),計(jì)算并比較網(wǎng)頁(yè)特征集合與分類特征 集合的相似度,對(duì)網(wǎng)頁(yè)進(jìn)行歸類。所述歸類過(guò)程是一個(gè)逐層進(jìn)行多次匹配的過(guò) 程,當(dāng)某個(gè)網(wǎng)頁(yè)歸到一個(gè)類別時(shí),還需要考慮是否歸到其子類中更加合適,如 果是,繼續(xù)往分類體系的深處歸類,直到在最底層的分類中,如果所述網(wǎng)頁(yè)和 該類的任何子類都不相似,則歸到未具名子類中。信息分類子系統(tǒng)主要完成分類樹(shù)的類別分裂,其中執(zhí)行層504負(fù)責(zé)根據(jù)不 同的分裂需要進(jìn)行分類,并根據(jù)人工判別層505返回的結(jié)果改變分類樹(shù)的形 態(tài),包括圖4所示的聚類單元402、控制單元404和日志單元405,其功能不 再詳述;人工判別層505負(fù)責(zé)人工確認(rèn)分類的有效性,并標(biāo)注名稱,包括圖4 所示的人工判別單元403。信息分類子系統(tǒng)的功能與具體實(shí)現(xiàn)不再詳述。應(yīng)用子系統(tǒng)主要基于動(dòng)態(tài)分類樹(shù),提供各種應(yīng)用服務(wù)。其中,查詢層506 負(fù)責(zé)查詢所述動(dòng)態(tài)分類樹(shù),并根據(jù)查詢結(jié)果提供相應(yīng)的應(yīng)用服務(wù);應(yīng)用層507 負(fù)責(zé)根據(jù)各種應(yīng)用的需要,調(diào)用所述查詢層506提供的各種服務(wù)。查詢層506 提供的應(yīng)用服務(wù)包括搜索引擎服務(wù),基于興趣點(diǎn)的異步推送,熱點(diǎn)信息的優(yōu)先 匹配,查詢?nèi)蒎e(cuò),逐層分類提示,興趣點(diǎn)關(guān)聯(lián)的建立,以及網(wǎng)頁(yè)屬性分析服務(wù)。對(duì)應(yīng)所述服務(wù),本發(fā)明實(shí)施例中提供了查詢單元、興趣點(diǎn)推測(cè)單元和異步推送 單元、熱點(diǎn)推測(cè)單元、分類提示單元、興趣點(diǎn)關(guān)聯(lián)單元、網(wǎng)頁(yè)屬性分析單元,分別部署在查詢層506,響應(yīng)應(yīng)用層507的調(diào)用。下面分別說(shuō)明。查詢單元負(fù)責(zé)查詢所述動(dòng)態(tài)分類樹(shù),可以根據(jù)網(wǎng)頁(yè)查出其全部分類屬性, 或者根據(jù)其中 一個(gè)分類查出其所包含的網(wǎng)頁(yè)信息。興趣點(diǎn)推測(cè)單元負(fù)責(zé)根據(jù)用戶提交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān)鍵詞集 合,計(jì)算并比較所述關(guān)4建詞集合與對(duì)應(yīng)每個(gè)類別的特征集合的相似度,將相似 度最大的分類對(duì)應(yīng)用戶的興趣點(diǎn)。并結(jié)合異步推送單元,將該類別出現(xiàn)的新的 信息,通過(guò)電子郵件、短信、信件、報(bào)表等異步通訊方式發(fā)送給用戶,實(shí)現(xiàn)用 戶一次提交關(guān)4建詞,系統(tǒng)轉(zhuǎn)換為興趣點(diǎn),按照興趣點(diǎn)推送信息,實(shí)現(xiàn)用戶對(duì)興 趣點(diǎn)的長(zhǎng)期關(guān)注。而且,用戶可以一次性提交對(duì)應(yīng)多個(gè)興趣點(diǎn)的關(guān)鍵詞或關(guān)鍵 詞組合。與按照關(guān)鍵詞異步推送的方式相比,所述基于用戶興趣點(diǎn)的異步推送, 由于是對(duì)更細(xì)致的分類進(jìn)行興趣匹配,所以比關(guān)鍵詞推送的信息更加符合用戶 的需求。熱點(diǎn)推測(cè)單元負(fù)責(zé)根據(jù)日志單元記錄的分類活躍度,推測(cè)出近期的熱點(diǎn)新 聞。在一個(gè)時(shí)期內(nèi)分裂次數(shù)最多、變化最明顯的分類即為熱點(diǎn), 一個(gè)時(shí)期內(nèi)由 于網(wǎng)頁(yè)信息的快速添加而新聚合成的分類也是熱點(diǎn)。系統(tǒng)可以自動(dòng)獲知熱點(diǎn), 并主動(dòng)推送給用戶,例如在搜索引擎服務(wù)中,可以優(yōu)先按照所述熱點(diǎn)分類匹配 和估計(jì)用戶的搜索期望。而且,優(yōu)先匹配基于興趣點(diǎn)分類的熱點(diǎn)信息還具有查 詢?nèi)蒎e(cuò)的功能,搜索結(jié)果不受錯(cuò)誤搜索詞的影響。所述熱點(diǎn)推測(cè)單元還對(duì)新添加到動(dòng)態(tài)分類樹(shù)中的網(wǎng)頁(yè)信息,按照熱點(diǎn)類別 或應(yīng)用中特別關(guān)注的類別優(yōu)先的原則進(jìn)行匹配,從而獲得較高的歸類效率。分類提示單元負(fù)責(zé)支持各種粒度的分類查詢,提供逐層分類提示, 一步步 引導(dǎo)用戶不斷精確搜索,從而快速、準(zhǔn)確地查找到需要的信息,避免每次在大 搜索中查找。所述分類提示單元給出分類提示信息的方式包括逐次提交和整體提交兩 種方式。所述逐次提交指每次給出一個(gè)層次的分類提示,用戶通過(guò)多次選擇分類才能找到需要的信息;所述整體提交指針對(duì)高級(jí)用戶,直接給出所述分類體 系的整體分類目錄,這樣用戶不必逐次選擇,在所述整體目錄中進(jìn)行一次性選擇,就可以直接定位到所需要的類別中。優(yōu)選的,所述分類提示單元針對(duì)某些特殊的應(yīng)用,允許用戶提交"關(guān)鍵詞 +分類"的組合,并根據(jù)所述組合信息,查找到分類目錄,然后直接將指定目 錄下的全部網(wǎng)頁(yè)顯示。用戶通過(guò)輸入快捷搜索詞,即能直接得到自己需要的網(wǎng) 頁(yè)集合。興趣點(diǎn)關(guān)聯(lián)單元負(fù)責(zé)將同一分類或近似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),在需 要建立網(wǎng)頁(yè)關(guān)聯(lián)的應(yīng)用中,主動(dòng)互相推薦各自的網(wǎng)頁(yè)內(nèi)容。由于分類的細(xì)致性, 并且在動(dòng)態(tài)分類過(guò)程中對(duì)自動(dòng)聚類的信息進(jìn)行了有效性確認(rèn),所以建立關(guān)聯(lián)關(guān) 系的網(wǎng)頁(yè)信息都具有更高的相似度,并對(duì)應(yīng)相同的用戶興趣點(diǎn)。網(wǎng)頁(yè)屬性分析單元負(fù)責(zé)根據(jù)用戶購(gòu)買關(guān)鍵詞的類別,展示相應(yīng)的廣告或信 息排名。如果用戶了解分類的屬性,就可以按照類別進(jìn)行關(guān)鍵詞投放,避免購(gòu) 買更多的關(guān)鍵詞。例如,對(duì)某個(gè)關(guān)鍵詞的竟價(jià)排名或廣告投放,購(gòu)買用戶在購(gòu) 買關(guān)鍵詞時(shí)可以針對(duì)關(guān)鍵詞所屬的其中一個(gè)類別,如果搜索用戶的查詢企圖是 所述類別,則優(yōu)先將某個(gè)網(wǎng)址排名靠前,或者將招j文的廣告優(yōu)先展示。上述位于查詢層506的各個(gè)功能模塊,通過(guò)應(yīng)用層的調(diào)用來(lái)滿足用戶的不 同需求,實(shí)現(xiàn)了動(dòng)態(tài)分類樹(shù)的多種應(yīng)用支持??傊?, 一個(gè)好的存儲(chǔ)方式可以解 決應(yīng)用中的多種難題,但是本發(fā)明實(shí)施例中提供的存儲(chǔ)方式并不是一個(gè)取代關(guān) 鍵字索引存儲(chǔ)的方式,該存儲(chǔ)方式是一個(gè)輔助存儲(chǔ)方式,也就是一個(gè)信息可以 通過(guò)動(dòng)態(tài)分類查找,也可以通過(guò)關(guān)鍵字查找。而且,由于分類加上了人工的語(yǔ) 義標(biāo)注,使得分類更加具有活力、更加準(zhǔn)確、更符合人的興趣點(diǎn)。以上對(duì)本發(fā)明所提供的 一種網(wǎng)頁(yè)信息分類方法、系統(tǒng)及應(yīng)用該分類的服務(wù) 系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn) 行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想; 同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng) 用范圍上均會(huì)有改變之處。綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限 制。
權(quán)利要求
1. 一種網(wǎng)頁(yè)信息分類方法,其特征在于,包括以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始分類;如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值,則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別;剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括標(biāo)注所述聚類后 的類別名稱。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于所述分裂過(guò)程中,標(biāo)注名 稱的類別縱向分裂為各個(gè)子類;孤立網(wǎng)頁(yè)類橫向分裂。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括確認(rèn)所述分裂結(jié) 果的有效性。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括每個(gè)分類稱為一 個(gè)結(jié)點(diǎn),跟蹤記錄所述樹(shù)型結(jié)構(gòu)中所有結(jié)點(diǎn)的分裂頻度。
6、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括新添加到所述樹(shù) 型結(jié)構(gòu)中的網(wǎng)頁(yè)信息進(jìn)行逐層匹配,歸到最底層的子類或孤立網(wǎng)頁(yè)類中。
7、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括根據(jù)用戶提交的 關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān)鍵詞集合,比較所述關(guān)鍵詞集合與對(duì)應(yīng)每個(gè)類別的 特征集合的相似度,將相似度最大的分類對(duì)應(yīng)用戶的興趣點(diǎn)。
8、 根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括將對(duì)應(yīng)用戶興趣 點(diǎn)分類下的新添加信息,異步推送給用戶。
9、 根據(jù)權(quán)利要求8所述的方法,其特征在于通過(guò)電子郵件、短信、信 件、報(bào)表方式將網(wǎng)頁(yè)信息異步推送給用戶。
10、 根據(jù)權(quán)利要求8所述的方法,其特征在于用戶一次性提交對(duì)應(yīng)多個(gè)興趣點(diǎn)的關(guān)鍵詞或關(guān)鍵詞組合。
11、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括判斷熱點(diǎn)分類, 對(duì)用戶提交的搜索關(guān)鍵詞,或者新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息,優(yōu)先匹 配所述熱點(diǎn)分類。
12、 根據(jù)權(quán)利要求11所述的方法,其特征在于,執(zhí)行以下判斷步驟將 預(yù)定時(shí)間段內(nèi)進(jìn)行多次分裂的類別判定為熱點(diǎn)分類。
13、 根據(jù)權(quán)利要求11所述的方法,其特征在于,執(zhí)行以下判斷步驟將預(yù)定時(shí)間段內(nèi)新標(biāo)注的類別判定為熱點(diǎn)分類。
14、 根據(jù)權(quán)利要求l所述的方法,其特征在于,還包括根據(jù)所述分類結(jié)果和用戶提交的搜索關(guān)鍵詞,逐層給出分類提示。
15、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括根據(jù)所述分類結(jié) 果,以及用戶提交的關(guān)鍵詞與分類的組合信息,直接顯示對(duì)應(yīng)類別下的網(wǎng)頁(yè)集 合。
16、 根據(jù)權(quán)利要求l所述的方法,其特征在于,還包括將同一分類或近 似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),并互相推薦各自的網(wǎng)頁(yè)內(nèi)容。
17、 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括建立關(guān)鍵詞-分 類 - 廣告或信息排名三者之間的對(duì)應(yīng)關(guān)系,并根據(jù)用戶輸入的關(guān)^:詞和選定的 分類,展示相應(yīng)的廣告或信息排名。
18、 一種網(wǎng)頁(yè)信息分類系統(tǒng),其特征在于,包括 動(dòng)態(tài)分類樹(shù),用于以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始分類;聚類單元,用于執(zhí)行聚類操作,如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值, 則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度,將相似度達(dá)到預(yù) 設(shè)量級(jí)值的網(wǎng)頁(yè)聚為 一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為 一個(gè)孤立網(wǎng)頁(yè)類;控制單元,用于根據(jù)聚類單元的執(zhí)行結(jié)果改變動(dòng)態(tài)分類樹(shù)的形態(tài)。
19、 根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,還包括人工判別單元, 用于標(biāo)注所述聚類后的類別名稱。
20、 根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于所述聚類單元在執(zhí)行聚 類時(shí),標(biāo)注名稱的類別縱向分裂為各個(gè)子類;孤立網(wǎng)頁(yè)類橫向分裂。
21、 根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,還包括網(wǎng)頁(yè)歸類單元, 用于將新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息進(jìn)行逐層匹配,歸到最底層的子類 或孤立網(wǎng)頁(yè)類中。
22、 根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,還包括日志單元,用 于跟蹤記錄動(dòng)態(tài)分類樹(shù)中所有結(jié)點(diǎn)的分裂頻度,其中每個(gè)分類稱為一個(gè)結(jié)點(diǎn)。
23、 一種應(yīng)用服務(wù)系統(tǒng),其特征在于,包括信息分類子系統(tǒng),包括動(dòng)態(tài)分類樹(shù),用于以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始 分類;聚類單元,用于執(zhí)行聚類操作,如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值, 則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別,剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類;控制單元, 用于根據(jù)聚類單元的執(zhí)行結(jié)果改變動(dòng)態(tài)分類樹(shù)的形態(tài);查詢單元,用于查詢所述動(dòng)態(tài)分類樹(shù),并根據(jù)查詢結(jié)杲提供相應(yīng)的應(yīng)用服務(wù);應(yīng)用層單元,用于響應(yīng)各種服務(wù)命令,調(diào)用所述查詢單元。
24、 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,還包括興趣點(diǎn)推測(cè)單 元,用于響應(yīng)應(yīng)用層單元的調(diào)用,根據(jù)用戶提交的關(guān)鍵詞或關(guān)鍵詞組合構(gòu)成關(guān) 鍵詞集合,比較所述關(guān)鍵詞集合與對(duì)應(yīng)每個(gè)類別的特征集合的相似度,將相似 度最大的分類對(duì)應(yīng)用戶的興趣點(diǎn)。
25、 根據(jù)權(quán)利要求24所述的系統(tǒng),其特征在于,還包括異步推送單元, 用于根據(jù)興趣點(diǎn)推測(cè)單元的推測(cè)結(jié)果,將對(duì)應(yīng)用戶興趣點(diǎn)分類下的新添加信 息,異步推送給用戶。
26、 根據(jù)權(quán)利要求25所述的系統(tǒng),其特征在于所述異步推送單元通過(guò) 電子郵件、短信、信件、報(bào)表方式將網(wǎng)頁(yè)信息異步推送給用戶。
27、 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,還包括熱點(diǎn)推測(cè)單元, 用于響應(yīng)應(yīng)用層單元的調(diào)用,判斷熱點(diǎn)分類,對(duì)用戶提交的搜索關(guān)鍵詞,或者 新添加到所述樹(shù)型結(jié)構(gòu)中的網(wǎng)頁(yè)信息,優(yōu)先匹配所述熱點(diǎn)分類。
28、 根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于所述熱點(diǎn)推測(cè)單元將預(yù) 定時(shí)間段內(nèi)進(jìn)行多次分裂的類別判定為熱點(diǎn)分類。
29、 根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于所述熱點(diǎn)推測(cè)單元將預(yù) 定時(shí)間段內(nèi)新標(biāo)注的類別判定為熱點(diǎn)分類。
30、 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,還包括分類提示單元, 用于響應(yīng)應(yīng)用層單元的調(diào)用,根據(jù)所述分類結(jié)果和用戶提交的搜索關(guān)鍵詞,逐 層給出分類提示。
31、 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,還包括興趣點(diǎn)關(guān)聯(lián)單 元,用于將同一分類或近似分類下的網(wǎng)頁(yè)信息建立關(guān)聯(lián),并響應(yīng)應(yīng)用層單元的 調(diào)用,互相推薦各自的網(wǎng)頁(yè)內(nèi)容。
32、 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,還包括網(wǎng)頁(yè)屬性分析 單元,用于建立關(guān)鍵詞-分類-廣告或信息排名三者之間的對(duì)應(yīng)關(guān)系,并根椐 用戶輸入的關(guān)4建詞和選定的分類,展示相應(yīng)的廣告或信息排名。
全文摘要
本發(fā)明公開(kāi)了一種網(wǎng)頁(yè)信息分類方法及系統(tǒng),涉及信息索引的存儲(chǔ)方式,解決現(xiàn)有信息索引方式提供的搜索服務(wù),對(duì)用戶要求高、搜索結(jié)果不準(zhǔn)確、搜索質(zhì)量有待提高的問(wèn)題。所述方法包括以樹(shù)型結(jié)構(gòu)建立網(wǎng)頁(yè)信息的初始分類;如果任一類別下的信息數(shù)目達(dá)到預(yù)設(shè)值,則對(duì)該類別進(jìn)行分裂,所述分裂包括按照網(wǎng)頁(yè)間的相似度執(zhí)行聚類操作,將相似度達(dá)到預(yù)設(shè)量級(jí)值的網(wǎng)頁(yè)聚為一個(gè)類別;剩下的網(wǎng)頁(yè)設(shè)為一個(gè)孤立網(wǎng)頁(yè)類。本發(fā)明對(duì)信息的分類在廣度和深度上更加全面、深入,可以支持更多的應(yīng)用服務(wù)。本發(fā)明還提供了一種應(yīng)用該分類的服務(wù)系統(tǒng)。
文檔編號(hào)G06F17/30GK101266603SQ20071007944
公開(kāi)日2008年9月17日 申請(qǐng)日期2007年3月12日 優(yōu)先權(quán)日2007年3月12日
發(fā)明者斌 梁 申請(qǐng)人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1