亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種搜索用戶的方法與裝置與流程

文檔序號(hào):12926803閱讀:303來源:國(guó)知局
一種搜索用戶的方法與裝置與流程
本發(fā)明涉及計(jì)算機(jī)通信技術(shù),特別涉及一種搜索用戶的方法與裝置。

背景技術(shù):
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,通過點(diǎn)對(duì)點(diǎn)的技術(shù)來實(shí)現(xiàn)互聯(lián)網(wǎng)上的即時(shí)溝通的即時(shí)通信(IM,InstantMessaging)軟件工具應(yīng)用越來越普遍,IM已經(jīng)被大多數(shù)的用戶所接受并成為用戶日常生活以及工作中必不可少的一部分,用戶通過IM軟件,可以實(shí)現(xiàn)與朋友、同事以及同學(xué)之間的交流與溝通。微型博客作為IM工具應(yīng)用的一部分,是一個(gè)基于用戶關(guān)系的信息分享、傳播以及獲取平臺(tái),用戶可以通過個(gè)人PC、移動(dòng)電話等終端設(shè)備,通過140個(gè)字左右的一句話來表達(dá)自己情感,與關(guān)注自己的用戶分享,從而實(shí)現(xiàn)個(gè)人信息即時(shí)分享、用戶間互動(dòng),是目前發(fā)展最為迅猛的互聯(lián)網(wǎng)業(yè)務(wù)。由于微型博客應(yīng)用的廣泛性,用戶可以方便地通過IM客戶端進(jìn)行社區(qū)內(nèi)用戶信息咨詢與搜索,例如,通過與類似數(shù)據(jù)庫(kù)搜索的方法實(shí)現(xiàn)用戶信息搜索,舉例來說,用戶登錄社區(qū),在社區(qū)的搜索欄中輸入用戶昵稱或用戶名等搜索關(guān)鍵詞,搜索引擎(搜索服務(wù)器)根據(jù)完全匹配算法(例如,字符串匹配算法)查詢與用戶昵稱相匹配的用戶信息中的用戶昵稱,并將該用戶昵稱信息向用戶展示。由上述可見,現(xiàn)有搜索用戶的方法,通過用戶昵稱或用戶名等搜索關(guān)鍵詞在社區(qū)內(nèi)進(jìn)行用戶搜索,搜索手段單一,難以滿足搜索用戶日益增長(zhǎng)的信息搜索需求;進(jìn)一步地,采用與搜索關(guān)鍵詞完全匹配的搜索方法,使得搜索結(jié)果可能遺漏搜索用戶所需信息,搜索效率較低,降低了用戶的搜索體驗(yàn);而且,展示的用戶信息中的用戶昵稱或用戶名內(nèi)容較少,缺少對(duì)該用戶的輔助性描述信息。

技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提出一種搜索用戶的方法,能夠提升搜索效率。本發(fā)明還提出一種搜索用戶的裝置,能夠提升搜索效率。為達(dá)到上述目的,本發(fā)明提供了一種搜索用戶的方法,該方法包括:獲取社區(qū)中各用戶信息;對(duì)所述用戶信息進(jìn)行分詞處理,得到候選索引詞語(yǔ);根據(jù)預(yù)先設(shè)置的詞語(yǔ)過濾策略對(duì)候選索引詞語(yǔ)進(jìn)行過濾,得到索引詞語(yǔ),所述過濾包括從所述候選索引詞語(yǔ)中去除無意義詞語(yǔ);對(duì)索引詞語(yǔ)進(jìn)行索引處理,得到索引信息,所述索引信息用于映射進(jìn)行處理前的用戶信息;接收用戶輸入的搜索關(guān)鍵詞,分別在存儲(chǔ)的所述用戶信息以及所述索引信息中查詢獲取該搜索關(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息,并將查詢得到的結(jié)果輸出。進(jìn)一步包括:獲取索引信息對(duì)應(yīng)的用戶,查詢?cè)撚脩舭l(fā)表的信息;基于各用戶發(fā)表的信息,獲取用戶行為特征信息;根據(jù)獲取的用戶行為特征信息計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)并排序,輸出排序前N位的用戶對(duì)應(yīng)的索引信息結(jié)果,其中,N為自然數(shù)。進(jìn)一步包括:獲取排序前N位的用戶,與執(zhí)行搜索的用戶的好友信息進(jìn)行匹配,根據(jù)匹配結(jié)果調(diào)整排序,將調(diào)整排序后的用戶對(duì)應(yīng)的索引信息結(jié)果輸出。進(jìn)一步包括:對(duì)各用戶發(fā)表的信息進(jìn)行分詞處理,得到候選索引詞語(yǔ)。進(jìn)一步包括:對(duì)用戶信息中的用戶昵稱進(jìn)行多元字符組合處理,并將得到的多元字符組合作為索引信息。所述用戶行為特征信息包括:用戶質(zhì)量特征屬性、文本質(zhì)量特征屬性、傳播熱度特征屬性以及時(shí)間緯度特征屬性中的一個(gè)或其任意組合。所述計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)包括:分別獲取用戶質(zhì)量特征屬性值、文本質(zhì)量特征屬性值、傳播熱度特征屬性值以及時(shí)間緯度特征屬性值;將預(yù)先設(shè)置的權(quán)重系數(shù)分別與獲取的用戶質(zhì)量特征屬性值、文本質(zhì)量特征屬性值、傳播熱度特征屬性值以及時(shí)間緯度特征屬性值相乘;計(jì)算相乘后得到的各值的和,作為所述用戶優(yōu)先級(jí)分?jǐn)?shù)。一種搜索用戶的裝置,該裝置包括:信息挖掘模塊以及搜索查詢模塊,其中,信息挖掘模塊,用于獲取社區(qū)中各用戶信息;切分處理單元,用于對(duì)所述用戶信息進(jìn)行分詞處理,得到候選索引詞語(yǔ);過濾單元,用于根據(jù)預(yù)先設(shè)置的詞語(yǔ)過濾策略對(duì)候選索引詞語(yǔ)進(jìn)行過濾,得到索引詞語(yǔ),所述過濾包括從所述候選索引詞語(yǔ)中去除無意義詞語(yǔ);索引處理單元,用于對(duì)索引詞語(yǔ)進(jìn)行索引處理,得到索引信息,所述索引信息用于映射進(jìn)行處理前的用戶信息;搜索查詢模塊,用于接收用戶輸入的搜索關(guān)鍵詞,分別在存儲(chǔ)的所述用戶信息以及所述索引信息中查詢?cè)撍阉麝P(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息,并將查詢得到的結(jié)果輸出,并將查詢得到的結(jié)果輸出。進(jìn)一步包括:用戶行為特征信息獲取模塊、優(yōu)先級(jí)分?jǐn)?shù)計(jì)算及排序模塊,其中,用戶行為特征信息獲取模塊,用于獲取索引信息對(duì)應(yīng)的用戶,查詢?cè)撚脩舭l(fā)表的信息,基于各用戶發(fā)表的信息,獲取用戶行為特征信息;優(yōu)先級(jí)分?jǐn)?shù)計(jì)算及排序模塊,用于根據(jù)獲取的用戶行為特征信息計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)并排序后輸出排序前N位的用戶對(duì)應(yīng)的索引信息結(jié)果,其中,N為自然數(shù)。進(jìn)一步包括:匹配模塊,用于獲取排序前N位的用戶,與執(zhí)行搜索的用戶的好友信息進(jìn)行匹配,根據(jù)匹配結(jié)果調(diào)整排序,將調(diào)整排序后的用戶對(duì)應(yīng)的索引信息結(jié)果輸出。所述切分處理單元進(jìn)一步用于獲取社區(qū)中各用戶發(fā)表的信息,并對(duì)信息進(jìn)行分詞處理,得到候選索引詞語(yǔ)。所述信息挖掘模塊進(jìn)一步包括:字符組合索引單元,用于對(duì)用戶信息中的用戶昵稱進(jìn)行多元字符組合處理,并將得到的多元字符組合作為備注的索引信息。由上述的技術(shù)方案可見,本發(fā)明實(shí)施例提供的一種搜索用戶的方法及裝置,獲取社區(qū)中各用戶信息,并對(duì)獲取的用戶信息進(jìn)行處理,生成索引信息;接收用戶輸入的搜索關(guān)鍵詞,分別在存儲(chǔ)的用戶信息以及索引信息中查詢獲取該搜索關(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息,并將查詢得到的結(jié)果輸出。這樣,通過對(duì)用戶進(jìn)行索引處理,使得執(zhí)行搜索的用戶只要輸入索引信息中的任一索引信息作為搜索關(guān)鍵詞,都能夠獲取該用戶信息以及設(shè)置的與該用戶對(duì)應(yīng)的索引信息,不僅擴(kuò)展了搜索手段,而且可以獲取盡可能多的該用戶相關(guān)信息,從而提升搜索效率以及用戶搜索體驗(yàn)。附圖說明圖1為本發(fā)明實(shí)施例的搜索用戶的方法流程示意圖。圖2為本發(fā)明實(shí)施例的搜索用戶的方法具體流程示意圖。圖3為本發(fā)明實(shí)施例的搜索用戶的裝置結(jié)構(gòu)示意圖。具體實(shí)施方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。現(xiàn)有通過用戶昵稱采用字符串完全匹配算法搜索用戶的方法,需要用戶輸入準(zhǔn)確的用戶昵稱或用戶名,如果輸入的用戶昵稱或用戶名不準(zhǔn)確,則會(huì)導(dǎo)致搜索失敗,使得搜索手段單一,難以滿足搜索用戶日益增長(zhǎng)的信息搜索需求,搜索效率較低。本發(fā)明實(shí)施例中,考慮對(duì)用戶信息進(jìn)行切詞以及分詞處理,并對(duì)切詞以及分詞處理的用戶信息進(jìn)行索引處理以提供用戶的輔助性描述信息,從而擴(kuò)展與用戶輸入的搜索關(guān)鍵詞相匹配的索引,在展示用戶信息的同時(shí),將該用戶對(duì)應(yīng)的索引信息一并展示,提升用戶的搜索體驗(yàn)。圖1為本發(fā)明實(shí)施例的搜索用戶的方法流程示意圖。參見圖1,該流程包括:步驟101,獲取社區(qū)中各用戶信息,并對(duì)獲取的用戶信息進(jìn)行處理,生成索引信息;本步驟中,用戶信息是指用戶在業(yè)務(wù)內(nèi)的個(gè)人資料信息,包括:用戶名、用戶標(biāo)識(shí)(ID)、用戶昵稱、個(gè)人說明等,其數(shù)據(jù)結(jié)構(gòu)具體可參見相關(guān)技術(shù)文獻(xiàn),在此不再贅述。其中,個(gè)人說明包括:說明文本以及備注描述文本。對(duì)獲取的用戶信息進(jìn)行處理,生成索引信息包括:A11、對(duì)用戶信息進(jìn)行分詞處理,得到候選索引詞語(yǔ);本步驟中,可以根據(jù)用戶信息中的用戶名、用戶昵稱、備注描述文本、說明文本,進(jìn)行分詞處理,得到各候選索引詞語(yǔ)。其中,備注描述文本包括用戶的學(xué)習(xí)經(jīng)歷、職業(yè)生涯等。關(guān)于進(jìn)行分詞處理的流程,屬于現(xiàn)有技術(shù),具體可參見相關(guān)技術(shù)文獻(xiàn),在此不再贅述。進(jìn)一步地,還可以對(duì)各用戶發(fā)表的信息,基于數(shù)據(jù)挖掘并進(jìn)行索引處理。即執(zhí)行步驟A11′。A11′、對(duì)各用戶發(fā)表的信息進(jìn)行分詞處理,得到候選索引詞語(yǔ);A12、根據(jù)預(yù)先設(shè)置的詞語(yǔ)過濾策略對(duì)候選索引詞語(yǔ)進(jìn)行過濾,得到索引詞語(yǔ);本步驟中,經(jīng)分詞處理后得到的各詞語(yǔ)中,包括一些停用詞以及無關(guān)詞性詞,該停用詞以及無關(guān)詞性詞對(duì)用戶的搜索來說是冗余的,不具有實(shí)際意義,因而,需要進(jìn)行過濾。其中,停用詞是指無意義的常見詞或一些符號(hào),例如,“的”、“能”、“在”、“和”、“他”等,無關(guān)詞性詞包括:連詞、狀態(tài)詞、語(yǔ)氣虛詞、形容詞、代詞等,例如,代詞有“你”、“我”、“他”等,連詞有“和”、“與”等。A13、對(duì)索引詞語(yǔ)進(jìn)行索引處理,作為索引信息。本步驟中,對(duì)索引詞語(yǔ)進(jìn)行索引處理后,即將索引信息映射為進(jìn)行分詞處理前的對(duì)應(yīng)用戶信息,這樣,如果用戶輸入的搜索關(guān)鍵詞包含索引詞語(yǔ),則根據(jù)該索引詞語(yǔ),可以搜索到該索引詞語(yǔ)映射的用戶信息,從而擴(kuò)展了搜索手段。較佳地,對(duì)過濾得到的索引詞語(yǔ)中的名詞、人名(尤其是名人)、機(jī)構(gòu)名、職業(yè)名詞、地點(diǎn)名稱加以索引,作為備注的索引信息,這樣,可以確保用戶在通過搜索關(guān)鍵詞(例如,用戶昵稱)進(jìn)行搜索時(shí),同時(shí)能夠獲取該搜索關(guān)鍵詞對(duì)應(yīng)的用戶信息中設(shè)置的索引信息,并進(jìn)行展示,以擴(kuò)展搜索手段,提升搜索效率。本發(fā)明實(shí)施例中,在對(duì)用戶信息中的各個(gè)文本字段進(jìn)行切分、索引后,還可以對(duì)用戶名或用戶昵稱進(jìn)行多元的字符組合,并將得到的多元字符組合作為備注的索引信息。即進(jìn)一步包括:A14、對(duì)用戶信息中的用戶昵稱進(jìn)行多元字符組合處理,并將得到的多元字符組合作為備注的索引信息。本步驟中,通過對(duì)用戶昵稱進(jìn)行多元字符組合處理,可以提高與用戶輸入的搜索關(guān)鍵詞的匹配概率,降低對(duì)用戶輸入的搜索關(guān)鍵詞的準(zhǔn)確度要求。例如,如果用戶昵稱為“ABCD”,則經(jīng)過大小寫轉(zhuǎn)換、全半角轉(zhuǎn)換、繁簡(jiǎn)體轉(zhuǎn)換等處理,并進(jìn)行多元字符組合,會(huì)分別建立備注的索引信息:A、B、C、D、ABC、BCD,其中,A、B、C、D為一元分詞,ABC、BCD為三元分詞,這樣,可以使得用戶輸入的搜索關(guān)鍵詞包括備注的索引中的任意一個(gè)索引詞時(shí),都能搜索到該索引詞對(duì)應(yīng)的用戶昵稱信息。當(dāng)然,實(shí)際應(yīng)用中,也可以采用二元字符組合并分別建立備注的索引信息,例如,AB、AC、AD、BC、BD、CD。上述說明的是建立索引的分詞方式,實(shí)際應(yīng)用中,對(duì)于用戶的檢索請(qǐng)求,其分詞的方式與建立索引的方式可以略有不同,例如,對(duì)于長(zhǎng)度不大于2的搜索關(guān)鍵詞進(jìn)行一元切詞,例如“AB”,可以直接切分成A和B;而對(duì)于長(zhǎng)度大于等于3的搜索關(guān)鍵詞,例如“ABCD”,可以切分成三元分詞的形式,即:ABC和BCD。這樣,對(duì)于用戶昵稱為ABCD,搜索用戶可以通過以下幾種搜索關(guān)鍵詞,搜索(召回)該用戶的情況:1.輸入a或b或c或d,那么請(qǐng)求通過一元分詞召回;2.輸入ab或bc或cd,那么請(qǐng)求被分詞一元分詞,也能被召回;3.輸入abc或bcd,直接三元分詞召回;4.輸入abcd,可以通過三元分詞召回。步驟102,接收用戶輸入的搜索關(guān)鍵詞,分別在存儲(chǔ)的用戶信息以及索引信息中查詢?cè)撍阉麝P(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息,并將查詢得到的結(jié)果輸出。本步驟中,在接收到用戶輸入的搜索關(guān)鍵詞后,從提供搜索服務(wù)的用戶信息以及生成的索引信息中進(jìn)行搜索,即根據(jù)完全匹配算法查詢與搜索關(guān)鍵詞相匹配的用戶信息,以及,在生成的索引信息中查詢與搜索關(guān)鍵詞相匹配的索引信息,并將搜索得到的索引信息、或者,索引信息及用戶信息返回給用戶。這樣,在存儲(chǔ)的用戶信息中如果查詢不到與搜索關(guān)鍵詞相匹配的用戶信息,還可以從存儲(chǔ)的索引信息中查詢與搜索關(guān)鍵詞相匹配的索引信息并展示給用戶,不僅擴(kuò)展了搜索手段,也提升搜索效率,而且,可以獲取盡可能多的該用戶相關(guān)信息,提升了用戶搜索體驗(yàn)。實(shí)際應(yīng)用中,在搜索得到搜索關(guān)鍵詞對(duì)應(yīng)的索引信息、或者,索引信息及用戶信息后,還可以進(jìn)一步包括:步驟103,獲取索引信息對(duì)應(yīng)的用戶,查詢?cè)撚脩舭l(fā)表的信息;本步驟中,基于用戶的訂閱關(guān)系,獲取用戶所在的社交圈,其中,訂閱關(guān)系即用戶之間的關(guān)系表達(dá),例如,用戶A訂閱用戶B形成訂閱關(guān)系后,則用戶B發(fā)出的所有信息都會(huì)推送到用戶A,同樣,用戶A發(fā)出的所有信息都會(huì)推送到用戶B,社交圈指的是用戶在各產(chǎn)品社區(qū)中好友的并集。從用戶所在的社交圈中,查詢用戶在社交圈發(fā)表的信息。步驟104,基于各用戶發(fā)表的信息,獲取用戶行為特征信息;本步驟中,用戶行為特征信息包括:用戶質(zhì)量特征屬性、文本質(zhì)量特征屬性、傳播熱度特征屬性以及時(shí)間緯度特征屬性中的一個(gè)或其任意組合。其中,用戶質(zhì)量特征屬性,用以標(biāo)識(shí)用戶發(fā)表的信息質(zhì)量,通常以發(fā)表的數(shù)量進(jìn)行表征并采用歸一化處理,使得歸一化處理后的用戶質(zhì)量特征屬性值的區(qū)間范圍為[0,1],1表示最活躍的一個(gè)用戶,即發(fā)表的信息數(shù)量最多的用戶對(duì)應(yīng)的用戶質(zhì)量特征屬性值,0表示沒有發(fā)表信息的用戶對(duì)應(yīng)的用戶質(zhì)量特征屬性值。文本質(zhì)量特征屬性,用以標(biāo)識(shí)用戶發(fā)表的信息中包含的名詞數(shù)量,可以采用歸一化處理,文本質(zhì)量特征屬性值的區(qū)間范圍為[0,1],1表示發(fā)表的信息中包含的名詞數(shù)量最多的一個(gè)用戶,即發(fā)表的信息中包含的名詞數(shù)量最多的用戶對(duì)應(yīng)的文本質(zhì)量特征屬性值,0表示沒有發(fā)表信息的用戶對(duì)應(yīng)的文本質(zhì)量特征屬性值。關(guān)于獲取信息中包含的名詞,可以通過前述的分詞處理并進(jìn)行統(tǒng)計(jì)得到。傳播熱度特征屬性,用以標(biāo)識(shí)用戶發(fā)表的各信息的轉(zhuǎn)播數(shù)、評(píng)論數(shù)以及瀏覽次數(shù),可以根據(jù)預(yù)先設(shè)置的策略對(duì)轉(zhuǎn)播數(shù)、評(píng)論數(shù)以及瀏覽次數(shù)進(jìn)行復(fù)合計(jì)算,并通過歸一化處理得到一個(gè)傳播熱度特征屬性值;時(shí)間緯度特征屬性,用以標(biāo)識(shí)用戶發(fā)表的各信息的時(shí)間,搜索到的用戶發(fā)表的信息越晚,表明該信息的時(shí)效性越強(qiáng),其對(duì)應(yīng)的歸一化的時(shí)間緯度特征屬性值也越大。例如,以搜索服務(wù)器存儲(chǔ)的最早的信息時(shí)間戳至當(dāng)前時(shí)間為時(shí)間緯度,并均分為預(yù)先設(shè)置數(shù)量的時(shí)間段,舉例來說,搜索服務(wù)器存儲(chǔ)的最早的信息時(shí)間戳信息為10個(gè)小時(shí)之前,則時(shí)間維度可以設(shè)置為(1,2,3,4,5,6,7,8,9,10),每一個(gè)刻度表示過去的一個(gè)時(shí)間單位(小時(shí)),即1表示信息時(shí)間戳信息為1小時(shí)之前,并設(shè)置每個(gè)刻度對(duì)應(yīng)的時(shí)間緯度特征屬性值,例如,1對(duì)應(yīng)的時(shí)間緯度特征屬性值為1,10對(duì)應(yīng)的時(shí)間緯度特征屬性值為0等。步驟105,根據(jù)獲取的用戶行為特征信息計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)并排序。本步驟中,計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)公式為:v=ξ1×userank+ξ2×textrank+ξ3×hotrank+ξ4×timerank式中,v為用戶優(yōu)先級(jí)分?jǐn)?shù);userank為用戶質(zhì)量特征屬性值;textrank為文本質(zhì)量特征屬性值;hotrank為傳播熱度特征屬性值;timerank為時(shí)間緯度特征屬性值;ξ1、ξ2、ξ3、ξ4為權(quán)重系數(shù),可根據(jù)實(shí)際需要確定,較佳地,0≤ξi≤1,在得到用戶優(yōu)先級(jí)分?jǐn)?shù)后,根據(jù)優(yōu)先級(jí)分?jǐn)?shù)高低進(jìn)行排序,并按照預(yù)先設(shè)置的策略,輸出排序前N位的用戶對(duì)應(yīng)的索引信息結(jié)果,其中,N為自然數(shù)。這樣,基于信息的用戶質(zhì)量特征屬性、文本質(zhì)量特征屬性、傳播熱度特征屬性以及時(shí)間緯度特征屬性,采用綜合相關(guān)性的排序方式,滿足用戶在社區(qū)內(nèi)的信息搜索需求,這是傳統(tǒng)搜索引擎難以實(shí)現(xiàn)的,可以進(jìn)一步提供增強(qiáng)的索引信息結(jié)果,使索引信息結(jié)果更符合搜索用戶的需求,從而進(jìn)一步提升搜索效率以及搜索用戶的搜索體驗(yàn)。較佳地,對(duì)于排序前N位的用戶,還可以進(jìn)一步與用戶的好友圈中的好友信息進(jìn)行匹配,根據(jù)匹配結(jié)果調(diào)整排序,將調(diào)整排序后的用戶對(duì)應(yīng)的索引結(jié)果向搜索用戶展示,即進(jìn)一步包括步驟106。步驟106,獲取排序前N位的用戶,與執(zhí)行搜索的用戶的好友信息進(jìn)行匹配,根據(jù)匹配結(jié)果調(diào)整排序,將調(diào)整排序后的用戶對(duì)應(yīng)的索引信息結(jié)果輸出。本步驟中,舉例來說,根據(jù)用戶離線級(jí)別屬性分?jǐn)?shù)進(jìn)行排序,取前5位用戶,依序?yàn)橛脩?~用戶5,然后,與用戶的好友圈中的好友信息進(jìn)行匹配,其中,用戶2、用戶3以及用戶5為搜索用戶的好友,即與用戶的好友圈中的好友信息匹配成功,則調(diào)整排序后的用戶分別為:用戶2、用戶3、用戶5、用戶1以及用戶4,也就是說,與用戶的好友圈中的好友信息匹配成功的用戶優(yōu)先級(jí)最高,其對(duì)應(yīng)的索引信息優(yōu)先向搜索用戶展示。這樣,通過將排序前N位的用戶再與搜索用戶的好友進(jìn)行匹配,優(yōu)先展示與搜索用戶好友匹配成功的用戶,更進(jìn)一步提升了搜索用戶的搜索體驗(yàn)。由上述可見,本發(fā)明實(shí)施例的搜索用戶的方法,通過獲取社區(qū)中各用戶信息,并基于數(shù)據(jù)挖掘在獲取的用戶信息中增加備注的索引信息;根據(jù)用戶輸入的搜索關(guān)鍵詞,在社區(qū)中查詢獲取該搜索關(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息并輸出。這樣,通過對(duì)用戶進(jìn)行索引處理,使得該用戶中包含有多個(gè)索引信息,因而,搜索用戶只要輸入索引信息中的任一索引信息作為搜索關(guān)鍵詞,都能夠獲取該用戶信息以及設(shè)置的與該用戶對(duì)應(yīng)的索引信息,從而為搜索用戶提供輔助性描述信息,擴(kuò)展了搜索手段,滿足了搜索用戶日益增長(zhǎng)的信息搜索需求,使搜索用戶獲取盡可能多的該用戶相關(guān)信息,從而提升搜索效率以及用戶搜索體驗(yàn)。以下以用戶名為張三、昵稱為xiaoz19889898、個(gè)人說明內(nèi)容為IT民工,貧窮小白領(lǐng)的用戶為例,對(duì)本發(fā)明實(shí)施例的搜索方法進(jìn)行說明。圖2為本發(fā)明實(shí)施例的搜索用戶的方法具體流程示意圖。參見圖2,該流程包括:步驟201,獲取用戶信息;本步驟中,搜索服務(wù)器獲取用戶信息,并提取其中的文本信息,保留用戶信息的主干:張三/xiaoz/IT民工貧窮小白領(lǐng)。步驟202,進(jìn)行分詞處理,得到候選索引詞語(yǔ);本步驟中,根據(jù)現(xiàn)有的分詞處理算法,對(duì)張三/xiaoz/IT民工貧窮小白領(lǐng)進(jìn)行分詞處理,并對(duì)用戶昵稱進(jìn)行多元的字符組合,切分及組合后的結(jié)果是:張、三、張三;x、i、a、o、z、xia、iao、aoz;IT、民工、貧窮、小、白領(lǐng)。步驟203,對(duì)候選索引詞語(yǔ)進(jìn)行過濾,并對(duì)過濾得到的候選索引詞語(yǔ)進(jìn)行索引處理,作為備注的索引信息;本步驟中,從候選索引詞語(yǔ)中去除無意義詞語(yǔ):IT、貧窮、小等,保留民工、白領(lǐng),并為過濾后的候選索引詞語(yǔ)建立索引,即通過建立的索引詞語(yǔ),能夠索引到該索引詞語(yǔ)對(duì)應(yīng)的用戶,通過該用戶,能夠獲取該用戶信息中其他設(shè)置的索引信息。步驟204,將備注的索引信息加載到搜索服務(wù)器;本步驟中,將備注的索引信息加載到搜索服務(wù)器,具體可參見相關(guān)技術(shù)文獻(xiàn),在此不再贅述。步驟205,接收用戶輸入的搜索關(guān)鍵詞,與搜索服務(wù)器中的用戶信息及索引信息進(jìn)行匹配,如果命中,返回搜索結(jié)果;否則,返回搜索無結(jié)果的提示信息。本步驟中,如果用戶輸入的搜索關(guān)鍵詞為“張三”,則經(jīng)過與搜索服務(wù)器中的索引進(jìn)行匹配,向搜索用戶返回匹配的索引結(jié)果:張三:用戶昵稱為xiaoz19889898、民工白領(lǐng)。如果用戶輸入的搜索關(guān)鍵詞為“三”,則經(jīng)過與搜索系統(tǒng)中的索引進(jìn)行匹配,向搜索用戶返回匹配的索引結(jié)果除包括張三:用戶昵稱為xiaoz19889898、民工白領(lǐng)外,還包括與“三”匹配的其他用戶的索引信息,例如,搜索服務(wù)器中存儲(chǔ)的關(guān)于趙三的索引信息。圖3為本發(fā)明實(shí)施例的搜索用戶的裝置結(jié)構(gòu)示意圖。參見圖3,該裝置包括:信息挖掘模塊以及搜索查詢模塊,其中,信息挖掘模塊,用于獲取社區(qū)中各用戶信息,并對(duì)獲取的用戶信息進(jìn)行處理,生成索引信息;搜索查詢模塊,用于接收用戶輸入的搜索關(guān)鍵詞,分別在存儲(chǔ)的用戶信息以及索引信息中查詢?cè)撍阉麝P(guān)鍵詞對(duì)應(yīng)的索引信息及用戶信息,并將查詢得到的結(jié)果輸出。其中,信息挖掘模塊包括:切分處理單元、過濾單元以及索引處理單元(圖中未示出),其中,切分處理單元,用于對(duì)用戶信息進(jìn)行分詞處理,得到候選索引詞語(yǔ);本發(fā)明實(shí)施例中,根據(jù)用戶的用戶名、用戶昵稱、備注描述文本、說明文本,進(jìn)行分詞處理,得到各候選索引詞語(yǔ)。過濾單元,用于根據(jù)預(yù)先設(shè)置的詞語(yǔ)過濾策略對(duì)候選索引詞語(yǔ)進(jìn)行過濾,得到索引詞語(yǔ);索引處理單元,用于對(duì)索引詞語(yǔ)進(jìn)行索引處理,作為備注的索引信息。本發(fā)明實(shí)施例中,較佳地,對(duì)過濾得到的索引詞語(yǔ)中的名詞、人名(尤其是名人)、機(jī)構(gòu)名、職業(yè)名詞、地點(diǎn)名稱加以索引,作為備注的索引信息。切分處理單元進(jìn)一步用于獲取社區(qū)中各用戶發(fā)表的信息,并對(duì)信息進(jìn)行分詞處理,得到候選索引詞語(yǔ)。信息挖掘模塊進(jìn)一步包括:字符組合索引單元,用于對(duì)用戶信息中的用戶昵稱進(jìn)行多元字符組合處理,并將得到的多元字符組合作為備注的索引信息。該裝置進(jìn)一步包括:用戶行為特征信息獲取模塊、優(yōu)先級(jí)分?jǐn)?shù)計(jì)算及排序模塊,其中,用戶行為特征信息獲取模塊,用于獲取索引信息對(duì)應(yīng)的用戶,查詢?cè)撚脩舭l(fā)表的信息,基于各用戶發(fā)表的信息,獲取用戶行為特征信息;本發(fā)明實(shí)施例中,用戶行為特征信息包括:用戶質(zhì)量特征屬性、文本質(zhì)量特征屬性、傳播熱度特征屬性以及時(shí)間緯度特征屬性。其中,優(yōu)先級(jí)分?jǐn)?shù)計(jì)算及排序模塊,用于根據(jù)獲取的用戶行為特征信息計(jì)算用戶優(yōu)先級(jí)分?jǐn)?shù)并排序后輸出排序前N位的用戶對(duì)應(yīng)的索引信息結(jié)果,其中,N為自然數(shù)。較佳地,該裝置進(jìn)一步包括:匹配模塊,用于獲取排序前N位的用戶,與執(zhí)行搜索的用戶的好友信息進(jìn)行匹配,根據(jù)匹配結(jié)果調(diào)整排序,將調(diào)整排序后的用戶對(duì)應(yīng)的索引信息結(jié)果輸出。實(shí)際應(yīng)用中,該搜索用戶的裝置可以是搜索服務(wù)器。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換以及改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1