信息庫的生成方法及裝置、信息的搜索方法
【專利摘要】本申請(qǐng)公開了一種信息庫的生成方法及裝置、信息的搜索方法。該信息庫的生成方法包括:確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群;記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息;保存記錄到的所有信息而形成信息庫。通過搜集用戶群內(nèi)所有用戶具有相同類屬性的信息,來構(gòu)建具有特有屬性特征的信息庫,以滿足用戶搜索特有屬性信息的需求。
【專利說明】
信息庫的生成方法及裝置、信息的搜索方法
技術(shù)領(lǐng)域
[0001]本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種信息庫的生成方法及裝置、信息的搜索方法。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中,互聯(lián)網(wǎng)用戶在搜索引擎上搜索一般性新聞資訊時(shí),得出的搜索結(jié)果會(huì)較好的匹配到用戶初始的目標(biāo)資訊或信息。然而,由于一般搜索引擎的后臺(tái)數(shù)據(jù)庫內(nèi)的信息并非完全是目標(biāo)信息,因此用戶在互聯(lián)網(wǎng)搜索引擎上搜索一些需要的目標(biāo)資訊或信息時(shí),得出的搜索結(jié)果往往會(huì)夾雜一些非目標(biāo)的資訊或信息,因此搜索結(jié)論并不能精準(zhǔn)的匹配到用戶所要查找的目標(biāo)資訊或信息。
【發(fā)明內(nèi)容】
[0003]本申請(qǐng)?zhí)峁┮环N信息庫的生成方法及裝置,用以解決現(xiàn)有技術(shù)中作為搜索引擎后臺(tái)數(shù)據(jù)庫的信息庫中信息與用戶搜索的目標(biāo)信息不能很好地匹配的問題。
[0004]一種信息庫的生成方法,包括:
[0005]確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群;
[0006]記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息;
[0007]保存記錄到的所有信息而形成信息庫。
[0008]一種信息庫的生成裝置,包括:
[0009]確定模塊,用于確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群;
[0010]記錄模塊,用于記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息;
[0011]保存模塊,用于保存記錄到的所有信息而形成信息庫。
[0012]本申請(qǐng)?zhí)峁┑囊环N信息庫的生成方法及裝置,通過搜集用戶群內(nèi)所有用戶具有相同類屬性的信息,來構(gòu)建具有特有屬性特征的信息庫,以滿足用戶搜索特有屬性信息的需求。特別地,當(dāng)用戶需要搜索專業(yè)信息時(shí),本申請(qǐng)信息庫的生成方法,包括搜集具有相同專業(yè)背景且相互關(guān)聯(lián)的人員產(chǎn)生的專業(yè)信息,并通過搜集到的專業(yè)信息為基礎(chǔ)建立信息庫。由于信息庫內(nèi)的信息均為專業(yè)人員產(chǎn)生的信息,因此信息庫內(nèi)的信息專業(yè)、全面可供搜索用戶搜索使用。
[0013]本申請(qǐng)?zhí)徇€供一種信息的搜索方法,用以解決現(xiàn)有技術(shù)中用戶無法精確搜索到所需要的專業(yè)信息的問題。
[0014]—種信息的搜索方法,包括:
[0015]接收輸入的搜索詞;
[0016]查詢到與所述輸入搜索詞對(duì)應(yīng)的信息庫;
[0017]提供所述信息庫內(nèi)與所述搜索詞相匹配的信息。
[0018]本申請(qǐng)實(shí)施例提供一種信息的搜索方法,用戶在搜索信息時(shí),能夠快速查找到該索搜詞對(duì)應(yīng)的信息庫,并提供用戶想要得到的準(zhǔn)確信息。特別在以特定人員的姓名為關(guān)鍵詞搜索專業(yè)信息時(shí),該特定人員及與該特定人員相關(guān)聯(lián)的人員產(chǎn)生的信息均會(huì)被搜索出來,使得搜索人員得到的信息更專業(yè)、更全面、更準(zhǔn)確。
【附圖說明】
[0019]此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0020]圖1為本申請(qǐng)實(shí)施例提供的信息庫的生成方法的過程示意圖;
[0021]圖2為本申請(qǐng)實(shí)施例提供的信息庫的生成方法的一個(gè)過程的進(jìn)一步示意圖;
[0022]圖3為本申請(qǐng)實(shí)施例提供的信息的生成裝置的結(jié)構(gòu)示意圖;
[0023]圖4為本申請(qǐng)實(shí)施例提供的信息的搜索方法的過程示意圖。
【具體實(shí)施方式】
[0024]為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0025]圖1為本申請(qǐng)實(shí)施例提供的信息庫的生成方法,具體包括以下步驟:
[0026]Sll:確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群;
[0027]在本申請(qǐng)實(shí)施例中,每個(gè)互聯(lián)網(wǎng)用戶在互聯(lián)網(wǎng)上都有其身份標(biāo)簽,互聯(lián)網(wǎng)用戶通過其身份標(biāo)簽來被他人識(shí)別。用戶的身份標(biāo)簽一般由用戶自己填寫,身份標(biāo)簽的信息包括姓名、職業(yè)、專業(yè)、工作單位、電話號(hào)碼、郵件、帳號(hào)等信息。
[0028]在本申請(qǐng)實(shí)施例中,相同屬性的用戶指具有相同專業(yè)背景的用戶。比如,若干用戶的身份標(biāo)簽內(nèi)的專業(yè)信息均為醫(yī)生,那么上述用戶即具有相同的屬性。需要說明的是,有些用戶的身份標(biāo)簽只填寫了職業(yè)信息,雖然職業(yè)信息不同但也有可能具有相同專業(yè),即相同屬性。比如,有的用戶身份標(biāo)簽的職業(yè)為律師、有的用戶身份標(biāo)簽的職業(yè)為法官,雖然二者的職業(yè)不一樣,但均具有法律專業(yè)背景,因此二者也可以視為具有相同屬性。另外,從用戶的身份標(biāo)簽的工作單位也可以大致確認(rèn)其專業(yè)。比如,用戶的身份標(biāo)簽的工作單位為IBM,那該用戶的專業(yè)很有可能是IT專業(yè),那么該用戶與其他IT專業(yè)的用戶屬于相同的屬性。
[0029]在本申請(qǐng)實(shí)施例中,若干相互關(guān)聯(lián)的用戶指若干具有直接聯(lián)系或間接聯(lián)系的用戶。具有直接聯(lián)系的用戶是指兩用戶之間有可以直接聯(lián)絡(luò)。比如,用戶A與用戶B在即時(shí)通訊工具中互為好友,或者在各自的電話簿中互有對(duì)方的號(hào)碼。間接聯(lián)系的用戶指兩用戶之間無直接聯(lián)系,但均與一個(gè)第三用戶有直接聯(lián)系,那么該兩用戶之間就存在間接聯(lián)系。比如,用戶A與用戶B有直接聯(lián)系、用戶B與用戶C之間也有直接聯(lián)系,那么用戶A與用戶C之間就存在間接聯(lián)系。
[0030]圖2為步驟Sll確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群的進(jìn)一步示意圖,具體包括:
[0031]Slll:選定一個(gè)具有特定屬性的中心用戶。
[0032]比如,選定A為一個(gè)中心用戶,其具有醫(yī)學(xué)專業(yè)背景。
[0033]S112:確定與所述中心用戶有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)用戶。
[0034]比如,中心用戶A與bl、b2、b3之間有直接聯(lián)系,bl與cl、c2、c3之間有直接聯(lián)系,b2與c4、c5、d6之間有直接聯(lián)系,b3與c7、c8、c9之間也有直接聯(lián)系。關(guān)聯(lián)用戶bl、b2、b3是中心用戶A的第一度關(guān)系圈(或稱第一度人脈圈),關(guān)聯(lián)用戶cl、c2、c3、c4、c5、c6、c7、c8、c9為中心用戶A的第二度關(guān)系圈。需要說明的,根據(jù)信息庫對(duì)專業(yè)信息覆蓋面或量的需求,以中心用戶A為基礎(chǔ),不局限于第一度、第二度關(guān)系圈,可以在第二度關(guān)系圈的基礎(chǔ)上可以向外逐步展開第三度關(guān)系圈,以此類推可以得需要的關(guān)聯(lián)用戶。
[0035]S113:從確定出的關(guān)聯(lián)用戶中,篩選出與所述中心用戶具有相同屬性的若干關(guān)聯(lián)用戶,構(gòu)成用戶群。
[0036]繼續(xù)沿用上例說明,即將S112步驟確定的關(guān)聯(lián)用戶bl-b3,cl_c9中與中心用戶A不具有相同屬性的關(guān)聯(lián)用戶刪除,篩選出與中心用戶A具有相同屬性的關(guān)聯(lián)用戶。
[0037]通過步驟Slll至S113即可確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群。
[0038]S12:記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息。
[0039]在本申請(qǐng)實(shí)施例中,一般用戶在互聯(lián)網(wǎng)上會(huì)產(chǎn)生一些操作行為,比如,瀏覽信息、收藏瀏覽過得信息及發(fā)表相關(guān)信息。記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息,具體指記錄所述用戶群內(nèi)每個(gè)用戶在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其專業(yè)相匹配的?目息O
[0040]收集記錄用戶在互聯(lián)網(wǎng)上產(chǎn)生的信息可以通過cookie追蹤來實(shí)現(xiàn)。cookie是由用戶訪問網(wǎng)站的后臺(tái)服務(wù)器端生成,發(fā)送給瀏覽器,瀏覽器會(huì)將cookie的key/value保存到某個(gè)目錄下的文本文件內(nèi),用戶下次請(qǐng)求訪問同一網(wǎng)站時(shí)就發(fā)送該cookie給該網(wǎng)站的后臺(tái)服務(wù)器。Cookie中包含了各種互聯(lián)網(wǎng)賬號(hào)、計(jì)算機(jī)名、使用的瀏覽器、曾經(jīng)訪問的網(wǎng)站、瀏覽記錄等信息。因此,通過cookie可以識(shí)別用戶群內(nèi)的所有用戶并追蹤用戶產(chǎn)生的與其專業(yè)相關(guān)的信息。
[0041]S13:保存記錄到的所有信息而形成信息庫。
[0042]在本申請(qǐng)實(shí)施例中,可以根據(jù)記錄的信息的重要性標(biāo)識(shí),或者用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息;保存篩選出的重要信息,形成信息庫。根據(jù)用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息,具體包括:根據(jù)用戶對(duì)記錄的信息的瀏覽時(shí)間和/或翻頁速度,從記錄的信息中篩選出重要信息。需要說明的是,用戶通過專業(yè)瀏覽器在互聯(lián)網(wǎng)上進(jìn)行操作行為時(shí),可以針對(duì)自己瀏覽過的信息、收藏的信息進(jìn)行重要性的標(biāo)識(shí)。
[0043]保存記錄到的所有信息而形成信息庫,具體包括:保存所有信息對(duì)應(yīng)網(wǎng)頁的URL ;抓取URL對(duì)應(yīng)的網(wǎng)頁內(nèi)容;將網(wǎng)頁內(nèi)容存儲(chǔ)形成信息庫。
[0044]以上為本申請(qǐng)實(shí)施例提供的信息庫的生成方法,基于同樣的思路,本申請(qǐng)實(shí)施例提供的信息庫的生成裝置,如圖3所示。
[0045]圖3為本申請(qǐng)實(shí)施例提供的信息庫的生成裝置結(jié)構(gòu)示意圖,具體包括:
[0046]確定模塊21,用于確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群;
[0047]記錄模塊22,用于記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息;
[0048]保存模塊23,用于保存記錄到的所有信息而形成信息庫。
[0049]所述確定模塊21,具體包括:
[0050]選定單元211,用于選定一個(gè)具有特定屬性的中心用戶;
[0051]確定單元212,用于確定與所述中心用戶有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)用戶;
[0052]篩選單元213,用于從確定出的關(guān)聯(lián)用戶中,篩選出與所述中心用戶具有相同屬性的若干關(guān)聯(lián)用戶,構(gòu)成用戶群。
[0053]所述屬性是用戶的專業(yè)。
[0054]所述記錄模塊22,具體用于記錄所述用戶群內(nèi)每個(gè)用戶在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其屬性相匹配的信息。
[0055]所述保存模塊23,具體用于根據(jù)記錄的信息的重要性標(biāo)識(shí),或者用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息;保存篩選出的重要信息,形成信息庫。
[0056]所述用戶對(duì)記錄的信息的瀏覽行為,具體包括:用戶對(duì)記錄的信息的瀏覽時(shí)間和/或翻頁速度。
[0057]所述保存模塊23,具體包括:
[0058]保存單元231,用于保存所有信息對(duì)應(yīng)網(wǎng)頁的URL ;
[0059]抓取單元232,用于抓取URL對(duì)應(yīng)的網(wǎng)頁內(nèi)容;
[0060]存儲(chǔ)單元233,用于將網(wǎng)頁內(nèi)容存儲(chǔ)形成信息庫。
[0061]本申請(qǐng)?zhí)峁┑囊环N信息庫的生成方法及裝置,通過搜集用戶群內(nèi)所有用戶具有相同類屬性的信息,來構(gòu)建具有特有屬性特征的信息庫,以滿足用戶搜索特有屬性信息的需求。特別地,當(dāng)用戶需要搜索專業(yè)信息時(shí),本申請(qǐng)信息庫的生成方法,包括搜集具有相同專業(yè)背景且相互關(guān)聯(lián)的人員產(chǎn)生的專業(yè)信息,并通過搜集到的專業(yè)信息為基礎(chǔ)建立信息庫。由于信息庫內(nèi)的信息均為專業(yè)人員產(chǎn)生的信息,因此信息庫內(nèi)的信息專業(yè)、全面可供搜索用戶搜索使用。
[0062]圖4為本申請(qǐng)實(shí)施例提供的信息的搜索方法,具體包括以下步驟:
[0063]S31:接收輸入的搜索詞。
[0064]在本申請(qǐng)實(shí)施例中,搜索引擎接收搜索用戶輸入的搜索詞,該搜索詞與其所要查找的目標(biāo)信息相對(duì)應(yīng)。
[0065]S32:查詢與所述輸入的搜索詞對(duì)應(yīng)的信息庫。
[0066]在本申請(qǐng)實(shí)施例中,搜索引擎后臺(tái)數(shù)據(jù)庫中包含若干各種類型的專業(yè)信息庫,因此先查詢與所述搜索詞對(duì)應(yīng)的信息庫。比如,需要搜索關(guān)于補(bǔ)牙、植牙的信息,則先查詢醫(yī)學(xué)類的信息庫。
[0067]S33:提供所述信息庫內(nèi)與所述搜索詞相匹配的信息。
[0068]當(dāng)步驟S31接收輸入的搜索詞為特定人員的姓名時(shí),同時(shí)該特定人員具有特定的專業(yè)時(shí)。步驟S33所述提供所述信息庫內(nèi)與所述搜索詞相匹配的信息,進(jìn)一步具體包括:
[0069]查找到與所述特定人員相關(guān)聯(lián)且具有相同專業(yè)的關(guān)聯(lián)人員;
[0070]提供所述特定人員及其關(guān)聯(lián)人員在信息庫內(nèi)的所有信息。
[0071]所述查找到與所述特定人員相關(guān)聯(lián)且具有相同專業(yè)的關(guān)聯(lián)人員,具體包括:
[0072]查找到與所述特定人員有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)人員;
[0073]從所述關(guān)聯(lián)人員中,篩選出與所述特定人員有具有相同專業(yè)的關(guān)聯(lián)人員。
[0074]需要說明的是,所述信息庫是通過信息庫的生成方法所建立的信息庫,該信息庫內(nèi)的信息為特定人員及關(guān)聯(lián)人員在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其專業(yè)相關(guān)的信息。
[0075]本申請(qǐng)實(shí)施例提供一種信息的搜索方法,用戶在搜索信息時(shí),能夠快速查找到該索搜詞對(duì)應(yīng)的信息庫,并提用戶想要得到的準(zhǔn)確信息。特別在以特定人員的姓名為關(guān)鍵詞搜索專業(yè)信息時(shí),該特定人員及與該特定人員相關(guān)聯(lián)的人員產(chǎn)生的信息均會(huì)被搜索出來,使得搜索人員得到的信息更專業(yè)、更全面、更準(zhǔn)確。
[0076]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0077]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0078]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0079]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0080]在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0081]內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
[0082]計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
[0083]還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。
[0084]本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0085]以上所述僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來說,本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種信息庫的生成方法,其特征在于,包括: 確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群; 記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息; 保存記錄到的所有信息而形成信息庫。2.如權(quán)利要求1所述的方法,其特征在于,所述確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群,具體包括: 選定一個(gè)具有特定屬性的中心用戶; 確定與所述中心用戶有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)用戶; 從確定出的關(guān)聯(lián)用戶中,篩選出與所述中心用戶具有相同屬性的若干關(guān)聯(lián)用戶,構(gòu)成用戶群。3.如權(quán)利要求1或2所述的方法,其特征在于,所述屬性是用戶的專業(yè)。4.如權(quán)利要求1所述的方法,其特征在于,所述記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息,具體包括: 記錄所述用戶群內(nèi)每個(gè)用戶在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其屬性相匹配的信息。5.如權(quán)利要求4所述的方法,其特征在于,保存記錄到的所有信息而形成信息庫,具體包括: 根據(jù)記錄的信息的重要性標(biāo)識(shí),或者用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息; 保存篩選出的重要信息,形成信息庫。6.如權(quán)利要求5所述的方法,其特征在于,根據(jù)用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息,具體包括: 根據(jù)用戶對(duì)記錄的信息的瀏覽時(shí)間和/或翻頁速度,從記錄的信息中篩選出重要信息。7.如權(quán)利要求1所述的方法,其特征在于,所述保存記錄到的所有信息而形成信息庫,具體包括: 保存所有信息對(duì)應(yīng)網(wǎng)頁的URL ; 抓取URL對(duì)應(yīng)的網(wǎng)頁內(nèi)容; 將網(wǎng)頁內(nèi)容存儲(chǔ)形成信息庫。8.一種信息庫的生成裝置,其特征在于,包括: 確定模塊,用于確定包括若干相互關(guān)聯(lián)且具有相同屬性的用戶的用戶群; 記錄模塊,用于記錄所述用戶群內(nèi)每個(gè)用戶產(chǎn)生的與其屬性相匹配的信息; 保存模塊,用于保存記錄到的所有信息而形成信息庫。9.如權(quán)利要求8所述的裝置,其特征在于,所述確定模塊,具體包括: 選定單元,用于選定一個(gè)具有特定屬性的中心用戶; 確定單元,用于確定與所述中心用戶有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)用戶; 篩選單元,用于從確定出的關(guān)聯(lián)用戶中,篩選出與所述中心用戶具有相同屬性的若干關(guān)聯(lián)用戶,構(gòu)成用戶群。10.如權(quán)利要求8或9所述的裝置,其特征在于,所述屬性是用戶的專業(yè)。11.如權(quán)利要求8所述的裝置,其特征在于,所述記錄模塊,具體用于記錄所述用戶群內(nèi)每個(gè)用戶在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其屬性相匹配的信息。12.如權(quán)利要求11所述的裝置,其特征在于,所述保存模塊,具體用于根據(jù)記錄的信息的重要性標(biāo)識(shí),或者用戶對(duì)記錄的信息的瀏覽行為,從記錄的信息中篩選出重要信息; 保存篩選出的重要信息,形成信息庫。13.如權(quán)利要求12所述的裝置,其特征在于,所述用戶對(duì)記錄的信息的瀏覽行為,具體包括: 用戶對(duì)記錄的信息的瀏覽時(shí)間和/或翻頁速度。14.如權(quán)利要求8所述的裝置,其特征在于,所述保存模塊,具體包括: 保存單元,用于保存所有信息對(duì)應(yīng)網(wǎng)頁的URL ; 抓取單元,用于抓取URL對(duì)應(yīng)的網(wǎng)頁內(nèi)容; 存儲(chǔ)單元,用于將網(wǎng)頁內(nèi)容存儲(chǔ)形成信息庫。15.一種信息的搜索方法,其特征在于,包括: 接收輸入的搜索詞; 查詢到與所述輸入搜索詞對(duì)應(yīng)的信息庫; 提供所述信息庫內(nèi)與所述搜索詞相匹配的信息。16.如權(quán)利要求15所述的方法,其特征在于,所述搜索詞為特定人員的姓名,所述特定人員具有特定的專業(yè)。17.如權(quán)利要求16所述的方法,其特征在于,所述提供所述信息庫內(nèi)與所述搜索詞相匹配的信息,具體包括: 查找到與所述特定人員相關(guān)聯(lián)且具有相同專業(yè)的關(guān)聯(lián)人員; 提供所述特定人員及其關(guān)聯(lián)人員在信息庫內(nèi)的所有信息。18.如權(quán)利要求17所述的方法,其特征在于,所述查找到與所述特定人員相關(guān)聯(lián)且具有相同專業(yè)的關(guān)聯(lián)人員,具體包括: 查找到與所述特定人員有直接聯(lián)系和間接聯(lián)系的關(guān)聯(lián)人員; 從所述關(guān)聯(lián)人員中,篩選出與所述特定人員有具有相同專業(yè)的關(guān)聯(lián)人員。19.如權(quán)利要求17或18所述的方法,其特征在于,所述信息庫內(nèi)的信息為特定人員及關(guān)聯(lián)人員在互聯(lián)網(wǎng)上發(fā)表、瀏覽、收藏的與其專業(yè)相關(guān)的信息。
【文檔編號(hào)】G06F17/30GK106033413SQ201510102743
【公開日】2016年10月19日
【申請(qǐng)日】2015年3月9日
【發(fā)明人】李立中, 虞教來
【申請(qǐng)人】阿里巴巴集團(tuán)控股有限公司