,例如,助詞“的”具有很高的出現(xiàn)頻率,但其通常具有很低的表意能力,因此,將其收集到停用詞表中。
[0067]具體地,在獲得每個(gè)電子出版物的屬性數(shù)據(jù)的分詞結(jié)果之后,確定兩個(gè)電子出版物的屬性數(shù)據(jù)是否一致的具體操作,還可以有多種方式,下面將舉例詳細(xì)說明其中的兩種具體操作,本實(shí)施例其他的具體操作不進(jìn)行特別限定。
[0068]一個(gè)具體操作,可以將屬性數(shù)據(jù)劃分為不同屬性維度的屬性數(shù)據(jù),例如,作者維度、出版社維度、出版日期維度、ISBN維度和圖書標(biāo)簽維度等。在獲得每個(gè)電子出版物的不同屬性維度的屬性數(shù)據(jù)的分詞結(jié)果之后,可以利用這些不同屬性維度的屬性數(shù)據(jù)的分詞結(jié)果,建立電子出版物的倒排索引列表,進(jìn)而再利用所建立的倒排索引列表,確定屬性數(shù)據(jù)一致的電子出版物。具體地,可以預(yù)先設(shè)置一個(gè)屬性維度閾值例如,3個(gè),若兩個(gè)電子出版物在大于或等于所述屬性維度閾值的屬性維度上,每個(gè)屬性維度的屬性數(shù)據(jù)都是一致的,則可以確定這兩個(gè)電子出版物的屬性數(shù)據(jù)是一致的。
[0069]所謂的屬性維度的屬性數(shù)據(jù)是一致的,是指同一個(gè)分詞結(jié)果同時(shí)對(duì)應(yīng)兩個(gè)電子出版物即電子出版物A和電子出版物B,說明在該分詞結(jié)果所在屬性維度上,這兩個(gè)電子出版物的屬性維度的屬性數(shù)據(jù)是一致的。
[0070]在此需要說明的是,屬性維度的屬性數(shù)據(jù)一致,針對(duì)不同的屬性維度的屬性數(shù)據(jù),有不同的含義。
[0071]例如,針對(duì)作者維度的屬性數(shù)據(jù),是指作者維度的屬性數(shù)據(jù)相同。
[0072]或者,再例如,針對(duì)出版社維度的屬性數(shù)據(jù),是指出版社維度的屬性數(shù)據(jù)相同。
[0073]或者,再例如,針對(duì)出版日期維度的屬性數(shù)據(jù),是指出版日期維度的屬性數(shù)據(jù)相同。
[0074]或者,再例如,針對(duì)ISBN維度的屬性數(shù)據(jù),是指ISBN維度的屬性數(shù)據(jù)相同。
[0075]或者,再例如,針對(duì)圖書標(biāo)簽維度的屬性數(shù)據(jù),是指圖書標(biāo)簽維度的屬性數(shù)據(jù)相同或相似。
[0076]另一個(gè)具體操作,在獲得每個(gè)電子出版物的屬性數(shù)據(jù)的分詞結(jié)果之后,還可以采用現(xiàn)有技術(shù)中的文本相似度算法,計(jì)算所獲取的每個(gè)電子出版物的屬性數(shù)據(jù)之間的相似度,根據(jù)計(jì)算得到的相似度,例如,以相似度大于或等于預(yù)先設(shè)置的相似度閾值作為一致依據(jù)等,確定電子出版物的屬性數(shù)據(jù)是否一致。例如,最長公共子串法、最長公共子序列法、最少編輯距離法、漢明距離法、余弦值法等,詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0077]類似地,在具體的應(yīng)用過程中,具體可以對(duì)所獲取的每個(gè)電子出版物的名稱數(shù)據(jù)進(jìn)行分詞處理,以獲得分詞結(jié)果。詳細(xì)描述具體可以參見對(duì)每個(gè)電子出版物的屬性數(shù)據(jù)所進(jìn)行的分詞處理,此處不再贅述。
[0078]在獲得每個(gè)電子出版物的名稱數(shù)據(jù)的分詞結(jié)果之后,還可以采用現(xiàn)有技術(shù)中的文本相似度算法,計(jì)算所獲取的每個(gè)電子出版物的名稱數(shù)據(jù)之間的相似度,根據(jù)計(jì)算得到的相似度,例如,以相似度大于或等于預(yù)先設(shè)置的相似度閾值作為一致依據(jù)等,確定名稱數(shù)據(jù)相似的若干個(gè)電子出版物。例如,最長公共子串法、最長公共子序列法、最少編輯距離法、漢明距離法、余弦值法等,詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0079]具體地,具體可以將每個(gè)候選組中,相似度滿足一定相似度條件的電子出版物,確定為名稱數(shù)據(jù)相似的電子出版物。例如,相似度大于或等于預(yù)先設(shè)置的相似度閾值,或按照相似度從大到小的順序?qū)﹄娮映霭嫖镞M(jìn)行排序,排在前面的指定數(shù)量位置,等等,本實(shí)施例對(duì)相似度條件不進(jìn)行特別限定。
[0080]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以展現(xiàn)所述推薦組中除了所述指定電子出版物之外的其他電子出版物的摘要數(shù)據(jù),所述摘要數(shù)據(jù)具體可以與電子出版物的實(shí)際內(nèi)容或網(wǎng)頁相鏈接。其中,所述電子出版物的摘要數(shù)據(jù)可以包括但不限于電子出版物的名稱數(shù)據(jù)、電子出版物的封面數(shù)據(jù)、電子出版物的訪問標(biāo)識(shí)例如統(tǒng)一資源定位符(Uniform Resource Locator, URL)等。
[0081]本實(shí)施例中,通過獲取指定電子出版物的標(biāo)識(shí)信息,進(jìn)而根據(jù)所述指定電子出版物的標(biāo)識(shí)信息,獲得所述指定電子出版物所屬的推薦組,所述推薦組為根據(jù)至少兩個(gè)電子出版物中每個(gè)電子出版物的屬性數(shù)據(jù)和所述每個(gè)電子出版物的名稱數(shù)據(jù)獲得,使得能夠展現(xiàn)所述推薦組中除了所述指定電子出版物之外的其他電子出版物,由于不再完全依賴電子出版物的標(biāo)題執(zhí)行推薦操作,而是結(jié)合電子出版物的屬性數(shù)據(jù),執(zhí)行推薦操作,使得推薦結(jié)果即所展現(xiàn)的其他電子出版物能夠基本滿足用戶的需求,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)瀏覽電子出版物列表或者反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與服務(wù)器之間的數(shù)據(jù)交互的問題,從而降低了服務(wù)器的處理負(fù)擔(dān)。
[0082]另外,采用本發(fā)明提供的技術(shù)方案,由于不再完全依賴電子出版物的標(biāo)題執(zhí)行推薦操作,而是結(jié)合電子出版物的屬性數(shù)據(jù),執(zhí)行推薦操作,使得推薦結(jié)果能夠基本滿足用戶的需求,因此,能夠有效提高推薦結(jié)果的有效性。
[0083]另外,采用本發(fā)明提供的技術(shù)方案,由于不再完全依賴電子出版物的標(biāo)題執(zhí)行推薦操作,而是結(jié)合電子出版物的屬性數(shù)據(jù),執(zhí)行推薦操作,使得推薦結(jié)果能夠基本滿足用戶的需求,因此,能夠有效提高推薦的效率。
[0084]需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0085]在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
[0086]圖2為本發(fā)明另一實(shí)施例提供的電子出版物的推薦裝置的結(jié)構(gòu)示意圖,如圖2所示。本實(shí)施例的電子出版物的推薦裝置可以包括獲取單元21、推薦單元22和展現(xiàn)單元23。其中,獲取單元21,用于獲取指定電子出版物的標(biāo)識(shí)信息;推薦單元22,用于根據(jù)所述指定電子出版物的標(biāo)識(shí)信息,獲得所述指定電子出版物所屬的推薦組;所述推薦組為根據(jù)至少兩個(gè)電子出版物中每個(gè)電子出版物的屬性數(shù)據(jù)和所述每個(gè)電子出版物的名稱數(shù)據(jù)獲得;展現(xiàn)單元23,用于展現(xiàn)所述推薦組中除了所述指定電子出版物之外的其他電子出版物。
[0087]需要說明的是,本實(shí)施例所提供的電子出版物的推薦裝置可以為位于本地終端的應(yīng)用,或者還可以為位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopment Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)的服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0088]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0089]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述獲取單元21所獲取的所述指定電子出版物的標(biāo)識(shí)信息可以包括但不限于所述指定電子出版物的國際標(biāo)準(zhǔn)書號(hào)(Internat1nal Standard Book Number, ISBN)或?yàn)樗鲋付娮映霭嫖锼峙涞奈ㄒ粯?biāo)識(shí),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0090]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,如圖3所示,本實(shí)施例所提供的電子出版物的推薦裝置還可以進(jìn)一步包括處理單元31,可以用于確定待分組的至少兩個(gè)電子出版物;以及根據(jù)所述至少兩個(gè)電子出版物中每個(gè)電子出版物的屬性數(shù)據(jù)和所述每個(gè)電子出版物的名稱數(shù)據(jù),獲得至少一個(gè)推薦組;所述至少一個(gè)推薦組中每個(gè)推薦組中包括至少兩個(gè)電子出版物。
[0091]其中,所述每個(gè)電子出版物的屬性數(shù)據(jù)可以包括但不限于作者、出版社、出版日期、ISBN和圖書標(biāo)簽中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0092]在一個(gè)具體的實(shí)現(xiàn)過程中,所述處理單元31,具體可以用于根據(jù)所述至少兩個(gè)電子出版物中每個(gè)電子出版物的屬性數(shù)據(jù),將屬性數(shù)據(jù)一致的至少兩個(gè)電子出版物劃分到相同的候選組,以獲得至少一個(gè)候選組;以及根據(jù)每個(gè)候選組中所包括的至少兩個(gè)電子出版物中每個(gè)電子出版物的名稱數(shù)據(jù),將名稱數(shù)據(jù)相似的至