;所述推薦組為根據(jù)至少兩個電子出版物中每個電子出版物的屬性數(shù)據(jù)和所述每個電子出版物的名稱數(shù)據(jù)獲得。
[0042]103、展現(xiàn)所述推薦組中除了所述指定電子出版物之外的其他電子出版物。
[0043]需要說明的是,101?103的執(zhí)行主體可以為位于本地終端的應(yīng)用,或者還可以為位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)的服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實施例對此不進(jìn)行特別限定。
[0044]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個網(wǎng)頁程序(webApp),本實施例對此不進(jìn)行特別限定。
[0045]這樣,通過獲取指定電子出版物的標(biāo)識信息,進(jìn)而根據(jù)所述指定電子出版物的標(biāo)識信息,獲得所述指定電子出版物所屬的推薦組,所述推薦組為根據(jù)至少兩個電子出版物中每個電子出版物的屬性數(shù)據(jù)和所述每個電子出版物的名稱數(shù)據(jù)獲得,使得能夠展現(xiàn)所述推薦組中除了所述指定電子出版物之外的其他電子出版物,由于不再完全依賴電子出版物的標(biāo)題執(zhí)行推薦操作,而是結(jié)合電子出版物的屬性數(shù)據(jù),執(zhí)行推薦操作,使得推薦結(jié)果即所展現(xiàn)的其他電子出版物能夠基本滿足用戶的需求,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)瀏覽電子出版物列表或者反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與服務(wù)器之間的數(shù)據(jù)交互的問題,從而降低了服務(wù)器的處理負(fù)擔(dān)。
[0046]所謂的電子出版物,是指以數(shù)字代碼方式,將有知識性、思想性內(nèi)容的信息編輯加工后存儲在固定物理形態(tài)的磁、光、電等介質(zhì)上,通過電子閱讀、顯示、播放設(shè)備讀取使用的大眾傳播媒體,以及新聞出版總署認(rèn)定的其他媒體形態(tài)。
[0047]所述電子出版物,可以按照傳播媒體分為電子圖書類、電子期刊類、電子報紙等,本實施例對此不進(jìn)行特別限定。
[0048]可選地,在本實施例的一個可能的實現(xiàn)方式中,在101中,具體可以對用戶行為數(shù)據(jù),例如,電子出版物的瀏覽記錄、電子出版物的搜索記錄、電子出版物的購買記錄等,進(jìn)行數(shù)據(jù)挖掘,以確定一個目標(biāo)電子出版物,作為所述指定電子出版物。
[0049]在一個具體的實現(xiàn)過程中,具體可以將用戶當(dāng)前所瀏覽或搜索的電子出版物,將其作為所述指定電子出版物,進(jìn)而獲取所述指定電子出版物的標(biāo)識信息。
[0050]在另一個具體的實現(xiàn)過程中,具體可以將用戶距離當(dāng)前最近時間所購買或瀏覽的電子出版物,將其作為所述指定電子出版物,進(jìn)而獲取所述指定電子出版物的標(biāo)識信息。
[0051]可選地,在本實施例的一個可能的實現(xiàn)方式中,在101中,所獲取的所述指定電子出版物的標(biāo)識信息可以包括但不限于所述指定電子出版物的國際標(biāo)準(zhǔn)書號(Internat1nal Standard Book Number, ISBN)或為所述指定電子出版物所分配的唯一標(biāo)識,本實施例對此不進(jìn)行特別限定。
[0052]ISBN,是國際通用的圖書或獨(dú)立的出版物(除定期出版的期刊)代碼。出版社可以通過ISBN清晰的辨認(rèn)所有非期刊書籍。一個ISBN只有一個或一份相應(yīng)的出版物與之對應(yīng)。ISBN,可以由四段共十位數(shù)字組成。第一段為組號,是國家、地區(qū)、語言或其他組織集團(tuán)的代號,由國際書號中心負(fù)責(zé)分配,中國的組號為數(shù)字“7”;第二段為出版社號,由國家標(biāo)準(zhǔn)書號中心負(fù)責(zé)分配,其位數(shù)視申請出版社圖書出版量多少而異,山東人民出版社的出版社號為“209”;第三段為書序號,由出版社負(fù)責(zé)管理分配;第四段為校驗碼,其數(shù)值由前九位數(shù)字依次以10?I加權(quán)之和并以11為模計算得到。
[0053]為所述指定電子出版物所分配的唯一標(biāo)識,可以由管理人員為每個電子出版物進(jìn)行人工分配,或者還可以由系統(tǒng)為每個電子出版物進(jìn)行自動分配,
[0054]在一個具體的實現(xiàn)過程中,具體可以采用現(xiàn)有技術(shù)中生成唯一標(biāo)識的方法,例如,利用數(shù)據(jù)庫中所記錄的主鍵ID作為唯一標(biāo)識,或者對主鍵ID進(jìn)行相關(guān)運(yùn)算例如,哈希運(yùn)算等,將運(yùn)算結(jié)果作為唯一標(biāo)識,或者還可以自定義一個自增的序列值,作為唯一標(biāo)識,等等,本實施例對此不進(jìn)行特別限定。至此,生成唯一標(biāo)識之后,則可以將所生成的唯一標(biāo)識,分配給每個電子出版物。
[0055]可選地,在本實施例的一個可能的實現(xiàn)方式中,在102之前,還可以進(jìn)一步對全部的電子出版物即待分組的至少兩個電子出版物,進(jìn)行分組處理,以獲得若干組相似的電子出版物。具體地,具體可以確定待分組的至少兩個電子出版物,進(jìn)而則可以根據(jù)所述至少兩個電子出版物中每個電子出版物的屬性數(shù)據(jù)和所述每個電子出版物的名稱數(shù)據(jù),獲得至少一個推薦組。其中,所述至少一個推薦組中每個推薦組中包括至少兩個電子出版物。
[0056]其中,所述每個電子出版物的屬性數(shù)據(jù)可以包括但不限于作者、出版社、出版日期、ISBN和圖書標(biāo)簽中的至少一項,本實施例對此不進(jìn)行特別限定。
[0057]其中,所述每個電子出版物的名稱數(shù)據(jù)可以包括但不限于名稱。
[0058]在一些情況下,例如,排版錯誤,或者,再例如,電子出版物的屬性數(shù)據(jù)或名稱數(shù)據(jù)本身沒有一個使用規(guī)范,等等,所獲取的每個電子出版物的屬性數(shù)據(jù)可能存在一些名稱上的差異。因此,在一個具體的實現(xiàn)過程中,在獲取所述每個電子出版物的屬性數(shù)據(jù)之后,還需要進(jìn)一步將所述每個電子出版物的屬性數(shù)據(jù),進(jìn)行標(biāo)準(zhǔn)化處理,以獲得具有標(biāo)準(zhǔn)化名稱的屬性數(shù)據(jù)。
[0059]例如,如果所獲取的作者為筆名“茅盾”,則可以將“茅盾”進(jìn)行名稱標(biāo)準(zhǔn)化處理,以獲得該作者的原名“沈德鴻”。
[0060]或者,再例如,如果所獲取的出版社為簡稱“外文出版社”,則可以將“外文出版社”進(jìn)行名稱標(biāo)準(zhǔn)化處理,以獲得該出版社的全稱“北京外文出版社”。
[0061]或者,再例如,如果所獲取的出版日期“14年9月”的格式不是預(yù)先設(shè)置的規(guī)范格式,例如XXXX年XX月等,則可以將所獲取的出版日期“14年9月”進(jìn)行名稱標(biāo)準(zhǔn)化處理,以獲得符合規(guī)范格式的出版日期“2014年09月”。
[0062]在一個具體的實現(xiàn)過程中,在確定了待分組的至少兩個電子出版物之后,具體可以根據(jù)所述至少兩個電子出版物中每個電子出版物的屬性數(shù)據(jù),將屬性數(shù)據(jù)一致的至少兩個電子出版物劃分到相同的候選組,以獲得至少一個候選組。然后,則可以根據(jù)每個候選組中所包括的至少兩個電子出版物中每個電子出版物的名稱數(shù)據(jù),將名稱數(shù)據(jù)相似的至少兩個電子出版物劃分到相同的推薦組,以獲得至少一個推薦組。
[0063]這樣,通過二層篩選,第一層篩選為利用電子出版物的屬性數(shù)據(jù),所進(jìn)行的初次篩選,以獲得一些屬性數(shù)據(jù)相似的電子出版物,第二層篩選為利用電子出版物的名稱數(shù)據(jù),所進(jìn)行的再次篩選,以獲得一些名稱數(shù)據(jù)相似的電子出版物,作為最終的一個推薦組中的相似電子出版物。
[0064]由于利用了電子出版物的屬性數(shù)據(jù),進(jìn)行了電子出版物的篩選,使得可以產(chǎn)生多個候選組。由于所采用的電子出版物的屬性數(shù)據(jù)的不同,可以有多種候選組的分組結(jié)果。而對于每個候選組中所包括的電子出版物,都可以進(jìn)一步利用電子出版物的名稱數(shù)據(jù),進(jìn)行電子出版物的再次篩選,因此,可以獲得若干個推薦組,這樣,通過不同推薦組中所包括的電子出版物的推薦,能夠滿足用戶個性化需求。
[0065]在具體的應(yīng)用過程中,具體可以對所獲取的每個電子出版物的屬性數(shù)據(jù)進(jìn)行分詞處理,以獲得分詞結(jié)果。在此,分詞處理技術(shù)已經(jīng)是本領(lǐng)域較成熟的技術(shù),對于英文屬性數(shù)據(jù)來說,由于英文本身是以詞為單位的,詞與詞之間靠空格分開,因此可以很容易地實現(xiàn)分詞。中文是以字為單位的,可以采用已有的諸如:基于字符串匹配的分詞方法、基于理解的分詞方法或者基于統(tǒng)計的分詞方法等對中文進(jìn)行分詞處理,較常用的例如基于字符串匹配的分詞方法中的最大正向匹配算法,詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0066]在對屬性數(shù)據(jù)進(jìn)行分詞處理后,為了提高后續(xù)處理的效率和減小噪音,對分詞處理后得到的各詞語進(jìn)行過濾處理,包括但不限于以下所列過濾處理:過濾掉預(yù)設(shè)的停用詞表所包含的詞語;其中,通用詞表是預(yù)先基于詞頻統(tǒng)計出的虛詞、助詞、代詞、冠詞、副詞、語氣詞等,這些詞語通常不具備獨(dú)立表意能力。具體可以通過對已有資源中出現(xiàn)頻率達(dá)到預(yù)設(shè)的高頻條件的詞語進(jìn)行收集得到