本申請涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種標題處理方法及設(shè)備。
背景技術(shù):
目前,對于互聯(lián)網(wǎng)搜索平臺等互聯(lián)網(wǎng)平臺來說,其所存儲的物品標題的長度一般為26個漢字左右,一方面可達到為相應(yīng)物品展示用戶獲取更多的訪問流量的效果,另一方面還可達到更為充分地描述各物品的內(nèi)容信息,以給訪問用戶提供較為豐富的參考信息的效果。
但是,對于安裝在智能手機、平板電腦等終端上的互聯(lián)網(wǎng)平臺應(yīng)用軟件(即客戶端)來說,當其在相應(yīng)的搜索結(jié)果頁等頁面中進行物品標題的展示時,由于受到終端屏幕大小的限制,一行通常僅能展示12個漢字左右,因而,無法將相應(yīng)的物品標題完整地展示出來,而僅能截取物品標題的前面一部分內(nèi)容進行展示。例如,對于完整內(nèi)容為“首尚格釋2015春裝新女裝圓領(lǐng)七分袖中長修身針織連衣裙LYQ-2084”的物品標題來說,由于受到終端屏幕大小的限制,僅能在相應(yīng)的搜索結(jié)果頁等頁面中展示“首尚格釋2015春裝新女裝”。
由于物品標題的前面一部分內(nèi)容通常并不能夠準確地反映物品的核心內(nèi)容,因而,使得最終展示的標題并不能夠準確地描述相應(yīng)的物品特性,使得展示效果并不佳。另外,由于用戶在根據(jù)展示的不完整標題進行物品內(nèi)容的查看時,通常還需要通過點擊展示的標題的方式,來獲取相應(yīng)的完整標題以實現(xiàn)物品內(nèi)容信息的查看,從而使得獲取物品信息的過程較為復(fù)雜,效率較低,降低用戶的應(yīng)用體驗。
技術(shù)實現(xiàn)要素:
本申請實施例提供了一種標題處理方法及設(shè)備,用以解決目前的標題展示方式所存在的效果不佳以及效率較低等的問題。
本申請實施例提供了一種標題處理方法,包括:
確定各待展示原始標題;
針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題;其中,所提取的至少一個關(guān)鍵語義詞組合后所占用的總字數(shù)不大于設(shè)定第一閾值;
在需要展示所述待展示原始標題時,展示與所述待展示原始標題相對應(yīng)的短標題。
相應(yīng)地,本申請實施例還提供了一種標題處理設(shè)備,包括:
標題確定模塊,用于確定各待展示原始標題;
標題簡化模塊,用于針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題;其中,所提取的至少一個關(guān)鍵語義詞組合后所占用的總字數(shù)不大于設(shè)定第一閾值;
標題展示模塊,用于在需要展示所述待展示原始標題時,展示與所述待展示原始標題相對應(yīng)的短標題。
本申請有益效果如下:
本申請實施例提供了一種標題處理方法及設(shè)備,在本申請實施例所述技術(shù)方案中,在進行物品標題等標題的展示時,針對每一待展示原始標題,可僅展示由至少一個用于反映該待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞所形成的、所占用的字數(shù)不大于設(shè)定第一閾值的短標題,從而避免了屏幕大小受限時,僅截取標題的前面一部分內(nèi)容進行展示時,展示內(nèi)容并不準確的問題,同時,由于展示的標題包含有原始標題的關(guān)鍵語義信息,因而,可直接根據(jù)展示的標題獲取物品等待展示內(nèi)容的內(nèi)容信息,無需再次通過點擊展示的標題的方式,來 獲取相應(yīng)的完整標題以實現(xiàn)物品等待展示內(nèi)容的內(nèi)容信息的查看,從而提高了信息獲取的效率,提高了用戶的應(yīng)用體驗。
附圖說明
為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1所示為本申請實施例一中所述標題處理方法的流程示意圖;
圖2所示為本申請實施例二中所述標題處理設(shè)備的結(jié)構(gòu)示意圖。
具體實施方式
為了使本申請的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本申請作進一步地詳細描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本申請保護的范圍。
實施例一:
本申請實施例一提供了一種標題處理方法,所述標題處理方法可適用于安裝于各終端內(nèi)的客戶端或各終端本身,本申請實施例對此不作贅述。具體地,如圖1所示,其為本申請實施例一中所述標題處理方法的流程示意圖,所述標題處理方法可包括以下步驟:
步驟101:確定各待展示原始標題;
步驟102:針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題;其中,所提取的至少一個關(guān)鍵語義詞組合后所占用的總字數(shù)不大于設(shè)定第一閾值;
步驟103:在需要展示所述待展示原始標題時,展示與所述待展示原始標題相對應(yīng)的短標題。
也就是說,在本申請實施例所述技術(shù)方案中,在進行物品標題等標題的展示時,針對每一待展示原始標題,可僅展示由至少一個用于反映該待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞所形成的、所占用的字數(shù)不大于設(shè)定第一閾值的短標題,從而避免了屏幕大小受限時,僅截取標題的前面一部分內(nèi)容進行展示時,展示內(nèi)容并不準確的問題,同時,由于展示的標題包含有原始標題的關(guān)鍵語義信息,因而,可直接根據(jù)展示的標題獲取物品等待展示內(nèi)容的內(nèi)容信息,無需再次通過點擊展示的標題的方式,來獲取相應(yīng)的完整標題以實現(xiàn)物品等待展示內(nèi)容的內(nèi)容信息的查看,從而提高了信息獲取的效率,提高了用戶的應(yīng)用體驗。
下面,將對本申請實施例中的各步驟進行詳細說明:
可選地,以互聯(lián)網(wǎng)平臺客戶端中的物品標題的展示為例,由于在進行物品標題的展示之前,通常可根據(jù)用戶輸入的搜索關(guān)鍵詞等搜索條件信息,進行搜索結(jié)果的確定,以將搜索結(jié)果所包含的各物品標題展示給對應(yīng)的用戶,因而,在步驟101中,可將相應(yīng)的搜索結(jié)果所包含的各原始標題作為待展示的原始標題。當然,需要說明的是,還可通過其他方式確定待展示的原始標題,本申請實施例對此不作贅述。
另外,需要說明的是,本申請實施例中所述的標題除了可為物品標題之外,還可為各種文章、作品等內(nèi)容的標題,本申請實施例對此不作任何限定。
進一步地,為了更準確地實現(xiàn)標題的簡化,針對每一待展示原始標題,在提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞之前,所述方法還可包括:
對所述待展示原始標題進行分詞,得到多個分詞。其中,進行分詞時所使用的分詞方式與現(xiàn)有技術(shù)相同,此處不再贅述。
例如,假設(shè)待展示原始標題為:韓語琳2015新款春裝女裝韓版時尚顯瘦 拼色真絲打底連衣裙禮服長裙;則,對所述待展示原始標題進行分詞后,可得到以下多個分詞:
韓語琳、2015新款、春裝、女裝、韓版、時尚、顯瘦、拼色、真絲、打底連衣裙、禮服長裙。
進一步地,針對每一待展示原始標題,在對所述待展示原始標題進行分詞,得到多個分詞之后,所述方法還可包括:
對所述待展示原始標題所對應(yīng)的多個分詞中的每個分詞進行屬性標注,以更直觀地得知各分詞的分詞屬性信息,便于后續(xù)進行標題簡化時使用。
其中,以物品標題為例,所述分詞的分詞屬性可至少包括品牌詞、營銷詞、產(chǎn)品詞、材質(zhì)詞、風(fēng)格詞、修飾詞等,本申請實施例對此不作贅述。
例如,假設(shè)待展示原始標題為:韓語琳2015新款春裝女裝韓版時尚顯瘦拼色真絲打底連衣裙禮服長裙;則,對所述待展示原始標題進行分詞且對各分詞進行屬性標注后,可得到以下多個分詞:
韓語琳[品牌詞]、2015新款[營銷詞]、春裝[產(chǎn)品詞]、女裝[產(chǎn)品詞]、韓版[風(fēng)格詞]、時尚[修飾詞]、顯瘦[風(fēng)格詞]、拼色[產(chǎn)品詞]、真絲[材質(zhì)詞]、打底連衣裙[產(chǎn)品詞]、禮服長裙[產(chǎn)品詞]。
進一步地,需要說明的是,為了進一步提高標題簡化的準確性,針對每一待展示原始標題,在提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞之前,所述方法還可包括:
對所述待展示原始標題進行預(yù)處理,以去除一些明顯錯誤的詞語或特殊符號等,使得所述待展示原始標題更為規(guī)范,本申請實施例對此不作贅述。
進一步地,針對每一待展示原始標題,在對所述待展示原始標題進行分詞,得到多個分詞之后,即可對所述待展示原始標題進行相應(yīng)簡化,以抽取出符合設(shè)定條件的短標題,即,可執(zhí)行提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題的操作。
可選地,針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,可具體實施為:
基于設(shè)定的機器翻譯模型,從所述待展示原始標題所對應(yīng)的多個分詞中,選取至少一個分詞作為所提取的至少一個關(guān)鍵語義詞;
其中,所述設(shè)定的機器翻譯模型可以是通過對各原始標題樣本以及與相應(yīng)原始標題樣本相對應(yīng)的短標題樣本(即,包含相應(yīng)原始標題樣本的關(guān)鍵語義且所占用的字數(shù)不大于設(shè)定第一閾值的短標題樣本)進行訓(xùn)練學(xué)習(xí)所得到的。
需要說明的是,在通過訓(xùn)練學(xué)習(xí)得到相應(yīng)的機器翻譯模型之后,還可實時或定時地根據(jù)不斷更新的樣本材料對該機器翻譯模型進行更新,以確保該機器翻譯模型的準確性,進而提高短標題抽取的準確性,本申請實施例對此不作贅述。
另外,需要說明的是,所述設(shè)定第一閾值可根據(jù)實際情況(如終端屏幕大小等)靈活調(diào)整,本申請實施例對此也不作贅述。
也就是說,在本申請所述實施例中,可基于設(shè)定的機器翻譯方法,從待展示原始標題所對應(yīng)的多個分詞中,抽取出至少一個分詞以形成包含最大語義的短標題。
例如,假設(shè)待展示原始標題為:韓語琳2015新款春裝女裝韓版時尚顯瘦拼色真絲打底連衣裙禮服長裙,且,設(shè)定第一閾值為9;則,可從上述待展示原始標題所對應(yīng)的多個分詞中抽取出以下分詞:拼色、真絲、打底連衣裙;或,拼色、真絲、禮服長裙;并根據(jù)抽取出的分詞形成相應(yīng)的短標題“拼色打底真絲連衣裙”,或,“拼色真絲禮服長裙”,本申請實施例對此不作贅述。
進一步地,需要說明的是,本申請所述實施例所采用的機器翻譯方法可為統(tǒng)計機器翻譯方法等機器翻譯方法。優(yōu)選地,由于統(tǒng)計機器翻譯方法是目前非限定領(lǐng)域機器翻譯中性能較佳、準確性較高的一種方法,因而,在本申請所述實施例中,可優(yōu)先采用統(tǒng)計機器翻譯方法來進行短標題的抽取。也就是說,在本申請所述實施例中,所述設(shè)定的機器翻譯模型可為設(shè)定的統(tǒng)計機器翻譯模 型,本申請實施例對此不作贅述。
另外,需要說明的是,參考現(xiàn)有技術(shù)關(guān)于統(tǒng)計機器翻譯方法的相關(guān)描述可知,采用統(tǒng)計機器翻譯方法進行短標題的抽取時,主要可包括以下三個步驟:
(1)分詞對齊;(2)訓(xùn)練翻譯模型;(3)解碼。
其中,前兩個步驟(1)和(2)即為相應(yīng)的機器翻譯模型的訓(xùn)練階段,后一階段(3)即為相應(yīng)的根據(jù)機器翻譯模型抽取待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞以形成相應(yīng)的短標題的階段,本申請實施例對此不作贅述。
進一步地,針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,還可具體實施為:
根據(jù)設(shè)定的屬性重要度詞表(如,物品類目下的屬性重要度詞表)和/或?qū)傩詸?quán)重詞表(如,物品類目下的term weight詞表),從所述待展示原始標題所對應(yīng)的多個分詞中,選取至少一個屬性重要度不小于設(shè)定第二閾值(該第二閾值可根據(jù)實際情況進行靈活調(diào)整)和/或?qū)傩詸?quán)重不小于設(shè)定第三閾值(該第三閾值可根據(jù)實際情況進行靈活調(diào)整)的分詞作為所提取的至少一個關(guān)鍵語義詞。
也就是說,在本申請所述實施例中,除了可采用機器翻譯方法抽取相應(yīng)的短標題之外,還可根據(jù)設(shè)定的屬性重要度詞表和/或?qū)傩詸?quán)重詞表,抽取相應(yīng)的短標題,以提高短標題生成的靈活性與多樣性,本申請實施例對此不作任何限定。
進一步地,需要說明的是,以物品標題為例,所述設(shè)定的屬性重要度詞表和/或?qū)傩詸?quán)重詞表通常是通過對大量物品的類目下的各屬性的重要度進行挖掘所得到的,本申請實施例對此不作贅述。
另外,需要說明的是,在通過挖掘得到相應(yīng)的屬性重要度詞表和/或?qū)傩詸?quán)重詞表之后,還可實時或定時地根據(jù)不斷更新的樣本材料對該屬性重要度詞表 和/或?qū)傩詸?quán)重詞表進行更新,以確保詞表的準確性,進而提高短標題抽取的準確性,本申請實施例對此不作贅述。
進一步地,在得到相應(yīng)的短標題后,在需要展示所述待展示原始標題時,則可僅展示與所述待展示原始標題相對應(yīng)的短標題,以避免屏幕大小受限時,僅截取標題的前面一部分內(nèi)容進行展示時,展示內(nèi)容并不準確的問題,同時,由于展示的標題包含有原始標題的關(guān)鍵語義信息,因而,可直接根據(jù)展示的標題獲取物品等待展示內(nèi)容的內(nèi)容信息,無需再次通過點擊展示的標題的方式,來獲取相應(yīng)的完整標題以實現(xiàn)物品等待展示內(nèi)容的內(nèi)容信息的查看,從而提高了信息獲取的效率,提高了用戶的應(yīng)用體驗。
需要說明的是,在展示相應(yīng)的短標題時,具體可根據(jù)實際應(yīng)用場景進行展示,如可在相應(yīng)的搜索結(jié)果頁等頁面中進行短標題的展示等,本申請實施例對此不作贅述。
進一步地,為了減少短標題生成的次數(shù),避免不必要的系統(tǒng)資源浪費,針對每一待展示原始標題,在提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞之前,所述方法還可包括:
確定所述待展示原始標題所占用的字數(shù)大于設(shè)定第一閾值。
也就是說,通??稍诖_定待展示原始標題所占用的字數(shù)大于設(shè)定第一閾值,如所占用的字數(shù)大于終端屏幕的一單行所能夠顯示的最大字數(shù),進而無法在終端屏幕的一單行上完整顯示時,再執(zhí)行本申請實施例所述的提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞、以得到相應(yīng)的短標題的操作。
當然,需要說明的是,為了避免原始標題中的詞語的重復(fù)堆砌,即便確定待展示原始標題所占用的字數(shù)不大于設(shè)定第一閾值,也可執(zhí)行本申請實施例所述的提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞、以得到相應(yīng)的短標題的操作,本申請實施例對此不作贅述。
另外,需要說明的是,在本申請所述實施例中,通??刹捎貌⑿刑幚淼姆绞綄Ω鞔故驹紭祟}進行關(guān)鍵語義詞的提取等操作,以提高標題處理的效率。
下面,將以在客戶端的搜索結(jié)果頁面中進行物品標題的展示為例,對本申請實施例中所述的標題處理方法進行具體說明,所述標題處理方法可包括以下步驟:
步驟一:客戶端根據(jù)用戶輸入的搜索關(guān)鍵詞等搜索條件信息,進行搜索結(jié)果的確定,以確定各待展示原始標題。
例如,當用戶輸入“連衣裙”這一搜索關(guān)鍵詞時,客戶端可根據(jù)該搜索關(guān)鍵詞,搜索確定包含這一搜索關(guān)鍵詞的所有標題信息,并將搜索到的標題信息作為各待展示原始標題。
步驟二:針對每一待展示原始標題,判斷所述待展示原始標題所占用的字數(shù)是否大于設(shè)定第一閾值,若是,則執(zhí)行步驟三,否則,可直接在相應(yīng)的搜索結(jié)果頁面中展示該待展示原始標題。
其中,該設(shè)定第一閾值可根據(jù)該客戶端所在的終端屏幕的大小而確定。
步驟三:對所述待展示原始標題進行分詞,得到多個分詞,并對所述待展示原始標題所對應(yīng)的多個分詞中的每個分詞進行屬性標注。
例如,假設(shè)待展示原始標題為:韓語琳2015新款春裝女裝韓版時尚顯瘦拼色真絲打底連衣裙禮服長裙;則,對所述待展示原始標題進行分詞且對各分詞進行屬性標注后,可得到以下多個分詞:
韓語琳[品牌詞]、2015新款[營銷詞]、春裝[產(chǎn)品詞]、女裝[產(chǎn)品詞]、韓版[風(fēng)格詞]、時尚[修飾詞]、顯瘦[風(fēng)格詞]、拼色[產(chǎn)品詞]、真絲[材質(zhì)詞]、打底連衣裙[產(chǎn)品詞]、禮服長裙[產(chǎn)品詞]。
步驟四:提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題;其中,所提取的至少一個關(guān)鍵語義詞組合后所占用的總字數(shù)不大于設(shè)定第 一閾值。
可選地,可根據(jù)設(shè)定的屬性重要度詞表(如,物品類目下的屬性重要度詞表)和/或?qū)傩詸?quán)重詞表(如,物品類目下的term weight詞表),從所述待展示原始標題所對應(yīng)的多個分詞中,選取至少一個屬性重要度不小于設(shè)定第二閾值和/或?qū)傩詸?quán)重不小于設(shè)定第三閾值的分詞作為所提取的至少一個關(guān)鍵語義詞。
例如,假設(shè)待展示原始標題為:韓語琳2015新款春裝女裝韓版時尚顯瘦拼色真絲打底連衣裙禮服長裙,設(shè)定第一閾值為9,且,對應(yīng)的屬性為產(chǎn)品詞或材質(zhì)詞的分詞的屬性重要度不小于設(shè)定第二閾值;則,可從上述待展示原始標題所對應(yīng)的多個分詞中抽取出以下分詞:拼色、真絲、打底連衣裙;或,拼色、真絲、禮服長裙;并根據(jù)抽取出的分詞形成相應(yīng)的短標題“拼色打底真絲連衣裙”,或,“拼色真絲禮服長裙”。
步驟五:在相應(yīng)的搜索結(jié)果頁面中展示與所述待展示原始標題相對應(yīng)的短標題,以實現(xiàn)相應(yīng)物品標題的展示。
需要說明的是,由于在本申請所述實施例中,在進行機器翻譯模型的訓(xùn)練、以及設(shè)定的屬性重要度詞表和/或?qū)傩詸?quán)重詞表的挖掘等操作時,需要對大量的離線數(shù)據(jù)進行統(tǒng)計,即,會牽涉到大規(guī)模的數(shù)據(jù)處理,因此,本申請實施例所述方案通??纱嬖诖笠?guī)模并行計算的需要,即通??尚枰蕾囉谙鄳?yīng)的云計算平臺等具備較高數(shù)據(jù)處理能力的平臺,本申請實施例對此也不作贅述。
本申請實施例一提供了一種標題處理方法,在本申請實施例一所述技術(shù)方案中,在進行物品標題等標題的展示時,針對每一待展示原始標題,可僅展示由至少一個用于反映該待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞所形成的、所占用的字數(shù)不大于設(shè)定第一閾值的短標題,從而避免了屏幕大小受限時,僅截取標題的前面一部分內(nèi)容進行展示時,展示內(nèi)容并不準確的問題,同時,由于展示的標題包含有原始標題的關(guān)鍵語義信息,因而,可直接根據(jù)展示的標題獲取物品等待展示內(nèi)容的內(nèi)容信息,無需再次通過點擊展示的標題的方式,來獲取相應(yīng)的完整標題以實現(xiàn)物品等待展示內(nèi)容的內(nèi)容信息的查看,從而提高了信 息獲取的效率,提高了用戶的應(yīng)用體驗。
實施例二:
基于同一發(fā)明構(gòu)思,本申請實施例二提供了一種標題處理設(shè)備,該標題處理設(shè)備的具體實施可參見上述方法實施例一中的相關(guān)描述,重復(fù)之處不再贅述,如圖2所示,該標題處理設(shè)備主要可包括:
標題確定模塊21,可用于確定各待展示原始標題;
標題簡化模塊22,可用于針對每一待展示原始標題,提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞,并根據(jù)提取的至少一個關(guān)鍵語義詞生成短標題;其中,所提取的至少一個關(guān)鍵語義詞組合后所占用的總字數(shù)不大于設(shè)定第一閾值;
標題展示模塊23,可用于在需要展示所述待展示原始標題時,展示與所述待展示原始標題相對應(yīng)的短標題。
進一步地,所述設(shè)備還可包括標題切分模塊24:
所述標題切分模塊24,可用于針對每一待展示原始標題,在提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞之前,對所述待展示原始標題進行分詞,得到多個分詞。
相應(yīng)地,所述標題簡化模塊22具體可用于基于設(shè)定的機器翻譯模型,從所述待展示原始標題所對應(yīng)的多個分詞中,選取至少一個分詞作為所提取的至少一個關(guān)鍵語義詞;
其中,所述設(shè)定的機器翻譯模型是通過對各原始標題樣本以及與相應(yīng)原始標題樣本相對應(yīng)的短標題樣本進行訓(xùn)練學(xué)習(xí)所得到的。
進一步地,所述標題簡化模塊22具體還可用于根據(jù)設(shè)定的屬性重要度詞表和/或?qū)傩詸?quán)重詞表,從所述待展示原始標題所對應(yīng)的多個分詞中,選取至少一個屬性重要度不小于設(shè)定第二閾值和/或?qū)傩詸?quán)重不小于設(shè)定第三閾值的分詞作為所提取的至少一個關(guān)鍵語義詞。
進一步地,所述標題簡化模塊22還可用于針對每一待展示原始標題,在 提取所述待展示原始標題中的至少一個用于反映所述待展示原始標題的關(guān)鍵語義的關(guān)鍵語義詞之前,確定所述待展示原始標題所占用的字數(shù)大于設(shè)定第一閾值。
本領(lǐng)域技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、裝置(設(shè)備)、或計算機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本申請是參照根據(jù)本申請實施例的方法、裝置(設(shè)備)和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本申請的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本申請范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本申請進行各種改動和變型而不脫離本申請的精神和范圍。這樣,倘若本申請的這些修改和變型屬于本申請權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本申請也意圖包含這些改動和變型在內(nèi)。