亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文本相關(guān)度的確定方法、查詢結(jié)果的推送方法及裝置與流程

文檔序號:12465209閱讀:224來源:國知局
文本相關(guān)度的確定方法、查詢結(jié)果的推送方法及裝置與流程
本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域,尤其涉及一種文本相關(guān)度的確定方法、查詢結(jié)果的推送方法及裝置。
背景技術(shù)
:在利用文本(查詢串)進行的查詢搜索中,查詢串一般都會對應(yīng)多個查詢結(jié)果。因此對于每一次的查詢搜索,往往需要對查詢串與查詢結(jié)果的文本串進行相似度計算,以確定查詢結(jié)果的文本串與查詢串之間的相關(guān)度。然后根據(jù)該相關(guān)度來輔助對查詢結(jié)果的展示排序。目前用于度量短文本相似性的方法包括:基于最長公共子串(英文:LongestCommonSubstring;縮寫:LCS)的方法、以及基于詞命中率的方法。舉例而言,在查詢串為“ABCD”的情況下,查詢結(jié)果包括“ABXCD”和“AXBYCD”。其中,無論哪種查詢結(jié)果,與查詢串之間的最長的相同字符串的長度都是2,也即最長公共子串均為2。另外,由于詞命中率不考慮查詢串和查詢結(jié)果的文本串的分詞順序,因此查詢串“ABCD”對上述兩種查詢結(jié)果“ABXCD”和“AXBYCD”的詞命中率也相同。然而,對于搜索者來說,結(jié)果“ABXCD”可能是更好的搜索結(jié)果。但是基于最長公共子串和詞命中率的計算方式均無法有效地對兩者進行區(qū)分,從而導(dǎo)致部分用戶主觀能識別的差別無法通過計算相似度來體現(xiàn)。技術(shù)實現(xiàn)要素:技術(shù)問題有鑒于此,本發(fā)明要解決的技術(shù)問題是,如何較為準確合理地確定文本相關(guān)度。解決方案為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一實施例,提供了一種文本相關(guān)度的確定方法,包括:對查詢詞進行分詞處理,所述查詢詞對應(yīng)至少一個查詢結(jié)果;對各所述查詢結(jié)果進行分詞處理;根據(jù)所述查詢詞的分詞結(jié)果和所述查詢結(jié)果的分詞結(jié)果來計算所述查詢詞到各所述查詢結(jié)果的編輯距離;以及根據(jù)各所述編輯距離確定所述查詢詞與各所述查詢結(jié)果之間的文本相關(guān)度。對于上述方法,在一種可能的實現(xiàn)方式中,對所述查詢詞進行分詞處理包括:將所述查詢詞轉(zhuǎn)變成由表示的有序詞序列,其中,qi是查詢詞Q的第i個分詞結(jié)果,qi在所述查詢詞Q中的詞權(quán)重為wqi;對所述查詢結(jié)果進行分詞處理包括:將所述查詢結(jié)果轉(zhuǎn)變成由表示的有序詞序列,其中,dj是查詢結(jié)果D的第j個分詞結(jié)果,dj在所述查詢結(jié)果D中的詞權(quán)重為wdj,對于上述方法,在一種可能的實現(xiàn)方式中,計算所述查詢詞到所述查詢文本的編輯距離包括:根據(jù)來計算所述查詢詞Q到所述查詢結(jié)果D的編輯距離EXTED(m,n),其中,EXTED(0,j)=0;EXTED(i,0)=EXTED(i-1,0)+C(add[qi]);增加操作的影響因子C(add[qi])=α×wqi;替換操作的影響因子C(replace[qi,dj])=β×(wqi+wdj);刪除操作的影響因子C(delete[dj])=γ×wdj;α、β、γ為預(yù)先設(shè)定的值。對于上述方法,在一種可能的實現(xiàn)方式中,確定所述查詢詞與所述查詢文本之間的文本相關(guān)度包括:根據(jù)sim(Q,D)=1-min(EXTED(i,j))/EXTED(m,0)來確定所述查詢詞Q與所述查詢結(jié)果D之間的文本相關(guān)度sim(Q,D)。為了解決上述技術(shù)問題,根據(jù)本發(fā)明的另一實施例,提供了一種查詢結(jié)果的推送方法,包括:根據(jù)本發(fā)明任一實施例所述的文本相關(guān)度的確定方法來確定文本相關(guān)度;以及按照所確定的文本相關(guān)度來推送查詢結(jié)果。為了解決上述技術(shù)問題,根據(jù)本發(fā)明的又一實施例,提供了一種文本相關(guān)度的確定裝置,包括:第一分詞模塊,用于對查詢詞進行分詞處理,所述查詢詞對應(yīng)至少一個查詢結(jié)果;第二分詞模塊,用于對各所述查詢結(jié)果進行分詞處理;計算模塊,與所述第一分詞模塊和所述第二分詞模塊均連接,用于根據(jù)所述查詢詞的分詞結(jié)果和所述查詢結(jié)果的分詞結(jié)果來計算所述查詢詞到各所述查詢結(jié)果的編輯距離;以及確定模塊,與所述計算模塊連接,用于根據(jù)各所述編輯距離確定所述查詢詞與各所述查詢結(jié)果之間的文本相關(guān)度。對于上述裝置,在一種可能的實現(xiàn)方式中,所述第一分詞模塊具體用于:將所述查詢詞轉(zhuǎn)變成由表示的有序詞序列,其中,qi是查詢詞Q的第i個分詞結(jié)果,qi在所述查詢詞Q中的詞權(quán)重為wqi;所述第二分詞模塊具體用于:將所述查詢結(jié)果轉(zhuǎn)變成由表示的有序詞序列,其中,dj是查詢結(jié)果D的第j個分詞結(jié)果,dj在所述查詢結(jié)果D中的詞權(quán)重為wdj,對于上述裝置,在一種可能的實現(xiàn)方式中,所述計算模塊具體用于:根據(jù)來計算所述查詢詞Q到所述查詢結(jié)果D的編輯距離EXTED(m,n),其中,EXTED(0,j)=0;EXTED(i,0)=EXTED(i-1,0)+C(add[qi]);增加操作的影響因子C(add[qi])=α×wqi;替換操作的影響因子C(replace[qi,dj])=β×(wqi+wdj);刪除操作的影響因子C(delete[dj])=γ×wdj;α、β、γ為預(yù)先設(shè)定的值。對于上述裝置,在一種可能的實現(xiàn)方式中,所述確定模塊具體用于:根據(jù)sim(Q,D)=1-min(EXTED(i,j))/EXTED(m,0)來確定所述查詢詞Q與所述查詢結(jié)果D之間的文本相關(guān)度sim(Q,D)。為了解決上述技術(shù)問題,根據(jù)本發(fā)明的又一實施例,提供了一種查詢結(jié)果的推送裝置,包括:根據(jù)本發(fā)明任一實施例所述的文本相關(guān)度的確定裝置,用于確定文本相關(guān)度;以及推送裝置,與所述文本相關(guān)度的確定裝置連接,用于按照所確定的文本相關(guān)度來推送查詢結(jié)果。有益效果通過對查詢詞和與該查詢詞對應(yīng)的查詢結(jié)果進行分詞處理,然后根據(jù)各自的分詞結(jié)果來計算兩者的文本相關(guān)度,根據(jù)本發(fā)明實施例的文本相關(guān)度的確定方法和裝置計算出的文本相似度能夠體現(xiàn)出用戶對各查詢結(jié)果的傾向性。另外,由于根據(jù)本發(fā)明實施例的查詢結(jié)果的推送方法和裝置利用上述文本相關(guān)度來進行查詢結(jié)果的推送,從而可以使得用戶快速準確地獲取所期望的查詢結(jié)果,相比現(xiàn)有技術(shù)更為準確合理。根據(jù)下面參考附圖對示例性實施例的詳細說明,本發(fā)明的其它特征及方面將變得清楚。附圖說明包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本發(fā)明的示例性實施例、特征和方面,并且用于解釋本發(fā)明的原理。圖1示出根據(jù)本發(fā)明一實施例的文本相關(guān)度的確定方法的流程圖;圖2示出根據(jù)本發(fā)明一實施例的查詢結(jié)果的推送方法的流程圖;圖3示出根據(jù)本發(fā)明一實施例的文本相關(guān)度的確定裝置的結(jié)構(gòu)框圖;圖4示出根據(jù)本發(fā)明一實施例的查詢結(jié)果的推送裝置的結(jié)構(gòu)框圖;圖5示出了本發(fā)明的又一實施例的文本相關(guān)度的確定裝置/查詢結(jié)果的推送裝置的結(jié)構(gòu)框圖。具體實施方式以下將參考附圖詳細說明本發(fā)明的各種示例性實施例、特征和方面。附圖中相同的附圖標記表示功能相同或相似的元件。盡管在附圖中示出了實施例的各種方面,但是除非特別指出,不必按比例繪制附圖。在這里專用的詞“示例性”意為“用作例子、實施例或說明性”。這里作為“示例性”所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。另外,為了更好的說明本發(fā)明,在下文的具體實施方式中給出了眾多的具體細節(jié)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,沒有某些具體細節(jié),本發(fā)明同樣可以實施。在一些實例中,對于本領(lǐng)域技術(shù)人員熟知的方法、手段、元件和電路未作詳細描述,以便于凸顯本發(fā)明的主旨。實施例1圖1示出根據(jù)本發(fā)明一實施例的文本相關(guān)度的確定方法的流程圖。如圖1所示,該確定方法可以包括:步驟S100、對查詢詞進行分詞處理,所述查詢詞對應(yīng)至少一個查詢結(jié)果;步驟S200、對各所述查詢結(jié)果進行分詞處理;步驟S300、根據(jù)所述查詢詞的分詞結(jié)果和所述查詢結(jié)果的分詞結(jié)果來計算所述查詢詞到各所述查詢結(jié)果的編輯距離;以及步驟S400、根據(jù)各所述編輯距離確定所述查詢詞與各所述查詢結(jié)果之間的文本相關(guān)度。需要說明的是,上述的查詢詞可以是文本,因此也稱作查詢串或者查詢文本串。上述的查詢結(jié)果可以是用于描述與查詢詞對應(yīng)的網(wǎng)絡(luò)資源屬性的描述文本、例如標題或者標簽等,也可以稱作查詢結(jié)果的文本串或者查詢結(jié)果串。網(wǎng)絡(luò)資源可以包括但不限于視頻資源、音頻資源、文本資源、網(wǎng)頁資源、以及網(wǎng)絡(luò)商城的商品資源等能夠在網(wǎng)絡(luò)系統(tǒng)中獲取的資源。在本實施例中,通過對查詢詞及其對應(yīng)的查詢結(jié)果進行分詞處理,然后根據(jù)分詞結(jié)果來計算查詢詞及其對應(yīng)的查詢結(jié)果的文本相關(guān)度。由此計算出的文本相似度能夠體現(xiàn)出用戶對各查詢結(jié)果的傾向性,從而使得用戶可以快速準確地獲取所期望的查詢結(jié)果,相比現(xiàn)有技術(shù)更為準確合理。實施例2本實施例用于說明上述實施例1的一種可能的實現(xiàn)方式。在本實施例的文本相關(guān)度的確定方法中,步驟S100中對查詢詞進行分詞處理可以包括:將所述查詢詞轉(zhuǎn)變成由表示的有序詞序列。其中,qi是查詢詞Q的第i個分詞結(jié)果,qi在所述查詢詞Q中的詞權(quán)重為wqi,其中,本領(lǐng)域技術(shù)人員應(yīng)能理解,m是正整數(shù),i表示從1到m之間的任意整數(shù),qi表示查詢詞Q的分詞結(jié)果中的第i個有序詞。舉例而言,通過對查詢詞“好聽的歌曲”進行分詞處理,可以轉(zhuǎn)變成包括“好聽”、“的”、“歌曲”的有序詞序列。其中,可以將第2個有序詞“的”的詞權(quán)重設(shè)置為比第1個有序詞“好聽”和第3個有序詞“歌曲”小,而將第1個有序詞“好聽”的詞權(quán)重設(shè)置為比第3個有序詞“歌曲”小。并且,這3個有序詞的詞權(quán)重之和為1。類似地,在本實施例所述的文本相關(guān)度的確定方法中,步驟S200中對查詢結(jié)果進行分詞處理可以包括:將所述查詢結(jié)果轉(zhuǎn)變成由表示的有序詞序列。其中,dj是查詢結(jié)果D的第j個分詞結(jié)果,dj在所述查詢結(jié)果D中的詞權(quán)重為wdj,與對查詢詞的上述說明類似地,本領(lǐng)域技術(shù)人員應(yīng)能理解,n是正整數(shù),j表示從1到n之間的任意整數(shù),dj表示查詢結(jié)果D的分詞結(jié)果中的第j個有序詞。這里不再對查詢結(jié)果具體舉例。這樣,根據(jù)通過本發(fā)明上述實施例所述的方法獲得的分詞結(jié)果,來計算查詢詞和查詢結(jié)果之間的文本相關(guān)度,能夠使得所計算出的文本相似度相比現(xiàn)有技術(shù)更為準確合理,以體現(xiàn)出用戶主觀上對各查詢結(jié)果的傾向性,從而使得用戶可以快速準確地獲取所期望的查詢結(jié)果。實施例3本實施例在實施例2的基礎(chǔ)上,進一步說明上述文本相關(guān)度的確定方法的可能的實現(xiàn)方式。在本實施例所述的文本相關(guān)度的確定方法中,步驟S300中計算查詢詞到查詢文本的編輯距離可以包括:根據(jù)來計算查詢詞Q到查詢結(jié)果D的編輯距離EXTED(m,n)。其中,EXTED(0,j)=0;EXTED(i,0)=EXTED(i-1,0)+C(add[qi]);增加操作的影響因子C(add[qi])=α×wqi;替換操作的影響因子C(replace[qi,dj])=β×(wqi+wdj);刪除操作的影響因子C(delete[dj])=γ×wdj;α、β、γ為預(yù)先設(shè)定的值。需要說明的是,編輯距離(英文:EditDistance)還可以稱為Levenshtein距離,可以指兩個字串之間,由一個轉(zhuǎn)成另一個所需的最少編輯操作次數(shù)。其中,許可的編輯操作包括將一個字符替換成另一個字符、插入一個字符、以及刪除一個字符。一般來說,編輯距離越小,兩個字串的相似度越大。舉例而言,根據(jù)經(jīng)驗,進行增加編輯(也即add操作)要比刪除編輯(也即delete操作)的影響更大,而刪除編輯要比替換編輯(也即replace操作)的影響更大。例如,可以將α、β、γ預(yù)先設(shè)置為1.0、0.5、0.7,并且已知查詢詞“AC”的分詞結(jié)果“A”和“C”的詞權(quán)重分別為0.4和0.6,查詢結(jié)果“ABC”的分詞結(jié)果“A”、“B”和“C”的詞權(quán)重分別為0.2、0.3和0.5,則查詢詞“AC”到查詢結(jié)果“ABC”的編輯距離的具體計算過程如下。首先,在i=0的情況下,根據(jù)EXTED(0,j)=0,將下述表1中i=0的這一行所有單元格全部賦值為0。然后,在j=0的情況下,根據(jù)EXTED(i,0)=EXTED(i-1,0)+C(add[qi])對下述表1中j=0的這一列的各單元格進行賦值。其中,對于i=1、j=0的單元格,值為0+1.0×0.4=0.4。對于i=2、j=0的單元格,值為0.4+1.0×0.6=1.0。最后,在i≥1,j≥1j=0的情況下,根據(jù)對下述表1中的其它單元格(例如i=1、2的行與j=1、2、3的列對應(yīng)的各單元格)進行賦值。其中,對于i=1、j=1的單元格,EXTED(i-1,j)+C(add[qi])=0+1.0×0.4=0.4,EXTED(i-1,j-1)+C(replace[qi,dj])=0+0.5×(0.4+0.2)=0.3,EXTED(i,j-1)+C(delete[dj])=0.4+0.7×0.2=0.54,將三者中最小的值0.3作為該單元格中的值。對于其它單元格,計算方法與i=1、j=1的單元格相同,這里不再詳述。由此遞推計算,得出如表1所示的編輯距離。表1編輯距離#(j=0)A(j=1)B(j=2)C(j=3)#(i=0)0000A(i=1)0.40.30.350.4C(i=2)1.00.80.750.9以上以詞權(quán)重以及各編輯操作(增加、替換和刪除)影響因子的具體數(shù)值為例對編輯距離的計算進行了說明,但本發(fā)明應(yīng)不限于此。本領(lǐng)域技術(shù)人員應(yīng)能理解,各編輯操作影響因子的具體數(shù)值不限于上述的經(jīng)驗值,可以通過機器學(xué)習(xí)等方式對各編輯影響因子進行自適應(yīng)地調(diào)節(jié)。這樣,根據(jù)通過本發(fā)明上述實施例所述的方法獲得的編輯距離,來計算查詢詞和查詢結(jié)果之間的文本相關(guān)度,能夠使得所計算出的文本相似度相比現(xiàn)有技術(shù)更為準確合理,以體現(xiàn)出用戶主觀上對各查詢結(jié)果的傾向性,從而使得用戶可以快速準確地獲取所期望的查詢結(jié)果。實施例4本實施例在實施例3的基礎(chǔ)上,進一步說明上述文本相關(guān)度的確定方法的可能的實現(xiàn)方式。在本實施例所述的文本相關(guān)度的確定方法中,步驟S400中確定查詢詞與查詢文本之間的文本相關(guān)度可以包括:根據(jù)sim(Q,D)=1-min(EXTED(i,j))/EXTED(m,0)來確定所述查詢詞Q與所述查詢結(jié)果D之間的文本相關(guān)度sim(Q,D)。另外,也可以不簡寫上述公式,而寫成sim(Q,D)=sim(<q1,q2,…,qm>,<w1,w2,…,wn>)=1-ext_ed(<q1,q2,…,qm>,<w1,w2,…,wn>)。仍以實施例3中的表1為例,其中,min(EXTED(i,j))=0.3,EXTED(m,0)=1,則文本相關(guān)度sim(Q,D)為0.7。文本相關(guān)度越大,則查詢詞與查詢結(jié)果之間的相關(guān)性越大。實現(xiàn)本發(fā)明實施例所述的文本相關(guān)度的確定方法的計算過程偽碼的一種示例如下:這樣,根據(jù)通過本發(fā)明上述實施例所述的方法計算查詢詞和查詢結(jié)果之間的文本相關(guān)度,能夠使得所計算出的文本相似度相比現(xiàn)有技術(shù)更為準確合理,以體現(xiàn)出用戶主觀上對各查詢結(jié)果的傾向性,從而使得用戶可以快速準確地獲取所期望的查詢結(jié)果。需要補充說明的是,
背景技術(shù)
中提及的基于最長公共子串的方法以及基于詞命中率的方法還存在如下問題:在進行一個查詢串較長(分詞結(jié)果數(shù)大于等于4)的短文本搜索時,存在很多模糊查詢(非完全命中或者連續(xù)全命中)的情況,無法有效地對之進行區(qū)分,從而導(dǎo)致此部分用戶主觀能識別的差別無法通過計算相似度體現(xiàn)。為此,如在實施例1-4中所述,本發(fā)明提出了一種基于文本分詞結(jié)果的擴展文本編輯距離來度量文本相似度的方法。該方法與通常的文本編輯距離的計算方法不同。本發(fā)明更關(guān)注查詢串,計算單元為詞并引入詞權(quán)重。對于結(jié)果文本中完全包含查詢串的情況,即使前后還包含其他文本也認為是一個好的結(jié)果。所以本發(fā)明在計算中取結(jié)果文本的任意子串的編輯距離的最小值的歸一化值作為最終的編輯距離值。根據(jù)本發(fā)明的文本相關(guān)度確定方法不僅能夠解決所有現(xiàn)有技術(shù)(例如基于LCS的方法)能解決的搜索中文本相似度計算問題,同時還能解決許多現(xiàn)有技術(shù)的方案無法解決的問題。另外,本發(fā)明提出的改進算法具有與現(xiàn)有技術(shù)的原有算法相同的時間復(fù)雜度(O(m*n))。另外,本發(fā)明所提出的技術(shù)方案常用于搜索中文本串的相似度度量,尤其適用于短文本相似度的實時計算。實施例5圖2示出根據(jù)本發(fā)明一實施例的查詢結(jié)果的推送方法的流程圖。如圖2所示,該推送方法可以包括:步驟S500、確定查詢詞與各查詢結(jié)果之間的文本相關(guān)度,其中可以根據(jù)上述實施例1-4中任一實施例的文本相關(guān)度的確定方法來確定所述文本相關(guān)度,這里對具體的確定步驟和所能實現(xiàn)的效果不再贅述;以及步驟S600、按照所確定的文本相關(guān)度來推送查詢結(jié)果。舉例而言,查詢詞Q與查詢結(jié)果D1、查詢結(jié)果D2和查詢結(jié)果D3相對應(yīng),并且根據(jù)步驟S500計算出查詢詞Q與各查詢結(jié)果之間的文本相關(guān)度分別為0.3、0.5和0.7,則用戶在利用查詢詞Q進行查詢搜索的情況下,按照文本相關(guān)度從高到低的順序來推送這些查詢結(jié)果。例如在搜索結(jié)果頁面上順次顯示查詢結(jié)果D3、查詢結(jié)果D2和查詢結(jié)果D1。這樣,由于利用相比現(xiàn)有技術(shù)更為準確合理、并能夠體現(xiàn)出用戶主觀上對各查詢結(jié)果的傾向性的文本相關(guān)度來進行查詢結(jié)果的推送,根據(jù)本發(fā)明實施例的查詢結(jié)果的推送方法可以使得用戶快速準確地獲取所期望的查詢結(jié)果。實施例6圖3示出根據(jù)本發(fā)明一實施例的文本相關(guān)度的確定裝置500的結(jié)構(gòu)框圖。如圖3所示,該確定裝置可以包括:第一分詞模塊100,用于對查詢詞進行分詞處理,所述查詢詞對應(yīng)至少一個查詢結(jié)果;第二分詞模塊200,用于對各所述查詢結(jié)果進行分詞處理;計算模塊300,與第一分詞模塊100和第二分詞模塊299均連接,用于根據(jù)所述查詢詞的分詞結(jié)果和所述查詢結(jié)果的分詞結(jié)果來計算所述查詢詞到各所述查詢結(jié)果的編輯距離;以及確定模塊400,與計算模塊300連接,用于根據(jù)各所述編輯距離確定所述查詢詞與各所述查詢結(jié)果之間的文本相關(guān)度。上述的第一分詞模塊100、第二分詞模塊200、計算模塊300和確定模塊400的具體實現(xiàn)機理可參見實施例1中對步驟S100至S400的說明,并且,根據(jù)本發(fā)明上述實現(xiàn)方式的文本相關(guān)度的確定裝置500能夠獲得與實施例1相同的有益效果,這里不再贅述。在一種可能的實現(xiàn)方式中,第一分詞模塊100具體可以用于:將所述查詢詞轉(zhuǎn)變成由表示的有序詞序列,其中,qi是查詢詞Q的第i個分詞結(jié)果,qi在所述查詢詞Q中的詞權(quán)重為wqi;第二分詞模塊200具體可以用于:將所述查詢結(jié)果轉(zhuǎn)變成由表示的有序詞序列,其中,dj是查詢結(jié)果D的第j個分詞結(jié)果,dj在所述查詢結(jié)果D中的詞權(quán)重為wdj,這種實現(xiàn)方式的第一分詞模塊100和第二分詞模塊200的具體實現(xiàn)機理可參見實施例2中對步驟S100和S200的進一步具體說明,并且,根據(jù)本發(fā)明這種實現(xiàn)方式的文本相關(guān)度的確定裝置500能夠獲得與實施例2相同的有益效果,這里不再贅述。另外,本領(lǐng)域技術(shù)人員應(yīng)能理解,本發(fā)明的確定裝置500還可以只包括一個分詞模塊,該分詞模塊能夠?qū)崿F(xiàn)第一分詞模塊100和第二分詞模塊200的功能。在一種可能的實現(xiàn)方式中,計算模塊300具體可以用于:根據(jù)來計算所述查詢詞Q到所述查詢結(jié)果D的編輯距離EXTED(m,n),其中,EXTED(0,j)=0;EXTED(i,0)=EXTED(i-1,0)+C(add[qi]);增加操作的影響因子C(add[qi])=α×wqi;替換操作的影響因子C(replace[qi,dj])=β×(wqi+wdj);刪除操作的影響因子C(delete[dj])=γ×wdj;α、β、γ為預(yù)先設(shè)定的值。這種實現(xiàn)方式的計算模塊300的具體實現(xiàn)機理可參見實施例3中對步驟S300的進一步具體說明,并且,根據(jù)本發(fā)明這種實現(xiàn)方式的文本相關(guān)度的確定裝置500能夠獲得與實施例3相同的有益效果,這里不再贅述。在一種可能的實現(xiàn)方式中,確定模塊400具體可以用于:根據(jù)sim(Q,D)=1-min(EXTED(i,j))/EXTED(m,0)來確定所述查詢詞Q與所述查詢結(jié)果D之間的文本相關(guān)度sim(Q,D)。這種實現(xiàn)方式的確定模塊400的具體實現(xiàn)機理可參見實施例4中對步驟S400的進一步具體說明,并且,根據(jù)本發(fā)明這種實現(xiàn)方式的文本相關(guān)度的確定裝置500能夠獲得與實施例4相同的有益效果,這里不再贅述。實施例7圖4示出根據(jù)本發(fā)明一實施例的查詢結(jié)果的推送裝置700的結(jié)構(gòu)框圖,如圖4所示,該裝置可以包括:根據(jù)實施例6中任一實現(xiàn)方式的文本相關(guān)度的確定裝置500,用于確定文本相關(guān)度;以及推送裝置700,與文本相關(guān)度的確定裝置500連接,用于按照所確定的文本相關(guān)度來推送查詢結(jié)果。上述的文本相關(guān)度的確定裝置500和推送裝置600的具體實現(xiàn)機理可參見實施例6中對步驟S500和S600的說明,并且,根據(jù)本發(fā)明上述實現(xiàn)方式的查詢結(jié)果的推送裝置700能夠獲得與實施例6相同的有益效果,這里不再贅述。實施例8圖5示出了本發(fā)明又一實施例的文本相關(guān)度的確定裝置/查詢結(jié)果的推送裝置1100的結(jié)構(gòu)框圖。所述文本相關(guān)度的確定裝置/查詢結(jié)果的推送裝置1100可以是具備計算能力的主機服務(wù)器、個人計算機PC、或者可攜帶的便攜式計算機或終端等。本發(fā)明具體實施例并不對計算節(jié)點的具體實現(xiàn)做限定。所述文本相關(guān)度的確定裝置/查詢結(jié)果的推送裝置1100包括處理器(processor)1110、通信接口(CommunicationsInterface)1120、存儲器(memory)1130和總線1140。其中,處理器1110、通信接口1120、以及存儲器1130通過總線1140完成相互間的通信。通信接口1120用于與網(wǎng)絡(luò)設(shè)備通信,其中網(wǎng)絡(luò)設(shè)備包括例如虛擬機管理中心、共享存儲等。處理器1110用于執(zhí)行程序。處理器1110可能是一個中央處理器CPU,或者是專用集成電路ASIC(ApplicationSpecificIntegratedCircuit),或者是被配置成實施本發(fā)明實施例的一個或多個集成電路。存儲器1130用于存放文件。存儲器1130可能包含高速RAM存儲器,也可能還包括非易失性存儲器(non-volatilememory),例如至少一個磁盤存儲器。存儲器1130也可以是存儲器陣列。存儲器1130還可能被分塊,并且所述塊可按一定的規(guī)則組合成虛擬卷。在一種可能的實施方式中,上述程序可為包括計算機操作指令的程序代碼,該程序具體可用于實現(xiàn)上述實施例1-4中所述的文本相關(guān)度的確定方法所包括的各步驟,以及/或者用于實現(xiàn)上述實施例5所述的查詢結(jié)果的推送方法所包括的各步驟。本領(lǐng)域普通技術(shù)人員可以意識到,本文所描述的實施例中的各示例性單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件形式來實現(xiàn),取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以針對特定的應(yīng)用選擇不同的方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。如果以計算機軟件的形式來實現(xiàn)所述功能并作為獨立的產(chǎn)品銷售或使用時,則在一定程度上可認為本發(fā)明的技術(shù)方案的全部或部分(例如對現(xiàn)有技術(shù)做出貢獻的部分)是以計算機軟件產(chǎn)品的形式體現(xiàn)的。該計算機軟件產(chǎn)品通常存儲在計算機可讀取的非易失性存儲介質(zhì)中,包括若干指令用以使得計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各實施例方法的全部或部分步驟。而前述的存儲介質(zhì)包括U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域
的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1