亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種重復(fù)文本的判定方法和裝置與流程

文檔序號:12120897閱讀:375來源:國知局
一種重復(fù)文本的判定方法和裝置與流程

本發(fā)明涉及信息處理技術(shù),尤其涉及一種重復(fù)文本的判定方法,以及一種重復(fù)文本的判定裝置。



背景技術(shù):

在文本處理過程中,常常使用文本去重方法,去除文本中重復(fù)出現(xiàn)的信息。目前判定兩個文本是否重復(fù)時,通常先計算兩個文本的相似度,之后再對計算的相似度的大小進(jìn)行判斷,如果計算的相似度小于相似度閾值,則判定兩個文本重復(fù)。

常用的文本相似度算法包括余弦相似度算法和文本哈希算法,其中,余弦相似度算法是將文本轉(zhuǎn)化成向量,計算向量之間的夾角余弦值,夾角預(yù)小兩個文本的相似度越高;文本哈希算法是將文本映射成相應(yīng)的哈希值,通過比對哈希值判斷兩個文本的相似度,使用上述任意一種方法可以去除文本中的重復(fù)信息。

但是,上述兩種算法都具有缺陷。具體地,余弦相似度算法中文本轉(zhuǎn)化和向量夾角計算需要耗費較大的計算量,使得余弦相似度算法的計算效率較低,因此使用余弦相似度算法判斷重復(fù)文本的判斷效率較低;文本哈希算法中相似度的判斷條件非常嚴(yán)苛,算法在使用上缺乏靈活性。因此,需要一種計算量較小、使用靈活的相似度算法。



技術(shù)實現(xiàn)要素:

鑒于上述問題,本發(fā)明的實施例提供了一種重復(fù)文本的判定方法,以及一種重復(fù)文本的判定裝置。

依據(jù)本發(fā)明的一個方面,提供了一種重復(fù)文本的判定方法,所述方法包括:

判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù);

若所述概要信息不重復(fù),則分別提取所述第一文本和第二文本的特征內(nèi)容;

識別所述第一文本和第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù);

若所述特征內(nèi)容重復(fù),則判定所述第一文本和第二文本重復(fù)。

可選地,所述判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù)包括:

判斷所述第一文本的第一概要信息與所述第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

可選地,所述判斷所述第一文本的第一概要信息與所述第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值包括:

對所述第一文本的第一概要信息和所述第二文本的第二概要信息分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第一詞語集合和第二詞語集合;

確定所述第一詞語集合轉(zhuǎn)化成所述第二詞語集合所需的最少編輯次數(shù);

依據(jù)所述最少編輯次數(shù)計算所述第一概要信息與所述第二概要信息的相似度;

判斷計算的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

可選地,所述方法還包括:

若計算的相似度大于或等于預(yù)設(shè)的相似度閾值,則判定所述第一概要信息與所述第二概要信息重復(fù),當(dāng)所述第一概要信息和所述第二概要信息重復(fù)時確定所述第一文本和所述第二文本重復(fù)。

可選地,所述分別提取所述第一文本和所述第二文本的特征內(nèi)容包括:

對所述第一文本的第一文本內(nèi)容和所述第二文本的第二文本內(nèi)容分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第三詞語集合和第四詞語集合;

從所述第三詞語集合和所述第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合,所述第一特征詞語集合用于區(qū)分所述第一文本與其他文本,所述第二特征詞語集合用于區(qū)分所述第二文本與其他文本;

所述識別所述第一文本和第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù)包括:

識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)。

可選地,所述從所述第三詞語集合和所述第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合包括:

計算所述第三詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第一特征詞語集合;

計算所述第四詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第二特征詞語集合。

可選地,所述識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)包括:

對所述第一特征詞語集合和所述第二特征詞語集合分別進(jìn)行字符轉(zhuǎn)碼和計算處理,對應(yīng)得到具有相同字符數(shù)的第一特征編碼信息和第二特征編碼信息;

計算所述第一特征編碼信息和所述第二特征編碼信息之間的差異度;

判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值,若小于,則判定所述第一特征詞語集合與所述第二特征詞語集合重復(fù)。

可選地,所述對所述第一特征詞語集合和所述第二特征詞語集合分別進(jìn)行字符轉(zhuǎn)碼和計算處理,對應(yīng)得到具有相同字符數(shù)的第一特征編碼信息和第二特征編碼信息包括:

對所述第一特征詞語集合和所述第二特征詞語集合中的各個詞語分別進(jìn)行字符轉(zhuǎn)碼處理,每個詞語對應(yīng)得到一個二進(jìn)制編碼信息;

計算各個特征詞語集合中每個詞語在其所在的特征詞語集合中的權(quán)重值,

依據(jù)所述各個特征詞語集合中每個詞語的權(quán)重值以及每個詞語對應(yīng)的二進(jìn)制編碼信息,按照預(yù)設(shè)算法計算所述第一特征詞語集合所對應(yīng)的第一特征編碼信息以及所述第二特征詞語集合所對應(yīng)的第二特征編碼信息。

可選地,每個詞語的二進(jìn)制編碼信息具有相同的字符數(shù),所述按照預(yù)設(shè)算法包括:

針對各個二進(jìn)制編碼信息,如果出現(xiàn)編碼信息1,則將所述編碼信息1替換為對應(yīng)詞語的權(quán)重值,如果出現(xiàn)編碼信息0,則將所述編碼信息0替換為對應(yīng)詞語的權(quán)重值的負(fù)數(shù),得到權(quán)重值編碼信息;

累計所述第一特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第一權(quán)重值累計編碼信息;

累計所述第二特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第二權(quán)重值累計編碼信息;

按照將正數(shù)轉(zhuǎn)化為1、將負(fù)數(shù)轉(zhuǎn)化為0以及保持零不變的規(guī)則,處理所述第一權(quán)重值累計編碼信息得到所述第一特征編碼信息,處理所述第二權(quán)重值累計編碼信息得到所述第二特征編碼信息。

可選地,所述計算所述第一特征編碼信息和所述第二特征編碼信息之間的差異度包括:

計算所述第一特征編碼信息和所述第二特征編碼信息中處于同一字符位置的數(shù)值的差值絕對值,統(tǒng)計計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目;

所述判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值包括:

判斷計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的數(shù)目閾值。

依據(jù)本發(fā)明的另一個方面,提供了一種重復(fù)文本的判定裝置,所述裝置包括:

概要信息判斷模塊,用于判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù);

特征內(nèi)容提取模塊,用于若所述概要信息不重復(fù),則分別提取所述第一文本和所述第二文本的特征內(nèi)容;

特征內(nèi)容識別模塊,用于識別所述第一文本和所述第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù);

重復(fù)文本判定模塊,用于若所述特征內(nèi)容重復(fù),則判定所述第一文本和所述第二文本重復(fù)。

可選地,所述概要信息判斷模塊,具體用于判斷所述第一文本的第一概要信息與所述第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

可選地,所述概要信息判斷模塊包括:

第一詞語集合得到子模塊,用于對所述第一文本的第一概要信息和所述第二文本的第二概要信息分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第一詞語集合和第二詞語集合;

最少編輯次數(shù)確定子模塊,用于確定所述第一詞語集合轉(zhuǎn)化成所述第二詞語集合所需的最少編輯次數(shù);

相似度計算子模塊,用于依據(jù)所述最少編輯次數(shù)計算所述第一概要信息與所述第二概要信息的相似度;

相似度判斷子模塊,用于判斷計算的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

可選地,所述裝置還包括:

重復(fù)概要信息判定模塊,用于若計算的相似度大于或等于預(yù)設(shè)的相似度閾值,則判定所述第一概要信息與所述第二概要信息重復(fù),當(dāng)所述第一概要信息和所述第二概要信息重復(fù)時確定所述第一文本和所述第二文本重復(fù)。

可選地,所述特征內(nèi)容提取模塊包括:

第二詞語集合得到子模塊,用于對所述第一文本的第一文本內(nèi)容和所述第二文本的第二文本內(nèi)容分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第三詞語集合和第四詞語集合;

特征詞語集合提取子模塊,用于從所述第三詞語集合和所述第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合,所述第一特征詞語集合用于區(qū)分所述第一文本與其他文本,所述第二特征詞語集合用于區(qū)分所述第二文本與其他文本;

所述特征內(nèi)容識別模塊,具體用于識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)。

可選地,所述特征詞語集合提取子模塊包括:

區(qū)分度計算單元,用于計算所述第三詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,計算所述第四詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度;

特征詞語集合組成單元,用于從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第一特征詞語集合,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第二特征詞語集合。

可選地,所述特征內(nèi)容識別模塊包括:

特征編碼信息得到子模塊,用于對所述第一特征詞語集合和所述第二特征詞語集合分別進(jìn)行字符轉(zhuǎn)碼和計算處理,對應(yīng)得到具有相同字符數(shù)的第一特征編碼信息和第二特征編碼信息;

差異度計算子模塊,用于計算所述第一特征編碼信息和所述第二特征編碼信息之間的差異度;

差異度判斷子模塊,用于判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值;

重復(fù)特征詞語集合判定子模塊,用于若計算得到的差異度小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值,則判定所述第一特征詞語集合與所述第二特征詞語集合重復(fù)。

可選地,所述特征編碼信息得到子模塊包括:

轉(zhuǎn)碼處理單元,用于對所述第一特征詞語集合和所述第二特征詞語集合中的各個詞語分別進(jìn)行字符轉(zhuǎn)碼處理,每個詞語對應(yīng)得到一個二進(jìn)制編碼信息;

權(quán)重值計算單元,用于計算各個特征詞語集合中每個詞語在其所在的特征詞語集合中的權(quán)重值,

特征編碼信息計算單元,用于依據(jù)所述各個特征詞語集合中每個詞語的權(quán)重值以及每個詞語對應(yīng)的二進(jìn)制編碼信息,按照預(yù)設(shè)算法計算所述第一特征詞語集合所對應(yīng)的第一特征編碼信息以及所述第二特征詞語集合所對應(yīng)的第二特征編碼信息。

可選地,每個詞語的二進(jìn)制編碼信息具有相同的字符數(shù),所述特征編碼信息計算單元包括:

權(quán)重值替換子單元,用于針對各個二進(jìn)制編碼信息,如果出現(xiàn)編碼信息1,則將所述編碼信息1替換為對應(yīng)詞語的權(quán)重值,如果出現(xiàn)編碼信息0,則將所述編碼信息0替換為對應(yīng)詞語的權(quán)重值的負(fù)數(shù),得到權(quán)重值編碼信息;

權(quán)重值累計編碼信息得到子單元,用于累計所述第一特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第一權(quán)重值累計編碼信息,累計所述第二特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第二權(quán)重值累計編碼信息;

權(quán)重值累計編碼信息處理子單元,用于按照將正數(shù)轉(zhuǎn)化為1、將負(fù)數(shù)轉(zhuǎn)化為0以及保持零不變的規(guī)則,處理所述第一權(quán)重值累計編碼信息得到所述第一特征編碼信息,處理所述第二權(quán)重值累計編碼信息得到所述第二特征編碼信息。

可選地,所述差異度計算子模塊,具體用于計算所述第一特征編碼信息和所述第二特征編碼信息中處于同一字符位置的數(shù)值的差值絕對值,統(tǒng)計計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目;

所述差異度判斷子模塊,具體用于判斷計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的數(shù)目閾值。

與現(xiàn)有技術(shù)相比,本發(fā)明實施例中,先對第一文本和第二文本的概要信息進(jìn)行判斷,如果判定概要信息重復(fù),則認(rèn)定兩個文本重復(fù);如果判定概要信息不重復(fù),則再對第一文本和第二文本的特征內(nèi)容進(jìn)行判斷,如果判定特征內(nèi)容重復(fù),則判定第一文本和第二文本重復(fù)。因此,對于概要信息相同的文本,使用本方法可以快速完成重復(fù)文本的判斷;對于概要信息不同的文本,提取特征內(nèi)容,進(jìn)一步對文本的特征內(nèi)容進(jìn)行判斷,從而完成重復(fù)文本的判斷,本發(fā)明實施例對重復(fù)文本的判斷過程所需的計算量較小、判斷效率較高、算法使用靈活。

上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。

附圖說明

通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:

圖1示出了根據(jù)本發(fā)明實施例1的重復(fù)文本的判定方法的流程圖;

圖2示出了根據(jù)本發(fā)明實施例2的重復(fù)文本的判定方法的流程圖;

圖3示出了根據(jù)本發(fā)明實施例1的重復(fù)文本的判定裝置的結(jié)構(gòu)框圖;

圖4示出了根據(jù)本發(fā)明實施例2的重復(fù)文本的判定裝置的結(jié)構(gòu)框圖。

具體實施方式

下面將參照附圖更詳細(xì)地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

實施例1

參考圖1,示出了根據(jù)本發(fā)明實施例1的重復(fù)文本的判定方法的流程圖,該方法具體可以包括以下步驟:

步驟101、判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù)。

本發(fā)明實施例中,第一文本和第二文本可以是新聞、文章、論文等,相應(yīng)的,概要信息可以為新聞標(biāo)題、文章標(biāo)題、文章關(guān)鍵詞、論文標(biāo)題、論文概要、論文關(guān)鍵詞等,也可以為上述多種信息的組合。本發(fā)明實施例可以應(yīng)用于網(wǎng)頁文本,概要信息可以為網(wǎng)頁文本所對應(yīng)的網(wǎng)絡(luò)地址、網(wǎng)頁文本關(guān)鍵詞等信息中的一種或多種組合。

在對第一文本和第二文本進(jìn)行判斷時,可以先對兩個文本的概要信息進(jìn)行判斷,判斷兩個概要信息是否滿足預(yù)設(shè)的針對重復(fù)文本的判斷條件,如果滿足,則判定兩個文本重復(fù),從而快速完成對重復(fù)文本的判斷過程;如果不滿足,則執(zhí)行下一步驟。

例如,對第一新聞的新聞標(biāo)題和第二新聞的新聞標(biāo)題進(jìn)行判斷,如果兩個新聞標(biāo)題重復(fù),則判定兩個文本重復(fù),否則,判定兩個文本不重復(fù),執(zhí)行下一步驟;對網(wǎng)頁文本所在的網(wǎng)絡(luò)地址是否相同進(jìn)行判斷,同時對同時存在于兩個文本中的網(wǎng)頁文本關(guān)鍵詞的數(shù)目是否達(dá)到數(shù)目閾值進(jìn)行判斷,如果兩個判斷條件均滿足,則判定兩個文本為重復(fù)文本。

可以根據(jù)需要限定重復(fù)文本的具體含義,例如,限定兩個概要信息完全相同的文本為重復(fù)文本、限定兩個概要信息的相似度大于預(yù)設(shè)相似度閾值的文本為重復(fù)文本等。

步驟102、若所述概要信息不重復(fù),則分別提取所述第一文本和所述第二文本的特征內(nèi)容。

如果判定兩個文本的概要信息不重復(fù),則對兩個文本的文本內(nèi)容進(jìn)行進(jìn)一步判斷,如果判定兩個文本的文本內(nèi)容相同,則判定兩個文本重復(fù);否則,判定兩個文本不重復(fù)。

對于內(nèi)容較多的文本,如果對整個文本的內(nèi)容進(jìn)行重復(fù)判斷,則需要耗費較大的工作量和較長的工作時間,從而導(dǎo)致針對文本內(nèi)容的重復(fù)判斷操作的效率較低。本發(fā)明實施例為了提高針對文本內(nèi)容的重復(fù)判斷操作的效率,不對文本的所有內(nèi)容進(jìn)行重復(fù)判斷,而是對文本的特征內(nèi)容進(jìn)行判斷,由于特征內(nèi)容與整個內(nèi)容相比,信息量較少,因此提高了重復(fù)判斷操作的效率。

本發(fā)明實施例在判定兩個文本的概要信息不重復(fù)后,對第一文本和第二文本中的特征內(nèi)容進(jìn)行提取。特征內(nèi)容是指可以將特征內(nèi)容所在文本與其他文本進(jìn)行區(qū)分的內(nèi)容,可以依據(jù)詞語在不同文本中的使用頻率、出現(xiàn)某一詞語的文本數(shù)量等條件或條件組合確定。例如,某一詞語在其所在文本中的使用頻率高、同時在數(shù)據(jù)庫中出現(xiàn)該詞語的文本數(shù)量少,則可以選定該詞語作為特征內(nèi)容。

步驟103、識別所述第一文本和所述第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù)。

在提取到第一文本和第二文本的特征內(nèi)容后,對兩個文本的特征內(nèi)容進(jìn)行識別,判斷兩個文本的特征內(nèi)容是否重復(fù)。實際中可以計算兩個文本的特征內(nèi)容的相似度,如果計算的相似度大于預(yù)設(shè)的相似度閾值,則判定兩個文本的特征內(nèi)容重復(fù)。

步驟104、若所述特征內(nèi)容重復(fù),則判定所述第一文本和所述第二文本重復(fù)。

如果判定第一文本的特征內(nèi)容與第二文本的特征內(nèi)容重復(fù),如判定兩個文本的特征內(nèi)容的相似度大于預(yù)設(shè)的相似度閾值,則判定兩個文本是重復(fù)文本。

對于網(wǎng)頁文本,可以先識別網(wǎng)頁結(jié)構(gòu),再根據(jù)網(wǎng)頁結(jié)構(gòu)提取文本標(biāo)題和文本內(nèi)容。網(wǎng)絡(luò)數(shù)據(jù)庫中存儲海量的文本信息,可以使用本發(fā)明實施例所述的方法從海量文本信息中快速判斷具有重復(fù)標(biāo)題的文本為重復(fù)文本,從而提高對海量文本信息中具有重復(fù)標(biāo)題的重復(fù)文本的判斷速度。

依據(jù)本發(fā)明實施例,先對第一文本和第二文本的概要信息進(jìn)行判斷,如果判定概要信息重復(fù),則認(rèn)定兩個文本重復(fù);如果判定概要信息不重復(fù),則再對第一文本和第二文本的特征內(nèi)容進(jìn)行判斷,如果判定特征內(nèi)容重復(fù),則判定第一文本和第二文本重復(fù)。因此,本發(fā)明實施例對于概要信息相同的文本,使用本方法可以快速完成重復(fù)文本的判斷;對于概要信息不同的文本,提取特征內(nèi)容,進(jìn)一步對文本的特征內(nèi)容進(jìn)行判斷,從而完成重復(fù)文本的判斷,本發(fā)明實施例對重復(fù)文本的判斷過程所需的計算量較小、判斷效率較高、算法使用靈活。

實施例2

參考圖2,示出了根據(jù)本發(fā)明實施例2的重復(fù)文本的判定方法的流程圖,該方法具體可以包括以下步驟:

步驟201、判斷所述第一文本的第一概要信息與所述第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

本發(fā)明實施例中,第一文本和第二文本可以是新聞、文章、論文等,相應(yīng)的,概要信息可以為新聞標(biāo)題、文章標(biāo)題、文章關(guān)鍵詞、論文標(biāo)題、論文概要、論文關(guān)鍵詞等,也可以為上述多種信息的組合。

本發(fā)明實施例判斷兩個文本是否重復(fù)時,先對兩個文本的概要信息進(jìn)行重復(fù)判斷,具體地,可以先計算兩個概要信息的相似度,然后判斷計算得到的相似度是否大于針對重復(fù)文本預(yù)設(shè)的相似度閾值,若計算的相似度大于或等于預(yù)設(shè)的相似度閾值,則判定第一概要信息與所述第二概要信息重復(fù),進(jìn)一步判定第一文本與第二文本重復(fù),即當(dāng)?shù)谝桓乓畔⒑偷诙乓畔⒅貜?fù)時確定第一文本和第二文本重復(fù);若計算的相似度小于預(yù)設(shè)的相似度閾值,則判定第一概要信息與所述第二概要信息不重復(fù),進(jìn)一步判定第一文本與第二文本不重復(fù)。

例如,針對重復(fù)概要信息設(shè)定的相似度閾值為95%,如果針對兩個文本的概要信息計算的相似度為90%,則判定兩個文本不重復(fù);如果針對兩個文本的的概要信息計算的相似度為97%,則判定兩個文本重復(fù)。

概要信息中存在停用詞即無意義詞,無意義詞指一些連接詞語、語氣詞語等,如“而且”、“并且”、“況且”、“啊”、“了”、“嗎”等,在對兩個文本的概要信息進(jìn)行相似度計算時,大量的停用詞不僅會增加計算工作量,有時還會影響相似度的計算結(jié)果,因此為減小相似度的計算工作量和提高計算結(jié)果的準(zhǔn)確定,本發(fā)明實施例在進(jìn)行概要信息的相似度計算時,可以先去除概要信息中的停用詞,再對剩余的有意義字詞進(jìn)行相似度計算。

具體地,判斷第一文本的第一概要信息與第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值的步驟可以包括:首先,對第一文本的第一概要信息和第二文本的第二概要信息分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第一詞語集合和第二詞語集合;其次,確定第一詞語集合轉(zhuǎn)化成第二詞語集合所需的最少編輯次數(shù),最少編輯次數(shù)越少,說明兩個詞語集合越相似,說明兩個文本越相似;再次,依據(jù)確定的最少編輯次數(shù)計算第一概要信息與所述第二概要信息的相似度;最后判斷計算的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

可以使用最小編輯距離算法(Levenshtein distance算法),計算第一詞語集合轉(zhuǎn)化成第二詞語集合所需的最少編輯次數(shù),即兩個詞語集合之間的編輯距離,其中,編輯可以包括替換、插入和刪除。一般編輯距離越小,說明兩個集合的相似度越高。

在使用最小編輯距離算法計算得到編輯距離后,使用公式sim=1–LD/(m+n),計算兩個概要信息的相似度。其中,sim為兩個概要信息的相似度、LD為編輯距離、m為第一詞語集合所包含的詞語的數(shù)目、n為第一詞語集合所包含的詞語的數(shù)目。

步驟202、若所述第一文本的第一概要信息與所述第二文本的第二概要信息不重復(fù),則對所述第一文本的第一文本內(nèi)容和所述第二文本的第二文本內(nèi)容分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第三詞語集合和第四詞語集合。

如果判定第一文本的第一概要信息與第二文本的第二概要信息不重復(fù),則需要對兩個文本的文本內(nèi)容進(jìn)行重復(fù)判斷。同樣考慮到文本內(nèi)容中包含大量的停用詞,為減小相似度的計算工作量和提高計算結(jié)果的準(zhǔn)確性,本發(fā)明實施例在進(jìn)行文本內(nèi)容的相似度計算時,可以先去除兩個文本內(nèi)容中的停用詞,具體地分別對兩個文本內(nèi)容進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第三詞語集合和第四詞語集合。

步驟203、從所述第三詞語集合和所述第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合。

對于包含指定數(shù)目文本的數(shù)據(jù)庫,不同文本中所包含的詞語可能不同、相同詞語使用的比例可能不同,可以通過數(shù)據(jù)分析,提取第一詞語集合中可以用來區(qū)分第一文本與其他文本的詞語,將提取的詞語組成第一特征詞語集合;提取第二詞語集合中可以用來區(qū)分第二文本與其他文本的詞語,將提取的詞語組成第二特征詞語集合。

由于特征詞語集合對文本具有區(qū)分功能,因此可以通過比對不同文本的特征詞語集合判斷兩個文本是否重復(fù)。

具體地,所述從第三詞語集合和第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合的步驟可以包括:

計算第三詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成第一區(qū)分詞語集合。

計算第四詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成第二區(qū)分詞語集合。

可以使用tf-idf算法(term frequency–inverse document frequency算法),計算詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度。對于包含大量文本的數(shù)據(jù)庫,如果某一詞語在某一文本中出現(xiàn)的頻率越高、同時包含該詞語的其他文本越少,則該詞語對該文本具有較好的區(qū)分作用,該詞語具有較大的區(qū)分度。

步驟204、識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)。

本步驟對屬于第一文本內(nèi)容的第一特征詞語集合和屬于第二文本內(nèi)容的第二特征詞語集合進(jìn)行重復(fù)判斷,如果判定兩個特征詞語集合重復(fù),則確定兩個文本重復(fù);否則,確定兩個文本不重復(fù)。實際中可以判斷兩個特征詞語集合的相似度是否大于或等于預(yù)設(shè)的相似度閾值,如果大于或等于,則判定兩個特征詞語集合重復(fù)。

所述識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)的步驟可以包括:

首先,對所述第一特征詞語集合和所述第二特征詞語集合分別進(jìn)行字符轉(zhuǎn)碼和計算處理,對應(yīng)得到具有相同字符數(shù)的第一特征編碼信息和第二特征編碼信息。

具體地,可以通過以下步驟從特征詞語集合獲取特征編碼信息,包括:1、對所述第一特征詞語集合和所述第二特征詞語集合中的各個詞語分別進(jìn)行字符轉(zhuǎn)碼處理,每個詞語對應(yīng)得到一個二進(jìn)制編碼信息,具體轉(zhuǎn)碼過程可以包括:先將特征詞語集合映射成ASCII(American Standard Code for Information Interchange,美國標(biāo)準(zhǔn)信息交換代碼);再使用hash(哈希)函數(shù),將得到的ASCII碼映射成0-1二進(jìn)制編碼信息;2、計算各個特征詞語集合中每個詞語在其所在的特征詞語集合中的權(quán)重值;3、依據(jù)所述各個特征詞語集合中每個詞語的權(quán)重值以及每個詞語對應(yīng)的二進(jìn)制編碼信息,按照預(yù)設(shè)算法計算所述第一特征詞語集合所對應(yīng)的第一特征編碼信息以及所述第二特征詞語集合所對應(yīng)的第二特征編碼信息。

每個詞語的二進(jìn)制編碼信息可以具有相同的字符數(shù),所述按照預(yù)設(shè)算法可以包括:

S1、針對各個二進(jìn)制編碼信息,如果出現(xiàn)編碼信息1,則將所述編碼信息1替換為對應(yīng)詞語的權(quán)重值,如果出現(xiàn)編碼信息0,則將所述編碼信息0替換為對應(yīng)詞語的權(quán)重值的負(fù)數(shù),得到權(quán)重值編碼信息;

S2、累計所述第一特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第一權(quán)重值累計編碼信息;

S3、累計所述第二特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第二權(quán)重值累計編碼信息;

S4、按照將正數(shù)轉(zhuǎn)化為1、將負(fù)數(shù)轉(zhuǎn)化為0以及保持零不變的規(guī)則,處理所述第一權(quán)重值累計編碼信息得到所述第一特征編碼信息,處理所述第二權(quán)重值累計編碼信息得到所述第二特征編碼信息。第一特征編碼信息和第二特征編碼信息為具有相同位數(shù)的二進(jìn)制編碼信息。

可以使用simhash算法計算第一特征編碼信息和第二特征編碼信息。

其次,計算第一特征編碼信息和第二特征編碼信息之間的差異度。

具體地,可以通過以下步驟計算第一特征編碼信息和第二特征編碼信息之間的差異度:計算第一特征編碼信息和第二特征編碼信息中處于同一字符位置的數(shù)值的差值絕對值,統(tǒng)計計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目。

最后,判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值。

具體地,可以通過以下步驟判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值:判斷計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的數(shù)目閾值。若計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目小于針對重復(fù)特征編碼信息預(yù)設(shè)的數(shù)目閾值,則判定第一特征詞語集合與第二特征詞語集合重復(fù);否則,判定第一特征詞語集合與第二特征詞語集合不重復(fù)。

可以分別計算第一特征詞語集合和第二特征詞語集合的海明距離,如果海明距離小于預(yù)設(shè)閾值,則判定兩個特征集合重復(fù),進(jìn)而判定兩個文本重復(fù)。

步驟205、若所述特征詞語集合,則判定所述第一文本和所述第二文本重復(fù)。

判定兩個文本的特征集合重復(fù)后,即可判定兩個文本重復(fù)。

依據(jù)本發(fā)明實施例,先對第一文本和第二文本的概要信息進(jìn)行判斷,如果判定概要信息重復(fù),則認(rèn)定兩個文本重復(fù);如果判定概要信息不重復(fù),則再對第一文本和第二文本的特征內(nèi)容進(jìn)行判斷,如果判定特征內(nèi)容重復(fù),則判定第一文本和第二文本重復(fù)。因此,本發(fā)明實施例對于概要信息相同的文本,使用本方法可以快速完成重復(fù)文本的判斷;對于概要信息不同的文本,提取特征內(nèi)容,進(jìn)一步對文本的特征內(nèi)容進(jìn)行判斷,從而完成重復(fù)文本的判斷,本發(fā)明實施例對重復(fù)文本的判斷過程所需的計算量較小、判斷效率較高、算法使用靈活。

實施例3

參考圖3,示出了根據(jù)本發(fā)明實施例1的重復(fù)文本的判定裝置的結(jié)構(gòu)框圖,具體可以包括:

概要信息判斷模塊301,用于判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù)。

特征內(nèi)容提取模塊302,用于若所述概要信息不重復(fù),則分別提取所述第一文本和所述第二文本的特征內(nèi)容。

特征內(nèi)容識別模塊303,用于識別所述第一文本和所述第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù)。

重復(fù)文本判定模塊304,用于若所述特征內(nèi)容重復(fù),則判定所述第一文本和所述第二文本重復(fù)。

依據(jù)本發(fā)明實施例,先對第一文本和第二文本的概要信息進(jìn)行判斷,如果判定概要信息重復(fù),則認(rèn)定兩個文本重復(fù);如果判定概要信息不重復(fù),則再對第一文本和第二文本的特征內(nèi)容進(jìn)行判斷,如果判定特征內(nèi)容重復(fù),則判定第一文本和第二文本重復(fù)。因此,本發(fā)明實施例對于概要信息相同的文本,使用本方法可以快速完成重復(fù)文本的判斷;對于概要信息不同的文本,提取特征內(nèi)容,進(jìn)一步對文本的特征內(nèi)容進(jìn)行判斷,從而完成重復(fù)文本的判斷,本發(fā)明實施例對重復(fù)文本的判斷過程所需的計算量較小、判斷效率較高、算法使用靈活。

實施例4

參考圖4,示出了根據(jù)本發(fā)明實施例2的重復(fù)文本的判定裝置的結(jié)構(gòu)框圖,具體可以包括:

概要信息判斷模塊401,用于判斷第一文本和第二文本分別對應(yīng)的概要信息是否重復(fù)。

特征內(nèi)容提取模塊402,用于若所述概要信息不重復(fù),則分別提取所述第一文本和所述第二文本的特征內(nèi)容。

特征內(nèi)容識別模塊403,用于識別所述第一文本和所述第二文本分別對應(yīng)的特征內(nèi)容是否重復(fù)。

重復(fù)文本判定模塊404,用于若所述特征內(nèi)容重復(fù),則判定所述第一文本和所述第二文本重復(fù)。

所述概要信息判斷模塊401,具體用于判斷所述第一文本的第一概要信息與所述第二文本的第二概要信息的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

所述特征內(nèi)容提取模塊402包括:

第二詞語集合得到子模塊4021,用于對所述第一文本的第一文本內(nèi)容和所述第二文本的第二文本內(nèi)容分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第三詞語集合和第四詞語集合;

特征詞語集合提取子模塊4022,用于從所述第三詞語集合和所述第四詞語集合中分別提取第一特征詞語集合和第二特征詞語集合,所述第一特征詞語集合用于區(qū)分所述第一文本與其他文本,所述第二特征詞語集合用于區(qū)分所述第二文本與其他文本;

所述特征內(nèi)容識別模塊403,具體用于識別所述第一特征詞語集合和所述第二特征詞語集合是否重復(fù)。

本發(fā)明實施例中,優(yōu)選地,所述概要信息判斷模塊401包括:

第一詞語集合得到子模塊,用于對所述第一文本的第一概要信息和所述第二文本的第二概要信息分別進(jìn)行分詞和去除停用詞處理,對應(yīng)得到第一詞語集合和第二詞語集合;

最少編輯次數(shù)確定子模塊,用于確定所述第一詞語集合轉(zhuǎn)化成所述第二詞語集合所需的最少編輯次數(shù);

相似度計算子模塊,用于依據(jù)所述最少編輯次數(shù)計算所述第一概要信息與所述第二概要信息的相似度;

相似度判斷子模塊,用于判斷計算的相似度是否大于或等于預(yù)設(shè)的相似度閾值。

本發(fā)明實施例中,優(yōu)選地,所述裝置還包括:

重復(fù)概要信息判定模塊,用于若計算的相似度大于或等于預(yù)設(shè)的相似度閾值,則判定所述第一概要信息與所述第二概要信息重復(fù),當(dāng)所述第一概要信息和所述第二概要信息重復(fù)時確定所述第一文本和所述第二文本重復(fù)。

本發(fā)明實施例中,優(yōu)選地,所述特征詞語集合提取子模塊4022包括:

區(qū)分度計算單元,用于計算所述第三詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度,計算所述第四詞語集合中各個詞語與其他文本的文本內(nèi)容的區(qū)分度;

特征詞語集合組成單元,用于從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第一特征詞語集合,從所有詞語中提取預(yù)設(shè)數(shù)目的區(qū)分度排名靠前的詞語或提取所述區(qū)分度大于區(qū)分度閾值的詞語,將提取的詞語組成所述第二特征詞語集合。

本發(fā)明實施例中,優(yōu)選地,所述特征內(nèi)容識別模塊403包括:

特征編碼信息得到子模塊,用于對所述第一特征詞語集合和所述第二特征詞語集合分別進(jìn)行字符轉(zhuǎn)碼和計算處理,對應(yīng)得到具有相同字符數(shù)的第一特征編碼信息和第二特征編碼信息;

差異度計算子模塊,用于計算所述第一特征編碼信息和所述第二特征編碼信息之間的差異度;

差異度判斷子模塊,用于判斷計算得到的差異度是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值;

重復(fù)特征詞語集合判定子模塊,用于若計算得到的差異度小于針對重復(fù)特征編碼信息預(yù)設(shè)的差異度閾值,則判定所述第一特征詞語集合與所述第二特征詞語集合重復(fù)。

本發(fā)明實施例中,優(yōu)選地,所述特征編碼信息得到子模塊包括:

轉(zhuǎn)碼處理單元,用于對所述第一特征詞語集合和所述第二特征詞語集合中的各個詞語分別進(jìn)行字符轉(zhuǎn)碼處理,每個詞語對應(yīng)得到一個二進(jìn)制編碼信息;

權(quán)重值計算單元,用于計算各個特征詞語集合中每個詞語在其所在的特征詞語集合中的權(quán)重值,

特征編碼信息計算單元,用于依據(jù)所述各個特征詞語集合中每個詞語的權(quán)重值以及每個詞語對應(yīng)的二進(jìn)制編碼信息,按照預(yù)設(shè)算法計算所述第一特征詞語集合所對應(yīng)的第一特征編碼信息以及所述第二特征詞語集合所對應(yīng)的第二特征編碼信息。

本發(fā)明實施例中,優(yōu)選地,每個詞語的二進(jìn)制編碼信息具有相同的字符數(shù),所述特征編碼信息計算單元包括:

權(quán)重值替換子單元,用于針對各個二進(jìn)制編碼信息,如果出現(xiàn)編碼信息1,則將所述編碼信息1替換為對應(yīng)詞語的權(quán)重值,如果出現(xiàn)編碼信息0,則將所述編碼信息0替換為對應(yīng)詞語的權(quán)重值的負(fù)數(shù),得到權(quán)重值編碼信息;

權(quán)重值累計編碼信息得到子單元,用于累計所述第一特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第一權(quán)重值累計編碼信息,累計所述第二特征詞語集合中所有詞語的權(quán)重值編碼信息中處于同一字符位置的數(shù)值的總和,得到第二權(quán)重值累計編碼信息;

權(quán)重值累計編碼信息處理子單元,用于按照將正數(shù)轉(zhuǎn)化為1、將負(fù)數(shù)轉(zhuǎn)化為0以及保持零不變的規(guī)則,處理所述第一權(quán)重值累計編碼信息得到所述第一特征編碼信息,處理所述第二權(quán)重值累計編碼信息得到所述第二特征編碼信息。

本發(fā)明實施例中,優(yōu)選地,所述差異度計算子模塊,具體用于計算所述第一特征編碼信息和所述第二特征編碼信息中處于同一字符位置的數(shù)值的差值絕對值,統(tǒng)計計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目;

所述差異度判斷子模塊,具體用于判斷計算后的處于不同字符位置的多個數(shù)值中數(shù)值1存在的數(shù)目是否小于針對重復(fù)特征編碼信息預(yù)設(shè)的數(shù)目閾值。

依據(jù)本發(fā)明實施例,先對第一文本和第二文本的概要信息進(jìn)行判斷,如果判定概要信息重復(fù),則認(rèn)定兩個文本重復(fù);如果判定概要信息不重復(fù),則再對第一文本和第二文本的特征內(nèi)容進(jìn)行判斷,如果判定特征內(nèi)容重復(fù),則判定第一文本和第二文本重復(fù)。因此,本發(fā)明實施例對于概要信息相同的文本,使用本方法可以快速完成重復(fù)文本的判斷;對于概要信息不同的文本,提取特征內(nèi)容,進(jìn)一步對文本的特征內(nèi)容進(jìn)行判斷,從而完成重復(fù)文本的判斷,本發(fā)明實施例對重復(fù)文本的判斷過程所需的計算量較小、判斷效率較高、算法使用靈活。

由于所述裝置實施例基本相應(yīng)于前述圖1-圖2所示的方法實施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關(guān)說明,在此就不贅述了。

在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。

在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細(xì)節(jié)的情況下實踐。在一些實例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。

類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。

本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實施例的任意之一都可以以任意的組合方式來使用。

本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的重復(fù)文本的判定裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。

應(yīng)該注意的是上述實施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1