專利名稱:一種語言元素的反饋方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字?jǐn)?shù)據(jù)處理領(lǐng)域,尤其涉及一種語言元素的反饋方法和設(shè)備。
背景技術(shù):
隨著互聯(lián)網(wǎng)的普及,文本信息爆炸性增長,人們每天需要處理的文本信息也越來越多。因此,很多文本處理系統(tǒng)應(yīng)運(yùn)而生,例如文本分類系統(tǒng)。現(xiàn)有的文本分類系統(tǒng)是將待分類文本的語言元素特征固化在工具中,例如,當(dāng)文本包含某些詞語時,就屬于某類,當(dāng)輸入新的文本時,即按照詞語特征進(jìn)行匹配。現(xiàn)有的文本處理系統(tǒng)根據(jù)語言元素本身處理文本信息,信息較為具體,可擴(kuò)展性較差;另外針對不同的后續(xù)處理,需要修改整個處理系統(tǒng),改動大,可移植性較差;因此大大影響了用戶體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種語言元素的反饋方法和設(shè)備,用于提高文本處理系統(tǒng)的可擴(kuò)展性、可移植性,從而提高用戶體驗(yàn)。本發(fā)明實(shí)施例提供了一種語言元素的反饋方法,包括服務(wù)器接收待識別的文本信息;所述服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息;所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。本發(fā)明實(shí)施例提供了一種語言元素的反饋設(shè)備,包括接收模塊,用于接收待識別的文本信息;識別模塊,用于識別所述文本信息的語言元素,生成語言元素屬性信息;發(fā)送模塊,用于將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。本發(fā)明實(shí)施例提供的一種語言元素的反饋方法和設(shè)備,通過服務(wù)器提取語言元素屬性并反饋給客戶端,為客戶端提供了更多參考信息,因此增強(qiáng)了文本處理系統(tǒng)的可擴(kuò)展性;再由客戶端進(jìn)行過濾,因此,對于不同的后續(xù)處理,可以采用不同的規(guī)則,從而提高了文本處理系統(tǒng)的可移植性;最終提高了用戶體驗(yàn)。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1所示為本發(fā)明實(shí)施例一種語言元素的反饋方法的流程圖2所示為本發(fā)明實(shí)施例一種語言元素的反饋設(shè)備的結(jié)構(gòu)圖。
具體實(shí)施例方式圖1所示為本發(fā)明實(shí)施例一種語言元素的反饋方法的流程圖,本實(shí)施例包括步驟101,服務(wù)器接收待識別的文本信息;步驟102,所述服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息;步驟103,所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。所述語言元素可以包括標(biāo)點(diǎn)、符號、字、語素、詞、詞組、語塊、組塊、固定搭配、句子成分、子句、和/或句子等。所述語言元素屬性信息包括語言元素屬性,所述語言元素屬性可以包括主語性質(zhì)的、謂語性質(zhì)的、賓語性質(zhì)的、代詞性的、名詞性的、動詞性的、修飾性的、否定意思的、重復(fù)出現(xiàn)的、所在位置性質(zhì)的、和/或是否與所述句子的主題相關(guān)的等。所述接收待識別的文本信息可以包括從客戶端接收待處理的文本信息,以及請求所述服務(wù)器識別的所述文本信息的語言元素屬性;從網(wǎng)絡(luò)爬蟲接收待處理的文本信息, 以及設(shè)置的請求所述服務(wù)器識別的所述文本信息的語言元素屬性。接收到文本信息和請求識別的屬性后,服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息。最后所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。例如在法律文件中,為了描述準(zhǔn)確,通常添加很多修飾性的語言元素,例如形容詞,然而在閱讀者看來,這些文字對于讀懂句子并沒有太大幫助。因此,服務(wù)器可以在將文本發(fā)送給客戶端的同時,將其中的修飾性語言元素屬性信息也發(fā)送給客戶端。這樣,客戶端可以根據(jù)自己的需求,對語言元素屬性為修飾性的語言元素進(jìn)行處理,例如,不進(jìn)行顯示等等。例如,若服務(wù)器發(fā)送修飾性的語言元素屬性信息,則本專利申請文件權(quán)利要求1 “服務(wù)器接收待識別的文本信息;所述服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息;所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。,,中的修飾性的語言元素依次可以為“待識別的”、“所述文本信息的”、“所述文本信息的”。服務(wù)器可以將這些語言元素的屬性,即修飾性的,通過語言元素屬性信息反饋給客戶端。本發(fā)明實(shí)施例提供的一種語言元素的反饋方法,通過服務(wù)器提取語言元素屬性并反饋給客戶端,為客戶端提供了更多參考信息,因此增強(qiáng)了文本處理系統(tǒng)的可擴(kuò)展性;再由客戶端進(jìn)行過濾,因此,對于不同的后續(xù)處理,可以采用不同的規(guī)則,從而提高了文本處理系統(tǒng)的可移植性;最終提高了用戶體驗(yàn)。圖2所示為本發(fā)明實(shí)施例一種語言元素的反饋設(shè)備的結(jié)構(gòu)圖,本實(shí)施例包括接收模塊201,用于接收待識別的文本信息;識別模塊202,用于識別所述文本信息的語言元素,生成語言元素屬性信息;發(fā)送模塊203,用于將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。
4
本實(shí)施例用于實(shí)施圖1所示實(shí)施例的方法。本發(fā)明實(shí)施例的接收模塊可以用于從客戶端接收待處理的文本信息,以及請求所述服務(wù)器識別的所述文本信息的語言元素屬性;或從網(wǎng)絡(luò)爬蟲接收待處理的文本信息,以及設(shè)置的請求所述服務(wù)器識別的所述文本信息的語言元素屬性。所述語言元素包括標(biāo)點(diǎn)、符號、字、語素、詞、詞組、語塊、組塊、固定搭配、句子成分、子句、和/或句子。所述語言元素屬性信息包括語言元素屬性,所述語言元素屬性包括主語性質(zhì)的、謂語性質(zhì)的、賓語性質(zhì)的、代詞性的、名詞性的、動詞性的、修飾性的、 否定意思的、重復(fù)出現(xiàn)的、所在位置性質(zhì)的、和/或是否與所述句子的主題相關(guān)的。本發(fā)明實(shí)施例提供的一種語言元素的反饋設(shè)備,通過服務(wù)器提取語言元素屬性并反饋給客戶端,為客戶端提供了更多參考信息,因此增強(qiáng)了文本處理系統(tǒng)的可擴(kuò)展性;再由客戶端進(jìn)行過濾,因此,對于不同的后續(xù)處理,可以采用不同的規(guī)則,從而提高了文本處理系統(tǒng)的可移植性;最終提高了用戶體驗(yàn)。通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在可讀取的存儲介質(zhì)中,如計算機(jī)的軟盤,硬盤或光盤等,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例上述的方法。以上上述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)上述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種語言元素的反饋方法,其特征在于,包括服務(wù)器接收待識別的文本信息;所述服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息;所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。
2.如權(quán)利要求1所述的方法,其特征在于,所述接收待識別的文本信息包括從客戶端接收待處理的文本信息,以及請求所述服務(wù)器識別的所述文本信息的語言元素屬性;或從網(wǎng)絡(luò)爬蟲接收待處理的文本信息,以及設(shè)置的請求所述服務(wù)器識別的所述文本信息的語言元素屬性。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述語言元素包括標(biāo)點(diǎn)、符號、字、語素、詞、詞組、語塊、組塊、固定搭配、句子成分、子句、和/或句子。
4.如權(quán)利要求1或2所述的方法,其特征在于,所述語言元素屬性信息包括語言元素屬性,所述語言元素屬性包括主語性質(zhì)的、謂語性質(zhì)的、賓語性質(zhì)的、代詞性的、名詞性的、動詞性的、修飾性的、否定意思的、重復(fù)出現(xiàn)的、所在位置性質(zhì)的、和/或是否與所述句子的主題相關(guān)的。
5.一種語言元素的反饋設(shè)備,其特征在于,包括接收模塊,用于接收待識別的文本信息;識別模塊,用于識別所述文本信息的語言元素,生成語言元素屬性信息;發(fā)送模塊,用于將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。
6.如權(quán)利要求5所述的設(shè)備,其特征在于,所述接收模塊用于從客戶端接收待處理的文本信息,以及請求所述服務(wù)器識別的所述文本信息的語言元素屬性;或從網(wǎng)絡(luò)爬蟲接收待處理的文本信息,以及設(shè)置的請求所述服務(wù)器識別的所述文本信息的語言元素屬性。
7.如權(quán)利要求5或6所述的設(shè)備,其特征在于,所述語言元素包括標(biāo)點(diǎn)、符號、字、語素、詞、詞組、語塊、組塊、固定搭配、句子成分、子句、和/或句子。
8.如權(quán)利要求5或6所述的設(shè)備,其特征在于,所述語言元素屬性信息包括語言元素屬性,所述語言元素屬性包括主語性質(zhì)的、謂語性質(zhì)的、賓語性質(zhì)的、代詞性的、名詞性的、動詞性的、修飾性的、否定意思的、重復(fù)出現(xiàn)的、所在位置性質(zhì)的、和/或是否與所述句子的主題相關(guān)的。
全文摘要
本發(fā)明實(shí)施例提供的一種語言元素的反饋方法和設(shè)備,包括服務(wù)器接收待識別的文本信息;所述服務(wù)器識別所述文本信息的語言元素,生成語言元素屬性信息;所述服務(wù)器將所述語言元素和所述語言元素屬性信息發(fā)送給客戶端,以使所述客戶端對所述文本信息的語言元素進(jìn)行過濾。本發(fā)明實(shí)施例提供的一種語言元素的反饋方法和設(shè)備,通過服務(wù)器提取語言元素屬性并反饋給客戶端,為客戶端提供了更多參考信息,因此增強(qiáng)了文本處理系統(tǒng)的可擴(kuò)展性;再由客戶端進(jìn)行過濾,因此,對于不同的后續(xù)處理,可以采用不同的規(guī)則,從而提高了文本處理系統(tǒng)的可移植性;最終提高了用戶體驗(yàn)。
文檔編號H04L29/06GK102455994SQ201010528068
公開日2012年5月16日 申請日期2010年10月27日 優(yōu)先權(quán)日2010年10月27日
發(fā)明者王博 申請人:王博