專利名稱:文本處理系統(tǒng)、文本處理方法及電子閱讀裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明有關(guān)于一種文本處理系統(tǒng)和文本處理方法,特別是涉及一種可輔助用戶記 憶的文本處理系統(tǒng)和文本處理方法,以及應(yīng)用該文本處理系統(tǒng)的電子閱讀裝置。
背景技術(shù):
中小學(xué)生學(xué)業(yè)負(fù)擔(dān)較重一直是困擾社會(huì)的一大問(wèn)題。在學(xué)習(xí)各種科目,尤其是語(yǔ) 文、歷史、地理等科目時(shí),常會(huì)遇到條目型態(tài)的知識(shí),例如八國(guó)聯(lián)軍是哪八國(guó);中國(guó)最早設(shè) 置的經(jīng)濟(jì)特區(qū)有哪些;化學(xué)元素周期表等,這些知識(shí)往往容易漏掉某些條目而無(wú)法記全。另外,在個(gè)人電腦或移動(dòng)電子終端(如手機(jī)、PDA、電子閱讀器)等電子裝置上閱讀 書籍已越來(lái)越受到人們的青睞,若能通過(guò)各種電子閱讀裝置輔助學(xué)習(xí),必將提高相關(guān)產(chǎn)品 的附加值,使該產(chǎn)品在市場(chǎng)上更具競(jìng)爭(zhēng)力。
發(fā)明內(nèi)容
針對(duì)上述技術(shù)問(wèn)題,本發(fā)明通過(guò)一種文本處理系統(tǒng)及文本處理方法,以達(dá)到幫助 使用者記憶條目?jī)?nèi)容,有效提升記憶效果的目的。本發(fā)明提供的文本處理系統(tǒng)包含輸入單元、存儲(chǔ)單元、延展單元和排列組合單元。 輸入單元用以在閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù)。 存儲(chǔ)單元用以存儲(chǔ)中文同音字庫(kù)和中文常用詞語(yǔ)料庫(kù)。延展單元分別電性連接輸入單元和 存儲(chǔ)單元,延展單元根據(jù)條目數(shù)據(jù)獲得對(duì)應(yīng)多個(gè)中文條目的首字,并查詢中文同音字庫(kù)形 成首字?jǐn)?shù)據(jù),首字?jǐn)?shù)據(jù)包含對(duì)應(yīng)多個(gè)中文條目的首字及首字的同音字。排列組合單元分別 電性連接延展單元和存儲(chǔ)單元,排列組合單元用以將首字?jǐn)?shù)據(jù)排列組合,并查詢中文常用 詞語(yǔ)料庫(kù)獲得短句數(shù)據(jù),短句數(shù)據(jù)是由對(duì)應(yīng)多個(gè)中文條目的首字、首字的同音字或包含其 的常用詞按次序串接而成。根據(jù)本發(fā)明所述的文本處理系統(tǒng)還包含顯示單元,用以顯示短句數(shù)據(jù)。根據(jù)本發(fā)明所述的文本處理系統(tǒng),短句數(shù)據(jù)包含多個(gè)短句組合,輸入單元還用以 選擇多個(gè)短句組合。根據(jù)本發(fā)明所述的文本處理系統(tǒng),輸入單元電性連接排列組合單元,輸入單元還 用以在獲得短句數(shù)據(jù)之前選擇候選的常用詞。本發(fā)明提供的電子閱讀裝置,包含上述的文本處理系統(tǒng)。電子閱讀裝置包含但不 限于是電子書閱讀器。本發(fā)明提供的文本處理方法包含以下步驟。(a)在閱讀文本時(shí)選取或是自行輸入 欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù)。(b)根據(jù)條目數(shù)據(jù)獲得對(duì)應(yīng)多個(gè)中文條目的首 字,并查詢中文同音字庫(kù)形成首字?jǐn)?shù)據(jù),首字?jǐn)?shù)據(jù)包含對(duì)應(yīng)多個(gè)中文條目的首字及首字的 同音字。(c)將首字?jǐn)?shù)據(jù)排列組合,并查詢中文常用詞語(yǔ)料庫(kù)獲得短句數(shù)據(jù),短句數(shù)據(jù)是由 對(duì)應(yīng)多個(gè)中文條目的首字、首字的同音字或包含其的常用詞按次序串接而成。根據(jù)本發(fā)明所述的文本處理方法還包含步驟(d),顯示短句數(shù)據(jù)。
根據(jù)本發(fā)明所述的文本處理方法,短句數(shù)據(jù)包含多個(gè)可被選擇的短句組合。根據(jù)本發(fā)明所述的文本處理方法,在步驟(C)中,在獲得短句數(shù)據(jù)之前還包含選 擇候選的常用詞。根據(jù)本發(fā)明所述的文本處理方法,在步驟(C)中,該次序?qū)?yīng)于欲背誦的多個(gè)中 文條目的順序。本發(fā)明通過(guò)條目首字或其同音字的重新組合,串聯(lián)出較簡(jiǎn)單且有意義的短句,輔 助使用者快速記憶。本發(fā)明提高了電子閱讀裝置的產(chǎn)品附加值,使產(chǎn)品在市場(chǎng)上更具競(jìng)爭(zhēng) 力。
圖1為本發(fā)明一實(shí)施例的文本處理系統(tǒng)的組成示意圖。圖2為本發(fā)明一實(shí)施例的文本處理方法的流程圖。
具體實(shí)施例方式為使對(duì)本發(fā)明的目的、構(gòu)造、特征、及其功能有進(jìn)一步的了解,茲配合實(shí)施例詳細(xì) 說(shuō)明如下。請(qǐng)參見(jiàn)圖1,圖1為本發(fā)明一實(shí)施例的文本處理系統(tǒng)1的組成示意圖。文本處理系 統(tǒng)1包含輸入單元11、存儲(chǔ)單元12、延展單元13和排列組合單元14。輸入單元11用以在 閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù)。存儲(chǔ)單元12用以 存儲(chǔ)中文同音字庫(kù)121和中文常用詞語(yǔ)料庫(kù)122。延展單元13分別電性連接輸入單元11 和存儲(chǔ)單元12,延展單元13根據(jù)條目數(shù)據(jù)獲得對(duì)應(yīng)多個(gè)中文條目的首字,并查詢中文同音 字庫(kù)121形成首字?jǐn)?shù)據(jù),首字?jǐn)?shù)據(jù)包含對(duì)應(yīng)多個(gè)中文條目的首字及首字的同音字。排列組 合單元14分別電性連接延展單元13和存儲(chǔ)單元12,排列組合單元14用以將首字?jǐn)?shù)據(jù)排列 組合,并查詢中文常用詞語(yǔ)料庫(kù)122獲得短句數(shù)據(jù),短句數(shù)據(jù)是由對(duì)應(yīng)多個(gè)中文條目的首 字、首字的同音字或包含其的常用詞按次序串接而成。優(yōu)選地,文本處理系統(tǒng)1還包含顯示單元15,用以顯示短句數(shù)據(jù)。在一實(shí)施例中,短句數(shù)據(jù)包含多個(gè)短句組合,輸入單元11還用以選擇多個(gè)短句組合。在另一實(shí)施例中,輸入單元11電性連接排列組合單元14,輸入單元11還用以在獲 得短句數(shù)據(jù)之前選擇候選的常用詞。本發(fā)明提供的電子閱讀裝置,包含上述的文本處理系統(tǒng)1。電子閱讀裝置包含但不 限于是電子書閱讀器。請(qǐng)參見(jiàn)圖2,圖2為本發(fā)明一實(shí)施例的文本處理方法的流程圖。本發(fā)明提供的文本 處理方法包含以下步驟。S21,在閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù)。 可支持的文本包括但不限于以下中文格式,如pdfjpub、txt、html、doc、ppt、xls、fb2。S22,根據(jù)條目數(shù)據(jù)獲得對(duì)應(yīng)多個(gè)中文條目的首字,并查詢中文同音字庫(kù)形成首字 數(shù)據(jù),首字?jǐn)?shù)據(jù)包含對(duì)應(yīng)多個(gè)中文條目的首字及首字的同音字。優(yōu)選地,建立依據(jù)“四聲”排 序的同音字庫(kù),以利查詢同音字時(shí)可依照“四聲優(yōu)先順序”反饋給使用模組。例如優(yōu)先反饋同聲調(diào)的同音字。S23,將首字?jǐn)?shù)據(jù)排列組合,并查詢中文常用詞語(yǔ)料庫(kù)獲得短句數(shù)據(jù),短句數(shù)據(jù)是 由對(duì)應(yīng)多個(gè)中文條目的首字、首字的同音字或包含其的常用詞按次序串接而成。該中文常 用詞語(yǔ)料庫(kù)包括但不限于兩字詞、三字詞、四字詞、五字詞。查詢常用詞時(shí)可依照“多字詞優(yōu) 先”順序反饋給使用模組,如當(dāng)輸入的同音字組合可以組成“新年快樂(lè)”,就不會(huì)僅反饋“新 年”,而是反饋“新年快樂(lè)”,以利背誦(長(zhǎng)字詞較短字詞容易記牢)和提高系統(tǒng)運(yùn)算效率。優(yōu)選地,本發(fā)明所述的文本處理方法還包含步驟S24,顯示短句數(shù)據(jù)。在一實(shí)施例中,短句數(shù)據(jù)包含多個(gè)可被選擇的短句組合。在另一實(shí)施例中,在獲得短句數(shù)據(jù)之前還包含選擇候選的常用詞。對(duì)于欲背誦的多個(gè)中文條目有順序要求的,在步驟S23中,該次序?qū)?yīng)于欲背誦 的多個(gè)中文條目的順序。下面通過(guò)一些應(yīng)用實(shí)例進(jìn)一步說(shuō)明本發(fā)明的工作原理。假設(shè)本發(fā)明于電子閱讀器上實(shí)現(xiàn),使用者正在閱讀有關(guān)“中國(guó)最早設(shè)置的經(jīng)濟(jì)特 區(qū)”的文章,并選擇了此輔助記憶功能。首先使用者選擇或標(biāo)記出要背誦的條目,如選擇的條目為深圳、珠海、廈門、汕 頭、海南省共五個(gè)條目。然后提取出首字為深、珠、廈、汕、海共五個(gè)首字,查詢中文同音字庫(kù),將此五個(gè)首 字以同音字延展如下(1).深深身申紳神沈嬸滲
(2).珠珠朱豬竹煮助祝著
(3).廈廈蝦瞎霞匣俠下嚇
(4).汕汕山珊衫陜閃善扇
(5).海海還害孩駭氦嗨亥由于該中文條目的順序并不是要記憶的知識(shí)點(diǎn),將以“無(wú)序”的方式排列組合上述
候選同音字。將各種排列組合查詢中文常用詞語(yǔ)料庫(kù),以“多字詞優(yōu)先”獲得常用詞[深山]。 刪除“深山”兩字所對(duì)應(yīng)的同音字,剩余字的同音字繼續(xù)排列組合,再查詢中文常用詞語(yǔ)料 庫(kù),獲得常用詞[下海]。反復(fù)刪除同音字并查詢常用詞,最后可得短句組合,例如[深山 豬下海]。該短句組合顯示并儲(chǔ)存于電子閱讀器上。使用者可牢記此短句,再背誦每個(gè)字所 簡(jiǎn)化的完整條目,如深——深圳、山——汕頭、豬——珠海、下——廈門、海——海南島,以 此輔助背誦中文條目知識(shí)。此發(fā)明除了可透過(guò)多次的選取文章段落以選擇要簡(jiǎn)化的條目?jī)?nèi)容,也可自行輸入 一段文字以啟動(dòng)輔助背誦的功能,例如化學(xué)元素周期表,當(dāng)輸入“氫氦鋰鈹硼…”,文本處理 為“青海鯉魚啤酒捧過(guò)來(lái)…”,以間插讓文句通順的文字,形成易讀好背甚至有故事情節(jié)的 短文,提升使用者背誦復(fù)雜資訊與條目知識(shí)的能力。本發(fā)明可幫助使用者簡(jiǎn)化要背誦的中文條目知識(shí)或是無(wú)文法的一連串中文字,有 效提升記憶效果,適合中文領(lǐng)域的升學(xué)教育。不同電子裝置可依據(jù)此發(fā)明調(diào)整其輸入文字 機(jī)制或選取條目的方式。通過(guò)該發(fā)明,使用者可隨時(shí)隨地運(yùn)用移動(dòng)電子裝置累積中文課程的知識(shí)背誦,以應(yīng)付競(jìng)爭(zhēng)激烈的升學(xué)考試,讓莘莘學(xué)子不再受背書的困擾,從而提升青少年 的生活品質(zhì)。本發(fā)明通過(guò)條目首字或其同音字的重新組合,串聯(lián)出較簡(jiǎn)單且有意義的短句,輔 助使用者快速記憶。本發(fā)明提高了電子閱讀裝置的產(chǎn)品附加值,使產(chǎn)品在市場(chǎng)上更具競(jìng)爭(zhēng) 力。本發(fā)明已由上述相關(guān)實(shí)施例加以描述,然而上述實(shí)施例僅為實(shí)施本發(fā)明的范例。 必需指出的是,已揭露的實(shí)施例并未限制本發(fā)明的范圍。相反地,在不脫離本發(fā)明的精神和 范圍內(nèi)所作的更動(dòng)與潤(rùn)飾,均屬本發(fā)明的專利保護(hù)范圍。
權(quán)利要求
1.一種文本處理系統(tǒng),其特征在于包含輸入單元,用以在閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目 數(shù)據(jù);存儲(chǔ)單元,用以存儲(chǔ)中文同音字庫(kù)和中文常用詞語(yǔ)料庫(kù);延展單元,分別電性連接該輸入單元和該存儲(chǔ)單元,該延展單元根據(jù)該條目數(shù)據(jù)獲得 對(duì)應(yīng)該多個(gè)中文條目的首字,并查詢?cè)撝形耐糇謳?kù)形成首字?jǐn)?shù)據(jù),該首字?jǐn)?shù)據(jù)包含對(duì)應(yīng) 該多個(gè)中文條目的首字及該首字的同音字;排列組合單元,分別電性連接該延展單元和該存儲(chǔ)單元,該排列組合單元用以將該首 字?jǐn)?shù)據(jù)排列組合,并查詢?cè)撝形某S迷~語(yǔ)料庫(kù)獲得短句數(shù)據(jù),該短句數(shù)據(jù)是由對(duì)應(yīng)該多個(gè) 中文條目的首字、該首字的同音字或包含其的常用詞按次序串接而成。
2.如權(quán)利要求1所述的文本處理系統(tǒng),其特征在于還包含顯示單元,用以顯示該短句 數(shù)據(jù)。
3.如權(quán)利要求2所述的文本處理系統(tǒng),其特征在于該短句數(shù)據(jù)包含多個(gè)短句組合,該 輸入單元還用以選擇該多個(gè)短句組合。
4.如權(quán)利要求2所述的文本處理系統(tǒng),其特征在于該輸入單元電性連接該排列組合單 元,該輸入單元還用以在獲得該短句數(shù)據(jù)之前選擇候選的常用詞。
5.一種電子閱讀裝置,其特征在于包含如權(quán)利要求1-4中任意一項(xiàng)所述的文本處理系統(tǒng)。
6.一種文本處理方法,其特征在于包含以下步驟(a)在閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù);(b)根據(jù)該條目數(shù)據(jù)獲得對(duì)應(yīng)該多個(gè)中文條目的首字,并查詢中文同音字庫(kù)形成首字 數(shù)據(jù),該首字?jǐn)?shù)據(jù)包含對(duì)應(yīng)該多個(gè)中文條目的首字及該首字的同音字;(c)將該首字?jǐn)?shù)據(jù)排列組合,并查詢中文常用詞語(yǔ)料庫(kù)獲得短句數(shù)據(jù),該短句數(shù)據(jù)是由 對(duì)應(yīng)該多個(gè)中文條目的首字、該首字的同音字或包含其的常用詞按次序串接而成。
7.如權(quán)利要求6所述的文本處理方法,其特征在于還包含步驟(d),顯示該短句數(shù)據(jù)。
8.如權(quán)利要求6所述的文本處理方法,其特征在于該短句數(shù)據(jù)包含多個(gè)可被選擇的短 句組合。
9.如權(quán)利要求6所述的文本處理方法,其特征在于在步驟(c)中,在獲得該短句數(shù)據(jù)之 前還包含選擇候選的常用詞。
10.如權(quán)利要求6所述的文本處理方法,其特征在于在步驟(c)中,該次序?qū)?yīng)于該欲 背誦的多個(gè)中文條目的順序。
全文摘要
本發(fā)明提供一種文本處理系統(tǒng)及方法,該文本處理系統(tǒng)包含輸入單元、存儲(chǔ)單元、延展單元和排列組合單元。輸入單元用以在閱讀文本時(shí)選取或是自行輸入欲背誦的多個(gè)中文條目,并形成條目數(shù)據(jù)。存儲(chǔ)單元用以存儲(chǔ)中文同音字庫(kù)和中文常用詞語(yǔ)料庫(kù)。延展單元分別電性連接輸入單元和存儲(chǔ)單元,延展單元根據(jù)條目數(shù)據(jù)獲得對(duì)應(yīng)多個(gè)中文條目的首字,并查詢中文同音字庫(kù)形成首字?jǐn)?shù)據(jù)。排列組合單元分別電性連接延展單元和存儲(chǔ)單元,排列組合單元用以將首字?jǐn)?shù)據(jù)排列組合,并查詢中文常用詞語(yǔ)料庫(kù)獲得短句數(shù)據(jù)。本發(fā)明可提高電子閱讀裝置的產(chǎn)品附加值,使產(chǎn)品在市場(chǎng)上更具競(jìng)爭(zhēng)力。
文檔編號(hào)G06F17/30GK102073622SQ20111000352
公開日2011年5月25日 申請(qǐng)日期2011年1月10日 優(yōu)先權(quán)日2011年1月10日
發(fā)明者陳志明 申請(qǐng)人:佳世達(dá)科技股份有限公司, 蘇州佳世達(dá)電通有限公司