專利名稱:嵌入式掌上外文輔助解讀器及其使用方法和用途的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息技術(shù)領(lǐng)域,具體涉及一種嵌入式掌上外文輔助解讀器。
背景技術(shù):
隨著以"和平和發(fā)展"為主題的國際合作的進(jìn)一步發(fā)展,經(jīng)濟(jì)全球化時代的 到來,以及信息技術(shù)、尤其互聯(lián)網(wǎng)技術(shù)的不斷提檔升級,各國和地區(qū)之間在政治、 經(jīng)濟(jì)、文化、教育、軍事、科技、教育等領(lǐng)域間的合作日益頻繁、交往愈加密切。 每時每刻都有大量的外文原文資料或信息需要快速處理并做出反應(yīng), 一般傳統(tǒng)的 方法是靠專業(yè)翻譯等人工手段完成,真正的信息需求者受專業(yè)知識和外語能力(一 方面掌握的語種有限,另一方面掌握的程度有限)的限制很難獨(dú)立完成。因此, 在信息處理方面,普遍存在依賴性強(qiáng)、速度慢、效率低、信息處理量有限等問題, 語言障礙成為國際間合作的攔路虎,信息處理的現(xiàn)代化亟待解決。1946年,世界上出現(xiàn)第一臺電子計算機(jī),從那時起,科學(xué)家們就試圖利用計算機(jī)手段代替人完成語言信息處理任務(wù),提高處理速度和效率。因此,以機(jī)器翻譯、人機(jī)對話系統(tǒng)、信息自動查詢系統(tǒng)、文本自動摘要系統(tǒng)等研究工作開始起步并得以長足的發(fā)展,當(dāng)然由于認(rèn)識上的偏誤,機(jī)器翻譯等研究工作也曾一度陷入低谷,但是,科學(xué)工作者們從未停止這一領(lǐng)域的執(zhí)著探索,近年來,計算機(jī)科學(xué)技術(shù)和互聯(lián)網(wǎng)技術(shù)又有突破性進(jìn)展,語言信息處理領(lǐng)域也取得很多成果,如語音識別與合成、文字識別技術(shù)、文本格式的相互轉(zhuǎn)換、語言形態(tài)分析、語言信息搜尋等技術(shù)趨于成熟;句法分析技術(shù)、語義分析技術(shù)等也不斷完善。應(yīng)該承認(rèn),到目前為止機(jī)器翻譯技術(shù)雖有發(fā)展,但實(shí)用化程度還遠(yuǎn)遠(yuǎn)不夠,有的資料翻譯過來后可讀性很差,此外,翻譯的對象必須是電子文檔,所以對電腦和其它相應(yīng)設(shè)備的依賴性都很大。當(dāng)今全球信息化大潮呈現(xiàn)如下趨勢信息存儲的數(shù)字化、信息處理的自動化、信息傳輸?shù)木W(wǎng)絡(luò)化、信息應(yīng)用的自動化、信息技術(shù)的集成化、信息系統(tǒng)的移動化 (便捷化)等。語言是信息的主要載體,因此,語言信息處理技術(shù)的快速發(fā)展成 為舉世關(guān)注的焦點(diǎn)和熱點(diǎn),是某個國家和地區(qū)綜合國力的重要標(biāo)志。袖珍靈巧、攜帶方便、實(shí)用便捷的語言處理器更是成為消費(fèi)者青睞的對象。我們認(rèn)為,從本質(zhì)上說,人類的所有活動都可歸為信息處理,不論是讀寫、 思考、規(guī)劃,還是純粹的各種現(xiàn)實(shí)活動,因?yàn)?,計算機(jī)能模擬人類的各種物理活 動和智能活動,而計算機(jī)工作原理的本質(zhì)正是數(shù)據(jù)信息處理。可見,外文閱讀理 解作為典型的語言信息處理過程完全可以像計算機(jī)信息處理一樣分解為若干離散性的步^^o局部任務(wù),我們可以把盡可能多的步驟和局部任務(wù)指派給一種信息系統(tǒng)去完成,基于此,我們集成現(xiàn)有的軟硬件成熟技術(shù),設(shè)計開發(fā)一種移動掌上 型外文文本輔助解讀器,以適應(yīng)信息技術(shù)集成化、便捷化、移動化、實(shí)用化需要。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種通過外文文本自動采集、文本自動識別、文本詞形 的自動還原、自動詞典査詢、語音自動標(biāo)注、詞義自動標(biāo)注等處理過程的實(shí)現(xiàn), 能夠快速便捷地從各種文本載體上(紙質(zhì)載體和電腦載體上)獲取相關(guān)信息并做 出相應(yīng)決策和判斷的嵌入式掌上外文文本輔助解讀器。上述的目的通過以下的技術(shù)方案實(shí)現(xiàn)一種嵌入式掌上外文輔助解讀器,其組成包括外殼,所述的外殼上鑲嵌有 用于數(shù)據(jù)采集的高精度掃描探頭或USB接口 ,所述的高精度掃描探頭或USB接 口與外殼內(nèi)的小型掌上電腦主機(jī)連接,所述的小型掌上電腦主機(jī)與用于顯示分析 結(jié)果的多點(diǎn)陣顯示器連接,所述的小型掌上電腦主機(jī)用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進(jìn)行解讀。上述的嵌入式掌上外文輔助解讀器,所述的小型掌上電腦主機(jī)包括CPU,os。上述的嵌入式掌上外文輔助解讀器的使用方法,a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在小型掌上電腦的存 儲器中;b) 將儲存器中的數(shù)據(jù)進(jìn)行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進(jìn)行保 存和校驗(yàn);d) 用形態(tài)分析器、句法分析器和機(jī)器詞典對上一步的文本進(jìn)行分析;e) 用信息標(biāo)注器將上一步的形態(tài)分析器、句法分析器和機(jī)器詞典的分析結(jié)果 以標(biāo)注在構(gòu)句塊的下方。上述的嵌入式掌上外文輔助解讀器的用途,所述的嵌入式掌上外文輔助解讀 器用作俄一漢輔助解讀器、漢一俄輔助解讀器、英一漢輔助解讀器、漢一英輔助 解讀器、英一俄輔助解讀器、俄一英輔助解讀器。這^^技術(shù)方案有以下有益效果1. 本發(fā)明產(chǎn)品為涉及外文閱讀理解和信息獲取的各領(lǐng)域群體_一外事人員、 商貿(mào)人員、國外旅游人員、借鑒外文資料的科研人員、專業(yè)翻譯、提高外語水平 的各層次學(xué)生提供得心應(yīng)手的輔助工具。2. 本發(fā)明產(chǎn)品具有文本采集功能,通過嵌入的掃描探頭實(shí)現(xiàn)紙質(zhì)版本外文文本髙精確度采集。3. 本發(fā)明產(chǎn)品具有文本存儲功能,把通過USb串口把從電腦下載的文本數(shù)據(jù) 或通過l)描述中采集到的數(shù)據(jù)保存在存儲器中。4. 本發(fā)明產(chǎn)品具有小型掌上電腦,能實(shí)現(xiàn)文本轉(zhuǎn)換功能,通過嵌入在解讀器中的文本轉(zhuǎn)換器把存儲器中的文本轉(zhuǎn)換成特定格式的文本。本產(chǎn)品還能夠通過其 信息標(biāo)注器進(jìn)行文本語音自動標(biāo)注,如漢語,英語等,對文本中的詞形進(jìn)行語音 的自動標(biāo)注。本產(chǎn)品具有文本詞形自動還原功能,對文本中的詞形進(jìn)行自動還原, 成為同詞典中詞頭一樣的原始詞。本產(chǎn)品具有文本詞法信息自動標(biāo)注功能,可根據(jù)需要對文本中的詞形進(jìn)行詞法信息自動標(biāo)注。本產(chǎn)品具有文本語義自動標(biāo)注功 能,對文本中的詞標(biāo)注某一特定語言對應(yīng)意義的對等詞。本產(chǎn)品解讀結(jié)果顯示調(diào)整自動存儲功能,把原文和標(biāo)注的結(jié)果顯示在嵌入的M示器上。本產(chǎn)品還具有fe讀結(jié)果顯示調(diào)整自動存儲功能,解讀的結(jié)果可調(diào)整和修改,并把結(jié)果存儲起來。 本產(chǎn)品具有其它輔助功能,包括語言選項(xiàng)功能,格式字體調(diào)整功能,語音合成功 能、記事本功能等。5. 本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器是發(fā)明人根據(jù)當(dāng)今信息化社會的 發(fā)展趨勢和現(xiàn)實(shí)需要,在充分研究現(xiàn)有成熟的實(shí)用化硬件和較完善的軟件實(shí)現(xiàn)技 術(shù)的基礎(chǔ)上,首次提出開發(fā)一種嵌入式掌上外文輔助解讀系統(tǒng),并提出建造這種 系統(tǒng)的軟硬件技術(shù)構(gòu)成、實(shí)現(xiàn)策略和集成方法。該系統(tǒng)能實(shí)現(xiàn)對紙質(zhì)版文檔或電 子版文檔進(jìn)行自動采集、轉(zhuǎn)換、詞形還原、語言信息自動標(biāo)注,尤其是可實(shí)現(xiàn)某 一特定語言的詞義對等物的標(biāo)注,從而為使用者在不受設(shè)備、時間、地點(diǎn)、所學(xué) 語種和語言程度掌握不夠的局限,迅速理解外文的意思,獲取到相關(guān)信息,及時做出反應(yīng)和決策。同時,長期使用這種設(shè)備還可不斷提高外語水平。系統(tǒng)具有移 動性強(qiáng)、攜帶方便、便捷靈巧,實(shí)用性強(qiáng)等特點(diǎn)。6.本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器可以不斷擴(kuò)展、逐步升級。
圖l是本產(chǎn)品的結(jié)構(gòu)示意圖。圖2是本發(fā)明的剖視圖。圖3是本發(fā)明產(chǎn)品的工作流程圖。圖4是本發(fā)明產(chǎn)品的電路結(jié)構(gòu)框圖(虛框內(nèi)為帶有獨(dú)立操作系統(tǒng)的PDA主機(jī))。本發(fā)明的
具體實(shí)施例方式
實(shí)施例l:一種嵌入式掌上外文輔助解讀器,其組成包括外殼,所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭或USB接口 ,所述的高精度掃描探頭或USB接 口與外殼內(nèi)的PDA(小型掌上電腦)主機(jī)連接,所述的PDA(小型掌上電腦)主機(jī)與 用于顯示分析結(jié)果的多點(diǎn)陣顯示器連接,所述的PDA主機(jī)用于對通過高精度掃 描探頭或USB接口所采集的數(shù)據(jù)進(jìn)行解讀,所述的PDA主機(jī)執(zhí)行如下步驟a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在存儲器中;b) 將儲存器中的數(shù)據(jù)進(jìn)行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進(jìn)行保 存和校驗(yàn);d) 用形態(tài)分析器、句法分析器和機(jī)器詞典對上一步的文本進(jìn)行分析;e) 用信息標(biāo)注器將上一步的形態(tài)分析器、句法分析器和機(jī)器詞典的分析結(jié)果 以標(biāo)注在構(gòu)句塊的下方。所述的PDA主機(jī)包括CPU, OS。本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器的工作過程為1) 進(jìn)行數(shù)據(jù)采集,其有兩種途徑 一是對于紙質(zhì)文檔而言,需要用高精度 廣角攝像頭的支持,完成掃描存儲的操作;二是對于電子版材料而言,需要USB 電腦接口的支持,完成下載存儲的操作;2) 數(shù)據(jù)識別,指用OCR識別器和文檔轉(zhuǎn)換器,把通過高精度廣角攝像頭掃描存儲的圖形文件或用USB接口下在的其它格式的文件轉(zhuǎn)換為特定格式的文件;3) 文本存儲,對2)步操作的結(jié)果發(fā)送到文檔存儲器保存;4) 文本校驗(yàn),對3)部存儲的文檔進(jìn)行拼寫檢查,消除錯誤;5) 文本分析,包括規(guī)范化處理、文本詞法自動分析、文本句法自動分析、詞典查詢等操作,對4)部的文本實(shí)現(xiàn)文本語句的自動識別和理解;6) 信息標(biāo)注,把5)步的分析結(jié)果以標(biāo)注在構(gòu)句塊的下方;7) 輸出顯示,用預(yù)設(shè)的文字(大小、字體)和顏色把6)步分析的結(jié)果顯示在屏幕上。實(shí)施例3:實(shí)施例1或2所述的嵌入式掌上外文輔助解讀器的用途,所述的嵌入式掌上外文輔助解讀器分為俄一漢輔助解讀器、漢一俄輔助解讀器、英一漢輔助解讀器、 漢一英輔助解讀器、英—俄輔助解讀器、俄一英輔助解讀器。
權(quán)利要求
1. 一種嵌入式掌上外文輔助解讀器,其組成包括外殼,其特征是所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭或USB接口,所述的高精度掃描探頭或USB接口與外殼內(nèi)的小型掌上電腦主機(jī)連接,所述的小型掌上電腦主機(jī)與用于顯示分析結(jié)果的多點(diǎn)陣顯示器連接,所述的小型掌上電腦主機(jī)用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進(jìn)行解讀。
2. 根據(jù)權(quán)利要求1所述的嵌入式掌上外文輔助解讀器,其特征是所述的小型 掌上電腦主機(jī)包括CPU, OS。
3. —種權(quán)利要求1或2所述的嵌入式掌上外文輔助解讀器的使用方法,其特 征是a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在小型掌上電腦的存 儲器中;b) 將儲存器中的數(shù)據(jù)進(jìn)行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進(jìn)行保 存和校驗(yàn);d) 用形態(tài)分析器、句法分析器和機(jī)器詞典對上一步的文本進(jìn)行分析;e) 用信息標(biāo)注器將上一步的形態(tài)分析器、句法分析器和機(jī)器詞典的分析結(jié)果 以標(biāo)注在構(gòu)句塊的下方。
4. 一種權(quán)利要求1或2所述的嵌入式掌上外文輔助解讀器的用途,所述的嵌 入式掌上外文輔助解讀器用作俄一漢輔助解讀器、漢一俄輔助解讀器、英—漢輔 助解讀器、漢一英輔助解讀器、英—俄輔助解讀器、俄一英輔助解讀器。
全文摘要
嵌入式掌上外文輔助解讀器及其使用方法和用途,語言信息處理技術(shù)的快速發(fā)展成為舉世關(guān)注的焦點(diǎn)和熱點(diǎn),本發(fā)明其組成包括外殼(1),所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭(2)或USB接口(3),所述的高精度掃描探頭(2)或USB接口(3)與外殼(1)內(nèi)的PDA主機(jī)(4)連接,所述的PDA主機(jī)與用于顯示分析結(jié)果的多點(diǎn)陣顯示器(5)連接,所述的PDA主機(jī)用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進(jìn)行解讀。本發(fā)明適用于信息技術(shù)領(lǐng)域。
文檔編號G06F17/28GK101231635SQ20071007169
公開日2008年7月30日 申請日期2007年1月26日 優(yōu)先權(quán)日2007年1月26日
發(fā)明者傅興尚, 王麗娟 申請人:黑龍江大學(xué)