文檔管理裝置以及文檔管理方法
【技術領域】
[0001]本發(fā)明涉及對字符串添加注釋的文檔管理裝置以及文檔管理方法。
【背景技術】
[0002]在國語及外語的學習當中,泛讀被當作有效的手段之一。而且目前為了學習,能夠從互聯網等處獲取很多文章來進行閱讀。
[0003]但是,從互聯網處獲取的文章等并不是以特定水平的學習者為對象而創(chuàng)建的文章。因而,這樣并不能稱為適于語言學習。
[0004]因此,例如在某種典型的技術中,按照英語的每個單詞或短語、表達來添加屬性。如果是用戶已學習過的,則添加“已學習”屬性,如果是下一個應學習的,則添加“正在學習”屬性。而且,在將獲取到的英文轉換為淺顯的英文時,若轉換為以學習為目的的英文時,則使用“已學習”和“正在學習”這兩個詞語來進行轉換。此外,若轉換為以理解內容為目的的英文時,則僅使用“已學習”這一個詞語來進行轉換。
【發(fā)明內容】
[0005]本發(fā)明的實施方式所涉及的文檔管理裝置包括讀取部、存儲部以及控制部。所述讀取部從原稿中讀取字符串。所述控制部,在對字符串進行登記的字符串登記模式下,使所述讀取部讀取所述原稿,對讀取出的所述字符串進行檢測,利用詞典對檢測出的字符串的注釋進行檢索,將所述檢測出的字符串與檢索出的注釋相互建立關聯并使所述存儲部進行存儲。
[0006]本發(fā)明的實施方式所涉及的文檔管理方法包括:(i)通過讀取部,從原稿中讀取字符串;(ii)通過控制部,在對字符串進行登記的字符串登記模式下,使所述讀取部讀取所述原稿,對讀取出的所述字符串進行檢測,利用詞典對檢測出的字符串的注釋進行檢索,將所述檢測出的字符串與檢索出的注釋相互建立關聯;(iii)通過存儲部,對建立了關聯的所述檢測出的字符串與所述檢索出的注釋進行存儲。
【附圖說明】
[0007]圖1示出本發(fā)明的第一實施方式所涉及的文檔管理裝置的概要。
[0008]圖2示出第一實施方式所涉及的文檔管理裝置的一般性結構。
[0009]圖3示出將第一實施方式所涉及的文檔管理裝置實現為圖像形成裝置時的結構。
[0010]圖4示出利用以圖像形成裝置為中心的客戶端-服務器型的文檔管理系統(tǒng)來實現第一實施方式所涉及的文檔管理裝置時的結構。
[0011]圖5示出第一實施方式所涉及的字符串登記模式下的處理流程。
[0012]圖6示出在第一實施方式所涉及的登記于存儲部中的信息的例子。
[0013]圖7示出在第一實施方式所涉及的文章輸出模式下,用戶對成為對欲插入注釋的字符串進行選擇的基準的用戶標識符及用戶屬性進行指定的方法的例子。
[0014]圖8示出第一實施方式所涉及的文章輸出模式下的處理流程。
[0015]圖9示出在第一實施方式中,在所獲取的文章中插入表示與用戶所指定的用戶標識符或用戶屬性相對應的字符串的含義的字符串(注釋)的例子。
[0016]圖10示出在第二實施方式所涉及的存儲于存儲部中的信息的例子。
[0017]圖11示出第二實施方式所涉及的文章輸出模式下的處理流程。
【具體實施方式】
[0018]以下參考附圖對本發(fā)明的各實施方式進行說明。
[0019]第一實施方式
[0020]圖1是用于對本發(fā)明的第一實施方式所涉及的文檔管理裝置的概要進行說明的圖。
[0021]如圖1所示,本發(fā)明的第一實施方式所涉及的文檔管理裝置在字符串登記模式和文章輸出模式這兩個模式下進行工作。
[0022]在字符串登記模式下,用戶不明白含義的字符串等希望為該字符串添加注釋的字符串被登記到文檔管理裝置中。登記是在寫有希望登記的字符串的紙質原稿上利用例如為希望登記的字符串加下劃線等方法來進行。
[0023]在圖1的例子中,當由于不明白寫在紙質原稿上的“身在法隆寺,啖柿聽鐘鳴”這一文章中的“鐘”的含義因而希望添加注釋時,用戶在“鐘”下劃線,并使其被文檔管理裝置讀入。
[0024]如此,用戶對于不明白的字符串等希望添加注釋的字符串,通過對紙質原稿的字符串進行標記,從而能夠簡單地將其登記到文檔管理裝置中。
[0025]文檔管理裝置讀入“鐘”并利用詞典進行檢索以獲取注釋,該注釋是表示“用于敲響的器具”這樣含義的字符串。
[0026]接著,在文章輸出模式下,如圖1所示,文檔管理裝置從用戶處獲取成為欲輸出的文章的基礎的文本數據。該文本數據不限于在字符串登記模式下讀入的原稿而為任意的文早。
[0027]由于在文檔管理裝置中登記有“鐘”,因此在文本數據的“鐘”之后,作為“鐘”的注釋的“用于敲響的器具”這一字符串被插入。插入注釋后的文章通過顯示裝置的顯示或打印裝置的打印而被提示給用戶。
[0028]如此,用戶能夠簡單地在欲輸出的文章中插入所登記的字符串的注釋。
[0029]以上對本發(fā)明的第一實施方式所涉及的文檔管理裝置的概要進行了說明。
[0030]下面對本發(fā)明的第一實施方式所涉及的文檔管理裝置的結構進行說明。另外,在下文中,首先對文檔管理裝置的一般性結構進行說明。然后,對將文檔管理裝置實現為一個復合機(MFP,Multifunct1n Peripheral)的實施方式的結構進行說明。進一步地,還對以經由網絡的客戶端-服務器型的結構來實現文檔管理裝置時的結構進行說明。
[0031]圖2是示出文檔管理裝置I的結構的結構圖。文檔管理裝置I包括:掃描儀2、信息處理裝置3以及輸出裝置9。
[0032]掃描儀2在字符串登記模式下讀入原稿,且在文章輸出模式下讀入欲輸出的文早。
[0033]輸出裝置9是顯示器等顯示裝置、打印機等打印裝置、用于向網絡上的外部設備發(fā)送數據的網絡設備等。輸出裝置9用于輸出已插入注釋后的文章。
[0034]信息處理裝置3可以使用一般的計算機來實現。信息處理裝置3包括:存儲部5、輸入部6、控制部7以及詞典8。
[0035]存儲部5對用戶登記的字符串及表示其含義的字符串、用戶標識符(后述)、用戶屬性(后述)等進行存儲。
[0036]輸入部6接收用戶對用戶標識符及用戶屬性的輸入。
[0037]詞典8登記有大量的字符串以及用于表示其含義的字符串即注釋。
[0038]控制部7具有:0CR(0pticalCharacter Recognit1n,光學字符識別)處理部7a、輸入控制部7b、讀取控制部7c、檢測部7d、檢索部7e、存儲控制部7f、文章接收部7g、屬性獲取部7h、屬性對照部71、字符串選擇部7j以及輸出控制部7k。控制部7執(zhí)行上述兩種模式下的處理。
[0039]OCR處理部7a從利用掃描儀2讀入的原稿的圖像數據中識別出文字,并生成電子文本數據。另外,掃描儀2和OCR處理部7a合在一起相當于讀取部。
[0040]輸入控制部7b對輸入部6進行控制。輸入控制部7b在字符串登記模式下使輸入部6接收對字符串進行登記的用戶(登記者)的屬性。輸入控制部7b在文章輸出模式下使輸入部6接收欲將文章輸出的用戶(輸出者)的屬性。
[0041]讀取控制部7c在字符串登記模式下使掃描儀2讀取已標記出欲登記的字符串的原稿。
[0042]檢測部7d根據從原稿中讀取出的標記的位置,檢測出為了添加注釋而登記的字符串。
[0043]檢索部7e利用詞典8對通過檢測部7d檢測出的字符串進行檢索。
[0044]存儲控制部7f將從原稿中檢測出的字符串、利用詞典8檢索出的注釋、以及對字符串進行登記的用戶的屬性相互建立關聯并使存儲部5進行存儲。
[0045]文章接收部7g在文章輸出模式下接收用戶欲輸出的文章。另外,文章接收部7g也可以使輸入部6接收欲輸出的文章。
[0046]屬性獲取部7h根據為了進行輸出而接收的文章的文件信息,獲取所接收的文章的作者的屬性。
[0047]屬性對照部7i對欲將文章輸出的用戶的屬性、屬性獲取部7h所獲取的文章的作者的屬性、以及登記了字符串的用戶的屬性進行對照。
[0048]字符串選擇部7 j根據屬性對照部7i的對照結果,從存儲部5所存儲的字符串中選擇出在欲輸出的文章中所包含的字符串中欲插入注釋的字符串。
[0049]輸出控制部7k使通過字符串選擇部7j選擇出的字符串的注釋與欲輸出的文章內的字符串相對應,并與文章一起輸出到輸出裝置9。
[0050]以上即為文檔管理裝置I的一般性的結構。
[0051]下面對將文檔管理裝置實現為圖像形成裝置時的結構進行說明。圖3是將文檔管理裝置實現為圖像形成裝置10時的結構圖。
[0052]圖像形成裝置10具備控制部11??刂撇?1由中央處理器(CPU,CentralProcessing Unit)、隨機存取存儲器(RAM,Random Access Memory)、只讀存儲器(ROM,ReadOnly Memory)以及專用的硬件電路等構成,負責圖像形成裝置10的整體的動作控制。
[0053]控制部11與圖像讀取部12、圖像處理部13、圖像存儲器14、圖