圖像分文檔方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是有關(guān)于一種掃描儀,且特別是有關(guān)于一種用于掃描儀的圖像分文檔方法。
【背景技術(shù)】
[0002]在電子化的時(shí)代,文檔管理的作業(yè)采用圖像數(shù)據(jù)來(lái)儲(chǔ)存是不可避免的趨勢(shì),以減少紙本的庫(kù)存量及紙本容易損毀的風(fēng)險(xiǎn)。將紙本的數(shù)據(jù)電子化之后,可以保存文稿來(lái)往的記錄、建立電子文檔,以利于文稿歸檔及查詢。但是,為了將大量的文稿輸進(jìn)計(jì)算機(jī)并分類、歸檔命名,常常耗掉相當(dāng)大的人力與成本。傳統(tǒng)的掃描儀掃描多個(gè)文稿,可以將每頁(yè)掃描圖像數(shù)據(jù)各自建立一個(gè)文檔,或是將所有圖像數(shù)據(jù)合并成一個(gè)文檔。無(wú)論是哪一種,對(duì)使用者而言都并不方便。前者須檢視文檔后重新命名,后者須自行分割文檔,其手續(xù)既繁瑣又沒(méi)有效率。
[0003]為了解決這個(gè)問(wèn)題,于是有自動(dòng)歸檔的概念出現(xiàn)。例如,當(dāng)有一疊文稿準(zhǔn)備掃描時(shí),先在文稿中預(yù)定分檔的地方安插空白頁(yè)、特定顏色頁(yè)或貼上條形碼(barcode)等。當(dāng)掃描儀掃到空白頁(yè)、特定顏色頁(yè)或條形碼,則將已掃描的多個(gè)圖像數(shù)據(jù)合并成一個(gè)獨(dú)立的文檔。然而,這樣的歸檔方式仍須要手動(dòng)加入特殊的辨識(shí)特征,例如人工先整理文稿把空白頁(yè)或barcode放到或貼到特定位置,而這步驟需要消耗許多時(shí)間。
【發(fā)明內(nèi)容】
[0004]本發(fā)明是有關(guān)于一種圖像分文檔方法,其通過(guò)辨識(shí)掃描圖像數(shù)據(jù),自動(dòng)判斷數(shù)據(jù)的窗體格式(例如申請(qǐng)表、簽呈、單據(jù)等制式格式),當(dāng)找到相同類型的窗體格式或符合系統(tǒng)設(shè)定的制式格式時(shí),可將掃描圖像數(shù)據(jù)分割為多個(gè)群組后,儲(chǔ)存為各自獨(dú)立的文檔,并可建立相對(duì)應(yīng)的文檔名。
[0005]根據(jù)本發(fā)明的一方面,提出一種圖像分文檔方法,包括下列步驟。依序掃描多個(gè)文稿,以對(duì)應(yīng)產(chǎn)生多個(gè)掃描圖像數(shù)據(jù)。從這些掃描圖像數(shù)據(jù)中尋找窗體格式。當(dāng)有Μ個(gè)窗體格式出現(xiàn)于這些掃描圖像數(shù)據(jù)中,將這些掃描圖像數(shù)據(jù)分為Μ個(gè)群組,并將窗體格式設(shè)在每一群組的首頁(yè),其中Μ為大于1的正整數(shù)。建立對(duì)應(yīng)于這些群組的Μ個(gè)文檔。
[0006]根據(jù)本發(fā)明的一方面,提出一種圖像分文檔方法,包括下列步驟。從初始掃描圖像數(shù)據(jù)中尋找窗體格式。當(dāng)窗體格式出現(xiàn)于初始掃描圖像數(shù)據(jù)中,將包含窗體格式的初始掃描圖像數(shù)據(jù)設(shè)為首頁(yè)。建立對(duì)應(yīng)于初始掃描圖像數(shù)據(jù)的初始文檔。
[0007]為了對(duì)本發(fā)明的上述及其他方面有更佳的了解,下文特舉較佳實(shí)施例,并配合附圖,作詳細(xì)說(shuō)明如下:
【附圖說(shuō)明】
[0008]圖1繪示依照本發(fā)明第一實(shí)施例的圖像分文檔方法的流程圖。
圖2繪示建立文檔名的流程圖。 圖3繪示依照本發(fā)明第二實(shí)施例的圖像分文檔方法的流程圖。
圖4繪示依照本發(fā)明第三實(shí)施例的圖像分文檔方法的流程圖。
圖5為分為不同群組的掃描圖像數(shù)據(jù)及文檔的示意圖。
圖6繪示依照本發(fā)明第四實(shí)施例的圖像分文檔方法的流程圖。
圖7繪示依照本發(fā)明第五實(shí)施例的圖像分文檔方法的流程圖。
圖8繪示依照本發(fā)明第六實(shí)施例的圖像分文檔方法的流程圖。
【具體實(shí)施方式】
[0009]為方便理解,實(shí)施例提到的“文稿”指的是實(shí)體紙本文稿,“文檔”指的是實(shí)體文稿經(jīng)掃描后形成的電子文檔。根據(jù)本實(shí)施例的范例,提出一種圖像分文檔方法,用于掃描圖像數(shù)據(jù)的歸檔及管理。當(dāng)一疊文稿被掃描后,在這些掃描圖像數(shù)據(jù)中找到相同類型的Μ個(gè)窗體格式或找到符合系統(tǒng)設(shè)定的Μ個(gè)窗體格式時(shí),系統(tǒng)自動(dòng)判斷此疊文稿中至少有Μ個(gè)相同類型的群組,因此,可將掃描圖像數(shù)據(jù)分割為Μ個(gè)群組后,各個(gè)群組儲(chǔ)存為各自獨(dú)立的文檔,并且各個(gè)群組可建立相對(duì)應(yīng)的文檔名,以加快掃描圖像數(shù)據(jù)的分文檔作業(yè)。
[0010]例如:掃描圖像數(shù)據(jù)為醫(yī)院的個(gè)人病歷資料,第一頁(yè)為個(gè)人基本資料或第一次看診資料,后續(xù)歷史的看診資料通常會(huì)附在個(gè)人基本數(shù)據(jù)之后,做為附加的圖像數(shù)據(jù)。一般而言,為了方便建立個(gè)人基本數(shù)據(jù),第一次看診數(shù)據(jù)的首頁(yè)為制式格式的窗體或申請(qǐng)表,以記載個(gè)人的基本數(shù)據(jù)及建文檔編號(hào)等。每一個(gè)人都會(huì)有屬于個(gè)人的首頁(yè)窗體,因此當(dāng)系統(tǒng)掃描并判斷一疊看診數(shù)據(jù)時(shí),只要出現(xiàn)第一次看診數(shù)據(jù),表示系統(tǒng)已經(jīng)掃描完前一個(gè)人的看診數(shù)據(jù),現(xiàn)在正在對(duì)下一個(gè)人的看診數(shù)據(jù)進(jìn)行掃描,此時(shí),系統(tǒng)自動(dòng)依照首頁(yè)窗體分割為不同的群組,并將第一次看診數(shù)據(jù)設(shè)為首頁(yè)后建立個(gè)人文檔,以區(qū)分不同病人的看診數(shù)據(jù)。
[0011]另外,掃描圖像數(shù)據(jù)可為政府機(jī)關(guān)的公文或簽呈,每個(gè)部門都會(huì)有專屬的首頁(yè)窗體,因此當(dāng)收件單位收到各個(gè)部門寄來(lái)的文稿時(shí),經(jīng)過(guò)掃描后可判斷其首頁(yè)窗體的格式,自動(dòng)依照發(fā)送部門分割為不同的群組,并建立相對(duì)應(yīng)群組的文檔,以加快掃描圖像數(shù)據(jù)的分文檔作業(yè)。
[0012]再者,掃描圖像數(shù)據(jù)可為銀行的請(qǐng)款單據(jù)或放款單據(jù),每個(gè)銀行都會(huì)有專屬的首頁(yè)窗體,因此當(dāng)會(huì)計(jì)單位收到各個(gè)銀行寄來(lái)的單據(jù)時(shí),經(jīng)過(guò)掃描后可判斷其首頁(yè)窗體的格式,自動(dòng)依照發(fā)送銀行分割為不同的群組,并建立相對(duì)應(yīng)群組的文檔,以加快掃描圖像數(shù)據(jù)的分文檔作業(yè)。
[0013]因此,不論是統(tǒng)一格式的首頁(yè)窗體或是專屬格式的首頁(yè)窗體,均可通過(guò)上述的圖像分文檔方法,將掃描圖像數(shù)據(jù)分割為不同的群組,再建立相對(duì)應(yīng)群組的文檔。
[0014]以下是提出實(shí)施例進(jìn)行詳細(xì)說(shuō)明,實(shí)施例僅用以作為范例說(shuō)明,并非用以限縮本發(fā)明想要保護(hù)的范圍。
第一實(shí)施例
[0015]請(qǐng)參照?qǐng)D1,其繪示依照本發(fā)明第一實(shí)施例的圖像分文檔方法的流程圖。圖像分文檔方法包括下列步驟S11?S14。在步驟S11中,將一疊文稿放入掃描儀中掃描,以產(chǎn)生多個(gè)掃描圖像數(shù)據(jù)。掃描圖像數(shù)據(jù)的文檔格式可為Pdf或rtf等具有文字形式格式的電子文檔。在步驟S12中,從這些掃描圖像數(shù)據(jù)中尋找窗體格式。窗體格式可為申請(qǐng)表、簽呈或單據(jù)等制式格式。在步驟S13中,當(dāng)有Μ個(gè)窗體格式出現(xiàn)于這些掃描圖像數(shù)據(jù)中,將這些掃描圖像數(shù)據(jù)分為Μ個(gè)群組,并將窗體格式設(shè)在每一群組的首頁(yè)。
[0016]例如:掃描圖像數(shù)據(jù)為醫(yī)院的個(gè)人病歷資料,第一頁(yè)為個(gè)人基本資料或第一次看診數(shù)據(jù),此時(shí),首頁(yè)的窗體格式可做為文檔設(shè)定時(shí)的參考,以依照首頁(yè)窗體分為不同群組。
[0017]在步驟S14中,建立對(duì)應(yīng)于這些群組的Μ個(gè)文檔。因此,這些掃描圖像數(shù)據(jù)可以依照首頁(yè)窗體進(jìn)行分文檔,并為這些文檔命名,以建立各別的文檔名。
[0018]請(qǐng)參照?qǐng)D2,其繪示建立文檔名的流程圖。在實(shí)施例中,文檔的命名方法包括下列步驟S21?S23。在步驟S21中,從每一群組的首頁(yè)中尋找關(guān)鍵詞字符串,以及辨認(rèn)排序于關(guān)鍵詞字符串之后的編碼字符串。例如:在圖5中,掃描圖像數(shù)據(jù)被分為三個(gè)群組G1?G3,每一群組的首頁(yè)具有相同的窗體格式。
[0019]在第1群組G1的首頁(yè)窗體中有一段文字為編號(hào):001,若[編號(hào):]為關(guān)鍵詞字符串,則001為他的編碼字符串。在步驟S22中,建立對(duì)應(yīng)于這些群組的Μ個(gè)文檔。在步驟S23中,若尋找到關(guān)鍵詞字符串,自動(dòng)按編碼字符串訂定這些文檔的文檔名。文檔名不限于完全依照編碼字符串,也可以以該編碼字符串為基礎(chǔ)而有其他變化。例如:編碼字符串為001,文檔名可以為001-1、PR-001、數(shù)據(jù)001等等。
[0020]第2群組G2的文檔名可以為002.pdf或其他變化,例如002-1、PR-002、數(shù)據(jù)002等等。第3群組G3的文檔名可以為003.pdf或其他變化,例如003-1、PR-003、數(shù)據(jù)003等坐寸。
第二實(shí)施例
[0021]此外,本發(fā)明又提出第二實(shí)施例。請(qǐng)參照?qǐng)D3,其繪示依照本發(fā)明第二實(shí)施例的圖像分文檔方法的流程圖,包括步驟S31?S34。其中,步驟S33?S34與第一實(shí)施例的步驟S23?S24相同。在步驟S31?S32中,本發(fā)明更包括掃描比對(duì)文稿,以產(chǎn)生比對(duì)圖像數(shù)據(jù),并依據(jù)此比對(duì)圖像數(shù)據(jù),從這些掃描圖像數(shù)據(jù)中尋找窗體格式。在步驟S32中,若尋找到符合的窗體格式,則進(jìn)行步驟S33的分組作業(yè)以及步驟S34的建文檔作業(yè)。
[0022]比對(duì)圖像數(shù)據(jù)可以為具有空白窗體格式的圖像數(shù)據(jù)。若只有一種窗體格式可供比對(duì),則系統(tǒng)只會(huì)尋找與此種窗體格式相同的圖像數(shù)據(jù),然而,若有兩種或兩種以上的窗體格式可供比對(duì),則系統(tǒng)會(huì)尋找符合上述各種窗體格式的圖像數(shù)據(jù)。例如,在圖5中,若第1群組G1具有第一種窗體格式,第2群組G2具有第二種窗體格式,而第3群組G3具有第三種窗體格式,則系統(tǒng)會(huì)從掃描圖像數(shù)據(jù)中尋找這三種窗體格式,再按照這三種窗體格式至少分為三個(gè)群組G1?G3,以進(jìn)行掃描圖像數(shù)據(jù)的分文檔作業(yè)。
[0023]有關(guān)第一實(shí)施例中的文檔命名方法也可應(yīng)用在第二實(shí)施例中,相關(guān)的內(nèi)容請(qǐng)一并參照?qǐng)D2的說(shuō)明,在此不再贅述。
第三實(shí)施例
[0024]此外,本發(fā)明又提出第三實(shí)施例。請(qǐng)參照?qǐng)D4,其繪示依照本發(fā)明第三實(shí)施例的圖像分文檔方法的流程圖,包括步驟S41?S44。其中,步驟S43?S44與第一實(shí)施例的步驟S23?S24相同。在步驟S41?S42中,本發(fā)明更包括接收窗體格式設(shè)定指示,并依據(jù)窗體格式設(shè)定指示,尋找這些掃描圖像數(shù)據(jù)中的窗體格式。
[0025]窗體格式設(shè)定例如顯示在用戶操作接口上,以供用戶在該用戶操作接口上設(shè)定尋找