專利名稱:用于自動(dòng)和動(dòng)態(tài)地構(gòu)建文件管理應(yīng)用程序的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總的涉及內(nèi)容管理。更具體地,本發(fā)明涉及一種內(nèi)容管理應(yīng)用程序,其應(yīng)用相關(guān)文件分析、元數(shù)據(jù)抽取和業(yè)務(wù)處理相關(guān)算法及方法來(lái)自動(dòng)和動(dòng)態(tài)地對(duì)文件進(jìn)行分類,以便路由、處理和執(zhí)行定制的業(yè)務(wù)邏輯。
背景技術(shù):
內(nèi)容管理被定義為在任何介質(zhì)中或以任何格式建立、組織、管理和存儲(chǔ)數(shù)字作品集合的軟件。內(nèi)容管理是指處理各種類型的結(jié)構(gòu)化和非結(jié)構(gòu)化的信息的過(guò)程,該結(jié)構(gòu)化和非結(jié)構(gòu)化信息包括圖像和文件,可包括帳單數(shù)據(jù)、用戶服務(wù)信息和其它類型的內(nèi)容。內(nèi)容管理還指的是捕獲、存儲(chǔ)、分類、編碼、集成、更新和保護(hù)任何和全部信息的過(guò)程。研究估算超過(guò)75%的企業(yè)數(shù)據(jù)是非結(jié)構(gòu)化和與文件相關(guān)的(Lyman Peter等人著“多少信息,2000”,http://www.sims.berkeley.edu/how-much-info.)。
內(nèi)容管理市場(chǎng)的關(guān)鍵技術(shù)包括文件管理、網(wǎng)絡(luò)內(nèi)容管理、數(shù)字資產(chǎn)管理和記錄管理。內(nèi)容管理的典型用戶在文件量大的產(chǎn)業(yè)中,其中文件管理是基本需求,通常由于管理和服從的原因。內(nèi)容包括許多不同形式的需要管理的非結(jié)構(gòu)化數(shù)據(jù)業(yè)務(wù)文件、動(dòng)態(tài)網(wǎng)絡(luò)內(nèi)容、記錄管理和豐富媒體。業(yè)務(wù)文件包括合同、發(fā)貨單、表格和電子郵件。舉例來(lái)說(shuō),業(yè)務(wù)文件能方便內(nèi)部后-辦公室處理及與用戶、合作伙伴和供應(yīng)商直接外部通信。動(dòng)態(tài)網(wǎng)絡(luò)內(nèi)容包括有關(guān)數(shù)據(jù)庫(kù)中的業(yè)務(wù)數(shù)據(jù)和個(gè)人化信息。記錄管理典型地由政府和工業(yè)規(guī)范來(lái)驅(qū)動(dòng)以便有效進(jìn)行文件處理、審計(jì)索引和數(shù)據(jù)保留。豐富媒體包括數(shù)字音頻和視頻。豐富媒體是許多產(chǎn)業(yè)中培訓(xùn)、教育、營(yíng)銷和用戶關(guān)系管理中的快速變化領(lǐng)域。
將文件管理與工作流相關(guān)的概念已經(jīng)通用了幾十年,許多文件管理系統(tǒng)包括該特征。一個(gè)傳統(tǒng)的方法用涉及為一個(gè)機(jī)器工具公司提供處理的案例研究來(lái)對(duì)集成文件和工作流管理的問(wèn)題提供工具和方法(Morschheuser,S.,等著的“應(yīng)用到機(jī)器工具公司的提供處理的集成文件和工作流管理”,有組織的計(jì)算系統(tǒng)會(huì)議公報(bào),1995)。該傳統(tǒng)方法為一種過(guò)程定義語(yǔ)言,使得帶有工作流引擎的面向文件的工具更加高效。
另一傳統(tǒng)方法將活動(dòng)文件特性的思想利用到文件管理應(yīng)用程序(Dourish,P.,等人著“利用用戶特定活動(dòng)特性延伸文件管理系統(tǒng)”,信息系統(tǒng)的ACM學(xué)報(bào)(TOIS),第18卷,第2期,2000)。該傳統(tǒng)方法避免以前的分層存儲(chǔ)機(jī)制,而反映對(duì)用戶任務(wù)很有意義的文件分類,提供統(tǒng)一交互架構(gòu)中一個(gè)或多個(gè)個(gè)體的想法的集成手段。基于特性的文件管理系統(tǒng)增加了活動(dòng)特性的概念,以便在特性基礎(chǔ)結(jié)構(gòu)上提供基于文件的服務(wù),該活動(dòng)特性載有可執(zhí)行碼。
而另一傳統(tǒng)的系統(tǒng)捕獲基本的自由結(jié)構(gòu)化文件,諸如典型地用于辦公室領(lǐng)域中的文件(Mattos,N.M.,等人著“集成辦公室文件處理和管理的方法”,ACM SIGOIS公報(bào),辦公室信息系統(tǒng)會(huì)議公報(bào),第11卷,第2-3期,1990)。該傳統(tǒng)系統(tǒng)易于處理包含信息。分析過(guò)的文件存儲(chǔ)在文件管理系統(tǒng)中,該文件管理系統(tǒng)連接到幾個(gè)不同的后續(xù)服務(wù)并用作基本工作流。
FileNet提供一種結(jié)合了文件技術(shù)的工作流引擎來(lái)分別自動(dòng)操作制造和特別業(yè)務(wù)處理(Whelan,D“FileNet集成文件管理數(shù)據(jù)庫(kù)使用和問(wèn)題”,ACM SIGMOD記錄,數(shù)據(jù)管理1998ACM SIGMOD國(guó)際會(huì)議學(xué)報(bào),第27卷,第2期,1998)。
大多數(shù)傳統(tǒng)文件管理系統(tǒng)由一相關(guān)模型支持。關(guān)于有關(guān)的關(guān)系模型研究,關(guān)系方案的正式模型化源自對(duì)運(yùn)行時(shí)間方面的強(qiáng)調(diào),諸如查詢表達(dá)(Andries M等人著“用于延伸的實(shí)體關(guān)系模型的混合查詢語(yǔ)言”,視覺(jué)語(yǔ)言和計(jì)算期刊,8(1),1997,視覺(jué)查詢系統(tǒng)特刊;和Angelaccio M等人著“QBD*完全視覺(jué)查詢系統(tǒng)”,視覺(jué)語(yǔ)言和計(jì)算期刊,1(2),255-273,1990)、查詢結(jié)果顯示和對(duì)存儲(chǔ)數(shù)據(jù)的導(dǎo)航。總的來(lái)說(shuō),這些任務(wù)稱作視覺(jué)查詢系統(tǒng)(VQS)(Catarci,T.,等人著“數(shù)據(jù)庫(kù)的視覺(jué)查詢系統(tǒng)一個(gè)調(diào)查”技術(shù)報(bào)告SI/RR-95/17,Dipartimentodi Scienze dell’Informazione,Universita’di Roma“La Sapienza”1995)。
對(duì)比來(lái)說(shuō),在用于定義和操作數(shù)據(jù)模型和數(shù)據(jù)庫(kù)方案的工具所提供的接口方面,傳統(tǒng)系統(tǒng)投入的注意力較少。商用數(shù)據(jù)庫(kù)建模產(chǎn)品(例如Ration工具)提供視覺(jué)數(shù)據(jù)建模文檔,其集成到更廣泛的軟件開(kāi)發(fā)周期中(Gornik D,“UML數(shù)據(jù)建模文檔”,IBM Rational軟件白紙TP 16205/02,2003)。這些文檔通常適應(yīng)于關(guān)系數(shù)據(jù)庫(kù)的UML(統(tǒng)一建模語(yǔ)言)建模。由Wisconsin大學(xué)開(kāi)發(fā)的OPOSSUM系統(tǒng)允許數(shù)據(jù)庫(kù)方案通過(guò)方案可視化操作來(lái)編輯(Haber,E.M.等人著“OPOSSUM靈活的方案可視化和編輯工具”,1994ACM CHI會(huì)議公報(bào),MA波士頓,1994年4月;Haber,E.M.等人著“Opossum通過(guò)可定制的可視化的桌面方案管理”,于第21次國(guó)際VLDB會(huì)議公報(bào),第527-538頁(yè),瑞典Zurich,1995年9月)。
文件管理系統(tǒng)典型地包括文件理解和分類的某些方面來(lái)支持業(yè)務(wù)處理。已經(jīng)有人探索了分類機(jī)器打印的文件的通常問(wèn)題,其中視覺(jué)布局是識(shí)別精細(xì)?;悇e的一個(gè)關(guān)鍵因素,這是因?yàn)槲募?nèi)容特征相似。文件管理的一個(gè)傳統(tǒng)方法利用從文件頁(yè)的掃描二進(jìn)制圖像檢測(cè)的布局結(jié)構(gòu),而不利用光學(xué)字符識(shí)別(OCR)結(jié)果,而是利用屬性關(guān)系圖(Bagdanov,A.D.,等人著“利用一階隨機(jī)圖形的精細(xì)?;募诸悺?,ICDAR01學(xué)報(bào))。
另一傳統(tǒng)系統(tǒng)在布局上利用基于“邏輯近似性”的學(xué)習(xí)技術(shù),其中定向的權(quán)重圖用于代表文件布局(Li,X.,等人著“帶有學(xué)習(xí)能力的文件分類和抽取系統(tǒng)”,ICDAR99學(xué)報(bào))。而另一傳統(tǒng)系統(tǒng)利用基于視覺(jué)相似性的文件分類(Hu,J等人著“文件圖像布局比較和分類”,ICDAR99學(xué)報(bào))。在該傳統(tǒng)系統(tǒng)中,引入間隔編碼法來(lái)捕獲空間布局的元素。這些傳統(tǒng)系統(tǒng)提出基于隱馬爾可夫模型的頁(yè)面布局分類系統(tǒng),該系統(tǒng)是可以基于空間特征可訓(xùn)練和延伸的。
另一傳統(tǒng)系統(tǒng)利用面向用戶的掃描圖像部分的“快速捕獲”,其包括易于訪問(wèn)、編輯、和分配到需要的目的地(如檔案、應(yīng)用程序和網(wǎng)頁(yè)等)的工具(Simske,S.J等人著“編輯和創(chuàng)作面向用戶的掃描圖像的分析”,文件工程2003ACM論壇公報(bào),2003)。這些工具利用面向用戶的分區(qū)分析(公知為“點(diǎn)擊與選擇”)和基于統(tǒng)計(jì)的區(qū)域分類?!包c(diǎn)擊與選擇”包含從下向上的分區(qū)分析引擎。基于統(tǒng)計(jì)的區(qū)域分類允許區(qū)域的快速重構(gòu)。
雖然這些傳統(tǒng)技術(shù)被證明是有用的,但還需要進(jìn)一步的改進(jìn)。文件管理應(yīng)用程序的生命周期典型地包括以下階段a)內(nèi)容的攝取(ingest)或捕獲;b)管理(包括搜索、檢取和工作流);c)在業(yè)務(wù)過(guò)程結(jié)束時(shí)完成;以及d)由于服從和規(guī)定的原因而建檔。
攝取或捕獲階段典型地產(chǎn)生關(guān)于進(jìn)入文件的元數(shù)據(jù),并將該文件與內(nèi)容管理系統(tǒng)中定義的方案關(guān)聯(lián)起來(lái)。相關(guān)于一個(gè)方案的元數(shù)據(jù)使得管理階段能在業(yè)務(wù)處理和工作流的上下文中有效地搜索數(shù)據(jù)庫(kù)。在完成了相關(guān)于處理的所有管理和事務(wù)之后,可以觸發(fā)完成(fulfillment)動(dòng)作,諸如通知、與其它系統(tǒng)(如記帳、支付、記錄等)的集成。如果文件需要保留一固定的時(shí)間段用于審計(jì),可以在斷線存儲(chǔ)器中建檔。
傳統(tǒng)的文件管理系統(tǒng)在分開(kāi)的捕獲子系統(tǒng)中管理攝取階段,這些子系統(tǒng)使得元數(shù)據(jù)在分開(kāi)的環(huán)境中規(guī)定。傳統(tǒng)文件管理系統(tǒng)中應(yīng)該管理的數(shù)據(jù)放置在不同的位置,如不同的業(yè)務(wù)分支、相對(duì)于主辦公室的現(xiàn)場(chǎng)辦公室等。隨后文件被“釋放”到文件管理系統(tǒng)。由于這些捕獲子系統(tǒng)經(jīng)常是從總的內(nèi)容管理系統(tǒng)中分離出來(lái)的,所抽取的元數(shù)據(jù)被松散地連到方案和業(yè)務(wù)處理。其結(jié)果是,經(jīng)常有相關(guān)于元數(shù)據(jù)的實(shí)際分配和相關(guān)于具體方案和處理的一個(gè)人工步驟,這導(dǎo)致總的上下文的效率降低。例如,一個(gè)業(yè)務(wù)需要的數(shù)據(jù)典型地通常由人工成批地收集和處理。此外,在管理階段之后,攝取階段總是與業(yè)務(wù)處理的完成或觸發(fā)沒(méi)有聯(lián)系。
因此需要一種系統(tǒng)、一種服務(wù)、一種計(jì)算機(jī)程序產(chǎn)品和相關(guān)的方法,用來(lái)自動(dòng)、動(dòng)態(tài)和有選擇地構(gòu)建(compose)和管理數(shù)據(jù)和文件。這種需求目前尚未得到滿足。
發(fā)明內(nèi)容
本發(fā)明滿足這一需要提供一個(gè)系統(tǒng)、一種服務(wù)、一個(gè)計(jì)算機(jī)程序產(chǎn)品和一相關(guān)方法(這里統(tǒng)稱為“該系統(tǒng)”或“本系統(tǒng)”),用于應(yīng)用相關(guān)文件分析、元數(shù)據(jù)抽取、業(yè)務(wù)處理相關(guān)算法和方法來(lái)自動(dòng)、動(dòng)態(tài)和選擇性地分類文件,以進(jìn)行路由、處理和執(zhí)行定制的業(yè)務(wù)邏輯。
本發(fā)明提供一種智能文件管理架構(gòu),具有相關(guān)文件分析、元數(shù)據(jù)抽取和業(yè)務(wù)處理相關(guān)算法和方法。本系統(tǒng)從一個(gè)或多個(gè)通道接受文件-掃描紙件、打印數(shù)據(jù)流、來(lái)自桌上電腦的電子文件,分類這些文件并抽取元數(shù)據(jù),執(zhí)行定制的應(yīng)用文檔并觸發(fā)與該處理有關(guān)的業(yè)務(wù)邏輯。
本發(fā)明包括一個(gè)元數(shù)據(jù)提示模塊、一個(gè)元數(shù)據(jù)抽取模塊、業(yè)務(wù)處理過(guò)程、一個(gè)驗(yàn)證模塊和一個(gè)執(zhí)行模塊。元數(shù)據(jù)提示模塊安裝在諸如掃描儀或打印機(jī)的輸入設(shè)備中。當(dāng)用戶通過(guò)輸入設(shè)備將一個(gè)文件輸入到本系統(tǒng)中時(shí),元數(shù)據(jù)提示模塊通過(guò)一個(gè)或多個(gè)提示從用戶請(qǐng)求關(guān)于該文件的信息。這些提示的形式可以是選擇、按鈕點(diǎn)擊、文本輸入等。在一個(gè)實(shí)施例中,元數(shù)據(jù)提示模塊安裝在具有元數(shù)據(jù)抽取模塊的服務(wù)器上。元數(shù)據(jù)抽取模塊自動(dòng)從文件中抽取元數(shù)據(jù)。
執(zhí)行模塊安裝在網(wǎng)關(guān)上。在一個(gè)實(shí)施例中,執(zhí)行模塊安裝在帶有元數(shù)據(jù)抽取模塊的服務(wù)器上。執(zhí)行模塊恢復(fù)文件和來(lái)自服務(wù)器的相關(guān)元數(shù)據(jù)。執(zhí)行模塊如確定的文件和相關(guān)元數(shù)據(jù)那樣,選擇性地、自動(dòng)地執(zhí)行業(yè)務(wù)處理中的指令。
業(yè)務(wù)處理包括由執(zhí)行模塊執(zhí)行的指令。這些指令逐文件地選擇地被執(zhí)行,逐文件基礎(chǔ)是從文件分類確定的。用戶可以對(duì)于每個(gè)文件類型選擇執(zhí)行業(yè)務(wù)處理的哪個(gè)指令。進(jìn)一步,用戶可以在本系統(tǒng)操作時(shí)修正指令的選擇而不改變執(zhí)行模塊的任何部分并且不關(guān)閉本系統(tǒng)或重啟本系統(tǒng)。如相關(guān)元數(shù)據(jù)和業(yè)務(wù)處理確定的,執(zhí)行模塊將文件和相關(guān)元數(shù)據(jù)發(fā)送到一個(gè)或多個(gè)輸出設(shè)備。
傳統(tǒng)的內(nèi)容管理系統(tǒng)構(gòu)成一個(gè)單一的架構(gòu),其利用一個(gè)共有基礎(chǔ)結(jié)構(gòu)緊密地將收取階段和管理階段及完成階段連在一起。相比較而言,本系統(tǒng)利用動(dòng)態(tài)和靈活的架構(gòu),該架構(gòu)使得相關(guān)于文件管理處理的周期次數(shù)顯著減少,提供了處理中的總體效率。
傳統(tǒng)內(nèi)容管理系統(tǒng)依賴具有特征的可預(yù)測(cè)位置的結(jié)構(gòu)化的形式,通常僅僅在視覺(jué)特征上操作。本系統(tǒng)包括業(yè)務(wù)處理形式的一個(gè)規(guī)則引擎,來(lái)檢測(cè)和分類非結(jié)構(gòu)化形式和結(jié)構(gòu)化形式,這里屬性和視覺(jué)布局的位置不是固定的。本系統(tǒng)使用規(guī)則謂語(yǔ)中的文件布局及布局內(nèi)的文本內(nèi)容來(lái)檢測(cè)和分類文件。由本系統(tǒng)管理的文件流可動(dòng)態(tài)配置到一個(gè)應(yīng)用,這是傳統(tǒng)工作流和文件管理產(chǎn)品不能提供的。本系統(tǒng)在動(dòng)態(tài)配置性能方面可有效定制,并適用于真實(shí)世界的文件,如發(fā)貨單和航運(yùn)帳單。
本系統(tǒng)可以做成一個(gè)實(shí)用程序,如自動(dòng)文件管理實(shí)用程序。本系統(tǒng)向用戶提供識(shí)別自動(dòng)文件管理實(shí)用程序的一個(gè)或多個(gè)業(yè)務(wù)處理、然后調(diào)用該自動(dòng)文件管理實(shí)用程序來(lái)接收作為輸入的文件、從該文件抽取元數(shù)據(jù)、分析該文件的元數(shù)據(jù)并分類該文件的手段。本系統(tǒng)向用戶提供接收文件和相關(guān)元數(shù)據(jù)需要驗(yàn)證的通知的手段。本系統(tǒng)向用戶提供驗(yàn)證或增加文件和相關(guān)元數(shù)據(jù)的手段。本系統(tǒng)還發(fā)出一個(gè)更新內(nèi)容到輸出設(shè)備,該更新內(nèi)容包括文件、相關(guān)元數(shù)據(jù)、文件的分類、用戶提供的增加的數(shù)據(jù)、用戶采取的行動(dòng)及業(yè)務(wù)處理的執(zhí)行結(jié)果。本系統(tǒng)還提供當(dāng)本系統(tǒng)處于操作中用戶修改業(yè)務(wù)處理的手段。
本發(fā)明的各種特征和獲得方式將參考后續(xù)的說(shuō)明書、權(quán)利要求書和附圖做更詳細(xì)的說(shuō)明,其中標(biāo)號(hào)適當(dāng)?shù)刂貜?fù)使用以指明有關(guān)項(xiàng)目的相關(guān)性,其中圖1是其中可以使用本發(fā)明的文件管理系統(tǒng)的示范操作環(huán)境的示意圖;圖2是圖1中的文件管理系統(tǒng)的高級(jí)體系結(jié)構(gòu)的方框圖;圖3是說(shuō)明本發(fā)明的文件和元數(shù)據(jù)流的圖1和圖2中的文件管理系統(tǒng)的方框圖;圖4是說(shuō)明圖1和圖2的文件管理系統(tǒng)的操作方法的處理流程圖;圖5是圖1和圖2的文件管理系統(tǒng)的示范性業(yè)務(wù)處理;圖6是說(shuō)明圖1和圖2的文件管理系統(tǒng)的串行連接特性的方框圖;圖7是說(shuō)明圖1和圖2中的文件管理系統(tǒng)的可擴(kuò)展性(scalability)和分布性質(zhì)方框圖。
具體實(shí)施例方式
圖1顯示了示范性整體環(huán)境(“內(nèi)容管理系統(tǒng)100”),其中可以使用本發(fā)明的一個(gè)系統(tǒng)、一種服務(wù)、一個(gè)計(jì)算機(jī)程序產(chǎn)品和相關(guān)方法(文件管理系統(tǒng)10或“系統(tǒng)10”),用于自動(dòng)、動(dòng)態(tài)地為電子商務(wù)主管服務(wù)構(gòu)建文件管理應(yīng)用程序。系統(tǒng)10包括典型地嵌入或安裝于輸入設(shè)備15或服務(wù)器20或網(wǎng)關(guān)25的軟件編程碼或計(jì)算機(jī)程序產(chǎn)品??蛇x地,系統(tǒng)10可以存儲(chǔ)在合適的存儲(chǔ)介質(zhì)上,諸如盤、CD、硬驅(qū)等設(shè)備上。雖然系統(tǒng)10是關(guān)于文件提及的,其可以用于管理能電子地傳送、處理、存儲(chǔ)的任何類型或形式的內(nèi)容,例如紙件或電子文件、照片、視頻記錄、音頻記錄等。
輸入設(shè)備15可以由多種設(shè)備表示,諸如計(jì)算機(jī)30、掃描儀35或打印機(jī)40。輸入設(shè)備15是能將內(nèi)容輸入到內(nèi)容管理系統(tǒng)100的任何類型的內(nèi)容捕獲設(shè)備。用戶可以通過(guò)輸入設(shè)備15輸入文件、圖像、視頻、音頻等到內(nèi)容管理系統(tǒng)100。輸入設(shè)備15可以通過(guò)網(wǎng)絡(luò)45訪問(wèn)服務(wù)器20。網(wǎng)關(guān)25通過(guò)網(wǎng)絡(luò)45訪問(wèn)服務(wù)器20和輸出設(shè)備50。
輸入設(shè)備15、服務(wù)器20、網(wǎng)關(guān)25和輸出設(shè)備50的每一個(gè)都包括允許通過(guò)網(wǎng)絡(luò)45安全接口的軟件。服務(wù)器20、網(wǎng)關(guān)25和輸出設(shè)備50分別經(jīng)通信鏈路55、60、65連接到網(wǎng)絡(luò)45。通信鏈路55、60、65包括諸如電話、電纜和衛(wèi)星鏈路等鏈路。輸入設(shè)備15可以經(jīng)諸如電話、電纜或衛(wèi)星鏈路的通信鏈路連接到網(wǎng)絡(luò)45。計(jì)算機(jī)30、掃描儀35和打印機(jī)40經(jīng)通信鏈路70、75、80連接到網(wǎng)絡(luò)45。
雖然系統(tǒng)10是關(guān)于網(wǎng)絡(luò)45描述的,輸入設(shè)備15、服務(wù)器20、網(wǎng)關(guān)25和輸出設(shè)備50也可以經(jīng)局域網(wǎng)、廣域網(wǎng)或其它任何允許輸入設(shè)備15、服務(wù)器20、網(wǎng)關(guān)25和輸出設(shè)備50之間通信的網(wǎng)絡(luò)來(lái)通信。此外,輸入設(shè)備15、服務(wù)器20、網(wǎng)關(guān)25或輸出設(shè)備50中的任何一個(gè)或多個(gè)可以共同定位,經(jīng)過(guò)諸如局域網(wǎng)的網(wǎng)絡(luò)來(lái)通信,而輸入設(shè)備15、服務(wù)器20、網(wǎng)關(guān)25和輸出設(shè)備50中的其它設(shè)備可以遠(yuǎn)地定位,經(jīng)過(guò)諸如因特網(wǎng)的網(wǎng)絡(luò)來(lái)連接。
計(jì)算機(jī)30在內(nèi)容管理系統(tǒng)100中的功能為輸入設(shè)備。計(jì)算機(jī)30可以用作其它功能,例如作為到內(nèi)容管理系統(tǒng)100的用戶接口。用戶可以從計(jì)算機(jī)或計(jì)算機(jī)30所代表的其它設(shè)備訪問(wèn)文件以驗(yàn)證或?yàn)g覽。
圖2說(shuō)明了系統(tǒng)10的高級(jí)層次結(jié)構(gòu)。系統(tǒng)10包括元數(shù)據(jù)提示模塊205、元數(shù)據(jù)抽取模塊210、業(yè)務(wù)處理215、執(zhí)行模塊220。元數(shù)據(jù)提示模塊205安裝在輸入設(shè)備15上。當(dāng)用戶經(jīng)輸入設(shè)備15輸入一文件到內(nèi)容管理系統(tǒng)100時(shí),元數(shù)據(jù)提示模塊205通過(guò)一個(gè)或多個(gè)提示(prompts)向用戶請(qǐng)求關(guān)于該文件的信息。這些提示可以采用文本、音頻、視頻等形式。在一個(gè)實(shí)施例中,元數(shù)據(jù)提示模塊205安裝在服務(wù)器20上。
元數(shù)據(jù)抽取模塊210安裝在服務(wù)器20上。元數(shù)據(jù)抽取模塊210自動(dòng)地從該文件抽取元數(shù)據(jù)。執(zhí)行模塊220安裝在網(wǎng)關(guān)25上。業(yè)務(wù)處理215也安裝在網(wǎng)關(guān)25上,它包括由執(zhí)行模塊220執(zhí)行的指令。執(zhí)行模塊220從服務(wù)器20檢取該文件和相關(guān)元數(shù)據(jù)。執(zhí)行模塊220分析該文件和相關(guān)元數(shù)據(jù)來(lái)確定文件類型并分類該文件。執(zhí)行模塊220于是逐個(gè)文件地、選擇性地、自動(dòng)地執(zhí)行業(yè)務(wù)處理215中的指令,確定文件類型和文件分類。
用戶可以針對(duì)每個(gè)文件類型選擇業(yè)務(wù)處理215中的哪個(gè)指令被執(zhí)行。此外用戶可以在系統(tǒng)10操作時(shí)修改指令的選擇,而不改變執(zhí)行模塊220的任何部分、關(guān)掉系統(tǒng)10或重啟系統(tǒng)10。執(zhí)行模塊220發(fā)出外部系統(tǒng)更新到輸出設(shè)備50來(lái)將該文件、相關(guān)元數(shù)據(jù)和執(zhí)行模塊220的輸出集成到輸出設(shè)備50。外部系統(tǒng)更新包括生成、更新、刪除或查詢。雖然輸出設(shè)備50僅為說(shuō)明的目的表示為一個(gè)設(shè)備,應(yīng)該清楚系統(tǒng)10也可以應(yīng)用于例如作為輸出設(shè)備50操作的附加設(shè)備上。此外,附加設(shè)備和輸出設(shè)備50可以操作多個(gè)不同的應(yīng)用程序,諸如數(shù)據(jù)庫(kù)、數(shù)據(jù)存儲(chǔ)、內(nèi)容管理系統(tǒng)等。
圖3更詳細(xì)地顯示了內(nèi)容管理系統(tǒng)100A的例子。圖4(圖4A和4B)顯示了內(nèi)容管理系統(tǒng)100A中的操作系統(tǒng)10的方法400。操作中,結(jié)合參考圖3和4,用戶經(jīng)輸入設(shè)備15通過(guò)例如掃描一個(gè)文件、經(jīng)打印機(jī)驅(qū)動(dòng)器直接打印一個(gè)文件等輸入一個(gè)文件(步驟405)。元數(shù)據(jù)提示模塊205針對(duì)關(guān)于該文件的信息提示用戶(步驟410)。元數(shù)據(jù)提示模塊205允許系統(tǒng)10與用戶接口并請(qǐng)求關(guān)于與該文件相關(guān)的用戶的信息,例如用戶名稱、用戶ID或用戶意見(jiàn)。元數(shù)據(jù)提示模塊205還允許系統(tǒng)10與用戶接口并請(qǐng)求不能從該文件識(shí)別的關(guān)于該文件的信息。用戶提供的關(guān)于用戶的信息和關(guān)于該文件的信息稱為用戶提示(user-prompted)元數(shù)據(jù)。
例如,對(duì)于發(fā)貨單,元數(shù)據(jù)提示模塊205可以請(qǐng)求交易日期、批發(fā)商等。對(duì)于保險(xiǎn)索賠,元數(shù)據(jù)提示模塊205可以請(qǐng)求單據(jù)號(hào)、客戶等。元數(shù)據(jù)提示模塊205檢測(cè)正輸入文件的文件類型并根據(jù)文件類型調(diào)整提供給用戶的提示。元數(shù)據(jù)提示模塊205通常針對(duì)文件中未提供的關(guān)于該文件的信息提示用戶。在對(duì)于保險(xiǎn)公司的內(nèi)容管理系統(tǒng)100A的一個(gè)例子中,對(duì)于產(chǎn)生的不同類型的文件,諸如發(fā)貨單、索賠、估算、損害圖片、證言的視頻、音頻采訪、修理投標(biāo)等,提示是不同的。元數(shù)據(jù)提示模塊205的輸出是文件和用戶提示元數(shù)據(jù)。
文件和與該文件相關(guān)的用戶提示元數(shù)據(jù)被發(fā)送到服務(wù)器20和元數(shù)據(jù)抽取模塊210(步驟415)。服務(wù)器20暫時(shí)存儲(chǔ)該文件和用戶提示元數(shù)據(jù)(步驟420)。元數(shù)據(jù)抽取模塊210處理該文件以便獲得抽取的元數(shù)據(jù)(步驟425);即,通過(guò)從該文件自動(dòng)抽取元數(shù)據(jù)發(fā)現(xiàn)的關(guān)于該文件的數(shù)據(jù)。從文件自動(dòng)抽取元數(shù)據(jù)可以使用任何方法,例如光學(xué)字符識(shí)別(OCR),邏輯OCR,命名的實(shí)體抽取等等。該文件、用戶提示元數(shù)據(jù)和抽取的元數(shù)據(jù)總稱為文件/元數(shù)據(jù)包。
執(zhí)行模塊220從服務(wù)器20檢取(retrieve)文件/元數(shù)據(jù)包(步驟430)。執(zhí)行模塊220選擇性地自動(dòng)執(zhí)行業(yè)務(wù)處理215中的指令。執(zhí)行模塊220基于用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)自動(dòng)分類該文件(步驟435)。執(zhí)行模塊220自動(dòng)確定文件是例如發(fā)貨單、保險(xiǎn)索賠中的證據(jù)、一個(gè)申請(qǐng)表等?;谖募诸?,執(zhí)行模塊220從文件的相關(guān)部分有選擇地抽取關(guān)鍵數(shù)據(jù)字段(步驟440)。例如,執(zhí)行模塊220可以根據(jù)文件分類從文件內(nèi)的已知位置抽取交易號(hào)、文件ID號(hào)等。選擇性抽取的結(jié)果稱作分區(qū)(zonal)數(shù)據(jù)元素。業(yè)務(wù)處理215確定關(guān)鍵數(shù)據(jù)字段及在文件中的位置。
執(zhí)行模塊220執(zhí)行的具體抽取是從業(yè)務(wù)處理215確定的。對(duì)于每個(gè)文件類型,業(yè)務(wù)處理215確定分類要求、要抽取的數(shù)據(jù)、OCR要求等。如業(yè)務(wù)處理215指示的,執(zhí)行模塊220可以選擇性地僅OCR文件中特定的區(qū)域,這里稱為分區(qū)OCR(zonal OCR)。例如,用到保險(xiǎn)索賠處理上,分區(qū)OCR可以抽取關(guān)于索賠的信息而不是索賠者的地址。
如業(yè)務(wù)處理215指示的,執(zhí)行模塊220發(fā)送一個(gè)通知給用戶,通知需要驗(yàn)證文件/元數(shù)據(jù)包及分區(qū)數(shù)據(jù)元素(步驟445)。這個(gè)通知可以通過(guò)任何方式提供,如郵件、電子郵件、即時(shí)消息、語(yǔ)音郵件、蜂窩電話、無(wú)線、電話或任何其它機(jī)制,通知適當(dāng)?shù)娜藖?lái)驗(yàn)證文件。執(zhí)行模塊220可以從文件分類確定通知的接收者。例如,可以通知一個(gè)人來(lái)驗(yàn)證保險(xiǎn)索賠,同時(shí)通知另一個(gè)人來(lái)驗(yàn)證發(fā)貨單。業(yè)務(wù)處理215提供驗(yàn)證通知的指示到一個(gè)特定的人或組織。
執(zhí)行模塊220將文件/元數(shù)據(jù)包、分區(qū)數(shù)據(jù)元素、業(yè)務(wù)處理215確定的分類結(jié)果輸出到驗(yàn)證模塊。用戶驗(yàn)證(步驟450)包括瀏覽和校正數(shù)據(jù)、增加(augment)數(shù)據(jù)及執(zhí)行任何需要的動(dòng)作。在一個(gè)實(shí)施例中,通過(guò)驗(yàn)證接口(例如基于網(wǎng)絡(luò)的驗(yàn)證接口)向用戶提供驗(yàn)證頁(yè)面。執(zhí)行模塊220從用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)提供的信息中及業(yè)務(wù)處理215提供的指令中生成一個(gè)或多個(gè)定制的驗(yàn)證頁(yè)面“onthe fly”。
用戶瀏覽用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素來(lái)檢查OCR和印刷錯(cuò)誤。用戶可以瀏覽文件的分類以便更精確。用戶還可以在需要時(shí)增加數(shù)據(jù)。此外,用戶可以執(zhí)行文件到達(dá)后需要的任何操作,例如支付發(fā)貨單。在瀏覽和修改之后,驗(yàn)證模塊將驗(yàn)證的文件/元數(shù)據(jù)包、驗(yàn)證的分區(qū)數(shù)據(jù)元素、驗(yàn)證的分類結(jié)果、任何增加的數(shù)據(jù)、用戶執(zhí)行的任何操作的記錄返回到執(zhí)行模塊。
驗(yàn)證模塊305獲得的結(jié)果被返回到執(zhí)行模塊220(步驟455)。執(zhí)行模塊220選擇性地自動(dòng)執(zhí)行來(lái)自業(yè)務(wù)處理215的任何附加指令(步驟460)。執(zhí)行模塊220將文件/元數(shù)據(jù)包與輸出設(shè)備50關(guān)聯(lián)起來(lái)(步驟465)。輸出設(shè)備可以是數(shù)據(jù)庫(kù)、內(nèi)容管理系統(tǒng)、內(nèi)容存儲(chǔ)器等。執(zhí)行模塊220將文件/元數(shù)據(jù)包、分區(qū)數(shù)據(jù)元素、增加的數(shù)據(jù)、業(yè)務(wù)處理215的執(zhí)行結(jié)果、用戶執(zhí)行的任何動(dòng)作的記錄及任何需要的外部系統(tǒng)更新輸出到輸出設(shè)備(步驟470)。執(zhí)行模塊220的輸出還包括與輸出設(shè)備的外部系統(tǒng)集成,如生成、更新、刪除和查詢。
執(zhí)行模塊220根據(jù)相關(guān)于用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的信息的業(yè)務(wù)處理215處理文件/元數(shù)據(jù)包。在一個(gè)實(shí)施例中,業(yè)務(wù)處理215以結(jié)構(gòu)化或半結(jié)構(gòu)化的表述存儲(chǔ),如可擴(kuò)展的標(biāo)識(shí)語(yǔ)言(XML)、網(wǎng)絡(luò)服務(wù)的業(yè)務(wù)處理執(zhí)行語(yǔ)言(BPEL)等。業(yè)務(wù)處理215將系統(tǒng)10定制到某特定業(yè)務(wù)發(fā)展和某具體業(yè)務(wù)處理。業(yè)務(wù)處理215是動(dòng)態(tài)可適應(yīng)的;業(yè)務(wù)處理215中編碼的邏輯業(yè)務(wù)處理可簡(jiǎn)單地通過(guò)改變一個(gè)文件(例如XML文件)來(lái)改變,而無(wú)需改變系統(tǒng)10的任何其它部分、安裝新軟件、重啟內(nèi)容管理系統(tǒng)100A、中斷內(nèi)容管理系統(tǒng)100A的操作。
業(yè)務(wù)處理215的示范說(shuō)明作為XML文件500顯示在圖5中。雖然為說(shuō)明目的業(yè)務(wù)處理215僅相對(duì)于XML文件做了說(shuō)明,很顯然系統(tǒng)10也可以應(yīng)用到例如任何結(jié)構(gòu)化或半結(jié)構(gòu)化編程語(yǔ)言。業(yè)務(wù)處理215包括分類說(shuō)明505、分區(qū)OCR說(shuō)明510、通知說(shuō)明515。根據(jù)需要可以增加另外的說(shuō)明到業(yè)務(wù)處理215。
對(duì)業(yè)務(wù)處理215的每個(gè)構(gòu)成元件,使用說(shuō)明520可以設(shè)定為開(kāi)(on)(如圖5所示)或關(guān)(<USAGE>Off</USAGE>)。如圖5所示,使用說(shuō)明520對(duì)于分類說(shuō)明505、分區(qū)OCR說(shuō)明510、通知說(shuō)明515設(shè)定為“開(kāi)”。分類說(shuō)明505、分區(qū)OCR說(shuō)明510、通知說(shuō)明515之中的一個(gè)或多個(gè)的使用說(shuō)明520可在操作內(nèi)容管理系統(tǒng)100的任何時(shí)間改變。
分類說(shuō)明505和分區(qū)OCR說(shuō)明510還包括驗(yàn)證說(shuō)明525。驗(yàn)證說(shuō)明525指定文件自動(dòng)處理的人工驗(yàn)證??梢詾榉诸愓f(shuō)明505和分區(qū)OCR說(shuō)明510指定驗(yàn)證說(shuō)明525。驗(yàn)證說(shuō)明525可以設(shè)定為“開(kāi)”(如圖5所示)或關(guān)(<VERIFICATION>Off</VERIFICATION>)。分類說(shuō)明505和分區(qū)OCR說(shuō)明510中的一個(gè)或多個(gè)的驗(yàn)證說(shuō)明525可以在內(nèi)容管理系統(tǒng)100的操作期間的任意時(shí)間改變。
通知說(shuō)明515包括通知接口說(shuō)明530、通知接觸說(shuō)明535、通知文本540。雖然在圖5中示為電子郵件通知,該通知接口說(shuō)明530可以制作為其它形式的通知,例如郵件、即時(shí)消息、語(yǔ)音消息(如蜂窩電話)、無(wú)線、電話等。由通知接口說(shuō)明530、通知接觸說(shuō)明535和通知文本540指定的任何一個(gè)或多個(gè)形式的通知可以在內(nèi)容管理系統(tǒng)100操作期間的任意時(shí)間改變。
圖6示出一個(gè)實(shí)施例,其中附加版本的內(nèi)容管理系統(tǒng)100作為串行內(nèi)容管理系統(tǒng)600的節(jié)點(diǎn)來(lái)操作。內(nèi)容管理系統(tǒng)100B包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設(shè)備15B、元數(shù)據(jù)抽取模塊210B、執(zhí)行模塊220B和輸出設(shè)備50B。類似地,內(nèi)容管理系統(tǒng)100C包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設(shè)備15C、元數(shù)據(jù)抽取模塊210C、執(zhí)行模塊220C和輸出設(shè)備50C??梢栽黾觾?nèi)容管理系統(tǒng)100的附加版本,如內(nèi)容管理系統(tǒng)100N所示的。內(nèi)容管理系統(tǒng)100N包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設(shè)備15N、元數(shù)據(jù)抽取模塊210N、執(zhí)行模塊220N和輸出設(shè)備50N。
內(nèi)容管理系統(tǒng)100B、內(nèi)容管理系統(tǒng)100C和內(nèi)容管理系統(tǒng)100N中的每一個(gè)在工作流中作為節(jié)點(diǎn)運(yùn)行。執(zhí)行模塊220B的輸出發(fā)送到內(nèi)容管理系統(tǒng)100B的輸出設(shè)備50B及內(nèi)容管理系統(tǒng)100C的元數(shù)據(jù)抽取模塊210C。以類似的方式,執(zhí)行模塊605的輸出發(fā)送到串行內(nèi)容管理系統(tǒng)600的總工作流的下一個(gè)元數(shù)據(jù)抽取模塊610。
例如,串行內(nèi)容管理系統(tǒng)600可以表示一個(gè)發(fā)明的專利申請(qǐng)發(fā)展過(guò)程的工作流。內(nèi)容管理系統(tǒng)100B代表專利披露(disclosure)節(jié)點(diǎn)。內(nèi)容管理系統(tǒng)100C代表專利評(píng)估(review)節(jié)點(diǎn)。內(nèi)容管理系統(tǒng)100N代表專利申請(qǐng)?zhí)峤还?jié)點(diǎn)。輸入設(shè)備15B代表從一個(gè)大公司的世界各地的發(fā)明人收集信息的許多輸入設(shè)備。輸入設(shè)備15B包括發(fā)明人使用的計(jì)算機(jī)、掃描儀、打印機(jī)、實(shí)驗(yàn)設(shè)備或任何其它捕獲可以用于專利申請(qǐng)發(fā)展過(guò)程的信息的設(shè)備。來(lái)自輸入設(shè)備15B的信息發(fā)送到元數(shù)據(jù)抽取模塊210B和執(zhí)行模塊220B,用于如前所述地處理。執(zhí)行模塊的輸出如前所述地進(jìn)行驗(yàn)證并存儲(chǔ)在輸出設(shè)備50B中。
執(zhí)行模塊220B的選擇輸出由執(zhí)行模塊220B自動(dòng)輸入到元數(shù)據(jù)抽取模塊210C并加到專利評(píng)估節(jié)點(diǎn)的信息流上。專利評(píng)估節(jié)點(diǎn)需要的進(jìn)一步信息由輸入設(shè)備15C收集。專利評(píng)估節(jié)點(diǎn)的驗(yàn)證過(guò)程包括管理者和同伴對(duì)專利申請(qǐng)的認(rèn)同。
執(zhí)行模塊220C的選擇輸出自動(dòng)輸入到元數(shù)據(jù)抽取模塊210N并加到專利申請(qǐng)?zhí)峤还?jié)點(diǎn)的信息流上。到元數(shù)據(jù)抽取模塊210N的輸入包括來(lái)自專利評(píng)審節(jié)點(diǎn)、專利代理人的輸入、專利申請(qǐng)寫作者的輸入、起草者的輸入及發(fā)明人的附加輸入的選擇的文件和信息。執(zhí)行模塊50N的輸出包括專利申請(qǐng)和申請(qǐng)文件。
圖7顯示分布式文件管理系統(tǒng)700,該系統(tǒng)說(shuō)明了系統(tǒng)10的分布式能力并說(shuō)明系統(tǒng)10的可擴(kuò)展性。例如,一個(gè)公司可以包括北美分部、亞太分部和歐洲分部。北美分部包括北美內(nèi)容管理系統(tǒng)705。亞太分部包括亞太內(nèi)容管理系統(tǒng)710。歐洲分部包括歐洲內(nèi)容管理系統(tǒng)715。
北美內(nèi)容管理系統(tǒng)705包括諸如輸入設(shè)備15AA到15AN中的任何一個(gè)或多個(gè)輸入設(shè)備、諸如元數(shù)據(jù)抽取模塊210AA到210AN中的任何一個(gè)或多個(gè)的元數(shù)據(jù)抽取模塊、諸如執(zhí)行模塊220AA到220AN中的任何一個(gè)或多個(gè)的執(zhí)行模塊。輸入設(shè)備15AA到15AN、元數(shù)據(jù)抽取模塊210AA到210AN和執(zhí)行模塊220AA到220AN中的任何一個(gè)或多個(gè)可以在同一房間、同一建筑或整個(gè)北美的不同位置。此外,可以按照需要將輸入設(shè)備15AA到15AN,元數(shù)據(jù)抽取模塊210AA到210AN,或執(zhí)行模塊220AA到220AN中的適當(dāng)數(shù)量的單元加入到北美內(nèi)容管理系統(tǒng)705之中,以便充分管理文件流。
亞太內(nèi)容管理系統(tǒng)710包括輸入設(shè)備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB。輸入設(shè)備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB中的任何一個(gè)或多個(gè)可以在同一房間、同一建筑或整個(gè)亞太地區(qū)的不同位置。雖然輸入設(shè)備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB的每一個(gè)都在圖7中示出,可以按照需要將輸入設(shè)備15AA,元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB中的適當(dāng)數(shù)量的設(shè)備加入到亞太內(nèi)容管理系統(tǒng)710之中,以便充分管理文件流。
歐洲內(nèi)容管理系統(tǒng)715包括輸入設(shè)備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC。輸入設(shè)備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC中的任何一個(gè)或多個(gè)可以在同一房間、同一建筑或整個(gè)歐洲的不同位置。雖然輸入設(shè)備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC的每一個(gè)都在圖7中示出,可以按照需要將輸入設(shè)備15CC,元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC加入到歐洲內(nèi)容管理系統(tǒng)715之中,以便充分管理文件流。
如圖7所示,北美內(nèi)容管理系統(tǒng)705、亞太內(nèi)容管理系統(tǒng)710和歐洲內(nèi)容管理系統(tǒng)715的輸出發(fā)送到一個(gè)輸出設(shè)備50AA。輸出設(shè)備50AA可以放置在北美、亞太地區(qū)、歐洲或其他任何位置。因此,使用系統(tǒng)10的內(nèi)容管理系統(tǒng)100可以在世界范圍串行(圖6)或分布式(圖7)管理文件流,或者以結(jié)合了串行和分布式特征的方式來(lái)管理文件流。例如,亞太內(nèi)容管理系統(tǒng)710可以由串行內(nèi)容管理系統(tǒng)600代替,輸出設(shè)備50N的功能由輸出設(shè)備50AA代替。
本內(nèi)容管理系統(tǒng)可以應(yīng)用的一個(gè)例子為信用卡爭(zhēng)端管理。例如,一個(gè)客戶關(guān)系管理公司處理客戶和銷售商之間因?yàn)樾庞每ㄊ召M(fèi)引起的爭(zhēng)端。信用卡爭(zhēng)端管理的傳統(tǒng)內(nèi)容管理系統(tǒng)的爭(zhēng)端處理流典型地如下1、客戶打電話給客戶服務(wù)代表(CSR),并接收到一個(gè)唯一的案件ID和客戶爭(zhēng)端表;2、爭(zhēng)端管理系統(tǒng)接收銷售商爭(zhēng)端文件并自動(dòng)存儲(chǔ)該銷售商爭(zhēng)端文件到傳統(tǒng)的文件管理系統(tǒng)中;3、客戶利用多種輸入通道(例如郵件、電子郵件或傳真)將該爭(zhēng)端表和證明文件郵回到客戶關(guān)系管理公司;4、郵件室工作人員掃描客戶文件;客戶文件放在停放區(qū)域直到客戶服務(wù)代表瀏覽該客戶文件及將客戶文件與爭(zhēng)端記錄聯(lián)系起來(lái);5、客戶還通過(guò)電子郵件發(fā)送一個(gè)證明該爭(zhēng)端的收據(jù);此電子郵件要求在該電子郵件能與爭(zhēng)端記錄聯(lián)系起來(lái)之前客戶服務(wù)代表對(duì)其進(jìn)行閱覽。
利用傳統(tǒng)的信用卡爭(zhēng)端管理內(nèi)容管理系統(tǒng),當(dāng)客戶已經(jīng)發(fā)送了爭(zhēng)端文件時(shí)會(huì)在步驟3、4之間發(fā)生多達(dá)一周的延遲,直到客戶服務(wù)代表評(píng)估爭(zhēng)端文件夾。與將客戶文件與爭(zhēng)端文件夾鏈接相關(guān)的人工步驟是由爭(zhēng)端處理中的不同人員參與的,由此引起延遲。
利用內(nèi)容管理系統(tǒng)100和系統(tǒng)10,自上述步驟3的改進(jìn)的處理過(guò)程如下1、郵件室工作人員使用輸入設(shè)備15掃描客戶文件,響應(yīng)來(lái)自元數(shù)據(jù)提示模塊205的提示輸入案件ID。系統(tǒng)10自動(dòng)將客戶文件與爭(zhēng)端記錄關(guān)聯(lián)起來(lái)。
2、收到客戶的電子郵件后,客戶服務(wù)代表通過(guò)響應(yīng)來(lái)自元數(shù)據(jù)提示模塊205的提示輸入案件ID,將該電子郵件直接從電子郵件應(yīng)用程序插入到正確的爭(zhēng)端文件夾。
3、執(zhí)行模塊220自動(dòng)地將爭(zhēng)端文件夾移動(dòng)從“懸置”狀態(tài)移動(dòng)到“準(zhǔn)備好”狀態(tài)以便爭(zhēng)端辦公人員閱覽(即驗(yàn)證)。
內(nèi)容管理系統(tǒng)100和系統(tǒng)10提供的改進(jìn)的業(yè)務(wù)處理能減少爭(zhēng)端解決時(shí)間,從大約一周到大約兩天,這為客戶提供了有吸引力的業(yè)務(wù)價(jià)值。
內(nèi)容管理系統(tǒng)100和系統(tǒng)10可以應(yīng)用的另一例子可以是管理停車票據(jù)。大城市管理停車票據(jù)的過(guò)程包括數(shù)據(jù)中心、呼叫中心、支付系統(tǒng)和支付應(yīng)用。美國(guó)的一個(gè)大城市每年擁有300萬(wàn)手寫票據(jù)。
目前,停車票據(jù)通過(guò)晚上從分支辦公室(全城大約30個(gè)分支辦公室,平均每個(gè)位置有1萬(wàn)張票據(jù))收集紙件文件來(lái)管理。在中心位置,由兩個(gè)掃描儀操作人員和專門負(fù)責(zé)掃描后驗(yàn)證文件任務(wù)的十個(gè)驗(yàn)證人員,利用高容量掃描儀將文件成批掃描成圖像。在建立票據(jù)的電子記錄之前這個(gè)過(guò)程花費(fèi)3個(gè)工作日;因此票據(jù)輸入和驗(yàn)證是相關(guān)于票據(jù)的任何業(yè)務(wù)處理的關(guān)鍵因素。
內(nèi)容管理系統(tǒng)100和系統(tǒng)10在票據(jù)事件的1個(gè)工作日內(nèi)生成每個(gè)分支位置的1萬(wàn)張票據(jù)的電子記錄。系統(tǒng)10還支持票據(jù)和相關(guān)數(shù)據(jù)的分布式驗(yàn)證,這樣票據(jù)記錄可以在兩個(gè)工作日內(nèi)觸發(fā)與票據(jù)相關(guān)的業(yè)務(wù)處理215。總體來(lái)說(shuō),在處理周期中,利用內(nèi)容管理系統(tǒng)100和系統(tǒng)10可以獲得高效率。
應(yīng)當(dāng)理解,已經(jīng)說(shuō)明的本發(fā)明的具體實(shí)施例只是本發(fā)明原理的特定應(yīng)用??梢栽诓幻撾x本發(fā)明的精神和范圍,對(duì)本系統(tǒng)、方法和服務(wù)做成很多變動(dòng),用于自動(dòng)和動(dòng)態(tài)地為電子商務(wù)主持服務(wù)構(gòu)造文件管理應(yīng)用程序。雖然本發(fā)明是針對(duì)文件的,很顯然本發(fā)明也可以應(yīng)用于可以電子傳送、處理或存儲(chǔ)的任何形式或類型的內(nèi)容,例如紙件或電子文件、照片、視頻記錄、音頻記錄等。
權(quán)利要求
1.一種自動(dòng)和動(dòng)態(tài)地為一個(gè)文件構(gòu)建多個(gè)文件管理應(yīng)用程序的方法,包括從輸入設(shè)備接收該文件;自動(dòng)獲取多個(gè)與該文件有關(guān)的用戶提示的元數(shù)據(jù);自動(dòng)從該文件抽取多個(gè)抽取的元數(shù)據(jù);對(duì)該文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個(gè)或多個(gè)執(zhí)行業(yè)務(wù)處理,以獲得業(yè)務(wù)處理執(zhí)行結(jié)果;若需要,則自動(dòng)地通知用戶,該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個(gè)或多個(gè)需要驗(yàn)證;以及將該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設(shè)備。
2.如權(quán)利要求1所述的方法,還包括自動(dòng)地對(duì)該文件執(zhí)行選擇性抽取,以產(chǎn)生分區(qū)數(shù)據(jù)元素。
3.如權(quán)利要求1所述的方法,還包括將該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個(gè)或多個(gè)提供給用戶進(jìn)行驗(yàn)證。
4.如權(quán)利要求1所述的方法,還包括自動(dòng)地提示用戶提供所述多個(gè)用戶提示的元數(shù)據(jù)。
5.如權(quán)利要求1所述的方法,其中該文件包括紙件文件、電子文件、視頻記錄、音頻記錄、照片和數(shù)字照片中的任何一個(gè)或多個(gè)。
6.如權(quán)利要求1所述的方法,其中驗(yàn)證包括多個(gè)用戶提供的增加的數(shù)據(jù)。
7.如權(quán)利要求2所述的方法,其中自動(dòng)地抽取所抽取的元數(shù)據(jù)的步驟包括對(duì)文件執(zhí)行光學(xué)字符識(shí)別。
8.如權(quán)利要求7所述的方法,其中自動(dòng)地執(zhí)行選擇性抽取的步驟包括在該文件的特定部分執(zhí)行光學(xué)字符識(shí)別。
9.如權(quán)利要求8所述的方法,其中該文件的特定部分是所述業(yè)務(wù)處理確定的。
10.如權(quán)利要求9所述的方法,其中業(yè)務(wù)部分被用戶改動(dòng),以改變文件的特定部分的位置。
11.如權(quán)利要求1所述的方法,其中該輸入設(shè)備包括掃描儀、計(jì)算機(jī)、打印機(jī)和其中可以在本地閱覽器及應(yīng)用程序中的任何一個(gè)或多個(gè)中閱覽文件的設(shè)備中的任何一個(gè)或多個(gè)。
12.如權(quán)利要求1所述的方法,其中集成的步驟包括創(chuàng)建、更新、刪除和查詢中的任何一個(gè)或多個(gè)。
13.如權(quán)利要求1所述的方法,其中集成的步驟包括與外部系統(tǒng)接口進(jìn)行接口。
14.如權(quán)利要求13所述的方法,其中該外部系統(tǒng)接口是由所述業(yè)務(wù)處理指定的。
15.如權(quán)利要求1所述的方法,其中用戶通過(guò)所述業(yè)務(wù)處理指定用于驗(yàn)證的驗(yàn)證接口。
16.如權(quán)利要求1所述的方法,其中用戶通過(guò)所述業(yè)務(wù)處理指定用于通知的通知接口。
17.如權(quán)利要求1所述的方法,其中用戶通過(guò)所述業(yè)務(wù)處理指定對(duì)輸出設(shè)備的訪問(wèn)。
18.如權(quán)利要求1所述的方法,其中所述業(yè)務(wù)處理在分布環(huán)境中操作。
19.如權(quán)利要求1所述的方法,其中所述業(yè)務(wù)處理在包括結(jié)構(gòu)化格式的文件中規(guī)定。
20.如權(quán)利要求1所述的方法,其中所述業(yè)務(wù)處理在包括半結(jié)構(gòu)化格式的文件中規(guī)定。
21.一種自動(dòng)和動(dòng)態(tài)地為一個(gè)文件構(gòu)建多個(gè)文件管理應(yīng)用程序的方法,包括為用戶提供識(shí)別和修改業(yè)務(wù)處理的裝置;調(diào)用自動(dòng)文件管理實(shí)用程序,其中所述文件和所述業(yè)務(wù)處理是所述自動(dòng)文件管理實(shí)用程序可用的;為用戶提供驗(yàn)證文件和相關(guān)數(shù)據(jù)的裝置;產(chǎn)生驗(yàn)證的文件和多個(gè)驗(yàn)證的數(shù)據(jù);為用戶提供增加文件和相關(guān)數(shù)據(jù),和產(chǎn)生多個(gè)增加的數(shù)據(jù)的裝置;并且其中驗(yàn)證的文件、驗(yàn)證的數(shù)據(jù)和增加的數(shù)據(jù)由自動(dòng)文件管理實(shí)用程序根據(jù)所述業(yè)務(wù)處理的指示來(lái)處理。
22.一種計(jì)算機(jī)程序產(chǎn)品,具有多個(gè)可執(zhí)行指令碼,用于自動(dòng)和動(dòng)態(tài)地為一個(gè)文件構(gòu)建多個(gè)文件管理應(yīng)用程序,包括第一組指令碼,用于從輸入設(shè)備接收該文件;第二組指令碼,用于自動(dòng)地獲取多個(gè)與該文件相關(guān)的用戶提示的元數(shù)據(jù);第三組指令碼,用于自動(dòng)地從該文件抽取多個(gè)抽取的元數(shù)據(jù);第四組指令碼,用于對(duì)所述文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個(gè)或多個(gè)執(zhí)行業(yè)務(wù)處理,以獲得業(yè)務(wù)處理執(zhí)行結(jié)果;若需要,還包括第五組指令碼,用于自動(dòng)地向用戶通知,所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個(gè)或多個(gè)需要驗(yàn)證;和第六組指令碼,用于將所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設(shè)備。
23.一種文件管理系統(tǒng),用于自動(dòng)和動(dòng)態(tài)地為一個(gè)文件構(gòu)建多個(gè)文件管理應(yīng)用程序,包括產(chǎn)生該文件的輸入設(shè)備;用于自動(dòng)地獲取與該文件相關(guān)的多個(gè)用戶提示的元數(shù)據(jù)的模塊;用于自動(dòng)地從該文件抽取多個(gè)抽取的元數(shù)據(jù)的元數(shù)據(jù)抽取模塊;執(zhí)行模塊,用于對(duì)所述文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個(gè)或多個(gè)執(zhí)行業(yè)務(wù)處理以獲得業(yè)務(wù)處理執(zhí)行結(jié)果;若需要,還包括通知模塊,用于自動(dòng)地通知用戶,所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個(gè)或多個(gè)需要驗(yàn)證;輸出設(shè)備,用于將所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設(shè)備。
全文摘要
一種文件管理系統(tǒng),應(yīng)用相關(guān)文件分析、元數(shù)據(jù)抽取、業(yè)務(wù)處理相關(guān)算法和方法來(lái)自動(dòng)、動(dòng)態(tài)地分類文件,以進(jìn)行路由、處理和執(zhí)行定制業(yè)務(wù)邏輯。該文件管理系統(tǒng)從一個(gè)或多個(gè)通道接受文件,分類該文件,抽取元數(shù)據(jù),執(zhí)行定制的應(yīng)用文檔并觸發(fā)與該處理相關(guān)的業(yè)務(wù)邏輯。該文件管理系統(tǒng)包括一個(gè)規(guī)則引擎,用來(lái)檢測(cè)和分類非結(jié)構(gòu)化形式和結(jié)構(gòu)化形式,這里屬性的位置和視覺(jué)布局的位置是不固定的。該文件管理系統(tǒng)提供管理文件的分立系統(tǒng)間的自動(dòng)鏈接,用于完全執(zhí)行業(yè)務(wù)處理。
文檔編號(hào)G06F17/30GK1801147SQ200510119370
公開(kāi)日2006年7月12日 申請(qǐng)日期2005年11月2日 優(yōu)先權(quán)日2004年11月3日
發(fā)明者維卡斯·克里什納, 薩維塔·斯里尼瓦桑 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司