影像數(shù)據(jù)包處理方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及數(shù)據(jù)處理【技術領域】,具體而言,涉及影像數(shù)據(jù)包處理方法及系統(tǒng)。該方法,包括:提取接收到的影像數(shù)據(jù)包中的關鍵字信息;利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包;按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員。本發(fā)明提供的影像數(shù)據(jù)包處理方法及系統(tǒng),在接收到需要處理的影像數(shù)據(jù)包時,利用影像數(shù)據(jù)包中的關鍵字信息對影像數(shù)據(jù)包重新打包,并且利用矢量篩選分配原則對重新打包后獲得的預處理工作包進行動態(tài)分配,使影像數(shù)據(jù)包根據(jù)設定的分配條件進行合理分配,提高作業(yè)人員對影像數(shù)據(jù)包的處理效率,進一步滿足用用戶對影像數(shù)據(jù)包的處理需求。
【專利說明】影像數(shù)據(jù)包處理方法及系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術領域】,具體而言,涉及影像數(shù)據(jù)包處理方法及系統(tǒng)。
【背景技術】
[0002]影像數(shù)據(jù)包是指包含有圖像文件、文本文件、WORD文件、EXCEL文件或其它類型文件的數(shù)據(jù)包。
[0003]當前對影像數(shù)據(jù)包處理的方式主要為,接收到影像數(shù)據(jù)包的作業(yè)任務時,通過人工方式將需處理的影像數(shù)據(jù)包分配給作業(yè)人員,由作業(yè)人員對數(shù)據(jù)包進行操作。
[0004]以人工方式將影像數(shù)據(jù)包分配給工作人員,負責分配的人員對各個工作人員的處理效率、擅長處理的包類型等因素可能不能進行充分掌握,由此可能導致影像數(shù)據(jù)包的處理效率低,不能滿足用戶對影像數(shù)據(jù)包的處理需求。
【發(fā)明內容】
[0005]本發(fā)明的目的在于提供影像數(shù)據(jù)包處理方法及系統(tǒng),以解決上述的問題。
[0006]在本發(fā)明的實施例中提供了影像數(shù)據(jù)包處理方法,包括:提取接收到的影像數(shù)據(jù)包中的關鍵字信息;利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包;按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員。
[0007]優(yōu)選地,所述提取接收到的影像數(shù)據(jù)包中的關鍵字信息包括:所述影像數(shù)據(jù)包中的文件為圖片文件時,利用OCR識別技術識別所述圖片文件中的文件或圖形,并提取相應的關鍵字信息。
[0008]優(yōu)選地,所述利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包,包括:利用所述關鍵字信息確定所述影像數(shù)據(jù)包中的文件所使用的影像模板;根據(jù)確定出的所述影像模板,對所述影像數(shù)據(jù)包中的文件進行切割處理,形成文件片;將形成的文件片按照所包含的信息類型進行分類,并標識信息標簽;對分類后的所述文件片重新進行打包,形成預處理工作包。
[0009]優(yōu)選地,所述按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員,包括:利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型;利用所述任務篩選模型對所述預處理工作包進行矢量篩選;根據(jù)所述矢量篩選的結果將所述預處理工作包分配給相應的工作人員。
[0010]優(yōu)選地,所述利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型,包括:利用所述工作人員的處理效率、處理質量、工作地點、工作時間及技能等級信息構造任務篩選模型。
[0011]優(yōu)選地,利用支持向量機SVM建立所述任務篩選模型。
[0012]優(yōu)選地,所述利用所述任務篩選模型對所述預處理工作包進行矢量篩選,包括:所述預處理工作包中包括屬性因子,其中所述屬性因子包括:任務獲取時間、任務提交時間、緊急程度、技術要素、處理規(guī)則及影像包類型;根據(jù)所述屬性因子,將所述預處理工作包與所述任務篩選模型進行矢量篩選匹配。
[0013]本發(fā)明實施例還提供了影像數(shù)據(jù)包處理系統(tǒng),包括:信息提取模塊,用于提取接收到的影像數(shù)據(jù)包中的關鍵字信息;重新打包模塊,用于利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包;篩選匹配模塊,用于按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員。
[0014]優(yōu)選地,所述重新打包模塊,包括:影像模板確定子模塊,用于利用所述關鍵字信息確定所述影像數(shù)據(jù)包中的文件所使用的影像模板;切割子模塊,用于根據(jù)確定出的所述影像模板,對所述影像數(shù)據(jù)包中的文件進行切割處理,形成文件片;分類子模塊,用于將形成的文件片按照所包含的信息類型進行分類,并標識信息標簽;打包子模塊,用于對分類后的所述文件片重新進行打包,形成預處理工作包。
[0015]優(yōu)選地,所述篩選匹配模塊,包括:模型建立子模塊,用于利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型;篩選子模塊,用于利用所述任務篩選模型對所述預處理工作包進行矢量篩選;分配子模塊,用于根據(jù)所述矢量篩選的結果將所述預處理工作包分配給相應的工作人員。
[0016]本發(fā)明實施例提供的影像數(shù)據(jù)包處理方法及系統(tǒng),在接收到需要處理的影像數(shù)據(jù)包時,利用影像數(shù)據(jù)包中的關鍵字信息對影像數(shù)據(jù)包重新打包,并且利用矢量篩選分配原則對重新打包后獲得的預處理工作包進行動態(tài)分配,使影像數(shù)據(jù)包根據(jù)設定的分配條件進行合理分配,提高作業(yè)人員對影像數(shù)據(jù)包的處理效率,進一步滿足用用戶對影像數(shù)據(jù)包的
處理需求。
【專利附圖】
【附圖說明】
[0017]圖1示出了本發(fā)明實施例中影像數(shù)據(jù)包處理的一種流程圖;
[0018]圖2示出了本發(fā)明實施例中影像數(shù)據(jù)包處理的另一種流程圖;
[0019]圖3示出了本發(fā)明實施例中影像數(shù)據(jù)包處理系統(tǒng)的結構圖。
【具體實施方式】
[0020]下面通過具體的實施例子并結合附圖對本發(fā)明做進一步的詳細描述。
[0021]本發(fā)明實施例提供了一種影像數(shù)據(jù)包處理方法,如圖1所示,主要處理步驟包括:
[0022]步驟Sll:提取接收到的影像數(shù)據(jù)包中的關鍵字信息;
[0023]步驟S12:利用關鍵字信息對影像數(shù)據(jù)包進行識別并對影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包;
[0024]步驟S13:按照預定的矢量篩選分配原則將預處理工作包分配給相應的工作人員。
[0025]本發(fā)明實施例提供的影像數(shù)據(jù)包處理方法在接收到需要處理的影像數(shù)據(jù)包時,利用影像數(shù)據(jù)包中的關鍵字信息對影像數(shù)據(jù)包重新打包,并且利用矢量篩選分配原則對重新打包后獲得的預處理工作包進行動態(tài)分配,使影像數(shù)據(jù)包根據(jù)設定的分配條件進行合理分配,提高作業(yè)人員對影像數(shù)據(jù)包的處理效率,進一步滿足用用戶對影像數(shù)據(jù)包的處理需求。
[0026]本發(fā)明實施例中接收到的影像數(shù)據(jù)包是指包含有圖像文件、文本文件、WORD文件、EXCEL文件或其它類型文件的數(shù)據(jù)包。[0027]在提取影像數(shù)據(jù)包中的關鍵字信息時,如果是文本文件、WORD文件及EXCEL文件這類可以直接提取信息的文件時,則直接讀取相應的關鍵字信息。
[0028]而對于圖片文件,利用文件的掃描電子件等,則可以利用OCR識別技術識別圖片文件中的文件或圖形,并提取相應的關鍵字信息。
[0029]對于某一個領域的影像數(shù)據(jù)包,其所包含的文件大多會使用本領域中具有固定格式的模板,因此對于影像數(shù)據(jù)包中的文件識別其所使用的模板則有利于對影像數(shù)據(jù)包的分配處理。
[0030]具體地,利用提取的影像數(shù)據(jù)包的關鍵字信息確定影像數(shù)據(jù)包中的文件所使用的影像模板;根據(jù)確定出的影像模板,對影像數(shù)據(jù)包中的文件進行切割處理,形成文件片;將形成的文件片按照所包含的信息類型進行分類,并標識信息標簽;對分類后的文件片重新進行打包,形成預處理工作包。
[0031]對形成的預處理工作包采用篩網(wǎng)式派發(fā)方法,目的在于充分地利用區(qū)域人員的動態(tài)信息,關注更有意義的區(qū)域人員動態(tài)信息,而非盲目地逐人判斷逐人分配。
[0032]本發(fā)明實施中在按照預定的矢量篩選分配原則將預處理工作包分配給相應的工作人員時包括:利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型;利用任務篩選模型對預處理工作包進行矢量篩選;根據(jù)矢量篩選的結果將預處理工作包分配給相應的工作人員。
[0033]其中利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型,包括:利用工作人員的處理效率、處理質量、工作地點、工作時間及技能等級信息構造任務篩選模型。
[0034]優(yōu)選地,利用支持向量機SVM建立任務篩選模型,選用SVM建立任務篩選模型的原因是其在可量化因素集較少的情況下仍可以把模型一般化,并且實時性高。
[0035].SVM為模型篩選匹配更加快速智能,最大化收集信息加以利用。該模型篩選條件并不是固定的,而是隨著矢量篩選模型而變化。系統(tǒng)對處理過的工作包信息提取出所有特征信息,并將數(shù)量最多的作為篩選主要條件。所以系統(tǒng)在篩選方面,隨著信息量的增加,就能更加準確的派發(fā)工作。
[0036]利用任務篩選模型對預處理工作包進行矢量篩選,包括:預處理工作包中包括屬性因子,其中屬性因子包括:任務獲取時間、任務提交時間、緊急程度、技術要素、處理規(guī)則及影像包類型;根據(jù)屬性因子,將預處理工作包與任務篩選模型進行矢量篩選匹配。
[0037]在實際數(shù)據(jù)包處理操作過程中,作業(yè)人員的處理能力與接收到的影像數(shù)據(jù)包為兩個動態(tài)變化因素,本發(fā)明實施例的影像數(shù)據(jù)包處理方法,從作業(yè)人員及影像數(shù)據(jù)包兩個方面進行數(shù)據(jù)匹配,從而實現(xiàn)對影像數(shù)據(jù)包的合理分配,進而提高影像數(shù)據(jù)包的處理效率。
[0038]如圖2示出了影像數(shù)據(jù)包處理流程圖,其中在接收到影像數(shù)據(jù)包后,提取影像數(shù)據(jù)包中的工作特征以構造工作對象。
[0039]具體地,構造工作對象包括:從影像數(shù)據(jù)包中提取關鍵字,如影像包類型、所包括的圖形尺寸、樣式、印刷體關鍵字及來源等,利用提取的關鍵字構造工作包特征屬性,實現(xiàn)影像數(shù)據(jù)包重新打包。對重新打包的工作包按照工作包特征屬性進行矢量篩選分配,其中構造的工作包特征屬性包括影像類型、中文要求、處理時效要求、準確率要求、識別規(guī)則及來源機構等。
[0040]構建的工作對象數(shù)據(jù)包(即預處理工作包)按照矢量篩選方式分配給在線工作人員。[0041]為了實現(xiàn)矢量篩選方式,需要針對根據(jù)在線工作人員的處理能力構造處理能力對象(即構建任務篩選模型),對在線人員的工作能力,是以時間為單位進行數(shù)據(jù)挖掘;如每分鐘處理某種工作效率高低,質量好壞,技能優(yōu)先來改變工作任務收發(fā)等。
[0042]具體實施辦法如下:
[0043]采用多因素抽象建立處理能力對象y = f (X)。
[0044]在匹配篩選前設定有效生命時間,其中有效生命時間是指時間L內處理某種工作包的效率或質量;
[0045]對于y = f(x)中所涉及的因素矢量化定義,其中因素X—般有3種以上;
[0046]通過法則f運算得出模型y值,其中法則f是一種作業(yè)員匹配過濾工作包的方法;決定匹配成功的因素包括作業(yè)員的處理能力成熟度,作業(yè)員成熟度可以為某個工作類型處理最好、最快和工作包與處理能力的相似度。
[0047]匹配是指對工作對象及處理能力對象進行相似度分析,主要特征屬性相似度達到設置的分數(shù)閾值即可處理,分值越高獲取機率越大。
[0048]在對工作對象及處理能力對象進行相似度分析時,通過對所涉及的因素進行分值計算,利用匹配分值進行匹配結果運算。
[0049]具體地,匹配相似度分析過程中所涉及的因素包括來源、質效、時效、規(guī)則、存量、工作包估價、難度系數(shù)、安全系數(shù)、工作時間及處理地點中的一種或多種,可根據(jù)實際影像數(shù)據(jù)包處理要求進行設置。
[0050]所涉及的每項因素的符合度*成熟度=I?100分,其中成熟度分值預先設置。
[0051]若y>380,那么可判定為這個區(qū)域穩(wěn)定,其中y>380是一個假設下限值,系統(tǒng)中選定五種因素進行匹配運算,其中可選的因素包括來源、質效、時效、規(guī)則、存量、工作包估價、難度系數(shù)、安全系數(shù)、工作時間、處理地點等,每項符合度*成熟度=(1-100分),y〈380表示沒匹配的價值,工作包隨機分配處理。
[0052]本發(fā)明實施例還提供了一種影像數(shù)據(jù)包處理系統(tǒng),如圖3所示主要包括:
[0053]信息提取模塊21,用于提取接收到的影像數(shù)據(jù)包中的關鍵字信息;
[0054]重新打包模塊22,用于利用關鍵字信息對影像數(shù)據(jù)包進行識別并對影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包;
[0055]篩選匹配模塊23,用于按照預定的矢量篩選分配原則將預處理工作包分配給相應的工作人員。
[0056]重新打包模塊22,包括:影像模板確定子模塊,用于利用關鍵字信息確定影像數(shù)據(jù)包中的文件所使用的影像模板;切割子模塊,用于根據(jù)確定出的影像模板,對影像數(shù)據(jù)包中的文件進行切割處理,形成文件片;分類子模塊,用于將形成的文件片按照所包含的信息類型進行分類,并標識信息標簽;打包子模塊,用于對分類后的文件片重新進行打包,形成預處理工作包。
[0057]篩選匹配模塊,包括:模型建立子模塊,用于利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型;篩選子模塊,用于利用任務篩選模型對預處理工作包進行矢量篩選;分配子模塊,用于根據(jù)矢量篩選的結果將預處理工作包分配給相應的工作人員。
[0058]以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
【權利要求】
1.影像數(shù)據(jù)包處理方法,其特征在于,包括: 提取接收到的影像數(shù)據(jù)包中的關鍵字信息; 利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包; 按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員。
2.根據(jù)權利要求1所述的方法,其特征在于,所述提取接收到的影像數(shù)據(jù)包中的關鍵字信息包括: 所述影像數(shù) 據(jù)包中的文件為圖片文件時,利用OCR識別技術識別所述圖片文件中的文件或圖形,并提取相應的關鍵字信息。
3.根據(jù)權利要求1所述的方法,其特征在于,所述利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包,包括: 利用所述關鍵字信息確定所述影像數(shù)據(jù)包中的文件所使用的影像模板; 根據(jù)確定出的所述影像模板,對所述影像數(shù)據(jù)包中的文件進行切割處理,形成文件片; 將形成的文件片按照所包含的信息類型進行分類,并標識信息標簽; 對分類后的所述文件片重新進行打包,形成預處理工作包。
4.根據(jù)權利要求1所述的方法,其特征在于,所述按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員,包括: 利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型; 利用所述任務篩選模型對所述預處理工作包進行矢量篩選; 根據(jù)所述矢量篩選的結果將所述預處理工作包分配給相應的工作人員。
5.根據(jù)權利要求4所述的方法,其特征在于,所述利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型,包括: 利用所述工作人員的處理效率、處理質量、工作地點、工作時間及技能等級信息構造任務篩選模型。
6.根據(jù)權利要求5所述的方法,其特征在于,利用支持向量機SVM建立所述任務篩選模型。
7.根據(jù)權利要求4所述的方法,其特征在于,所述利用所述任務篩選模型對所述預處理工作包進行矢量篩選,包括: 所述預處理工作包中包括屬性因子,其中所述屬性因子包括:任務獲取時間、任務提交時間、緊急程度、技術要素、處理規(guī)則及影像包類型; 根據(jù)所述屬性因子,將所述預處理工作包與所述任務篩選模型進行矢量篩選匹配。
8.影像數(shù)據(jù)包處理系統(tǒng),其特征在于,包括: 信息提取模塊,用于提取接收到的影像數(shù)據(jù)包中的關鍵字信息; 重新打包模塊,用于利用所述關鍵字信息對所述影像數(shù)據(jù)包進行識別并對所述影像數(shù)據(jù)包中的文件進行重新打包,形成欲處理工作包; 篩選匹配模塊,用于按照預定的矢量篩選分配原則將所述預處理工作包分配給相應的工作人員。
9.根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述重新打包模塊,包括:影像模板確定子模塊,用于利用所述關鍵字信息確定所述影像數(shù)據(jù)包中的文件所使用的影像模板; 切割子模塊,用于根據(jù)確定出的所述影像模板,對所述影像數(shù)據(jù)包中的文件進行切割處理,形成文件片; 分類子模塊,用于將形成的文件片按照所包含的信息類型進行分類,并標識信息標 簽; 打包子模塊,用于對分類后的所述文件片重新進行打包,形成預處理工作包。
10.根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述篩選匹配模塊,包括: 模型建立子模塊,用于利用工作人員的歷史作業(yè)數(shù)據(jù)構造任務篩選模型; 篩選子模塊,用于利用所述任務篩選模型對所述預處理工作包進行矢量篩選; 分配子模塊,用于根據(jù)所述矢量篩選的結果將所述預處理工作包分配給相應的工作人員。
【文檔編號】G06T5/00GK103985094SQ201410208568
【公開日】2014年8月13日 申請日期:2014年5月16日 優(yōu)先權日:2014年5月16日
【發(fā)明者】康彥昌 申請人:大慶市華拓數(shù)碼科技有限公司