1.一種電子政務(wù)系統(tǒng)的績效評估方法,其特征在于,包括:
提取非結(jié)構(gòu)化文本中的關(guān)鍵信息;利用所述關(guān)鍵信息確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色;根據(jù)所述文本角色對應(yīng)的工作類型確定第一績效信息;
利用基于Hash值的改進(jìn)編輯距離算法確定同一文檔的修改信息;根據(jù)所述修改信息的類型確定第二績效信息;根據(jù)第一績效信息、第二績效信息及預(yù)設(shè)績效權(quán)重信息,確定綜合績效信息。
2.根據(jù)權(quán)利要求1所述的績效評估方法,其特征在于,所述提取非結(jié)構(gòu)化文本中的關(guān)鍵信息包括:
確定所述非結(jié)構(gòu)化文本中的目標(biāo)短語信息;
利用頻繁項集算法及所述目標(biāo)短語信息,從所述非結(jié)構(gòu)化文本中提取關(guān)聯(lián)短語信息;
利用內(nèi)部和外部特征的規(guī)則匹配算法,從所述非結(jié)構(gòu)化文本中提取命名實體關(guān)鍵信息。
3.根據(jù)權(quán)利要求2所述的績效評估方法,其特征在于,利用所述關(guān)鍵信息確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色,包括:
計算所述關(guān)鍵信息與每個文本角色的相似度,將相似度最高的文本角色作為所述非結(jié)構(gòu)化文本的文本角色。
4.根據(jù)權(quán)利要求2所述的績效評估方法,其特征在于,利用所述關(guān)鍵信息確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色,包括:
利用SVM文本分類算法,及所述非結(jié)構(gòu)化文本和所述關(guān)鍵信息,確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色。
5.根據(jù)權(quán)利要求1-4中任意一項所述的績效評估方法,其特征在于,所述利用基于Hash值的改進(jìn)編輯距離算法確定同一文檔的修改信息,根據(jù)所述修改信息的類型確定第二績效信息包括:
計算同一文檔的原文檔Hash表和修改后文檔Hash表;
通過對比所述原文檔Hash表和修改后文檔Hash表,確定兩個文檔的不同部分;
利用編輯距離算法確定所述兩個文檔的不同部分的修改信息;所述修改信息的類型包括:文檔添加信息、文檔修改信息和文檔刪除信息;
根據(jù)不同類型修改信息的權(quán)重,確定第二績效信息。
6.一種電子政務(wù)系統(tǒng)的績效評估系統(tǒng),其特征在于,包括:
非結(jié)構(gòu)化文本分析模塊,用于提取非結(jié)構(gòu)化文本中的關(guān)鍵信息,利用所述關(guān)鍵信息確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色,根據(jù)所述文本角色對應(yīng)的工作類型確定第一績效信息;
文檔編輯統(tǒng)計模塊,用于利用基于Hash值的改進(jìn)編輯距離算法確定同一文檔的修改信息,根據(jù)所述修改信息的類型確定第二績效信息;
績效統(tǒng)計模塊,用于根據(jù)第一績效信息、第二績效信息及預(yù)設(shè)績效權(quán)重信息,確定綜合績效信息。
7.根據(jù)權(quán)利要求6所述的績效評估系統(tǒng),其特征在于,所述非結(jié)構(gòu)化文本分析模塊包括:
目標(biāo)短語確定單元,用于確定所述非結(jié)構(gòu)化文本中的目標(biāo)短語信息;
關(guān)聯(lián)短語提取單元,用于利用頻繁項集算法及所述目標(biāo)短語信息,從所述非結(jié)構(gòu)化文本中提取關(guān)聯(lián)短語信息;
命名實體提取單元,用于利用內(nèi)部和外部特征的規(guī)則匹配算法,從所述非結(jié)構(gòu)化文本中提取命名實體關(guān)鍵信息。
8.根據(jù)權(quán)利要求7所述的績效評估系統(tǒng),其特征在于,所述非結(jié)構(gòu)化文本分析模塊包括:
第一文本角色確定單元,用于計算所述關(guān)鍵信息與每個文本角色的相似度,將相似度最高的文本角色作為所述非結(jié)構(gòu)化文本的文本角色。
9.根據(jù)權(quán)利要求7所述的績效評估系統(tǒng),其特征在于,所述非結(jié)構(gòu)化文本分析模塊包括:
第二本角色確定單元,用于利用SVM文本分類算法,及所述非結(jié)構(gòu)化文本、所述關(guān)鍵信息,確定與所述非結(jié)構(gòu)化文本對應(yīng)的文本角色。
10.根據(jù)權(quán)利要求6-4中任意一項所述的績效評估系統(tǒng),其特征在于,所述文檔編輯統(tǒng)計模塊,包括:
文檔Hash表計算單元,用于計算同一文檔的原文檔Hash表和修改后文檔Hash表;
對比單元,用于通過對比所述原文檔Hash表和修改后文檔Hash表,確定兩個文檔的不同部分;
修改信息確定單元,用于利用編輯距離算法確定所述兩個文檔的不同部分的修改信息;所述修改信息的類型包括:文檔添加信息、文檔修改信息和文檔刪除信息;
第二績效確定單元,用于根據(jù)不同類型修改信息的權(quán)重,確定第二績效信息。