1.一種數據要素抽取分析系統(tǒng),其特征在于,該分析系統(tǒng)包括展現體系(001)、應用體系(002)和數據體系(003);
其中,應用體系(002)包括:
數據源配置模塊(0021),其作為數據連接模塊用于通過配置業(yè)務數據庫0031的數據源信息從而使得數據表接入模塊(0022)接收來自業(yè)務數據庫(0031)的數據表信息;
數據表接入模塊(0022),其用于接收來自業(yè)務數據庫(0031)的數據表信息,并將接收到的數據表信息作為要素抽取數據表信息傳送到要素抽取模型配置模塊(0023);
要素抽取模型配置模塊(0023),其用于接收要素抽取數據表信息,根據其設置要素抽取模型,并將所設置的要素抽取模型傳送到要素抽取任務管理模塊(0024);和
要素抽取任務管理模塊(0024),其用于對要素抽取模型進行任務管理并執(zhí)行,在執(zhí)行所述要素抽取模型的過程中產生抽取結果數據信息,并將其存儲到要素結果庫(0033),或者將其傳送到要素統(tǒng)計分析模塊(0011)和/或要素關聯查詢模塊(0012);
所述展現體系(001)包括:
要素統(tǒng)計分析模塊(0011),其用于接收要素抽取結果數據信息,并將其按類別進行分類統(tǒng)計,并以表格或圖形的方式進行顯示;和/或
要素關聯查詢模塊(0012),其用于接收要素抽取結果數據信息,并將其按檢索條件進行精確檢索或模糊檢索后,產生檢索結果,并對所述檢索結果以列表的形式進行顯示;
所述數據體系(003)包括:業(yè)務數據庫(0031)和要素結果庫(0033)。
2.根據權利要求1所述的數據要素抽取分析系統(tǒng),其特征 在于,所述要素關聯查詢模塊(0012),還用以對所述檢索結果進行溯源操作并顯示檢索結果的來源信息列表,點擊來源信息列表即可查看信息詳情,任選地,所述要素關聯查詢模塊(0012)還可以對詳情信息中的要素字段信息做下一步要素關聯查詢。
3.根據權利要求1所述的數據要素抽取分析系統(tǒng),其特征在于,要素抽取模型包括:
抽取模型名稱子模塊,用以存儲抽取模型的名稱;
抽取表數據源子模塊,用以存儲抽取數據表的數據源信息;
抽取數據表子模塊,用以存儲抽取數據表信息的表名;
抽取表增量字段子模塊,用以存儲抽取數據表信息的增量字段;
抽取表增量方式子模塊,用以設定抽取數據表信息的增量方式;
抽取表過濾條件子模塊,用以設定對抽取數據表信息的過濾條件;
抽取模型類別子模塊,用以設定抽取模型的類別;和
抽取字段定義子模塊,用以存儲抽取數據表的抽取字段信息。
4.根據權利要求1所述的數據要素抽取分析系統(tǒng),其特征在于,所述數據體系(003)包括:
業(yè)務數據庫(0031),其包括戶籍信息數據庫、住宿信息數據庫和航班信息數據庫;
系統(tǒng)配置庫(0032),其用以存儲系統(tǒng)內部產生的數據信息,其中,所述系統(tǒng)配置庫(0032)中包括有數據源表、接入數據表、接入表字段、抽取模型配置表和抽取任務配置表;和
要素結果庫(0033),其用以存儲要素抽取任務管理模塊在執(zhí)行所述要素抽取模型的過程中產生的抽取結果數據信息;
其中,優(yōu)選地,業(yè)務數據庫有多個,數據源配置模塊作為數據連接模塊使得數據表接入模塊接收來自多個業(yè)務數據庫中的數據表信息。
5.根據權利要求1-4所述的數據要素抽取分析系統(tǒng),其特征在于,要素抽取模型配置模塊通過對抽取模型配置表的數據信息的添加、修改和查詢來配置要素抽取模型;
數據源配置模塊通過對數據源表的數據信息的添加、修改和刪除來管理數據源信息;
數據表接入模塊通過對接入數據表的數據信息的添加、刪除和修改來管理接入源數據表信息;
要素抽取任務管理模塊通過對抽取任務配置表的數據信息的進行添加、修改和刪除來管理抽取任務,所述管理抽取任務即為對所述要素抽取模型進行任務管理。
6.一種數據要素抽取分析方法,其特征在于,該分析方法包括以下步驟:
步驟(1):通過數據源配置模塊(0021)配置業(yè)務數據庫的數據源信息,從而使得數據表接入模塊(0022)接收來自業(yè)務數據庫(0031)的數據表信息;
步驟(2):數據表接入模塊(0022)根據數據源配置模塊配置的數據源信息接收來自業(yè)務數據庫(0031)的數據表信息,并將接收到的數據表信息作為要素抽取數據表信息傳送到要素抽取模型配置模塊(0023);
步驟(3):通過要素抽取模型配置模塊(0023)接收要素抽取數據表信息,根據接收到的要素抽取數據表信息設置要素抽取模型,并將所設置的要素抽取模型傳送到要素抽取任務管理模塊(0024);
步驟(4):要素抽取任務管理模塊(0024)對要素抽取模 型進行任務管理并執(zhí)行,在執(zhí)行所述要素抽取模型的過程中產生抽取結果數據信息,將其存儲到要素結果庫(0033),或者將其傳送到要素統(tǒng)計分析模塊(0011)和/或要素關聯查詢模塊(0012);
步驟(5):通過要素統(tǒng)計分析模塊(0011)對接收的要素抽取結果數據信息按類別進行分類統(tǒng)計,并以表格或圖形的方式進行顯示;和
步驟(6):通過要素關聯查詢模塊(0012)對接收到的要素抽取結果數據信息按檢索條件進行精確檢索或模糊檢索后,產生檢索結果,并對所述檢索結果以列表的形式進行顯示。
7.根據權利要求6所述的數據要素抽取分析方法,其特征在于,步驟(6)中所述要素關聯查詢模塊(0012)還用以對所述檢索結果進行溯源操作并顯示檢索結果的來源信息列表,點擊來源信息列表即可查看信息詳情,任選地,所述要素關聯查詢模塊(0012)還可以對詳情信息中的要素字段信息做下一步要素關聯查詢。
8.根據權利要求6所述的數據要素抽取分析方法,其特征在于,步驟(3)中的要素抽取模型包括:
抽取模型名稱子模塊,用以存儲抽取模型的名稱;
抽取表數據源子模塊,用以存儲抽取數據表的數據源信息;
抽取數據表子模塊,用以存儲抽取數據表信息的表名;
抽取表增量字段子模塊,用以存儲抽取數據表信息的增量字段;
抽取表增量方式子模塊,用以設定抽取數據表信息的增量方式;
抽取表過濾條件子模塊,用以設定對抽取數據表信息的過濾條件;
抽取模型類別子模塊,用以設定抽取模型的類別;和
抽取字段定義子模塊,用以存儲抽取數據表的抽取字段信息。
9.根據權利要求6所述的數據要素抽取分析方法,其特征在于,
步驟(1)中的業(yè)務數據庫(0031)和步驟(4)中的要素結果庫(0033)都設置在數據體系(003)中,數據體系(003)包括:
業(yè)務數據庫(0031),其包括戶籍信息數據庫、住宿信息數據庫和航班信息數據庫;
系統(tǒng)配置庫(0032),其用以存儲系統(tǒng)內部產生的數據信息,其中,所述系統(tǒng)配置庫(0032)中包括有數據源表、接入數據表、接入表字段、抽取模型配置表和抽取任務配置表;和
要素結果庫(0033),其用以存儲要素抽取任務管理模塊在執(zhí)行所述要素抽取模型的過程中產生的抽取結果數據信息;
其中,優(yōu)選地,業(yè)務數據庫有多個,數據源配置模塊作為數據連接模塊使得數據表接入模塊接收來自多個業(yè)務數據庫中的數據表信息。
10.根據權利要求6-9所述的數據要素抽取分析方法,其特征在于,要素抽取模型配置模塊通過對抽取模型配置表的數據信息的添加、修改和查詢來配置要素抽取模型;
數據源配置模塊通過對數據源表的數據信息的添加、修改和刪除來管理對數據源信息;
數據表接入模塊通過對接入數據表的數據信息的添加、刪除和修改來管理接入源數據表信息
要素抽取任務管理模塊通過對抽取任務配置表的數據信息的進行添加、修改和刪除來管理抽取任務,所述管理抽取任務 即為對所述要素抽取模型進行任務管理。