數(shù)據(jù)分析支援裝置及數(shù)據(jù)分析支援方法本申請以日本專利申請的特愿2012-065768(申請日為2012年3月22日)為基礎(chǔ),根據(jù)該申請而享有優(yōu)先權(quán)益。本申請通過參照該申請而包含同申請的全部內(nèi)容。
技術(shù)領(lǐng)域:
本發(fā)明的實施方式涉及支援與不同的組織分別相關(guān)的數(shù)據(jù)的分析的數(shù)據(jù)分析支援裝置及數(shù)據(jù)分析支援方法。
背景技術(shù):
:目前,將與不同組織分別相關(guān)的合計數(shù)據(jù)即事務(wù)失誤(mistake)數(shù)據(jù)分別統(tǒng)和進(jìn)行分析,由此將具有同趨勢的事務(wù)失誤數(shù)據(jù)的組織之間進(jìn)行聚類(clustering)。不同組織例如是指多種金融機構(gòu)。在不同組織的合計數(shù)據(jù)中特定組織的合計數(shù)據(jù)與其它組織的合計數(shù)據(jù)之間存在不一致的屬性的情況下,與該其它組織中事務(wù)失誤相關(guān)的原因信息成為將多個組織的合計數(shù)據(jù)統(tǒng)和進(jìn)行分析時的缺損信息。在特定組織的合計數(shù)據(jù)和其它組織的合計數(shù)據(jù)之間有不一致的屬性是指例如上述的特定組織將事務(wù)失誤的原因信息合計、而其它組織不將該原因信息合計。作為現(xiàn)有的對缺損信息的應(yīng)對有如下方法。首先,具有對缺損信息的應(yīng)對功能的處理裝置從蓄積于數(shù)據(jù)庫的合計數(shù)據(jù)群中檢測缺損數(shù)據(jù)。缺損數(shù)據(jù)是一部分特征缺損的數(shù)據(jù)。然后,處理裝置將合計數(shù)據(jù)群分割為缺損數(shù)據(jù)和正常數(shù)據(jù)。正常數(shù)據(jù)是無缺損的數(shù)據(jù)。其次,處理裝置使用預(yù)定的類似尺度求出與缺損數(shù)據(jù)類似的正常數(shù)據(jù)。然后,處理裝置將該求出的正常數(shù)據(jù)中與缺損數(shù)據(jù)的缺損特征相對應(yīng)的特征數(shù)據(jù)作為補充數(shù)據(jù)代入缺損數(shù)據(jù)的缺損特征。如上述,使用預(yù)定的類似尺度求取與缺損數(shù)據(jù)類似的正常數(shù)據(jù)的手法中,處理裝置在某組織的合計數(shù)據(jù)中有缺損的情況下,使用其它組織的合計數(shù)據(jù)補充該組織的缺損數(shù)據(jù)。當(dāng)像這樣使用其它組織的合計數(shù)據(jù)補充缺損數(shù)據(jù)時,不能說補充后的合計數(shù)據(jù)的可靠性非常充分,從而分析精度不足。技術(shù)實現(xiàn)要素:本發(fā)明要解決的課題在于,提供一種數(shù)據(jù)分析支援裝置及數(shù)據(jù)分析支援方法,即使在不同組織各自的數(shù)據(jù)中產(chǎn)生由于數(shù)據(jù)屬性在組織間不同而導(dǎo)致的缺損,也能夠提高將這些數(shù)據(jù)統(tǒng)和時的分析精度。根據(jù)實施方式,數(shù)據(jù)分析支援裝置具有:組織類別數(shù)據(jù)表存儲部,其存儲與作為分析對象的多個組織各自有關(guān)的組織類別數(shù)據(jù)表(datatable),該組織類別數(shù)據(jù)表用于按組織類別管理記錄(record),該記錄是具有至少一種屬性的數(shù)據(jù)。該數(shù)據(jù)分析支援裝置具有:距離計算部,其對于預(yù)定的記錄組,基于在構(gòu)成所述記錄組的各記錄間共通的屬性的種類數(shù)、及該共通的屬性的值,計算表示構(gòu)成所述記錄組的各記錄間的類似度的距離。預(yù)定的記錄組是由組織類別數(shù)據(jù)表表示的、在多個組織間具有至少一種共通的屬性的多個組織各自的記錄組。該數(shù)據(jù)分析支援裝置具有:分析處理部,其基于由所述距離計算部計算出的距離,進(jìn)行用于對所述多個組織分別進(jìn)行分類的分析。根據(jù)所述結(jié)構(gòu)的數(shù)據(jù)分析支援裝置,即使在不同的組織各自的數(shù)據(jù)中產(chǎn)生由于數(shù)據(jù)屬性在組織間不同導(dǎo)致的缺損,也能夠提高將這些數(shù)據(jù)統(tǒng)和時的分析精度。附圖說明圖1是表示實施方式的數(shù)據(jù)分析支援裝置的功能構(gòu)成例的框圖;圖2是以表形式表示多個銀行的分行的事務(wù)失誤數(shù)據(jù)之一例的圖;圖3是以表形式表示基于多個銀行的分行的事務(wù)失誤數(shù)據(jù)的、按分行類別合計的事務(wù)失誤件數(shù)的數(shù)據(jù)之一例的圖;圖4是表示實施方式的數(shù)據(jù)分析支援裝置的處理數(shù)據(jù)的流程之一例的圖;圖5是表示實施方式的數(shù)據(jù)分析支援裝置的處理動作的順序之一例的流程圖;圖6是表示本實施方式的數(shù)據(jù)分析支援裝置的數(shù)據(jù)表結(jié)合部41進(jìn)行的用于同一屬性提取用的處理動作之一例的流程圖;圖7是以表形式表示由本實施方式的數(shù)據(jù)分析支援裝置的數(shù)據(jù)表結(jié)合部生成的結(jié)合完成數(shù)據(jù)表之一例的圖;圖8是表示本實施方式的數(shù)據(jù)分析支援裝置的記錄間距離計算部進(jìn)行的處理動作之一例的流程圖;圖9是表示本實施方式的數(shù)據(jù)分析支援裝置的分析處理部進(jìn)行的處理動作之一例的流程圖;圖10是表示分組中心分行的初始集合的設(shè)定例的圖;圖11是表示使各分行與分組中心分行相對應(yīng)的例子的圖;圖12是以表形式表示由結(jié)合完成數(shù)據(jù)表定義的預(yù)定的分組中包含的各組織的屬性及屬性值之一例的圖;圖13是以表形式表示由結(jié)合完成數(shù)據(jù)表定義的預(yù)定的分組中包含的各組織的各屬性的重心的計算結(jié)果之一例的圖;圖14是表示各分組的重心之一例的圖;圖15是以表形式表示由結(jié)合完成數(shù)據(jù)表定義的分組的分組中心分行的再計算結(jié)果之一例的圖;圖16是以表形式表示用于分組的精度的評價的實驗數(shù)據(jù)的圖;圖17是以表形式表示用于分組的精度的評價的、各銀行的事務(wù)失誤收集狀況的圖;圖18是以表形式表示用于分組的精度的評價的、包含缺損項目的實驗數(shù)據(jù)的圖;圖19是以表形式表示實際正確地分類為各分組的分行數(shù)的準(zhǔn)確率的圖。具體實施方式下面,參照附圖說明實施方式。本實施方式的數(shù)據(jù)分析支援裝置存儲組織類別數(shù)據(jù)表。該組織類別數(shù)據(jù)表是有關(guān)作為分析對象的多個組織各自的、用于按組織類別管理記錄的數(shù)據(jù)表,該記錄是具有至少一種屬性的合計數(shù)據(jù)。該數(shù)據(jù)分析支援裝置獲得由組織類別數(shù)據(jù)表所示的多個組織間具有至少一種共通的屬性的有關(guān)多個組織各自的記錄組共通的屬性的值。數(shù)據(jù)分析支援裝置基于該值獲得在該記錄間共通的屬性的種類數(shù)及該共通的屬性的值。數(shù)據(jù)分析支援裝置基于該值計算構(gòu)成記錄組的各記錄之間的距離。該數(shù)據(jù)分析支援裝置基于該算出的距離進(jìn)行以與各記錄相對應(yīng)的組織為分組(cluster)要素的分組。圖1是表示實施方式的數(shù)據(jù)分析支援裝置的功能構(gòu)成例的框圖。如圖1所示,實施方式的數(shù)據(jù)分析支援裝置10具有控制部11、存儲裝置12、數(shù)據(jù)表結(jié)合部41、記錄間距離計算部42、分析處理部43。分析處理部作為分組實施部起作用。控制部11擔(dān)當(dāng)裝置整體的處理動作。數(shù)據(jù)表結(jié)合部41、記錄間距離計算部42、分析處理部43是通過微處理器(microprocessor)上的軟件(software)執(zhí)行的處理部。另外,如圖1所示,數(shù)據(jù)表結(jié)合部41、記錄間距離計算部42、分析處理部43可以經(jīng)由存儲裝置12在各部間進(jìn)行信息的收受。另外,存儲裝置12是非易失性存儲器(nonvolatilememory}等存儲介質(zhì)。存儲裝置12具有組織類別數(shù)據(jù)表存儲部31、結(jié)合完成數(shù)據(jù)表存儲部32、記錄間距離存儲部33及分組結(jié)果存儲部34。本實施方式中,敘述用于分組的分析對象的各組織的事務(wù)失誤數(shù)據(jù)的例子。本實施方式中,分析對象的各組織為銀行的各分行。數(shù)據(jù)分析支援裝置10將在各銀行的各分行合計的合計數(shù)據(jù)結(jié)合。數(shù)據(jù)分析支援裝置10進(jìn)行該統(tǒng)和的結(jié)果是,使用產(chǎn)生了缺損值的數(shù)據(jù)基于事務(wù)失誤發(fā)生的特征將多個銀行的各分行分組。在各行的銀行蓄積事務(wù)失誤數(shù)據(jù)。事務(wù)失誤數(shù)據(jù)是指對于每天的業(yè)務(wù)中發(fā)生的失誤表示何時、哪種業(yè)務(wù)、是誰發(fā)生哪種失誤的信息。失誤例如是指手續(xù)費的錯誤、賬戶號碼指定的錯誤等。上述的表示誰發(fā)生失誤的信息是表示發(fā)生失誤的銀行職員的職務(wù)或頭銜為何的信息。另外,上述的表示發(fā)生哪種失誤的信息是失誤的原因為何,損失金額有多少等的信息。關(guān)于事務(wù)失誤收集的信息的屬性在各行的銀行間大致相同。但是,有時在特定銀行存在固有的屬性。另外,不限于特定屬性的信息必須在所有的銀行收集。圖2是以表形式表示多個銀行的分行的事務(wù)失誤數(shù)據(jù)之一例的圖。該圖2中,表示在三個銀行的各分行發(fā)生的事務(wù)失誤數(shù)據(jù)。在本實施方式中,三個銀行是指A銀行、B銀行、及C銀行。這些A銀行、B銀行、C銀行中,均收集事務(wù)失誤的發(fā)生日、發(fā)生分行、失誤發(fā)生業(yè)務(wù)的信息。該情況下,各行的事務(wù)失誤數(shù)據(jù)作為同一屬性具有發(fā)生日、發(fā)生分行、失誤發(fā)生業(yè)務(wù)。在A銀行、C銀行收集事務(wù)失誤的發(fā)生者的職務(wù)的信息。但是,在B銀行不收集事務(wù)失誤的發(fā)生者的職務(wù)的信息。該情況下,B銀行的事務(wù)失誤數(shù)據(jù)不具有屬性“發(fā)生者的職務(wù)”。該屬性的值成為B銀行的事務(wù)失誤數(shù)據(jù)的缺損值。另外,A銀行、B銀行收集事務(wù)失誤的發(fā)生原因信息。但是,C銀行不收集事務(wù)失誤的發(fā)生原因信息。該情況下,C銀行的事務(wù)失誤數(shù)據(jù)中沒有屬性“失誤發(fā)生原因”。該屬性的值成為C銀行的事務(wù)失誤數(shù)據(jù)的缺損值。圖2中,為便于說明,將缺損屬性的缺損值作為“空”(NULL)明示。但實際上,在每個銀行的事務(wù)失誤數(shù)據(jù)中不存在未收集的數(shù)據(jù)的屬性其自身。圖3是以表形式表示基于多個銀行的分行的事務(wù)失誤數(shù)據(jù)按分行類別合計的事務(wù)失誤件數(shù)的數(shù)據(jù)之一例的圖。關(guān)于圖2所示的事務(wù)失誤數(shù)據(jù),對各行的銀行的分行類別的失誤件數(shù)的合計進(jìn)行說明。再次,為了簡化說明,僅處理圖2所示的事務(wù)失誤數(shù)據(jù)中的屬性“失誤發(fā)生業(yè)務(wù)”、“發(fā)生者的職務(wù)”、“失誤發(fā)生原因”。如圖3所示,例如在A銀行的事務(wù)失誤數(shù)據(jù)中,將屬性“分行編號”、屬性“業(yè)務(wù):存款”、屬性“業(yè)務(wù):貸款”、屬性“職務(wù):一般銀行職員”、屬性“職務(wù):兼職”(part-timejob)、屬性“原因:能力不足”、屬性“原因:失誤”的值對各分行分別進(jìn)行合計。圖3所示的屬性“分行編號”是表示A銀行的各分行的分行編號的屬性。屬性“業(yè)務(wù)1存款”是表示事務(wù)失誤的發(fā)生業(yè)務(wù)為存款的屬性。屬性“業(yè)務(wù)1貸款”是表示事務(wù)失誤的發(fā)生業(yè)務(wù)為貸款的屬性。屬性“職務(wù):一般銀行職員”是表示事務(wù)失誤的發(fā)生者的職務(wù)為一般銀行職員的屬性。屬性“職務(wù);兼職”是表示事務(wù)失誤的發(fā)生者的職務(wù)為兼職的屬性。屬性“原因:能力不足”是表示事務(wù)失誤的發(fā)生原因為能力不足的屬性。屬性“原因:失誤”是表示事務(wù)失誤的發(fā)生原因為人為失誤的屬性。例如,對以圖3所示的組織類別數(shù)據(jù)表的分行編號“A001”的行定義的屬性“業(yè)務(wù)1存款”的列的欄的值“31”進(jìn)行說明。該值表示在A銀行的分行編號為“A001”的分行發(fā)生的事務(wù)失誤內(nèi)、業(yè)務(wù)為存款的事務(wù)失誤的件數(shù)為31件。另外,假如以圖3所示的組織類別數(shù)據(jù)表分行編號“B001”的行定義屬性“職務(wù):一般銀行職員”的列,則該列的單元(cel1)的值成為缺損值“空”。如上述,實際上在每個銀行的事務(wù)失誤數(shù)據(jù)中,關(guān)于未收集的數(shù)據(jù)不存在屬性其自身,因此,在各銀行未收集的屬性的值也未在事務(wù)失誤件數(shù)的合計結(jié)果中體現(xiàn)。圖3中,將各銀行的各分行的組織類別數(shù)據(jù)表的不存在的屬性名表記于虛線包圍的列,將與該屬性名對應(yīng)的件數(shù)設(shè)為“空”。但是,實際上這種屬性的列自身不存在。在本實施方式中,按分行類別合計的各屬性的失誤件數(shù)的數(shù)據(jù)作為組織類別數(shù)據(jù)表被存儲于圖1所示的存儲裝置12的組織類別數(shù)據(jù)表存儲部31。圖3所示的例中,同銀行的各分行的合計數(shù)據(jù)的各屬性相同。另外,圖3所示的例中,將有關(guān)這些各分行的數(shù)據(jù)表設(shè)為包的組織類別數(shù)據(jù)表。該數(shù)據(jù)表按銀行類別區(qū)分。圖4是表示實施方式的數(shù)據(jù)分析支援裝置進(jìn)行的處理數(shù)據(jù)的流程之一例的圖。數(shù)據(jù)表結(jié)合部41將各銀行的各分行的組織類別數(shù)據(jù)表作為輸入數(shù)據(jù)取入。該組織類別數(shù)據(jù)表被存儲于存儲裝置12的組織類別數(shù)據(jù)表存儲部31。另外,數(shù)據(jù)表結(jié)合部41從組織類別數(shù)據(jù)表中的屬性在組織間、即分行間確定同一屬性。數(shù)據(jù)表結(jié)合部41基于該確定的屬性結(jié)合各組織的數(shù)據(jù)表,由此生成單一的結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表存儲于存儲裝置12的結(jié)合完成數(shù)據(jù)表存儲部32。在本實施方式中,將結(jié)合完成數(shù)據(jù)表中的一個分行的各屬性的失誤件數(shù)的數(shù)據(jù)的集合設(shè)為一個記錄。記錄間距離計算部42對結(jié)合完成數(shù)據(jù)表中的任意的兩個記錄計算表示記錄間的類似程度的高低的距離。該兩個記錄是不管銀行的類別的兩個分行的各屬性的失誤件數(shù)的數(shù)據(jù)。記錄間距離計算部42將該計算結(jié)果存儲于存儲裝置12的記錄間距離存儲部33。分析處理部43使用存儲于記錄間距離存儲部33的構(gòu)成記錄組的各記錄間的距離的信息,將結(jié)合完成數(shù)據(jù)表中的記錄分組。分析處理部43將分組結(jié)果存儲于存儲裝置12的分組結(jié)果存儲部34。進(jìn)而,分析處理部43將分組結(jié)果向顯示裝置20輸出。顯示裝置20例如是液晶顯示裝置等。圖5是表示實施方式的數(shù)據(jù)分析支援裝置的處理動作的順序之一例的流程圖。在此說明的順序是處理動作的概要,各處理的詳情后述。首先,數(shù)據(jù)分析支援裝置10的數(shù)據(jù)表結(jié)合部41提取存儲于存儲裝置12的組織類別數(shù)據(jù)表存儲部31的各組織的組織類別數(shù)據(jù)表的各屬性(步驟S1)。數(shù)據(jù)表結(jié)合部41從各組織的組織類別數(shù)據(jù)表提取同一屬性(步驟S2)。同一屬性在組織間是同一屬性。作為確定提取對象的同一屬性的方法之一例,例舉圖3所示的在各銀行的組織類別數(shù)據(jù)表間檢測屬性名的完全一致的方法。數(shù)據(jù)表結(jié)合部41利用在步驟S2提取的同一屬性將存儲于存儲裝置12的組織類別數(shù)據(jù)表存儲部31的組織類別數(shù)據(jù)表結(jié)合,生成單一的結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表存儲于存儲裝置12的結(jié)合完成數(shù)據(jù)表存儲部32(步驟S3)。就數(shù)據(jù)表結(jié)合部41而言,如果有僅存在于一部分組織的組織類別數(shù)據(jù)表的屬性,則將該屬性追加到不具有該屬性的組織類別數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該追加的屬性的屬性值作為缺損值(空)。記錄間距離計算部42從存儲于存儲裝置12的結(jié)合完成數(shù)據(jù)表存儲部32的結(jié)合完成數(shù)據(jù)表的各記錄的中選擇任意兩個記錄。記錄間距離計算部42計算該選擇的記錄間的距離(步驟S4)。本實施方式中,記錄間距離計算部42以該選擇的兩記錄的屬性的內(nèi)的由至少任一記錄將值為缺損值的屬性設(shè)為記錄間的距離的計算對象外的屬性。記錄間距離計算部42僅以兩記錄均具有值的屬性作為對象,計算記錄間的距離。記錄間距離計算部42將該算出的距離的信息存儲于存儲裝置12的記錄間距離存儲部33。記錄間距離計算部42對結(jié)合完成數(shù)據(jù)表的兩記錄的所有的組合進(jìn)行計算記錄間的距離并存儲于記錄間距離存儲部33的處理。分析處理部43使用存儲于存儲裝置12的記錄間距離存儲部33的記錄間的距離的信息將結(jié)合完成數(shù)據(jù)表中的記錄分組,由此進(jìn)行各分行的分組(步驟S5)。而且,分析處理部43將分組結(jié)果存儲于存儲裝置12的分組結(jié)果存儲部34。分析處理部43將分組結(jié)果向顯示裝置20輸出(步驟S6)。其次,說明數(shù)據(jù)表結(jié)合部41的動作的詳情。如上述,數(shù)據(jù)表結(jié)合部41從存儲于存儲裝置12的組織類別數(shù)據(jù)表存儲部31的組織類別數(shù)據(jù)表提取屬性。數(shù)據(jù)表結(jié)合部41使用屬性的提取結(jié)果確定組織間的同一屬性,將各組織的數(shù)據(jù)表結(jié)合。圖6是表示用于通過本實施方式的數(shù)據(jù)分析支援裝置的數(shù)據(jù)表結(jié)合部41提取同一屬性的處理動作之一例的流程圖。圖6所示的處理動作是詳細(xì)說明圖5所示的處理動作的步驟S2的動作,是用于提取組織間的同一屬性的處理動作。以圖3所示的組織類別數(shù)據(jù)表為例。該例中,如果存在不同銀行的各分行的組織類別數(shù)據(jù)表分別具有同一屬性名的屬性,則數(shù)據(jù)表結(jié)合部41將其作為同一屬性提取。數(shù)據(jù)表結(jié)合部41從存儲裝置12的組織類別數(shù)據(jù)表存儲部31讀取銀行類別的數(shù)據(jù)表,生成由所有銀行的所有屬性構(gòu)成的屬性集合T(步驟S11)。具體而言,在該步驟S11中,數(shù)據(jù)表結(jié)合部41從圖3所示的組織類別數(shù)據(jù)表得到的屬性集合T的要素為以下14種屬性?!皹I(yè)務(wù):存款(A銀行)”、“業(yè)務(wù):存款(B銀行)”、“業(yè)務(wù);存款(C銀行)”“業(yè)務(wù):貸款(A銀行)”、“業(yè)務(wù):貸款(B銀行)”、“業(yè)務(wù);貸款(C銀行)”“職務(wù):一般銀行職員(A銀行):、“職務(wù):一般銀行職員(C銀行)”“職務(wù):兼職(A銀行)”、“職務(wù):兼職(C銀行)”“原因:能力不足(A銀行)”、“原因1能力不足(B銀行)”“原因:失誤(A銀行)”、“原因:失誤(B銀行)”在有多個具有同一屬性名的屬性的情況下,如果屬性值的合計元的銀行不同,則這些屬性作為屬性集合T中個別的要素進(jìn)行計數(shù)(count)。例如,上述的“業(yè)務(wù):存款(A銀行)”、“業(yè)務(wù):存款(B銀行)”、“業(yè)務(wù):存款(C銀行)”的屬性名是除銀行名以外的“業(yè)務(wù):存款”。這些“業(yè)務(wù):存款(A銀行)”、“業(yè)務(wù):存款(B銀行)”、“業(yè)務(wù):存款(C銀行)”成為屬性集合T中個別的要素。數(shù)據(jù)表結(jié)合部41從在步驟S11生成的屬性集合T中提取任意一個屬性(步驟S12)。將該提取的屬性稱作屬性a。如果有屬性集合T中的屬性內(nèi)具有與在步驟S12提取的屬性a相同的屬性名的屬性,則數(shù)據(jù)表結(jié)合部41與屬性值的合計元的銀行的類別無關(guān)地提取該屬性(步驟S13)。將該提取的屬性稱作屬性b、屬性c、…。具體而言,數(shù)據(jù)表結(jié)合部41在步驟S12中將“業(yè)務(wù):存款(A銀行)”作為屬性a提取的情況下,在步驟S13中將“業(yè)務(wù):存款(B銀行)”、“業(yè)務(wù):存款(C銀行)”作為屬性b、屬性c提取。這些屬性b、屬性c是具有與屬性a相同的屬性名“業(yè)務(wù):存款”的屬性。數(shù)據(jù)表結(jié)合部41將在步驟S12及步驟S13提取的屬性a、b、c、…的信息作為同一屬性存儲于存儲裝置12(步驟S14)。在此,在具有與從屬性集合T中提取的屬性a相同的屬性名的屬性不存在于屬性集合T中的情況下,數(shù)據(jù)表結(jié)合部41僅將該屬性a作為上述的同一屬性存儲于存儲裝置12。具有與從屬性集合T中提取的屬性a相同的屬性名的屬性不存在于屬性集合T中是指屬性a僅在單一組織的組織類別數(shù)據(jù)表存在,該屬性a不存在于其它組織的組織類別數(shù)據(jù)表。在步驟S11中生成的屬性集合T中有步驟S12或步驟S13中尚未提取的屬性的情況下(步驟S15的是),數(shù)據(jù)表結(jié)合部41返回步驟S12。而且,數(shù)據(jù)表結(jié)合部41將從屬性集合T中未提取的屬性的某一個從屬性集合T中作為新的屬性a提取。另外,如果沒有屬性集合T中的屬性內(nèi)、具有與在步驟S12提取的屬性a相同的屬性名的屬性,則數(shù)據(jù)表結(jié)合部41返回步驟S12。然后,數(shù)據(jù)表結(jié)合部41將從屬性集合T中未提取的屬性的某一個從屬性集合T中作為新的屬性a提取。在步驟S11中生成的屬性集合T中有在步驟S12或步驟S13中尚未提取的屬性是指,屬性集合T中的屬性內(nèi),在步驟S12中不作為屬性a提取,且在步驟S13中不作為屬性b、c、…提取的屬性。數(shù)據(jù)表結(jié)合部41對在該返回的步驟S12提取的新的屬性a再次進(jìn)行步驟S13、S14的處理。另外,數(shù)據(jù)表結(jié)合部41在全部提取了在步驟S11生成的屬性集合T中的屬性的情況下(步驟S15的否),結(jié)束用于同一屬性提取的處理。全部提取在步驟S11生成的屬性集合T中的屬性是指將屬性集合T中的所有屬性在步驟S12中作為屬性a提取結(jié)束、或者在步驟S13中作為屬性b、c、…提取結(jié)束。在數(shù)據(jù)表結(jié)合部41結(jié)束同一屬性提取的處理的情況下,該數(shù)據(jù)表結(jié)合部41從圖3所示的組織類別數(shù)據(jù)表作為同一屬性得到的屬性組為以下的(ア)、(イ)、(ウ)、(エ)、(オ)、(カ)這6組。(ア):“業(yè)務(wù)1存款(A銀行)”、“業(yè)務(wù):存款(B銀行)”、“業(yè)務(wù):存款(C銀行)”(イ):“業(yè)務(wù):貸款(A銀行)”、“業(yè)務(wù):貸款(B銀行)”、“業(yè)務(wù):貸款(C銀行)”(ウ):“職務(wù):一般銀行職員(A銀行)”、“職務(wù):一般銀行職員(C銀行)”(エ):“職務(wù):兼職(A銀行)”、“職務(wù);兼職(C銀行)”(オ):“原因:能力不足(A銀行)”、“原因:能力不足(B銀行)”(カ):“原因:失誤(A銀行)”、“原因1失誤(B銀行)”其次,下面表示利用數(shù)據(jù)表結(jié)合部41,使用在步驟S14存儲于存儲裝置12的同一屬性用于將組織類別數(shù)據(jù)表結(jié)合的處理動作。數(shù)據(jù)表結(jié)合部41在從所有組織的組織類別數(shù)據(jù)表提取出同一屬性的情況下,將該屬性編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該屬性設(shè)為結(jié)合完成數(shù)據(jù)表的一屬性。具體而言,在圖3所示的從組織類別數(shù)據(jù)表提取的同一屬性的組(ア)中,在A、B、C銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“業(yè)務(wù):存款”的屬性。另外,如圖3所示,在各銀行的組織類別數(shù)據(jù)表中存在該“業(yè)務(wù):存款”的屬性。數(shù)據(jù)表結(jié)合部41將該屬性編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該屬性作為該結(jié)合完成數(shù)據(jù)表的屬性“業(yè)務(wù):存款”。同樣,在從圖3所示的組織類別數(shù)據(jù)表提取出的上述的同一屬性的組(イ)中,在A、B、C銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“業(yè)務(wù):貸款”的屬性。另外,如圖3所示,在各銀行的組織類別數(shù)據(jù)表中存在該“業(yè)務(wù):貸款”的屬性。數(shù)據(jù)表結(jié)合部41將該屬性編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該屬性作為該結(jié)合完成數(shù)據(jù)表的屬性“業(yè)務(wù):貸款”。另外,在與從一部分銀行的各分行的組織類別數(shù)據(jù)表提取出的屬性相同的屬性未從其它銀行的各分行的組織類別數(shù)據(jù)表提取出的情況下,數(shù)據(jù)表結(jié)合部41將該屬性追加到該其它銀行的屬性。數(shù)據(jù)表結(jié)合部41將該屬性設(shè)為結(jié)合完成數(shù)據(jù)表的一屬性。該情況下,數(shù)據(jù)表結(jié)合部41將結(jié)合完成數(shù)據(jù)表中與上述其它銀行對應(yīng)的上述的追加的屬性的屬性值全部作為缺損值。具體而言,在圖3所示的從組織類別數(shù)據(jù)表提取的同一屬性的組(ウ)中,在A、C銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“職務(wù):一般銀行職員”的屬性。但是,在B銀行的各分行的組織類別數(shù)據(jù)表中不存在該“職務(wù):一般銀行職員”的屬性。因此,數(shù)據(jù)表結(jié)合部41生成在B銀行的各分行的組織類別數(shù)據(jù)表中追加了“職務(wù):一般銀行職員”的表。數(shù)據(jù)表結(jié)合部41將該表編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表的B銀行的各分行的行的“職務(wù):一般銀行職員”的列的單元的值即屬性值全部作為缺損值。另外,在圖3所示的從組織類別數(shù)據(jù)表提取的同一屬性的組(エ)中,在A、C銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“職務(wù):兼職”的屬性。但是,在B銀行的各分行的組織類別數(shù)據(jù)表中不存在該“職務(wù):兼職”的屬性。因此,數(shù)據(jù)表結(jié)合部41生成在B銀行的各分行的組織類別數(shù)據(jù)表中追加了“職務(wù):兼職”的表。而且,數(shù)據(jù)表結(jié)合部41將該表編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表中B銀行的各分行的行的“職務(wù):兼職”的列的單元的值即屬性值全部作為缺損值。另外,在從圖3所示的組織類別數(shù)據(jù)表提取出的同一屬性的組(オ)中,在A、B銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“原因:能力不足”的屬性。但是,在C銀行的各分行的組織類別數(shù)據(jù)表中不存在該“原因:能力不足”的屬性。因此,數(shù)據(jù)表結(jié)合部41生成在C銀行的各分行的組織類別數(shù)據(jù)表中追加了“原因:能力不足”的表。而且,數(shù)據(jù)表結(jié)合部41將該表編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表的C銀行的各分行的行的“原因:能力不足”的列的單元的值即屬性值全部作為缺損值。另外,在圖3所示的從組織類別數(shù)據(jù)表提取出的同一屬性的組(カ)中,在A、B銀行的各分行的組織類別數(shù)據(jù)表中作為同一屬性存在“原因:失誤”的屬性。但是,在C銀行的各分行的組織類別數(shù)據(jù)表中不存在該“原因:失誤”的屬性。因此,數(shù)據(jù)表結(jié)合部41生成在C銀行的各分行的組織類別數(shù)據(jù)表中追加了“原因:失誤”的表。而且,數(shù)據(jù)表結(jié)合部41將該表編入結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表的C銀行的各分行的行的“原因:失誤”的列的單元的值即屬性值全部作為缺損值。這樣,數(shù)據(jù)表結(jié)合部41通過將圖3所示的各銀行的各分行的組織類別數(shù)據(jù)表結(jié)合,生成單一的結(jié)合完成數(shù)據(jù)表。數(shù)據(jù)表結(jié)合部41將該結(jié)合完成數(shù)據(jù)表存儲于存儲裝置12的結(jié)合完成數(shù)據(jù)表存儲部32。圖7是以表形式表示通過本實施方式的數(shù)據(jù)分析支援裝置的數(shù)據(jù)表結(jié)合部生成的結(jié)合完成數(shù)據(jù)表之一例的圖。該結(jié)合完成數(shù)據(jù)表的各行與各銀行的各分行的一記錄對應(yīng)。結(jié)合完成數(shù)據(jù)表的各列與各行的分行編號、及結(jié)合元的組織類別數(shù)據(jù)表中的各屬性對應(yīng)。各屬性是指“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”、“原因:能力不足”、“原因:失誤”。例如,圖3所示的由A銀行的各分行的組織類別數(shù)據(jù)表的分行編號“A001”的行定義的屬性“業(yè)務(wù):存款”的列的單元的值為“31”。該情況下,由結(jié)合完成數(shù)據(jù)表的分行編號“A001”的行定義的屬性“業(yè)務(wù):存款”的列的單元的值也為“31”。另外,圖3所示的由B銀行的各分行的組織類別數(shù)據(jù)表的分行編號“B001”的行定義的屬性“職務(wù):一般銀行職員”及“職務(wù):兼職”的列的單元的值不存在。該情況下,由結(jié)合完成數(shù)據(jù)表的分行編號“B001”的行定義的屬性“職務(wù):一般銀行職員”及“職務(wù):兼職”的列的單元的值為“空”。另外,圖3所示的由C銀行的各分行的組織類別數(shù)據(jù)表的分行編號“C001”的行定義的屬性“原因:能力不足”及“原因:失誤”的列的單元的值不存在。該情況下,由結(jié)合完成數(shù)據(jù)表的分行編號“C001”的行定義的屬性“原因:能力不足”及“原因:失誤”的列的單元的值為“空”。其次,說明記錄間距離計算部42的動作的詳情。圖8是表示本實施方式的數(shù)據(jù)分析支援裝置的記錄間距離計算部進(jìn)行的處理動作之一例的流程圖。圖8所示的處理動作是詳細(xì)說明圖5所示的處理動作的步驟S4的動作。該處理動作是用于計算結(jié)合完成數(shù)據(jù)表的任意的兩個記錄間的距離的處理動作。結(jié)合完成數(shù)據(jù)表中,將該表的沿著行方向的單元的集合作為一個記錄。任意的兩個記錄間的距離表示這兩個記錄的類似度的高低。記錄間距離計算部42任意指定結(jié)合完成數(shù)據(jù)表中的記錄對(pair)(步驟S21)。記錄對是結(jié)合完成數(shù)據(jù)表的兩個記錄的組。在此,將記錄i和記錄j的組作為記錄對。記錄間距離計算部42確定共通屬性(步驟S22)。該共通屬性是指構(gòu)成記錄對的各記錄分別均具有值的屬性。其次,記錄間距離計算部42考慮在步驟S22確定的共通屬性,根據(jù)以下的式(1)計算記錄i和記錄j之間的距離di,j。記錄間距離計算部42將該算出的距離的信息與記錄對的各記錄的識別名的信息一同存儲于存儲裝置12的記錄間距離存儲部33(步驟S23)。式(1)的n是記錄i和記錄j之間的共通屬性的種類數(shù)。式(1)的c是記錄i和記錄j之間的共通屬性的集合。式(1)的a是屬性。式(1)的ak是記錄k的屬性a的屬性值。該k為變量,是i或j。即,記錄i和記錄j之間的距離基于由記錄i中的在記錄i和記錄j之間共通的屬性的值減去記錄j中的在記錄i和記錄j之間共通的屬性的值所得的值和該共通的屬性的種類數(shù)的倒數(shù)計算。說明具體例。首先,作為第一例,例舉選擇與圖7所示的分行編號“A001”的行對應(yīng)的記錄和與分行編號“A002”的行對應(yīng)的記錄對的例子。該情況下,與“A001”的行對應(yīng)的記錄的具有不是缺損值的值的屬性為6個。這6個屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”、“原因:能力不足”、“原因:失誤”。另外,和與“A001”的行對應(yīng)的記錄相同,與“A002”的行對應(yīng)的記錄中具有不是缺損值的值的屬性為6個。這6個屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”、“原因;能力不足”、“原因:失誤”。即,兩記錄彼此具有6個屬性。這些屬性全部為共通屬性。該情況下,在步驟S21確定的共通屬性為6個。這6個屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”、“原因:能力不足”、“原因:失誤”。該情況下,記錄間距離計算部42使用作為共通屬性的6個屬性計算歐幾里得距離。對根據(jù)式(1),通過記錄間距離計算部42用共通屬性數(shù)6除該距離所得的值進(jìn)行說明。該值是與分行編號“A001”的行對應(yīng)的記錄和與分行編號“A002”的行對應(yīng)的記錄之間的距離。下面表示該距離的值。另外,作為第二例,例舉選擇圖7所示的與分行編號“A001”的行對應(yīng)的記錄和與分行編號“B001”的行對應(yīng)的記錄對的例子。該例中,與“A001”的行對應(yīng)的記錄的具有不是缺損值的值的屬性為6個。這6個屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”、“原因:能力不足”、“原因:失誤”。另一方面,如圖7所示,與“B001”的行對應(yīng)的記錄的屬性中具有不是缺損值的值的屬性為4個。這4個屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“原因;能力不足”、“原因;失誤”。即,就兩記錄而言,作為“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“原因:能力不足”、“原因:失誤”的4個屬性均具有不是缺損值的值。這些屬性成為在步驟S21確定的共通屬性。另一方面,如圖7所示,與“B001”的行對應(yīng)的記錄的屬性中“職務(wù):一般銀行職員”、“職務(wù):兼職”這2屬性具有缺損值。該屬性為與“A001”的行對應(yīng)的記錄具有不是缺損值的值的屬性。這些屬性不是在步驟S21確定的共通屬性。該情況下,記錄間距離計算部42使用作為共通屬性的4屬性計算歐幾里得距離。根據(jù)式(1)用共通屬性數(shù)4除該距離所得的值為與分行編號“A001”的行對應(yīng)的記錄和與分行編號“B001”的行對應(yīng)的記錄之間的距離。下面表示該距離的值。另外,作為第三例,例舉選擇圖7所示的與分行編號“B001”的行對應(yīng)的記錄和與分行編號“C001”的行對應(yīng)的記錄對的例子。該例中,與“B001”的行對應(yīng)的記錄的具有不是缺損值的值的屬性是“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”、“原因:能力不足”、“原因:失誤”這4個。另一方面,在與“C001”的行對應(yīng)的記錄中,具有不是缺損值的值的屬性是“業(yè)務(wù)存款”、“業(yè)務(wù):貸款”、“職務(wù):一般銀行職員”、“職務(wù):兼職”這4個。即,兩記錄中的“業(yè)務(wù):存款”、“業(yè)務(wù):貸款”這2屬性均具有不是缺損值的值。這些屬性成為在步驟S21確定的共通屬性。另一方面,與“C001”的行對應(yīng)的記錄的“職務(wù):一般銀行職員”、“職務(wù):兼職”這2屬性具有不是缺損值的值。另一方面,與“B001”的行對應(yīng)的記錄的“職務(wù):一般銀行職員”、“職務(wù):兼職”這2屬性具有缺損值。這些屬性不是在步驟S21確定的共通屬性。另外,與“B001”的行對應(yīng)的記錄的“職務(wù):一般銀行職員”、“職務(wù):兼職”這2屬性具有不是缺損值的值。另一方面,與“C001”的行對應(yīng)的記錄的“職務(wù):一般銀行職員”、“職務(wù);兼職”這2屬性具有缺損值。這些屬性也不是在步驟S21確定的共通屬性。該情況下,記錄間距離計算部42使用作為共通屬性的2屬性計算歐幾里得距離。根據(jù)式(1)由共通屬性數(shù)2除該距離所得的值為與分行編號“B001”的行對應(yīng)的記錄和與分行編號“C001”的行對應(yīng)的記錄之間的距離。下面表示該距離的值。即,在本實施方式的與各分行對應(yīng)的記錄間的距離的計算中,防止因現(xiàn)有技術(shù)那樣共通的屬性越多,相加的項越增加,導(dǎo)致這些和即距離的值不適合地增大。進(jìn)而,在本實施方式中,如式(1)所示,每一屬性的屬性值的差越大,算出的距離的值越大。另外,如式(1)所示,共通的屬性的種類數(shù)越多,算出的距離的值越小。據(jù)此,在本實施方式中,相比現(xiàn)有技術(shù),可提高距離計算的精度。相對于某記錄對的步驟S23的處理后,結(jié)合完成數(shù)據(jù)表上的所有記錄對各自的構(gòu)成該記錄對的記錄間的距離的計算未結(jié)束的情況下(步驟S24的否),記錄間距離計算部42返回步驟S21。該情況下,記錄間距離計算部42任意指定結(jié)合完成數(shù)據(jù)表的兩個記錄的新的對。然后,記錄間距離計算部42再次進(jìn)行步驟S22、S23的處理。另外,在結(jié)合完成數(shù)據(jù)表上的所有記錄對的各自的構(gòu)成該記錄對的記錄間的距離的計算結(jié)束的情況下(步驟S24的是),記錄間距離計算部42結(jié)束用于記錄間的距離的計算的處理。這樣,記錄間距離計算部42計算結(jié)合完成數(shù)據(jù)表上的所有記錄對的記錄間的距離。其次,說明分析處理部43的動作的詳情。圖9是表示本實施方式的數(shù)據(jù)分析支援裝置的分析處理部進(jìn)行的處理動作之一例的流程圖。圖9所示的處理動作中詳細(xì)說明圖5所示的處理動作的步驟S5。該處理動作是讀出存儲于存儲裝置12的結(jié)合完成數(shù)據(jù)表存儲部32的結(jié)合完成數(shù)據(jù)表,用于進(jìn)行以該表的分行編號的列表示的所有的分行的分組的處理動作。下面,以二維圖表示將各銀行的各分行分組的過程。在本實施方式中,分析處理部43為對各分行分組而設(shè)定分組中心分行。分析處理部43使與該分組中心分行的距離近的分行與該分組中心分行相對應(yīng)地設(shè)定分組。分析處理部43求該設(shè)定的分組的重心,將距離該重心最近的分行設(shè)定為新的分組中心分行。如果求重心的前后的分組中心分行相同,則視為分析處理部43進(jìn)行正確的分組,輸出分組結(jié)果。圖10是表示分組中心分行的初始集合的設(shè)定例的圖。圖10所示的二維圖中,用圓表示結(jié)合完成數(shù)據(jù)表中的各行的由分行編號表示的各分行。而且,該二維圖中,分行間的距離表示存儲于存儲裝置12的記錄間距離存儲部33的距離。分析處理部43隨機地選擇與預(yù)先指定的分組數(shù)同數(shù)的分行,將這些選擇的各分行設(shè)定為分組中心分行(步驟S31)。例如在指定分組數(shù)為3的情況下,分析處理部43以圖10為例,將該圖10所示的黑圈的三個分行分別設(shè)定為分組中心分行。其次,分析處理部43任意選擇在步驟S31設(shè)定的分組中心分行以外的各分行的一個(步驟S32)。分析處理部43將該選擇的分行和各分組中心分行之間的距離分別從存儲裝置12的記錄間距離存儲部33讀出并進(jìn)行參照(步驟S33)。分析處理部43將在步驟S32選擇的分行與在各分組中心分行中距離最近的分組中心分行對應(yīng)起來,由此任意生成分組(步驟S34)。該生成的分組的要素分別是分組中心分行、及與該分組中心分行對應(yīng)的其它分行。圖11是表示使各分行與分組中心分行對應(yīng)的例的圖。圖11所示的例中,表示第一分組、第二分組、第三分組這三個分組。第一分組是作為3分行的分組。這3分行的分組將在圖10所示的各分組中心分行中距離第一分組中心分行51最近的兩個分行與第一分組中心分行51對應(yīng)起來。第二分組是由雙重線L1包圍的作為4分行的分組。這4分行的分組將在圖10所示的各分組中心分行中距離第二分組中心分行52最近的3分行與第二分組中心分行52對應(yīng)起來。第三分組是作為6分行的分組。這6分行的分組將在圖10所示的各分組中心分行中距離第三分組中心分行53最近的5分行與第三分組中心分行53對應(yīng)起來。接著,如果在步驟S32選擇完分組中心分行以外的所有分行、即用于生成分組的分行(步驟S35的是),則分析處理部43計算在步驟S34生成的各分組的重心(步驟S36)。在此,使交點命中由圖11的雙重線L1包圍的作為4分行的第二分組來進(jìn)行說明。圖12是以表形式表示由結(jié)合完成數(shù)據(jù)表定義的預(yù)定的分組中包含的各組織的屬性及屬性值之一例的圖。該圖中,表示圖7所示的結(jié)合完成數(shù)據(jù)表中的包含于上述的第二分組的4個分行的記錄的屬性及該屬性的屬性值。包含于第二分組的4個分行是與圖7所示的結(jié)合完成數(shù)據(jù)表的分行編號“A003”、分行編號“A004”、分行編號“B003”、及分行編號“C003”分別對應(yīng)的分行。具體而言,在步驟S36中,分析處理部43對于與第二分組中包含的4個分行分別對應(yīng)的記錄的各屬性計算各記錄的同屬性的屬性值的平均值。分析處理部43將該平均值作為重心的屬性值。但是,在算出的重心的各記錄中存在屬性值為缺損值的記錄的情況下,分析處理部43不將該記錄的屬性值作為用于計算平均值的值使用。分析處理部43僅以具有屬性值的記錄為對象計算平均值。在此,說明圖12所示的各記錄的“業(yè)務(wù):存款”的屬性值的平均值、即“業(yè)務(wù)存款”的重心的屬性值。該屬性值是與圖12所示的記錄的“業(yè)務(wù):存款”的列的各分行對應(yīng)的行的值的總和除以記錄數(shù)“4”所得的值。該記錄數(shù)“4”是在各記錄中“業(yè)務(wù):存款”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的與各記錄的“業(yè)務(wù):存款”的列的各分行對應(yīng)的行的值的總和是分行編號“A003”的行的值“5”、分行編號“A004”的行的值“2”、分行編號“B003”的行的值“3”、分行編號“C003”的行的值“3”的總和。圖12所示的各記錄的“業(yè)務(wù):存款”的重心的屬性值由下式表示。(5+2+3+3}/4=3.25另外,說明圖12所示的各記錄的“業(yè)務(wù):貸款”的屬性值的平均值、即“業(yè)務(wù):貸款”的重心的屬性值。該屬性值是圖12所示的與記錄的“業(yè)務(wù):貸款”的列的各分行對應(yīng)的行的值的總和除以記錄數(shù)“4”所得的值。該記錄數(shù)“4”是在各記錄中“業(yè)務(wù):貸款”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的與各記錄的“業(yè)務(wù);貸款”的列的各分行對應(yīng)的行的值的總和為分行編號“A003”的行的值“3”、分行編號“A004”的行的值“5”、分行編號“B003”的行的值“4”、分行編號“C003”的行的值“3”的總和。圖12所示的各記錄的“業(yè)務(wù):貸款”的重心的屬性值由下式表示。(3+5+4+3)/4=3.75另外,說明圖12所示的各記錄的“職務(wù):一般銀行職員”的屬性值的平均值、即“職務(wù);一般銀行職員”的重心的屬性值。該屬性值是圖12所示的與記錄的“職務(wù):一般銀行職員”的列的各分行對應(yīng)的行的值的總和除以記錄數(shù)“3”所得的值。該記錄數(shù)“3”是在各記錄中“職務(wù):一般”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的各記錄的“職務(wù):一般銀行職員”的列的各分行的行的值的總和是分行編號“A003”的行的值“2”、分行編號“A004”的行的值“4”、分行編號“C003”的行的值“4”的總和。圖12所示的各記錄的“職務(wù):一般銀行職員”的重心的屬性值如下式表示。(2+4+4)/3≈3.33另外,圖12所示的各記錄的“職務(wù):兼職”的屬性值的平均值、即“職務(wù)兼職”的重心的屬性值是圖12所示的記錄的“職務(wù):兼職”的列的各分行的行的值的總和除以記錄數(shù)“3”所得的值。該記錄數(shù)“3”是在各記錄中“職務(wù):兼職”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的記錄的“職務(wù):兼職”的列的各分行的行的值的總和是分行編號“A003”的行的值“6”、分行編號“A004”的行的值“3”、分行編號“C003”的行的值“2”的總和。圖12所示的各記錄的“職務(wù):兼職”的重心的屬性值由下式表示。(6+3+2)/3≈3.67另外,圖12所示的各記錄的“原因:能力不足”的屬性值的平均值、即“原因:能力不足”的重心的屬性值是圖12所示的記錄的“原因:能力不足”的列的各分行的行的值的總和除以記錄數(shù)“3”所得的值。該記錄數(shù)“3”是在各記錄中“原因:能力不足”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的記錄的“原因:能力不足”的列的各分行的行的值的總和是分行編號“A003”的行的值“3”、分行編號“A004”的行的值“3”、分行編號“B003”的行的值“2”的總和。圖12所示的各記錄的“原因:能力不足”的重心的屬性值由下式表示。(3+3+2)/3≈2.67另外,圖12所示的各記錄的“原因:失誤”的屬性值的平均值、即“原因:失誤”的重心的屬性值是圖12所示的記錄的“原因:失誤”的列的各分行的行的值的總和除以記錄數(shù)“3”所得的值。該記錄數(shù)“3”是在各記錄中“原因:能力不足”的屬性值作為不是缺損值的值存在的記錄的數(shù)。圖12所示的記錄的“原因:失誤”的列的各分行的行的值的總和是分行編號“A003”的行的值“5”、分行編號“A004”的行的值“4”、分行編號“B003”的行的值“5”的總和。圖12所示的各記錄的“原因:失誤”的重心的屬性值由下式表示。(5+4+5)/3≈4.67圖13是以表形式表示由結(jié)合完成數(shù)據(jù)表定義的預(yù)定的分組中包含的各組織(分行)的各屬性的重心的計算結(jié)果之一例的圖。圖14是表示各分組的重心之一例的圖。圖14中,由x標(biāo)記表示二維圖上的各第一分組的重心、第二分組的重心、及第三分組的重心。最后,分析處理部43再計算各分組的分組中心分行(步驟S37)。具體而言,分析處理部43在包含步驟S31中設(shè)定的分組中心分行的所有分行中計算新的分組中心分行。該新的分組中心分行是對于由結(jié)合完成數(shù)據(jù)表定義的預(yù)定的分組與在步驟S36算出的重心之間的距離最小的分行。分析處理部43將該分行設(shè)定為新的分組中心分行。分析處理部43對于在步驟S31設(shè)定的各分組中心分行進(jìn)行新的分組中心分行的設(shè)定,由此重新設(shè)定分組中心的集合。分析處理部43為計算各分行和分組的重心的距離而與分行之間的距離的計算同樣地使用上述的式(1)。圖15是以表形式表示以結(jié)合完成數(shù)據(jù)表定義的分組的分組中心分行的再計算結(jié)果之一例的圖。如果在步驟S37再計算的分組中心分行的集合從在步驟S31設(shè)定的本來的分組中心分行的集合發(fā)生變化(步驟S38的是),則視為分析處理部43沒有進(jìn)行適當(dāng)?shù)姆纸M,返回步驟S32。而且,分析處理部43任意選擇在步驟S37再計算的分組中心分行以外的各分行之一。分析處理部43再次進(jìn)行以該分組中心分行為基準(zhǔn)的步驟S33之后的處理。圖15所示的例中,由于分組中心分行的集合從圖10所示的狀態(tài)發(fā)生狀態(tài)變化,所以返回步驟S32。具體而言,如圖15所示,第一分組的分組中心分行從當(dāng)初的分組中心分行51變化為分組中心分行61。另外,第二分組的分組中心分行從當(dāng)初的分組中心分行52變化為分組中心分行62。另外,第三分組的分組中心分行從當(dāng)初的分組中心分行53變化為分組中心分行63。另外,如果在步驟S37再計算的分組中心分行的集合從在步驟S31設(shè)定的本來的分組中心分行的集合不發(fā)生變化(步驟S38的否),則視為分析處理部43進(jìn)行適當(dāng)?shù)姆纸M,結(jié)束用于分組的處理。然后,分析處理部43將分組結(jié)果存儲于存儲裝置12的分組結(jié)果存儲部34。分析處理部43將分組結(jié)果向例如液晶顯示器裝置等顯示裝置20輸出。其次,下面敘述將本實施方式適用于實數(shù)據(jù)的情況下的用于評價分組的精度的實際的結(jié)果。本實驗中,對以下的3手法的精度進(jìn)行比較。(ア)本實施方式的手法(イ)已有的手法(有缺損項目)(ウ)已有的手法(無缺損項目)作為已有的手法(イ)、(ウ),使用通常使用的以下的手法?!安粚⒅辽僖粋€記錄為缺損值的屬性用于分析?!逼渲?,關(guān)于手法(ウ),以無缺損項目的數(shù)據(jù)作為輸入數(shù)據(jù)。這相當(dāng)于能靈活運用全部輸入數(shù)據(jù)的情況,表示分組手法的精度的上限。接著,對用于實驗的數(shù)據(jù)進(jìn)行說明。圖16是以表形式表示用于分組的精度的評價的實驗數(shù)據(jù)的圖。該實驗數(shù)據(jù)是將作為A銀行、B銀行、C銀行的三個銀行的、合計30分行的事務(wù)失誤合計的數(shù)據(jù)。該實驗數(shù)據(jù)具有銀行的類別的列、分行編號的列、分行類別的列。另外,該實驗數(shù)據(jù)具有失誤的屬性值的列的。該失誤的屬性值的列是用于分組的列。其中,用于分組的屬性值不是失誤件數(shù)的合計值,而是失誤件數(shù)的比。例如圖16所示的與數(shù)據(jù)的A銀行的分行編號“A01”對應(yīng)的記錄的“業(yè)務(wù)a”的屬性值0.291表示相對于在分行A01發(fā)生的所有的失誤的件數(shù)的、在分行A01發(fā)生的業(yè)務(wù)a的失誤的件數(shù)的比例。即,將作為某記錄的業(yè)務(wù)a~業(yè)務(wù)e的所有的屬性值合計的值為1。圖16所示的數(shù)據(jù)為用于上述的手法(ウ)的輸入數(shù)據(jù)。另一方面,用于手法(ア)、(イ)的輸入數(shù)據(jù)通過使圖16所示的數(shù)據(jù)模擬發(fā)生缺損而生成。圖17是以表形式表示利用于分組的精度評價的各銀行的事務(wù)失誤收集狀況的圖。該圖17所示的例中,有關(guān)“擔(dān)當(dāng)者”的項目的信息、及有關(guān)“狀況”的項目的信息在各銀行收集。但是,B銀行假定為不收集有關(guān)“業(yè)務(wù)”的項目的信息。另外,C銀行假定為不收集與“原因”的項目有關(guān)的信息。另外,將圖16的假定為如上未收集的部分為缺損值。圖18是以表形式表示利用于分組的精度評價的包含缺損項目的實驗數(shù)據(jù)的圖。分組結(jié)果的評價使用圖16及圖18所示的“分行類別”的列的值。該“分行類別”是在三個銀行間共通使用的分行的類別。這些類別由“大型”、"小型”、"特殊”三種屬性值構(gòu)成。在此,將以通過分組數(shù)為3實施的各手法生成的分組分別看作“大型”、“小型”、“特殊”的集合。而且,對三個分組和三個分行類別所有的組合計算實際上正確分類的分行數(shù)相對于所有分行數(shù)的比例。將以該計算結(jié)果表示的最高的值作為手法的準(zhǔn)確率(accuracyrate)。例如,考慮將應(yīng)分類為第一分組的分行類別設(shè)為“大型”,將應(yīng)分類為第二分組的分行類別設(shè)為“小型”,將應(yīng)分類為第三分組的分行類別設(shè)為“特殊”的情況。該情況下中,相對于第一分組,將作為“大型”的分行、“大型”的分行、“小型”的分行、“特殊”的分行、及“特殊”的分行的五個分行假定為通過某手法實際分類。另外,相對于第二分組,將作為“小型”的分行、“小型”的分行的兩個分行假定為以相同手法實際分類。另外,相對于第三分組,將作為“大型”的分行、“特殊”的分行、“特殊”的分行、及“特殊”的分行的四個分行假定為以相同手法實際分類。被分類為這些第一分組、第二分組、第三分組的分行的類別如下。第一分組:大型、大型、小型、特殊、特殊第二分組:小型、小型第三分組:大型、特殊、特殊、特殊分類為該第一分組的“大型”的分行數(shù)為2。另外,被分類為第二分組的“小型”的分行數(shù)為2。另外,被分類為第三分組的“特殊”的分行數(shù)為3。這樣,正確地分類為第一分組的分行數(shù)為2。另外,正確地分類為第二分組的分行數(shù)為2。另外,正確地分類為第三分組的分行數(shù)為3。另外,所有分行數(shù)為11。該情況下,實際上正確地分類為各分組的分行數(shù)相對于所有分行數(shù)的比例即準(zhǔn)確率為{2+2+3)/11=7/11。而且,將通過同手法對三個分組和三個分行類別的所有的組合求出的準(zhǔn)確率的中最高的準(zhǔn)確率設(shè)為該手法的分組結(jié)果的準(zhǔn)確率。其次,圖19表示實際上正確地分類為各分組的分行數(shù)相對于所有分行數(shù)的準(zhǔn)確率。該準(zhǔn)確率表示通過手法(ア)、手法(イ)、手法(ウ)的各手法的精度的好壞。如該例所示,“(ア)本實施方式的手法”的精度高于“(イ)已有的手法(有缺損項目)”的精度。因此,相比已有的手法,本實施方式的手法相對于包含缺損項目的數(shù)據(jù)可靠。如上,本實施方式中,數(shù)據(jù)分析支援裝置存儲與桌位分析對象的多個阻止分別有關(guān)的組織類別數(shù)據(jù)表,該組織類別數(shù)據(jù)表用于按組織類別管理記錄,該記錄是包含至少一種屬性的合計數(shù)據(jù)。另外,數(shù)據(jù)分析支援裝置基于在預(yù)定的記錄組的記錄間共通的屬性的種類數(shù)、及該共通的屬性的值,來計算記錄間的距離。預(yù)定的記錄組是指由組織類別數(shù)據(jù)表表示的、在多個組織間具有至少一種共通的屬性的多個組織各自的記錄組。另外,數(shù)據(jù)分析支援裝置基于該計算出的距離進(jìn)行以與各記錄對應(yīng)的組織作為分組要素的分組。因此,由于收集的屬性按組織不同,所以即使在合計數(shù)據(jù)在全部組織間不一致的狀況下,也能夠靈活運用組織間共通的屬性的信息,由此,能夠有效靈活運用所收集的數(shù)據(jù),能夠進(jìn)行將多個組織的數(shù)據(jù)統(tǒng)和時的精度高的分析。根據(jù)這些各實施方式,能夠提供即使不同組織各自的數(shù)據(jù)的內(nèi)、數(shù)據(jù)的屬性在組織間不同而導(dǎo)致的缺損發(fā)生,也可以提高將這些數(shù)據(jù)統(tǒng)和時的分析精度的數(shù)據(jù)分析支援裝置。在如上說明的實施方式中,說明了組織類別數(shù)據(jù)表為關(guān)于作為分析對象的多個組織各自的、用于按組織類別管理具有至少一種屬性的合計數(shù)據(jù)即記錄的數(shù)據(jù)表。但是,由該組織類別數(shù)據(jù)表管理的數(shù)據(jù)也可以為定量的數(shù)據(jù),還可以為定性的數(shù)據(jù)。另外,在本實施方式中,說明了分析處理部43基于構(gòu)成多個組織各自的記錄組的各記錄間的距離進(jìn)行將與各記錄對應(yīng)的組織作為分組要素的分組處理。但該多個組織具有由組織類別數(shù)據(jù)表所示的至少一種共通的屬性。但是,不限于此,只要能進(jìn)行使用構(gòu)成記錄組的各記錄之間的距離的分析處理,則也可以通過分析處理部43,例如使用構(gòu)成記錄組的各記錄間的距離進(jìn)行通過自組織化圖的分析處理及通過多維尺度構(gòu)成法的分析處理。此外,上述實施方式中記載的手法作為計算機可執(zhí)行的程序也可以存儲于磁盤(軟盤(注冊商標(biāo))(floppydisk)、硬盤(harddisk)等)、光盤(CD-ROM、DVD等)、光磁盤(MO)、半導(dǎo)體存儲器等存儲介質(zhì)并發(fā)布。另外,作為該存儲介質(zhì),只要可存儲程序,且為計算機可讀取的存儲介質(zhì),則其存儲形式可以是任意形式。另外,基于從存儲介質(zhì)安裝(install)于計算機上的程序的指示在計算機上工作的OS(操作系統(tǒng)(operatingsystem))、數(shù)據(jù)庫管理軟件、網(wǎng)絡(luò)(network)軟件等MW(中間件(middleware))等也可以執(zhí)行用于實現(xiàn)上述實施方式的各處理的一部分。另外,本發(fā)明的存儲介質(zhì)不限于與計算機獨立的介質(zhì),也可以包含下載(download)通過LAN或因特網(wǎng)(Internet)等傳送的程序并存儲或暫時存儲的存儲介質(zhì)。另外,存儲介質(zhì)不限于一個,本發(fā)明的存儲介質(zhì)還包括從多個介質(zhì)執(zhí)行上述實施方式的處理的情況,媒體結(jié)構(gòu)可以是任意的結(jié)構(gòu)。此外,本發(fā)明中的計算機基于存儲于存儲介質(zhì)的程序執(zhí)行上述實施方式的各處理,也可以為由個人計算機(personalcomputer)等一個構(gòu)成的裝置、將多個裝置網(wǎng)絡(luò)連結(jié)的系統(tǒng)等任意的構(gòu)成。另外,本發(fā)明的計算機不限于個人計算機,還包括在信息處理設(shè)備中包含的運算處理裝置、微型計算機(microcomputer)等,是可通過程序?qū)崿F(xiàn)本發(fā)明的功能的設(shè)備、裝置的總稱。說明了發(fā)明的幾個實施方式,而這些實施方式作為例子進(jìn)行展示,沒有限定發(fā)明范圍的意圖。這些新的實施方式可以以其它各種方式實施,在不脫離發(fā)明宗旨的范圍內(nèi)可以進(jìn)行各種省略、置換、變更。這些實施方式及其變形包含于發(fā)明的范圍及宗旨,并且還包含于權(quán)利要求書記載的發(fā)明和與其均等的范圍內(nèi)。當(dāng)前第1頁1 2 3