1.一種聚類實(shí)現(xiàn)方法,其特征在于,包括:
對(duì)待聚類數(shù)據(jù)集的聚類中心進(jìn)行初始化,其中,初始化聚類中心的數(shù)量與預(yù)設(shè)的聚類數(shù)目相匹配;
根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心,其中,在計(jì)算所述最近聚類中心過(guò)程中消除了數(shù)據(jù)點(diǎn)自身平方計(jì)算帶來(lái)的冗余;
根據(jù)所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)的所述最近聚類中心的計(jì)算結(jié)果,更新所述聚類中心;
返回執(zhí)行根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心的操作,直至滿足聚類迭代結(jié)束條件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心包括:
根據(jù)公式:j=1,…,N,計(jì)算所述待聚類數(shù)據(jù)集中第i個(gè)數(shù)據(jù)點(diǎn)xi的最近聚類中心Ci;
其中,cj為第j個(gè)聚類中心,N為所述聚類數(shù)目,i∈[1,M],M為所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)總數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心進(jìn)一步包括:
將所述待聚類數(shù)據(jù)集切分為至少兩個(gè)數(shù)據(jù)子集;
獲取一個(gè)數(shù)據(jù)子集作為當(dāng)前操作數(shù)據(jù)子集;
將所述當(dāng)前操作數(shù)據(jù)子集拷貝至顯存中,并通過(guò)訪問所述顯存計(jì)算與所述當(dāng)前操作數(shù)據(jù)子集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心;
返回執(zhí)行獲取一個(gè)數(shù)據(jù)子集作為當(dāng)前操作數(shù)據(jù)子集的操作,直至完成對(duì)所述待聚類數(shù)據(jù)集中全部數(shù)據(jù)子集的處理。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述待聚類數(shù)據(jù)集切分為至少兩個(gè)數(shù)據(jù)子集包括:
預(yù)先設(shè)定切分?jǐn)?shù)量Q;
根據(jù)公式B=M%Q,計(jì)算待濾除數(shù)據(jù)點(diǎn)數(shù)量B,其中,M為所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)總數(shù),%為求余運(yùn)算;
從所述待聚類數(shù)據(jù)集中濾除B個(gè)數(shù)據(jù)點(diǎn)后,生成齊整待聚類數(shù)據(jù)集;
將所述齊整待聚類數(shù)據(jù)集切分為Q個(gè)包含相同數(shù)量數(shù)據(jù)點(diǎn)的數(shù)據(jù)子集。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述當(dāng)前操作數(shù)據(jù)子集拷貝至顯存中包括:
通過(guò)統(tǒng)一計(jì)算設(shè)備架構(gòu)流將所述當(dāng)前操作數(shù)據(jù)子集拷貝至顯存中。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)為圖片數(shù)據(jù)點(diǎn),其中,所述圖片數(shù)據(jù)點(diǎn)中包括至少兩個(gè)維度的圖片特征。
7.一種聚類實(shí)現(xiàn)裝置,其特征在于,包括:
聚類中心初始化模塊,用于對(duì)待聚類數(shù)據(jù)集的聚類中心進(jìn)行初始化,其中,初始化聚類中心的數(shù)量與預(yù)設(shè)的聚類數(shù)目相匹配;
最近聚類中心計(jì)算模塊,用于根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心,其中,在計(jì)算所述最近聚類中心過(guò)程中消除了數(shù)據(jù)點(diǎn)自身平方計(jì)算帶來(lái)的冗余;
聚類中心更新模塊,用于根據(jù)所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)的所述最近聚類中心的計(jì)算結(jié)果,更新所述聚類中心;
重復(fù)迭代模塊,用于返回執(zhí)行根據(jù)所述聚類中心,計(jì)算與所述待聚類數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心的操作,直至滿足聚類迭代結(jié)束條件。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述最近聚類中心計(jì)算模塊,具體用于:
根據(jù)公式:j=1,…,N,計(jì)算所述待聚類數(shù)據(jù)集中第i個(gè)數(shù)據(jù)點(diǎn)xi的最近聚類中心Ci;
其中,cj為第j個(gè)聚類中心,N為所述聚類數(shù)目,i∈[1,M],M為所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)總數(shù)。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述最近聚類中心計(jì)算模塊進(jìn)一步包括:
待聚類數(shù)據(jù)集切分單元,用于將所述待聚類數(shù)據(jù)集切分為至少兩個(gè)數(shù)據(jù)子集;
當(dāng)前操作數(shù)據(jù)子集獲取單元,用于獲取一個(gè)數(shù)據(jù)子集作為當(dāng)前操作數(shù)據(jù)子集;
最近聚類中心顯存計(jì)算單元,用于將所述當(dāng)前操作數(shù)據(jù)子集拷貝至顯存中,并通過(guò)訪問所述顯存計(jì)算與所述當(dāng)前操作數(shù)據(jù)子集中的各數(shù)據(jù)點(diǎn)分別對(duì)應(yīng)的最近聚類中心;
重復(fù)處理單元,用于返回執(zhí)行獲取一個(gè)數(shù)據(jù)子集作為當(dāng)前操作數(shù)據(jù)子集的操作,直至完成對(duì)所述待聚類數(shù)據(jù)集中全部數(shù)據(jù)子集的處理。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述待聚類數(shù)據(jù)集切分單元具體用于:
預(yù)先設(shè)定切分?jǐn)?shù)量Q;
根據(jù)公式:B=M%Q,計(jì)算待濾除數(shù)據(jù)點(diǎn)數(shù)量B,其中,M為所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)總數(shù),%為求余運(yùn)算;
從所述待聚類數(shù)據(jù)集中濾除B個(gè)數(shù)據(jù)點(diǎn)后,生成齊整待聚類數(shù)據(jù)集;
將所述齊整待聚類數(shù)據(jù)集切分為Q個(gè)包含相同數(shù)量數(shù)據(jù)點(diǎn)的數(shù)據(jù)子集。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述最近聚類中心顯存計(jì)算單元具體用于:
通過(guò)統(tǒng)一計(jì)算設(shè)備架構(gòu)流將所述當(dāng)前操作數(shù)據(jù)子集拷貝至顯存中。
12.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述待聚類數(shù)據(jù)集中包括的數(shù)據(jù)點(diǎn)為圖片數(shù)據(jù)點(diǎn),其中,所述圖片數(shù)據(jù)點(diǎn)中包括至少兩個(gè)維度的圖片特征。