亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種特征選擇方法及裝置的制造方法_5

文檔序號:9506180閱讀:來源:國知局
運算 效率和有效性。
[0180] 在本申請所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng),裝置和方法,可以 通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件 可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或 討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦 合或通信連接,可以是電性或其它的形式。
[0181] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0182] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理包括,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單 元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0183] 上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機可讀取存 儲介質中。上述軟件功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機 設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的 部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory,簡稱 ROM)、隨機存取存儲器(Random Access Memory,簡稱RAM)、磁碟或者光盤等各種可以存儲 程序代碼的介質。
[0184] 最后應說明的是:以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然 可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替 換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精 神和范圍。
【主權項】
1. 一種特征選擇方法,其特征在于,包括: 計算原始數(shù)據(jù)集中各特征變量之間的相關性,以及,所述原始數(shù)據(jù)集中各特征變量與 預測目標特征變量之間的相關性;其中,所述原始數(shù)據(jù)集包含N維特征變量,所述N維特征 變量包含N-1維所述特征變量和所述預測目標特征變量,所述N為正整數(shù); 根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性,和,所述原始數(shù)據(jù)集中各特征變量 與預測目標特征變量之間的相關性,獲取強相關特征子集和弱相關特征子集;其中,所述強 相關子集中包含的特征變量為所述原始數(shù)據(jù)集中,與所述預測目標特征變量直接相關的特 征變量;所述弱相關子集中包含的特征變量為所述原始數(shù)據(jù)集中,與所述預測目標特征變 量間接相關的特征變量; 將所述強相關特征子集中包含的所有特征變量,以及,所述弱相關特征子集中,與所述 強相關特征子集中的特征變量直接相關的特征變量的集合確定為所述預測目標特征變量 的最優(yōu)特征子集。2. 根據(jù)權利要求1所述的特征選擇方法,其特征在于,所述原始數(shù)據(jù)集還包含Μ組數(shù) 據(jù),所述Μ組數(shù)據(jù)包含訓練數(shù)據(jù)集,其中,每組數(shù)據(jù)中包含在同一時刻采集的所述Ν維特征 變量對應的數(shù)據(jù),所述Μ為正整數(shù); 相應的,所述計算原始數(shù)據(jù)集中各特征變量之間的相關性,以及,所述原始數(shù)據(jù)集中各 特征變量與預測目標特征變量之間的相關性,包括: 根據(jù)所述訓練數(shù)據(jù)集中的數(shù)據(jù)計算所述原始數(shù)據(jù)集中各特征變量之間的相關性,以 及,所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關性。3. 根據(jù)權利要求2所述的特征選擇方法,其特征在于,所述Μ組數(shù)據(jù)還包含評估數(shù)據(jù)集 和測試數(shù)據(jù)集; 相應的,所述根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性,和,所述原始數(shù)據(jù)集中 各特征變量與預測目標特征變量之間的相關性,獲取強相關特征子集和弱相關特征子集, 包括: 根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性、所述原始數(shù)據(jù)集中各特征變量與預 測目標特征變量之間的相關性、所述評估數(shù)據(jù)集、以及所述測試數(shù)據(jù)集獲取分類模型; 根據(jù)所述分類模型獲取所述強相關特征子集和所述弱相關特征子集。4. 根據(jù)權利要求3所述的特征選擇方法,其特征在于,所述根據(jù)所述原始數(shù)據(jù)集中各 特征變量之間的相關性、所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關 性、所述評估數(shù)據(jù)集、以及所述測試數(shù)據(jù)集獲取分類模型,包括: 根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性,和,所述原始數(shù)據(jù)集中各特征變量 與預測目標特征變量之間的相關性建立初始的貝葉斯網(wǎng)絡模型;其中,所述初始的貝葉斯 網(wǎng)絡模型包含節(jié)點和有向邊,所述節(jié)點表示特征變量,所述有向邊表示與所述有向邊連接 的兩個節(jié)點之間的相關性; 利用所述評估數(shù)據(jù)集迭代訓練所述初始的貝葉斯網(wǎng)絡模型,獲得穩(wěn)定的貝葉斯網(wǎng)絡模 型;其中,所述穩(wěn)定的貝葉斯網(wǎng)絡為包含不可逆的有向邊的貝葉斯網(wǎng)絡模型; 利用所述測試數(shù)據(jù)集測試所述穩(wěn)定的貝葉斯網(wǎng)絡模型,若所述穩(wěn)定的貝葉斯網(wǎng)絡模型 的拓撲結構保持不變,則將所述穩(wěn)定的貝葉斯網(wǎng)絡模型確定為分類模型。5. 根據(jù)權利要求1-4任一項所述的特征選擇方法,其特征在于,所述將所述強相關特 征子集中包含的所有特征變量,以及,所述弱相關特征子集中,與所述強相關特征子集中的 特征變量直接相關的特征變量的集合確定為所述預測目標特征變量的最優(yōu)特征子集,包 括: 在所述弱相關特征子集中,選擇第一特征變量,將所述第一特征變量加入當前預測模 型,判斷加入所述第一特征變量后的所述當前預測模型的預測精度是否大于所述當前預測 模型的預測精度,其中,所述第一特征變量為所述弱相關特征子集中,與所述預測目標特征 變量的相關性最大的特征變量,所述當前預測模型為初始預測模型或更新后的所述初始預 測模型,所述初始預測模型為以所述強相關特征子集中的特征變量為輸入端建立的預測模 型; 若是,則更新所述當前預測模型,并將所述第一特征變量從所述弱相關特征子集中刪 除,加入第一集合; 若否,則不更新所述當前預測模型,并將所述第一特征變量從所述弱相關特征子集中 刪除; 重復上述過程,直至所述弱相關特征子集中不存在特征變量; 將所述強相關特征子集中的特征變量和所述第一集合中的特征變量的集合確定為所 述預測目標特征變量的最優(yōu)特征子集。6. 根據(jù)權利要求5所述的特征選擇方法,其特征在于,所述預測模型為神經(jīng)網(wǎng)絡模型; 相應的,所述以所述強相關特征子集中的特征變量為輸入端建立預測模型,包括: 以強相關特征子集中包含的特征變量為輸入元構建神經(jīng)網(wǎng)絡模型;其中,所述神經(jīng)網(wǎng) 絡模型包含輸入層,隱含層,以及,輸出層;所述輸入層和隱含層之間,以及,所述隱含層與 所述輸出層之間通過連接權函數(shù)連接。7. -種特征選擇裝置,其特征在于,包括: 計算模塊,用于計算原始數(shù)據(jù)集中各特征變量之間的相關性,以及,所述原始數(shù)據(jù)集中 各特征變量與預測目標特征變量之間的相關性;其中,所述原始數(shù)據(jù)集包含N維特征變量, 所述N維特征變量包含N-1維所述特征變量和所述預測目標特征變量,所述N為正整數(shù); 獲取模塊,用于根據(jù)所述計算模塊計算出的所述原始數(shù)據(jù)集中各特征變量之間的相關 性,和,所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關性,獲取強相關特征 子集和弱相關特征子集;其中,所述強相關子集中包含的特征變量為所述原始數(shù)據(jù)集中,與 所述預測目標特征變量直接相關的特征變量;所述弱相關子集中包含的特征變量為所述原 始數(shù)據(jù)集中,與所述預測目標特征變量間接相關的特征變量; 確定模塊,用于將所述獲取模塊獲取的所述強相關特征子集中包含的所有特征變量, 以及,所述弱相關特征子集中,與所述強相關特征子集中的特征變量直接相關的特征變量 的集合確定為所述預測目標特征變量的最優(yōu)特征子集。8. 根據(jù)權利要求7所述的特征選擇裝置,其特征在于,所述原始數(shù)據(jù)集還包含Μ組數(shù) 據(jù),所述Μ組數(shù)據(jù)包含訓練數(shù)據(jù)集,其中,每組數(shù)據(jù)中包含在同一時刻采集的所述Ν維特征 變量對應的數(shù)據(jù),所述Μ為正整數(shù); 相應的,所述計算模塊,具體用于: 根據(jù)所述訓練數(shù)據(jù)集中的數(shù)據(jù)計算所述原始數(shù)據(jù)集中各特征變量之間的相關性,以 及,所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關性。9. 根據(jù)權利要求8所述的特征選擇裝置,其特征在于,所述Μ組數(shù)據(jù)還包含評估數(shù)據(jù)集 和測試數(shù)據(jù)集; 相應的,所述獲取模塊,具體用于: 根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性、所述原始數(shù)據(jù)集中各特征變量與預 測目標特征變量之間的相關性、所述評估數(shù)據(jù)集、以及所述測試數(shù)據(jù)集獲取分類模型; 根據(jù)所述分類模型獲取所述強相關特征子集和所述弱相關特征子集。10. 根據(jù)權利要求9所述的特征選擇裝置,其特征在于,所述獲取模塊,具體用于: 根據(jù)所述原始數(shù)據(jù)集中各特征變量之間的相關性,和,所述原始數(shù)據(jù)集中各特征變量 與預測目標特征變量之間的相關性建立初始的貝葉斯網(wǎng)絡模型;其中,所述初始的貝葉斯 網(wǎng)絡模型包含節(jié)點和有向邊,所述節(jié)點表示特征變量,所述有向邊表示與所述有向邊連接 的兩個節(jié)點之間的相關性; 利用所述評估數(shù)據(jù)集迭代訓練所述初始的貝葉斯網(wǎng)絡模型,獲得穩(wěn)定的貝葉斯網(wǎng)絡模 型;其中,所述穩(wěn)定的貝葉斯網(wǎng)絡為包含不可逆的有向邊的貝葉斯網(wǎng)絡模型; 利用所述測試數(shù)據(jù)集測試所述穩(wěn)定的貝葉斯網(wǎng)絡模型,若所述穩(wěn)定的貝葉斯網(wǎng)絡模型 的拓撲結構保持不變,則將所述穩(wěn)定的貝葉斯網(wǎng)絡模型確定為分類模型。11. 根據(jù)權利要求7-10任一項所述的特征選擇裝置,其特征在于,所述確定模塊,具體 用于: 在所述弱相關特征子集中,選擇第一特征變量,將所述第一特征變量加入當前預測模 型,判斷加入所述第一特征變量后的所述當前預測模型的預測精度是否大于所述當前預測 模型的預測精度,其中,所述第一特征變量為所述弱相關特征子集中,與所述預測目標特征 變量的相關性最大的特征變量,所述當前預測模型為初始預測模型或更新后的所述初始預 測模型,所述初始預測模型為以所述強相關特征子集中的特征變量為輸入端建立的預測模 型; 若是,則更新所述當前預測模型,并將所述第一特征變量從所述弱相關特征子集中刪 除,加入第一集合; 若否,則不更新所述當前預測模型,并將所述第一特征變量從所述弱相關特征子集中 刪除; 重復上述過程,直至所述弱相關特征子集中不存在特征變量; 將所述強相關特征子集中的特征變量和所述第一集合中的特征變量的集合確定為所 述預測目標特征變量的最優(yōu)特征子集。12. 根據(jù)權利要求11所述的特征選擇裝置,其特征在于,所述預測模型為神經(jīng)網(wǎng)絡模 型; 相應的,所述確定模塊,具體用于: 以強相關特征子集中包含的特征變量為輸入元構建神經(jīng)網(wǎng)絡模型;其中,所述神經(jīng)網(wǎng) 絡模型包含輸入層,隱含層,以及,輸出層;所述輸入層和隱含層之間,以及,所述隱含層與 所述輸出層之間通過連接權函數(shù)連接。
【專利摘要】本發(fā)明實施例提供一種特征選擇方法及裝置,涉及數(shù)據(jù)挖掘技術領域,基于特征變量之間的相關性確定最優(yōu)特征子集,提高了高維數(shù)據(jù)特征選擇的有效性及運算效率;本發(fā)明實施例提供的特征選擇方法包括:計算原始數(shù)據(jù)集中各特征變量之間,以及,所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關性;根據(jù)所述原始數(shù)據(jù)集中各特征變量之間,以及,所述原始數(shù)據(jù)集中各特征變量與預測目標特征變量之間的相關性,獲取強相關特征子集和弱相關特征子集;將所述強相關特征子集中包含的所有特征變量,以及,所述弱相關特征子集中,與所述強相關特征子集中的特征變量直接相關的特征變量的集合確定為所述預測目標特征變量的最優(yōu)特征子集。
【IPC分類】G06F17/30
【公開號】CN105260371
【申請?zhí)枴緾N201410342523
【發(fā)明人】張世明, 袁明軒, 曾嘉
【申請人】華為技術有限公司
【公開日】2016年1月20日
【申請日】2014年7月17日
當前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1