亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

預測類別的方法和裝置的制造方法_3

文檔序號:9687449閱讀:來源:國知局
規(guī)預測方法需要分別采用每個預測模型對當前實例的類別進行預測,再結合各個預測模型 給出的預測結果得到最終的預測結果。因此,常規(guī)預測方法需要分別采用多個模型對實例 進行預測,計算量大,而且未考慮標簽的相互關系,影響了最后的預測結果。
[0067] 圖4是根據(jù)本發(fā)明另一實施例的預測的方法的示意性流程圖。應注意,圖4所示 方法是對圖3的常規(guī)技術的改進。為了清楚起見,本實施例W兩個實例XI和x2、兩個標簽 類別、兩個待合并的預測模型為例進行說明。應理解,本發(fā)明的實施例并不限于此,實例、標 簽類別和預測模型的數(shù)目可W為更多個。送里,待合并的預測模型與圖3中的預測模型相 同,在此不再賞述。
[006引本發(fā)明的實施例在合并不同的預測模型時,會考慮到待合并的不同預測模型中各 個標簽的互相關系。例如,兩個標簽分別代表收入和年齡段1-5歲,郝么通常情況下年齡段 1-5歲的人群是沒有收入的,因此,通常情況下高收入者和年齡段1-5歲的人群是矛盾的, 即送兩個標簽具有相互排拆的關系,因此在合并時不會將送兩個標簽合并成一個多標簽類 另IJ。再如,明星和高人氣是具有相互影響關系標簽,因此在合并時,可W將送兩個標簽合并 成一個多標簽類別??紤]到兩個第一預測模型中的各個標簽的互相關系,可W將待合并的 兩個第一預測模型合并為一個第二預測模型,也就是說,將待合并的兩個第一預測模型中 的標簽類別中的標簽合并形成多標簽類別,例如,多標簽類別可W分別為[1,0, 0]、[0, 1,0] 和[0,0,1],從而獲得第二預測模型,如圖4所示。具體而言,在合并兩個第一預測模型時, 可W將兩個第一預測模型中的組合并成第二預測模型中相應的組,例如,將兩個第一預測 模型中的gl合并成第二預測模型中的gl,將兩個第一預測模型中的g2合并成第二預測模 型中的g2,依次類推,并且根據(jù)兩個待合并的第一預測模型中的組與標簽類別的關聯(lián)關系, 確定第二預測模型中的組與多標簽類別的關聯(lián)關系,例如,如果實例XI或x2與兩個第一預 測模型中的哪個組相關聯(lián),則合并后,實例XI或χ2仍舊與第二預測模型中的對應組相關 聯(lián)。送樣,根據(jù)第一預測模型中的組與標簽類別的關系,第二預測模型中的每個組可W連接 到一個特定的多標簽類別上。例如,圖4中,組gl和g4與多標簽類別[1,0, 0]相關聯(lián)、組 g2和巧與多標簽類別[0, 1,0]相關聯(lián)、組的和挑與多標簽類別[0, 0, 1]相關聯(lián)。從圖4 可W看出,當根據(jù)第二預測模型預測實例的類別時,實例XI與組gl、g2、g4和挑總共4個 組相關,由于gl和g4兩個組都與多標簽類別[1,0, 0]相關,gl和g4兩個組占總共四個組 的比例為2/4,可W預測實例XI屬于多標簽類別[1,0, 0]的概率為50%,同理,實例XI屬 于多標簽類別[0, 10]的概率為25%,屬于多標簽類別[0,0, 1]的概率為25%。
[0069] 應理解,圖3和圖4中的例子是為了幫助本領域技術人員更好地理解本發(fā)明實施 例,而非要限制本發(fā)明實施例的范圍。本領域技術人員根據(jù)所給出的圖4的例子,顯然可W 進行各種等價的修改或變化,送樣的修改或變化也落入本發(fā)明實施例的范圍內(nèi)。
[0070] 應理解,上述各過程的執(zhí)行順序應W其功能和內(nèi)在邏輯確定,而不應對本發(fā)明實 施例的實施過程構成任何限定。
[007。 應理解,圖3中的標簽類別的個數(shù)應至少為兩個,圖4中的多標簽類別應至少為兩 個。還應理解,圖3中的標簽類別中可W有一個標簽也可W有多個標簽,圖4中的多標簽類 別中可W有一個標簽也可W有多個標簽。另外,圖3的多個標簽類別中不同的標簽類別中 的標簽的種類可W不同,同樣的,圖4的多個標簽類別中不同的標簽類別中的標簽的種類 可W不同。再有,圖3中的一個標簽類別和圖4中的一個標簽類別中的標簽的種類也可W 不同,圖3中的一個標簽類別和圖4中的一個標簽類別中的標簽的個數(shù)也可W不同,本發(fā)明 實施例并不對此做限定。
[0072] 還應理解,上述實施例中,圖3和圖4中均包括兩個分類器模型,在實際應用中,第 二預測模型中的分類器模型的個數(shù)可W與第一預測模型中的分類器模型的個數(shù)不同,第二 預測模型中的分類器模型中的組與第一預測模型中的分類模型中的組也可W不同,本發(fā)明 實施例并不對此做限定。
[0073] 可選地,可W根據(jù)標簽的相互關系,得到標簽的相關性圖,具體地,如圖5所示,將 圖4中的所有組兩兩相連,當前的組形成的頂點代表了各個組與第二預測模型中相對應的 多標簽類別。根據(jù)該相關性圖,能夠直觀的得標簽的相互關系。
[0074] 根據(jù)圖4中所示的第二預測模型可W確定出具有不確定性的實例,并進行標注, [00巧]具體地,通過實例的信息賭衡量實例是否具有不確定性,在當前實例的信息賭大 于預設闊值時,表明實例具有不確定性,表明當前實例的預測不夠準確,需要獲取專家對當 前實例進行的預測。
[0076] 例如,根據(jù)W下公式確定當前的實例的信息賭:
[0077]
[0078] 其中,i表示第i個實例,Hi表示第i個實例的信息賭,1為大于或等于1且小于 或等于C的整數(shù),表示第1個多標簽類別康示第i個實例屬于第1個多標簽類別的概 率。
[0079] 例如,預設闊值可W為可W Ητ,可W將信息賭Hi > Ητ的實例標注,獲取專家的預 巧1|,換句話說,獲取專家對信息賭大于或等于預設闊值的實例的預測或標注的其多標簽類 另IJ。然后根據(jù)專家的預測或標注對第二預測模型進行訓練,之后使用訓練后的第二預測模 型對于與該不確定性大于預設闊值的實例相關的實例進行預測,能夠提高預測精度,因 此,本發(fā)明實施例方法通過基于不確定性的主動學習方法,能夠提高預測精度。
[0080] 例如,應用于分類預測中,如果實例為某一個人,可W根據(jù)分類器模型中的組對該 實例進行預測其屬于哪一個多標簽類別。例如,有多個多標簽類別,如有3個或4個多標簽 類別,其中,第一個多標簽類別可W為高收入者、中年人、教育行業(yè)和男性,第二個多標簽類 別還可W為高收入者、青年人、IT行業(yè)和女性。分類器模型可W根據(jù)該實例的屬性對該實例 進行預測,并確定出該實例屬于當前的多標簽類別的概率,例如,屬于第一個多標簽類別的 概率為75 %,屬于第二個多標簽類別的概率為25 %,屬于其他多標簽類別的概率均為0 %。 再例如,如果有4個多標簽類別,該實例屬于當前的類別的概率均為25%,表明該實例具有 不確定性,需要將此實例進行標注,獲取專家進行標注其屬于哪一個多標簽類別,或者屬于 哪一個多標簽類別的概率較高。之后將此信息反饋給分類器模型進行訓練。通過基于不確 定性的主動學習方法,能夠提高預測精度。
[0081] 例如,應用于回歸預測中,如果實例可W為出租房,分類器模型可W包括房租的計 算模型、出租房受歡迎程度的計算模型和房屋地理位置計算模型等。可W根據(jù)分類器模型 中的組對該實例進行預測其屬于哪一個多標簽類別,例如,有兩個多標簽類別,第一多標簽 類別中的一個標簽為價格3000-5000元,和另一個標簽為市區(qū)。第一個多標簽類別中的一 個標簽為價格2000-3000元,和另一個標簽為郊區(qū)。同樣可W預測出該出租房屬于哪一個 多標簽類別的概率,如果具有不確定性,同樣需要將此實例進行標注,獲取專家進行標定的 其屬于哪一個多標簽類別,或者屬于哪一個多標簽類別的概率較高。之后將此信息反饋給 分類器模型進行訓練。通過基于不確定性的主動學習方法,能夠提高預測精度。
[0082] 上文結合圖1至圖5詳細描述了本發(fā)明實施例的預測類別的方法,下面將結合圖 6-圖8詳細描述本發(fā)明實施例的預測類別的裝置。
[0083] 圖6是根據(jù)本發(fā)明實施例的一種預測類別的裝置的示意性框圖。如圖6所示的裝 置600包括;確定單元610、合并單元620和第一確定單元630。
[0084] 具體地,確定單元610,用于生成多個第一預測模型,其中,多個第一預測模型中的 每個第一預測模型用于將實例分成多個組,多個組中的每個組對應多個標簽類別中的一個 標簽類別,標簽類別包含至少一個標簽;合并單元620,用于根據(jù)多個第一預測模型中的標 簽之間的相互關系將多個第一預測模型合并為第二預測模型,其中,第二預測模型用于對 實例進行分類得到多個組,第二預測模型的多個組中的每個組對應多個多標簽類別中的一 個多標簽類別,多標簽類別包含多個標簽;第一確定單元630,用于根據(jù)第二預測模型確定 當前的實例屬于多個多標簽類別中的每個多標簽類別的概率,W預測當前的實例的類別。
當前第3頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1