技術(shù)總結(jié)
本發(fā)明公開了一種數(shù)據(jù)集合的確定方法和裝置。其中,該方法包括:接收到用于指示從多個(gè)第一數(shù)據(jù)集合中獲取目標(biāo)數(shù)據(jù)集合的指令,目標(biāo)數(shù)據(jù)集合的數(shù)據(jù)用于進(jìn)行數(shù)據(jù)分析;根據(jù)第一屬性集合確定每個(gè)第一數(shù)據(jù)集合中每個(gè)實(shí)例數(shù)據(jù)的目標(biāo)概率,目標(biāo)概率為實(shí)例數(shù)據(jù)屬于目標(biāo)類型的概率,第一屬性集合中包括用于指示為目標(biāo)類型的數(shù)據(jù)的屬性;基于每個(gè)第一數(shù)據(jù)集合中所有實(shí)例數(shù)據(jù)的目標(biāo)概率確定每個(gè)第一數(shù)據(jù)集合的采集質(zhì)量信息,采集質(zhì)量信息用于指示按照目標(biāo)類型采集到的第一數(shù)據(jù)集合的質(zhì)量;確定多個(gè)第一數(shù)據(jù)集合中采集質(zhì)量信息滿足預(yù)設(shè)質(zhì)量要求的為用于進(jìn)行數(shù)據(jù)分析的目標(biāo)數(shù)據(jù)集合。本發(fā)明解決了相關(guān)技術(shù)中無(wú)法獲取到質(zhì)量較高的數(shù)據(jù)集合的技術(shù)問(wèn)題。
技術(shù)研發(fā)人員:何彬彬
受保護(hù)的技術(shù)使用者:騰訊科技(深圳)有限公司
文檔號(hào)碼:201710069739
技術(shù)研發(fā)日:2017.02.08
技術(shù)公布日:2017.06.13