亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備與流程

文檔序號(hào):11515438閱讀:324來(lái)源:國(guó)知局
數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備與流程

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及基于機(jī)器學(xué)習(xí)的數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法、一種數(shù)據(jù)處理裝置、一種存儲(chǔ)設(shè)備及一種網(wǎng)絡(luò)設(shè)備。



背景技術(shù):

帶標(biāo)注結(jié)果的樣本數(shù)據(jù)如標(biāo)注了人臉位置的圖像數(shù)據(jù),或標(biāo)注了人臉表情的圖像數(shù)據(jù),或標(biāo)注了人物年齡的語(yǔ)音數(shù)據(jù)等是用于機(jī)器進(jìn)行訓(xùn)練學(xué)習(xí)的對(duì)象,是機(jī)器學(xué)習(xí)的基礎(chǔ)。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的各類(lèi)互聯(lián)網(wǎng)系統(tǒng)對(duì)樣本數(shù)據(jù)的需求日益增大;例如:隨著深度神經(jīng)網(wǎng)絡(luò)的層級(jí)數(shù)量的增加,深度神經(jīng)網(wǎng)絡(luò)需要的樣本數(shù)據(jù)的數(shù)量可能達(dá)到數(shù)億;再如:社交推薦系統(tǒng)為了獲得較為精準(zhǔn)有效的社交推薦,其可能需要的樣本數(shù)據(jù)的數(shù)量甚至可達(dá)數(shù)千億。然而,與大需求相矛盾的互聯(lián)網(wǎng)現(xiàn)狀則是普遍缺乏樣本數(shù)據(jù),造成此矛盾問(wèn)題的主要原因,是目前樣本數(shù)據(jù)的標(biāo)注過(guò)程由專(zhuān)門(mén)的標(biāo)注人員人工完成,成本較高且使得互聯(lián)網(wǎng)中的樣本數(shù)據(jù)稀缺匱乏。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備,能夠降低樣本數(shù)據(jù)的標(biāo)注成本,擴(kuò)充互聯(lián)網(wǎng)中樣本數(shù)據(jù)的數(shù)量。

一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法,可包括:

獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

優(yōu)選地,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,所述獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)之前,還包括:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù);

若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù),包括:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù),包括:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的標(biāo)識(shí);

若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù),包括:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,所述向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注,包括:

為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行選擇;

若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶(hù)在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

優(yōu)選地,所述采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)之后,還包括:

向所述至少一個(gè)目標(biāo)用戶(hù)輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式;

在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,所述采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果之后,還包括:

將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

另一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理裝置,可包括:

獲取單元,用于獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

輸出單元,用于向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

采集單元,用于采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

學(xué)習(xí)單元,用于采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

優(yōu)選地,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

判斷單元,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù);

處理單元,用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下通知所述獲取單元獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);或者用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,在一種實(shí)施方式中,所述判斷單元包括:

第一信息獲取單元,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

第一確定單元,用于若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,在另一種實(shí)施方式中,所述判斷單元包括:

標(biāo)識(shí)獲取單元,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的標(biāo)識(shí);

第二確定單元,用于若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,在又一種實(shí)施方式中,所述判斷單元包括:

第二信息獲取單元,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

第三確定單元,用于若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

優(yōu)選地,所述輸出單元包括:

方式設(shè)置單元,用于為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

數(shù)據(jù)輸出單元,用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行選擇;或用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶(hù)在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

提示單元,用于向所述至少一個(gè)目標(biāo)用戶(hù)輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式,并通知所述處理單元在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行身份驗(yàn)證。

優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

添加單元,用于將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

再一方面,本發(fā)明實(shí)施例提供一種存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有一條或一條以上指令,所述一條或一條以上指令適于由處理器加載并執(zhí)行本發(fā)明實(shí)施例所述的數(shù)據(jù)處理方法。

再一方面,本發(fā)明實(shí)施例提供一種網(wǎng)絡(luò)設(shè)備,包括:

處理器,適于實(shí)現(xiàn)一條或一條以上指令;以及,

存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有一條或一條以上指令,所述一條或一條以上指令適于由所述處理器加載并執(zhí)行本發(fā)明實(shí)施例所述的數(shù)據(jù)處理方法。

本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實(shí)施例提供的一種標(biāo)注頁(yè)面的示意圖;

圖2為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法的流程圖;

圖3為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理方法的流程圖;

圖4a為本發(fā)明實(shí)施例提供的另一種標(biāo)注頁(yè)面的示意圖;

圖4b為本發(fā)明實(shí)施例提供的另一種標(biāo)注頁(yè)面的示意圖;

圖4c為本發(fā)明實(shí)施例提供的又一種標(biāo)注頁(yè)面的示意圖;

圖5為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;

圖6為本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。

機(jī)器學(xué)習(xí)是一種涉及多領(lǐng)域交叉學(xué)科的技術(shù),主要涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科,其用于專(zhuān)門(mén)研究機(jī)器如何模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為以獲取新知識(shí)或新技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。此處的機(jī)器可指計(jì)算機(jī)、電子計(jì)算機(jī)、神經(jīng)計(jì)算機(jī)等等設(shè)備。目前,機(jī)器學(xué)習(xí)被廣泛應(yīng)用于各類(lèi)互聯(lián)網(wǎng)場(chǎng)景中,例如可應(yīng)用于:數(shù)據(jù)挖掘場(chǎng)景、計(jì)算機(jī)視覺(jué)場(chǎng)景、自然語(yǔ)言處理場(chǎng)景、神經(jīng)網(wǎng)絡(luò)的構(gòu)建場(chǎng)景、信息推薦場(chǎng)景等等。帶標(biāo)注結(jié)果的樣本數(shù)據(jù)是用于機(jī)器進(jìn)行訓(xùn)練學(xué)習(xí)的對(duì)象,是機(jī)器學(xué)習(xí)的基礎(chǔ),例如:標(biāo)注了人臉位置的圖像數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);或者,標(biāo)注了人臉表情的圖像數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);或者,標(biāo)注了人物年齡的語(yǔ)音數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);等等。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的各類(lèi)互聯(lián)網(wǎng)系統(tǒng)對(duì)樣本數(shù)據(jù)的需求日益增大;例如:隨著深度神經(jīng)網(wǎng)絡(luò)的層級(jí)數(shù)量的增加,深度神經(jīng)網(wǎng)絡(luò)需要的樣本數(shù)據(jù)的數(shù)量可能達(dá)到數(shù)億;再如:社交推薦系統(tǒng)為了獲得較為精準(zhǔn)有效的社交推薦,其可能需要的樣本數(shù)據(jù)的數(shù)量甚至可達(dá)數(shù)千億。然而,與大需求相矛盾的互聯(lián)網(wǎng)現(xiàn)狀則是普遍缺乏樣本數(shù)據(jù),這主要表現(xiàn)為兩方面,一方面是樣本數(shù)據(jù)的種類(lèi)匱乏;例如:互聯(lián)網(wǎng)中可能存在關(guān)于人臉位置的樣本數(shù)據(jù),但是關(guān)于人臉性別、人臉年齡、人臉表情、人臉姿勢(shì)等樣本數(shù)據(jù)卻十分缺乏。另一方面是樣本數(shù)據(jù)的數(shù)量嚴(yán)重不足;例如:目前存在于互聯(lián)網(wǎng)中的關(guān)于語(yǔ)音、物體、動(dòng)物、自動(dòng)駕駛等各類(lèi)樣本數(shù)據(jù)的量較少。造成此矛盾問(wèn)題的主要原因,是目前樣本數(shù)據(jù)的標(biāo)注過(guò)程由專(zhuān)門(mén)的標(biāo)注人員人工完成,成本較高且使得互聯(lián)網(wǎng)中的樣本數(shù)據(jù)稀缺匱乏。

實(shí)際上,一個(gè)樣本數(shù)據(jù)的一次標(biāo)注過(guò)程需要的是“短暫的注意力”;例如:針對(duì)某張照片或者某段語(yǔ)音體現(xiàn)出的情緒指數(shù)進(jìn)行標(biāo)注時(shí),假設(shè)情緒指數(shù)設(shè)置如下:1、沮喪;2、一般沮喪;3、平和;4、開(kāi)心;5、很開(kāi)心;此標(biāo)注過(guò)程僅需要標(biāo)注人員在該照片或語(yǔ)音持續(xù)數(shù)秒的注意力即可完成。仔細(xì)分析可知,互聯(lián)網(wǎng)本身即可提供大量這類(lèi)“短暫的注意力”,例如:為了保證互聯(lián)網(wǎng)用戶(hù)在應(yīng)用登錄、電子商務(wù)過(guò)程或其他應(yīng)用場(chǎng)景中的安全性,互聯(lián)網(wǎng)場(chǎng)景通常設(shè)有驗(yàn)證系統(tǒng),該驗(yàn)證系統(tǒng)要求用戶(hù)進(jìn)行諸如輸入驗(yàn)證碼等身份驗(yàn)證步驟,此類(lèi)驗(yàn)證步驟需要用戶(hù)付出“短暫的注意力”認(rèn)真看驗(yàn)證碼圖片、認(rèn)真輸入正確結(jié)果以便盡快通過(guò)驗(yàn)證?;诖?,本發(fā)明實(shí)施例利用互聯(lián)網(wǎng)所提供的大量“短暫的注意力”,收集多個(gè)互聯(lián)網(wǎng)用戶(hù)在身份驗(yàn)證過(guò)程中通過(guò)“短暫的注意力”所產(chǎn)生的較為可靠的輸出來(lái)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,并且基于機(jī)器學(xué)習(xí)獲得樣本數(shù)據(jù)的標(biāo)注結(jié)果,大大降低樣本數(shù)據(jù)的標(biāo)注成本,擴(kuò)充互聯(lián)網(wǎng)中樣本數(shù)據(jù)的數(shù)量。本發(fā)明實(shí)施例的主要思想如下:傳統(tǒng)的驗(yàn)證系統(tǒng)僅包含驗(yàn)證模式,也就是說(shuō)用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)即在驗(yàn)證模式下執(zhí)行身份驗(yàn)證的步驟,例如:某用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),在驗(yàn)證模式下向用戶(hù)輸出驗(yàn)證碼圖片,要求用戶(hù)填寫(xiě)并提交正確的驗(yàn)證碼以通過(guò)驗(yàn)證。本發(fā)明實(shí)施例的驗(yàn)證系統(tǒng)在驗(yàn)證模式的基礎(chǔ)上增加標(biāo)注模式,例如:用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),首先在標(biāo)注模式下完成對(duì)樣本數(shù)據(jù)的標(biāo)注,再切換至驗(yàn)證模式下向用戶(hù)輸出驗(yàn)證碼圖片要求用戶(hù)填寫(xiě)并提交正確的驗(yàn)證碼以通過(guò)驗(yàn)證。

下面結(jié)合圖1對(duì)本發(fā)明實(shí)施例的方案進(jìn)行簡(jiǎn)單闡述。假設(shè)要對(duì)圖1所示人臉照片體現(xiàn)出的情緒指數(shù)進(jìn)行標(biāo)注,并設(shè)置情緒指數(shù)如下:1、沮喪;2、一般沮喪;3、平和;4、開(kāi)心;5、很開(kāi)心;那么,本發(fā)明實(shí)施例的方案如下:當(dāng)互聯(lián)網(wǎng)中的用戶(hù)a進(jìn)入驗(yàn)證系統(tǒng)時(shí),首先在標(biāo)注模式下對(duì)用戶(hù)a展示該人臉照片及情緒指數(shù)選項(xiàng)要求用戶(hù)a選擇;同理,對(duì)進(jìn)入驗(yàn)證系統(tǒng)的互聯(lián)網(wǎng)的用戶(hù)b、用戶(hù)c、用戶(hù)d等其他用戶(hù)在標(biāo)注模式下展示同一張人臉照片及情緒指數(shù)要求其進(jìn)行情緒指數(shù)的選擇;可以理解的是,用戶(hù)對(duì)情緒指數(shù)的選擇可能是真實(shí)的、隨意的,甚至是無(wú)意義的。本發(fā)明實(shí)施例一方面收集所有用戶(hù)對(duì)同一張人臉照片所選擇的情緒指數(shù),這些選擇數(shù)據(jù)必然具有一定的分布規(guī)律,采用機(jī)器學(xué)習(xí)方法識(shí)別其中的有效數(shù)據(jù),最后得到該人臉照片關(guān)于情緒指數(shù)的標(biāo)注結(jié)果。另一方面在收集到各用戶(hù)所選擇的情緒指數(shù)之后,分別向各用戶(hù)輸出如“錯(cuò)誤,請(qǐng)重新選擇”類(lèi)似的驗(yàn)證失敗提示信息,然后從標(biāo)注模式切換至驗(yàn)證模式并在驗(yàn)證模式下采用互聯(lián)網(wǎng)已有的素材數(shù)據(jù)對(duì)各用戶(hù)進(jìn)行重新驗(yàn)證,例如向用戶(hù)輸出驗(yàn)證碼圖片要求用戶(hù)填寫(xiě)并提交正確的驗(yàn)證碼以通過(guò)驗(yàn)證。由上述例子可知,本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

基于上述描述,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法,請(qǐng)參見(jiàn)圖2,該方法可包括以下步驟s101-步驟s104。

s101,獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

傳統(tǒng)的驗(yàn)證系統(tǒng)是提供身份驗(yàn)證服務(wù)的系統(tǒng),例如:互聯(lián)網(wǎng)用戶(hù)進(jìn)行應(yīng)用登錄、電子商務(wù)等過(guò)程中會(huì)進(jìn)入驗(yàn)證系統(tǒng)進(jìn)行身份驗(yàn)證,如輸出驗(yàn)證碼圖片要求用戶(hù)填寫(xiě)并提交正確驗(yàn)證碼以確認(rèn)為非機(jī)器操作,以保證登錄或交易安全。本發(fā)明實(shí)施例的驗(yàn)證系統(tǒng)在提供身份驗(yàn)證服務(wù)的同時(shí),還提供樣本標(biāo)注服務(wù);按照上述例子:在互聯(lián)網(wǎng)用戶(hù)進(jìn)行應(yīng)用登錄、電子商務(wù)等過(guò)程中進(jìn)入驗(yàn)證系統(tǒng)進(jìn)行身份驗(yàn)證之前,首先讓互聯(lián)網(wǎng)用戶(hù)完成對(duì)樣本數(shù)據(jù)的標(biāo)注并收集互聯(lián)網(wǎng)用戶(hù)的標(biāo)注數(shù)據(jù),然后再對(duì)互聯(lián)網(wǎng)用戶(hù)執(zhí)行如輸出驗(yàn)證碼圖片要求用戶(hù)填寫(xiě)并提交正確驗(yàn)證碼的驗(yàn)證步驟。本發(fā)明實(shí)施例中,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本。所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。本步驟中,可從樣本庫(kù)中隨機(jī)選取一個(gè)樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù),或者,根據(jù)實(shí)際需要從樣本庫(kù)中指定一個(gè)樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù)。

s102,向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

可按照一定的格式輸出目標(biāo)樣本數(shù)據(jù),例如:可以在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)輸出該目標(biāo)樣本數(shù)據(jù)的一些可選的標(biāo)注數(shù)據(jù),這樣目標(biāo)用戶(hù)可以通過(guò)選擇一個(gè)標(biāo)注數(shù)據(jù)來(lái)完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注;或者,可以在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示輸入框,這樣目標(biāo)用戶(hù)可以通過(guò)手動(dòng)輸入標(biāo)注數(shù)據(jù)來(lái)完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注。

s103,采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)。

每個(gè)目標(biāo)用戶(hù)對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注會(huì)產(chǎn)生標(biāo)注數(shù)據(jù),如圖1所示,假設(shè)用戶(hù)a選擇“3、平和”,那么“3、平和”即為用戶(hù)a對(duì)人臉照片進(jìn)行標(biāo)注產(chǎn)生的標(biāo)注數(shù)據(jù);同理,用戶(hù)b選擇“2、一般沮喪”,那么“2、一般沮喪”為用戶(hù)b對(duì)人臉照片標(biāo)注產(chǎn)生的標(biāo)注數(shù)據(jù)。本步驟s103收集每一個(gè)目標(biāo)用戶(hù)分別對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的標(biāo)注數(shù)據(jù)。

s104,采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

目標(biāo)樣本數(shù)據(jù)的各標(biāo)注數(shù)據(jù)可能是真實(shí)的、隨意的,甚至是無(wú)意義的,但是這些標(biāo)注數(shù)據(jù)必然具有一定的分布規(guī)律,可以采用機(jī)器學(xué)習(xí)算法對(duì)這些標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,得到目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果;此處,機(jī)器學(xué)習(xí)算法可以包括但不限于:異常檢測(cè)算法、協(xié)同過(guò)濾算法、決策樹(shù)算法、最優(yōu)化算法等等。

本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量。

本發(fā)明實(shí)施例提供另一種數(shù)據(jù)處理方法,請(qǐng)參見(jiàn)圖3,該方法可包括以下步驟s201-步驟s208。

s201,當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù);若判斷結(jié)果為是,確定進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù),進(jìn)而轉(zhuǎn)入執(zhí)行s202;若判斷結(jié)果為否,確定進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù),進(jìn)入轉(zhuǎn)入執(zhí)行s208。

本發(fā)明實(shí)施例可以借助于所有互聯(lián)網(wǎng)用戶(hù)對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)注;但為了提升用戶(hù)體驗(yàn),優(yōu)選地,可選取一部分互聯(lián)網(wǎng)用戶(hù)作為目標(biāo)用戶(hù)來(lái)對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)注;步驟s201的判斷過(guò)程即是確定目標(biāo)用戶(hù)的過(guò)程;具體實(shí)現(xiàn)中,步驟s201至少包括以下三種可行的實(shí)施方式:

在一種可行的實(shí)施方式中,步驟s201可包括以下步驟s11-s13:

s11,當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次。

s12,若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù)。

s13,若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

步驟s11-s13采用的是隨機(jī)方式確定目標(biāo)用戶(hù),即根據(jù)歷史標(biāo)注的頻次隨機(jī)選取目標(biāo)用戶(hù)。其中,一個(gè)用戶(hù)的歷史標(biāo)注信息記錄了該用戶(hù)在預(yù)定周期內(nèi)執(zhí)行標(biāo)注操作的總次數(shù);比如:某用戶(hù)a在最近一個(gè)小時(shí)內(nèi)分別對(duì)樣本數(shù)據(jù)a進(jìn)行一次標(biāo)注,對(duì)樣本數(shù)據(jù)b進(jìn)行兩次標(biāo)注,對(duì)樣本數(shù)據(jù)c進(jìn)行一次標(biāo)注;那么,用戶(hù)a的歷史標(biāo)注信息記錄該用戶(hù)a的標(biāo)注頻次為4次/小時(shí)。一個(gè)用戶(hù)對(duì)應(yīng)一個(gè)歷史標(biāo)注信息,各用戶(hù)的歷史標(biāo)注信息可存儲(chǔ)至本地或云端存儲(chǔ)空間中,并根據(jù)用戶(hù)的標(biāo)注操作進(jìn)行實(shí)時(shí)更新,因此可以從本地或云端存儲(chǔ)空間中獲得用戶(hù)的歷史標(biāo)注信息。第一預(yù)設(shè)閥值可以根據(jù)實(shí)際需要進(jìn)行確定,例如:該第一預(yù)設(shè)閥值可以為5次/小時(shí),2次/分鐘等等。如果某用戶(hù)的標(biāo)注頻次大于或等于第一預(yù)設(shè)閥值,表明該用戶(hù)在預(yù)設(shè)周期內(nèi)已經(jīng)進(jìn)行過(guò)多次樣本數(shù)據(jù)的標(biāo)注操作,若驗(yàn)證過(guò)程中過(guò)于頻繁要求該用戶(hù)進(jìn)行標(biāo)注操作可能會(huì)影響該用戶(hù)的使用體驗(yàn),因此可將該用戶(hù)確定為普通用戶(hù),當(dāng)前預(yù)設(shè)周期內(nèi)不再進(jìn)行標(biāo)注操作;反之,如果某用戶(hù)的標(biāo)注頻次小于第一預(yù)設(shè)閥值,表明該用戶(hù)在預(yù)設(shè)周期內(nèi)進(jìn)行樣本數(shù)據(jù)的標(biāo)注操作次數(shù)較少,若驗(yàn)證過(guò)程中再次要求該用戶(hù)進(jìn)行標(biāo)注操作并不會(huì)影響該用戶(hù)的使用體驗(yàn),因此可將該用戶(hù)確定為目標(biāo)用戶(hù)進(jìn)入后續(xù)流程執(zhí)行標(biāo)注操作。

在另一種可行的實(shí)施方式中,該s201可包括以下步驟s21-s23。

s21,當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的標(biāo)識(shí)。

s22,若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù)。

s23,若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

步驟s21-s23采用的是定向方式確定目標(biāo)用戶(hù),即預(yù)先選定一些目標(biāo)用戶(hù)。其中,預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí)是預(yù)先選取的目標(biāo)用戶(hù)的標(biāo)識(shí);此處的標(biāo)識(shí)可以包括但不限于:即時(shí)通訊標(biāo)識(shí)(如qq號(hào)、微信號(hào)等)、sns標(biāo)識(shí)(如微博號(hào)、博客號(hào)等)、通信標(biāo)識(shí)(如手機(jī)號(hào)、座機(jī)號(hào)等)、email號(hào)等等。如果進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)標(biāo)識(shí)是預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則可確定該用戶(hù)為目標(biāo)用戶(hù);否則確定該用戶(hù)為普通用戶(hù)。

在又一種可行的實(shí)施方式中,該s201可包括以下步驟s31-s33。

s31,當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率。

s32,若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù)。

s33,若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

步驟s31-s33采用的是篩選方式確定目標(biāo)用戶(hù),即根據(jù)歷史驗(yàn)證的成功率篩選符合條件的目標(biāo)用戶(hù)。其中,一個(gè)用戶(hù)的歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;比如:某用戶(hù)a在以驗(yàn)證碼進(jìn)行身份驗(yàn)證的過(guò)程中,第1次至第n-1次所提交的驗(yàn)證碼均錯(cuò)誤,在第n次提交正確驗(yàn)證碼,那么用戶(hù)a的成功率為1/n(n為正整數(shù))。一個(gè)用戶(hù)對(duì)應(yīng)一個(gè)歷史驗(yàn)證信息,各用戶(hù)的歷史驗(yàn)證信息可存儲(chǔ)至本地或云端存儲(chǔ)空間中,并根據(jù)用戶(hù)的驗(yàn)證過(guò)程進(jìn)行實(shí)時(shí)更新,因此可以從本地或云端存儲(chǔ)空間中獲得用戶(hù)的歷史驗(yàn)證信息。第二預(yù)設(shè)閥值可以根據(jù)實(shí)際需要進(jìn)行確定,例如:該第二預(yù)設(shè)閥值可以為1/2,1/3等等。如果某用戶(hù)的驗(yàn)證成功率大于或等于第二預(yù)設(shè)閥值,表明該用戶(hù)通常較為認(rèn)真的完成驗(yàn)證過(guò)程,其提交的數(shù)據(jù)較為真實(shí)且可信度較高,適于將該用戶(hù)確定為目標(biāo)用戶(hù)以進(jìn)行樣本數(shù)據(jù)的標(biāo)注操作。反之如果某用戶(hù)的驗(yàn)證成功率小于第二預(yù)設(shè)閥值,表明該用戶(hù)在驗(yàn)證過(guò)程通常表現(xiàn)得較為隨意,其提交的數(shù)據(jù)真實(shí)性較低且可信度較低,不適于讓該用戶(hù)來(lái)執(zhí)行樣本數(shù)據(jù)的標(biāo)注操作,因此可將該用戶(hù)確定為普通用戶(hù)。

實(shí)際應(yīng)用中,上述三種實(shí)施方式可靈活選擇,如果確定目標(biāo)用戶(hù)進(jìn)入驗(yàn)證系統(tǒng),則轉(zhuǎn)入步驟s202在標(biāo)注模式下執(zhí)行后續(xù)對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注過(guò)程;如果確定是普通用戶(hù)進(jìn)入驗(yàn)證系統(tǒng),那么轉(zhuǎn)入步驟s208在驗(yàn)證模式下對(duì)該普通用戶(hù)進(jìn)行身份驗(yàn)證。

s202,啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

本步驟s202可參見(jiàn)圖2所示的步驟s101,在此不贅述。其中,目標(biāo)樣本數(shù)據(jù)是樣本庫(kù)中的任一個(gè)樣本數(shù)據(jù),其可以為圖像,例如:人臉圖像、動(dòng)物圖像等等;其也可以是語(yǔ)音,例如:一段人說(shuō)話(huà)的語(yǔ)音、一段歌曲等等;其還可以是文本,例如:一句話(huà)、一個(gè)單詞等等。

s203,向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

根據(jù)目標(biāo)樣本數(shù)據(jù)的類(lèi)型可靈活選擇輸出方式,例如:若目標(biāo)樣本數(shù)據(jù)為圖像、文本,那么可以通過(guò)顯示方式進(jìn)行輸出;再如:若目標(biāo)樣本數(shù)據(jù)為語(yǔ)音,那么可通過(guò)喇叭播放方式進(jìn)行輸出。輸出目標(biāo)樣本數(shù)據(jù)的目的在于讓目標(biāo)用戶(hù)通過(guò)感官系統(tǒng)(眼、耳、口、鼻)認(rèn)知目標(biāo)樣本數(shù)據(jù),并通過(guò)聽(tīng)說(shuō)讀寫(xiě)完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注。具體實(shí)現(xiàn)中,步驟s203可具體包括以下步驟s41-s43。

s41,為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式。

s42,若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行選擇。

s43,若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶(hù)在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

步驟s41-s43定義了目標(biāo)用戶(hù)采用何種方式對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;具體地,若目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,則在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示至少一個(gè)待選標(biāo)注數(shù)據(jù),目標(biāo)用戶(hù)直接選擇一個(gè)標(biāo)注數(shù)據(jù)即可完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注;此處,至少一個(gè)待選標(biāo)注數(shù)據(jù)既可以被封裝為選項(xiàng)(如圖1所示),此時(shí)目標(biāo)用戶(hù)可點(diǎn)擊選項(xiàng)從而選中一個(gè)標(biāo)注數(shù)據(jù)。至少一個(gè)待選標(biāo)注數(shù)據(jù)也可以被封裝至滑動(dòng)區(qū)域(如圖4a所示),此時(shí)目標(biāo)用戶(hù)通過(guò)在滑動(dòng)區(qū)域操作滑塊來(lái)選中一個(gè)標(biāo)注數(shù)據(jù)。若目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為為輸入方式,則在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示輸入框,由目標(biāo)用戶(hù)在輸入框中直接輸入標(biāo)注數(shù)據(jù)完成標(biāo)注;此處,輸入框可以是文本輸入框(如圖4b所示),也可以是語(yǔ)音輸入框(如圖4c所示)。

s204,采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);之后,轉(zhuǎn)入執(zhí)行步驟s205-s206;并且,轉(zhuǎn)入執(zhí)行步驟s207-s208。

s205,采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

步驟s204-s205可以參見(jiàn)圖2所示實(shí)施例的步驟s103-s104,在此不贅述。

s206,將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

s207,向所述至少一個(gè)目標(biāo)用戶(hù)輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式。

s208,啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

本發(fā)明實(shí)施例中,步驟s204收集到至少一個(gè)目標(biāo)用戶(hù)的標(biāo)注數(shù)據(jù)之后,會(huì)進(jìn)入兩個(gè)處理邏輯,其中一個(gè)處理邏輯為步驟s205-s206;另一個(gè)處理邏輯為步驟s207-s208。一方面,如果步驟s204收集到的標(biāo)注數(shù)據(jù)達(dá)到預(yù)設(shè)數(shù)量之后,此處的預(yù)設(shè)數(shù)量可根據(jù)實(shí)際需要進(jìn)行設(shè)定,為了保證準(zhǔn)確性,通??蓪㈩A(yù)設(shè)數(shù)量設(shè)置較大,如幾百、幾千、幾萬(wàn)等,以保證有足夠數(shù)量的標(biāo)注數(shù)據(jù);然后進(jìn)入步驟s205-s206通過(guò)機(jī)器學(xué)習(xí)算法對(duì)至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)得到目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果,至此獲得了一個(gè)帶標(biāo)注結(jié)果的、可用于機(jī)器學(xué)習(xí)訓(xùn)練的樣本數(shù)據(jù);最后將該帶有標(biāo)注結(jié)果的目標(biāo)樣本數(shù)據(jù)作為素材數(shù)據(jù)添加至素材庫(kù)中,這樣既擴(kuò)充了互聯(lián)網(wǎng)中用于訓(xùn)練學(xué)習(xí)的樣本數(shù)據(jù),又?jǐn)U充了互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中用于身份驗(yàn)證的素材數(shù)據(jù)。另一方面,步驟s204收集到各目標(biāo)用戶(hù)的標(biāo)注數(shù)據(jù)之后,會(huì)進(jìn)入步驟s207-s208分別向各目標(biāo)用戶(hù)輸出諸如“錯(cuò)誤,請(qǐng)重新選擇”,或者“錯(cuò)誤,請(qǐng)重新輸入”等驗(yàn)證失敗提示信息,以提醒目標(biāo)用戶(hù)重新在驗(yàn)證模式下進(jìn)行身份驗(yàn)證。

本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量?;谏鲜龇椒▽?shí)施例的描述,本發(fā)明實(shí)施例還公開(kāi)了一種數(shù)據(jù)處理裝置,該數(shù)據(jù)處理裝置可以是一個(gè)計(jì)算機(jī)程序(包括程序代碼),且該計(jì)算機(jī)程序可以運(yùn)行于終端(如pc(personalcomputer,個(gè)人計(jì)算機(jī))、手機(jī)等)、單個(gè)服務(wù)器或集群服務(wù)設(shè)備等網(wǎng)絡(luò)設(shè)備中以用來(lái)執(zhí)行圖2-圖3任一實(shí)施例所示的數(shù)據(jù)處理方法。請(qǐng)一并參見(jiàn)圖5,該數(shù)據(jù)處理裝置運(yùn)行如下單元:

獲取單元101,用于獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

輸出單元102,用于向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

采集單元103,用于采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)。

學(xué)習(xí)單元104,用于采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

具體實(shí)現(xiàn)中,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

具體實(shí)現(xiàn)中,該該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

判斷單元105,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù)。

處理單元106,用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下通知所述獲取單元獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);或者用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

在一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過(guò)程中具體運(yùn)行如下單元:

第一信息獲取單元1001,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次。

第一確定單元1002,用于若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

在另一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過(guò)程中具體運(yùn)行如下單元:

標(biāo)識(shí)獲取單元1011,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的標(biāo)識(shí)。

第二確定單元1012,用于若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

在又一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過(guò)程中具體運(yùn)行如下單元:

第二信息獲取單元1111,用于當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率。

第三確定單元1112,用于若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);或用于若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置在運(yùn)行所述輸出單元102的過(guò)程中具體運(yùn)行如下單元:

方式設(shè)置單元2001,用于為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式。

數(shù)據(jù)輸出單元2002,用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行選擇;或用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶(hù)在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

提示單元107,用于向所述至少一個(gè)目標(biāo)用戶(hù)輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式,并通知所述處理單元在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行身份驗(yàn)證。

具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

添加單元108,用于將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

根據(jù)本發(fā)明的一個(gè)實(shí)施例,圖2所示的數(shù)據(jù)處理方法涉及的各步驟可以是由圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元來(lái)執(zhí)行的。例如,圖2中所示的步驟s101-s104可以分別由圖5中所示的獲取單元101、輸出單元102、采集單元103和學(xué)習(xí)單元104來(lái)執(zhí)行。

根據(jù)本發(fā)明的另一個(gè)實(shí)施例,圖3所示的數(shù)據(jù)處理方法涉及的各步驟也可以是由圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元來(lái)執(zhí)行的。例如,圖3中所示的步驟s201-s208可以由圖5中所示的判斷單元105、獲取單元101、輸出單元102、采集單元103、學(xué)習(xí)單元104、處理單元106、添加單元108和提示單元107來(lái)執(zhí)行;其中,圖3中所示的步驟s11,s12-s13可以由圖5中所示的第一信息獲取單元1001和第一確定單元1002來(lái)執(zhí)行;步驟s21,s22-s23可以由圖5中所示的標(biāo)識(shí)獲取單元1011和第二確定單元1012來(lái)執(zhí)行;步驟s31,s32-s33可以由圖5中所示的第二信息獲取單元1111和第三確定單元1112來(lái)執(zhí)行;步驟s41-s42可以由圖5中所示的方式設(shè)置單元2001和數(shù)據(jù)輸出單元2002來(lái)執(zhí)行。

根據(jù)本發(fā)明的再一個(gè)實(shí)施例,圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元可以分別或全部合并為一個(gè)或若干個(gè)另外的單元來(lái)構(gòu)成,或者其中的某個(gè)(些)單元還可以再拆分為功能上更小的多個(gè)單元來(lái)構(gòu)成,這可以實(shí)現(xiàn)同樣的操作,而不影響本發(fā)明的實(shí)施例的技術(shù)效果的實(shí)現(xiàn)。上述單元是基于邏輯功能劃分的,在實(shí)際應(yīng)用中,一個(gè)單元的功能也可以由多個(gè)單元來(lái)實(shí)現(xiàn),或者多個(gè)單元的功能由一個(gè)單元實(shí)現(xiàn)。在本發(fā)明的其它實(shí)施例中,數(shù)據(jù)處理裝置也可以包括其它單元,在實(shí)際應(yīng)用中,這些功能也可以由其它單元協(xié)助實(shí)現(xiàn),并且可以由多個(gè)單元協(xié)作實(shí)現(xiàn)。

根據(jù)本發(fā)明的又一個(gè)實(shí)施例,可以通過(guò)在包括中央處理單元(cpu)、隨機(jī)存取存儲(chǔ)設(shè)備(ram)、只讀存儲(chǔ)設(shè)備(rom)等處理元件和存儲(chǔ)元件的例如計(jì)算機(jī)的通用計(jì)算設(shè)備上運(yùn)行能夠執(zhí)行如圖2或圖3中所示的數(shù)據(jù)處理方法,來(lái)構(gòu)造如圖5中所示的數(shù)據(jù)處理裝置設(shè)備,以及來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)處理方法。所述計(jì)算機(jī)程序可以記載于例如計(jì)算機(jī)可讀記錄介質(zhì)上,并通過(guò)計(jì)算機(jī)可讀記錄介質(zhì)裝載于上述計(jì)算設(shè)備中,并在其中運(yùn)行。

本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

本發(fā)明實(shí)施例還提供了一種網(wǎng)絡(luò)設(shè)備,該網(wǎng)絡(luò)設(shè)備可以是諸如pc(personalcomputer,個(gè)人計(jì)算機(jī))、手機(jī)、pda(平板電腦)等終端設(shè)備,也可以是諸如應(yīng)用服務(wù)器、集群服務(wù)器等服務(wù)設(shè)備。請(qǐng)參見(jiàn)圖6,該網(wǎng)絡(luò)設(shè)備的內(nèi)部結(jié)構(gòu)可包括但不限于:處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器。其中,網(wǎng)絡(luò)設(shè)備內(nèi)的處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器可通過(guò)總線(xiàn)或其他方式連接,在本發(fā)明實(shí)施例所示圖6中以通過(guò)總線(xiàn)連接為例。

其中,處理器(或稱(chēng)cpu(centralprocessingunit,中央處理器))是網(wǎng)絡(luò)設(shè)備的計(jì)算核心以及控制核心。網(wǎng)絡(luò)接口可選的可以包括標(biāo)準(zhǔn)的有線(xiàn)接口、無(wú)線(xiàn)接口(如wi-fi、移動(dòng)通信接口等)。存儲(chǔ)設(shè)備(memory)是網(wǎng)絡(luò)設(shè)備中的記憶設(shè)備,用于存放程序和數(shù)據(jù)??梢岳斫獾氖?,此處的存儲(chǔ)設(shè)備可以是高速ram存儲(chǔ)設(shè)備,也可以是非不穩(wěn)定的存儲(chǔ)設(shè)備(non-volatilememory),例如至少一個(gè)磁盤(pán)存儲(chǔ)設(shè)備;可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器的存儲(chǔ)裝置。存儲(chǔ)設(shè)備提供存儲(chǔ)空間,該存儲(chǔ)空間存儲(chǔ)了網(wǎng)絡(luò)設(shè)備的操作系統(tǒng),可包括但不限于:windows系統(tǒng)(一種操作系統(tǒng))、linux(一種操作系統(tǒng))、android(安卓,一種移動(dòng)操作系統(tǒng))系統(tǒng)、ios(一種移動(dòng)操作系統(tǒng))系統(tǒng)等等,本發(fā)明對(duì)此并不作限定;并且,在該存儲(chǔ)空間中還存放了適于被處理器加載并執(zhí)行的一條或一條以上的指令,這些指令可以是一個(gè)或一個(gè)以上的計(jì)算機(jī)程序(包括程序代碼)。

在本發(fā)明實(shí)施例中,處理器加載并執(zhí)行存儲(chǔ)設(shè)備中存放的一條或一條以上指令,以實(shí)現(xiàn)上述圖2-圖3所示方法流程的相應(yīng)步驟;具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行如下步驟:

獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)的步驟之前,還執(zhí)行如下步驟:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù);

若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

若進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù),則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)進(jìn)行身份驗(yàn)證。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù)的步驟時(shí),具體執(zhí)行如下步驟:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù)的步驟時(shí),具體執(zhí)行如下步驟:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的標(biāo)識(shí);

若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶(hù)標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)是否為目標(biāo)用戶(hù)的步驟時(shí),具體執(zhí)行如下步驟:

當(dāng)檢測(cè)到任一用戶(hù)進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為目標(biāo)用戶(hù);

若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶(hù)為普通用戶(hù)。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注的步驟時(shí),具體執(zhí)行如下步驟:

為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行選擇;

若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶(hù)輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶(hù)在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述采集所述至少一個(gè)目標(biāo)用戶(hù)對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)步驟之后,還執(zhí)行如下步驟:

向所述至少一個(gè)目標(biāo)用戶(hù)輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式;

在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶(hù)進(jìn)行身份驗(yàn)證。

具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果的步驟之后,還執(zhí)行如下步驟:

將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶(hù)在驗(yàn)證過(guò)程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶(hù)實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書(shū)中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。

此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。

流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。

應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門(mén)電路的離散邏輯電路,具有合適的組合邏輯門(mén)電路的專(zhuān)用集成電路,可編程門(mén)陣列(pga),現(xiàn)場(chǎng)可編程門(mén)陣列(fpga)等。此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。

以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1