1.一種基于腦電信號(hào)的詞向量計(jì)算方法,其特征在于,所述方法包括以下步驟:
步驟S1,收集文本語(yǔ)料庫(kù),對(duì)文本語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行處理,得到以詞組為單位的連續(xù)短語(yǔ)格式的語(yǔ)料;
步驟S2,將所述連續(xù)短語(yǔ)格式的語(yǔ)料呈現(xiàn)給標(biāo)注者,供標(biāo)注者閱讀,采集標(biāo)注者閱讀每一詞組時(shí)的腦電信號(hào);
步驟S3,將采集到的詞組對(duì)應(yīng)的腦電信號(hào)作為預(yù)測(cè)目標(biāo),訓(xùn)練詞向量,以當(dāng)前詞組的詞向量表示為特征預(yù)測(cè)其上下文的腦電信號(hào),構(gòu)建基于腦電信號(hào)的詞向量表示模型。
2.根據(jù)權(quán)利要求1所述的基于腦電信號(hào)的詞向量計(jì)算方法,其特征在于,所述步驟S1包括以下子步驟:
步驟S11,收集文本語(yǔ)料庫(kù),所述文本語(yǔ)料庫(kù)中的語(yǔ)料為句子或者篇章級(jí)別;
步驟S12,去除所述文本語(yǔ)料庫(kù)中長(zhǎng)度超過(guò)第一預(yù)設(shè)值或長(zhǎng)度小于二預(yù)設(shè)值的語(yǔ)料,得到預(yù)處理語(yǔ)料;
步驟S13,將所述預(yù)處理語(yǔ)料進(jìn)行分詞處理得到詞;
步驟S14,利用組塊分析技術(shù),將所述詞轉(zhuǎn)化為詞組,得到以連續(xù)短語(yǔ)格式的語(yǔ)料。
3.根據(jù)權(quán)利要求2所述的基于腦電信號(hào)的詞向量計(jì)算方法,其特征在于,所述步驟S3包括以下子步驟:
步驟S31,對(duì)采集到的腦電信號(hào)進(jìn)行降噪處理,得到降噪后的腦電信號(hào);
步驟S32,對(duì)所述降噪后的腦電信號(hào)進(jìn)行空間投影和降維處理;
步驟S33,將所述預(yù)處理語(yǔ)料中的所有詞組初始化為詞向量表示;
步驟S34,遍歷所述預(yù)處理語(yǔ)料中的所有詞組,以當(dāng)前詞組的詞向量表示為特征,使用神經(jīng)網(wǎng)絡(luò)回歸模型預(yù)測(cè)其上下文的腦電信號(hào),將預(yù)測(cè)的上下文的腦電信號(hào)與實(shí)際腦電信號(hào)進(jìn)行對(duì)比,獲取預(yù)測(cè)誤差,根據(jù)預(yù)測(cè)誤差調(diào)整當(dāng)前詞組的詞向量表示,其中,所述實(shí)際腦電信號(hào)為標(biāo)注者閱讀所述上下文時(shí)的腦電信號(hào);重復(fù)本步驟,直至預(yù)測(cè)誤差小于預(yù)設(shè)閾值。
4.根據(jù)權(quán)利要求3所述的基于腦電信號(hào)的詞向量計(jì)算方法,其特征在于,所述步驟S31包括:
對(duì)所述采集到的腦電信號(hào)進(jìn)行處理,得到信噪比高于第三預(yù)設(shè)值的腦電信號(hào);
所述步驟S32包括:
使用共空間模式算法對(duì)所述信噪比高于第三預(yù)設(shè)值的腦電信號(hào)進(jìn)行空間投影和降維,得到維度低于第四預(yù)設(shè)值的腦電信號(hào)。
5.根據(jù)權(quán)利要求3所述的基于腦電信號(hào)的詞向量計(jì)算方法,其特征在于,對(duì)所述采集到的腦電信號(hào)進(jìn)行降噪處理采用FASTICA算法。
6.一種基于腦電信號(hào)的詞向量計(jì)算裝置,其特征在于,所述裝置包括:
收集模塊,用于收集文本語(yǔ)料庫(kù),對(duì)文本語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行處理,得到以詞組為單位的連續(xù)短語(yǔ)格式的語(yǔ)料;
采集模塊,用于將所述連續(xù)短語(yǔ)格式的語(yǔ)料呈現(xiàn)給標(biāo)注者,供標(biāo)注者閱讀,采集標(biāo)注者閱讀每一詞組時(shí)的腦電信號(hào);
構(gòu)建模塊,用于將采集到的詞組對(duì)應(yīng)的腦電信號(hào)作為預(yù)測(cè)目標(biāo),訓(xùn)練詞向量,以當(dāng)前詞組的詞向量表示為特征預(yù)測(cè)其上下文的腦電信號(hào),構(gòu)建基于腦電信號(hào)的詞向量表示模型。
7.根據(jù)權(quán)利要求6所述的基于腦電信號(hào)的詞向量計(jì)算裝置,其特征在于,所述收集模塊包括:
收集單元,用于收集文本語(yǔ)料庫(kù),所述文本語(yǔ)料庫(kù)中的語(yǔ)料為句子或者篇章級(jí)別;
預(yù)處理單元,用于去除所述文本語(yǔ)料庫(kù)中長(zhǎng)度超過(guò)第一預(yù)設(shè)值或長(zhǎng)度小于第二預(yù)設(shè)值的語(yǔ)料,得到預(yù)處理語(yǔ)料;
分詞單元,用于將所述預(yù)處理語(yǔ)料進(jìn)行分詞處理得到詞;
轉(zhuǎn)化單元,用于利用組塊分析技術(shù),將所述詞轉(zhuǎn)化為詞組,得到以連續(xù)短語(yǔ)格式的語(yǔ)料。
8.根據(jù)權(quán)利要求7所述的基于腦電信號(hào)的詞向量計(jì)算裝置,其特征在于,所述構(gòu)建模塊包括:
降噪單元,用于對(duì)采集到的腦電信號(hào)進(jìn)行降噪處理,得到降噪后的腦電信號(hào);
降維單元,用于對(duì)所述降噪后的腦電信號(hào)進(jìn)行空間投影和降維處理;
初始化單元,用于將所述預(yù)處理語(yǔ)料中的所有詞組初始化為詞向量表示;
構(gòu)建單元,用于遍歷所述預(yù)處理語(yǔ)料中的所有詞組,以當(dāng)前詞組的詞向量表示為特征,使用神經(jīng)網(wǎng)絡(luò)回歸模型預(yù)測(cè)其上下文的腦電信號(hào),將預(yù)測(cè)的上下文的腦電信號(hào)與實(shí)際腦電信號(hào)進(jìn)行對(duì)比,獲取預(yù)測(cè)誤差,根據(jù)預(yù)測(cè)誤差調(diào)整當(dāng)前詞組的詞向量表示,其中,所述實(shí)際腦電信號(hào)為標(biāo)注者閱讀所述上下文時(shí)的腦電信號(hào);重復(fù)本步驟,直至預(yù)測(cè)誤差小于預(yù)設(shè)閾值。
9.根據(jù)權(quán)利要求8所述的基于腦電信號(hào)的詞向量計(jì)算裝置,其特征在于,
所述降噪單元還用于,對(duì)所述采集到的腦電信號(hào)進(jìn)行處理,得到信噪比高于第三預(yù)設(shè)值的腦電信號(hào);
所述降維單元還用于,使用共空間模式算法對(duì)所述信噪比高于第三預(yù)設(shè)值的腦電信號(hào)進(jìn)行空間投影和降維,得到維度低于第四預(yù)設(shè)值的腦電信號(hào)。
10.根據(jù)權(quán)利要求8所述的基于腦電信號(hào)的詞向量計(jì)算裝置,其特征在于,所述降噪模塊還用于采用FASTICA算法對(duì)所述采集到的腦電信號(hào)進(jìn)行降噪處理。