亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

詞向量處理方法、裝置以及電子設(shè)備與流程

文檔序號(hào):11323199閱讀:178來(lái)源:國(guó)知局
詞向量處理方法、裝置以及電子設(shè)備與流程

本申請(qǐng)涉及計(jì)算機(jī)軟件技術(shù)領(lǐng)域,尤其涉及詞向量處理方法、裝置以及電子設(shè)備。



背景技術(shù):

如今的自然語(yǔ)言處理的解決方案,大都采用基于神經(jīng)網(wǎng)絡(luò)的架構(gòu),而在這種架構(gòu)下一個(gè)重要的基礎(chǔ)技術(shù)就是詞向量。詞向量是將詞映射到一個(gè)固定維度的向量,該向量表征了該詞的語(yǔ)義信息。

在現(xiàn)有技術(shù)中,常見(jiàn)的用于生成詞向量的算法是專門(mén)針對(duì)英文設(shè)計(jì)的。比如,谷歌公司的單詞向量算法、微軟公司的深度神經(jīng)網(wǎng)絡(luò)算法等。

但是,現(xiàn)有技術(shù)的這些算法或者無(wú)法用于中文,或者雖能用于中文,但是,所生成中文詞的詞向量的實(shí)用效果較差。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)實(shí)施例提供詞向量處理方法、裝置以及電子設(shè)備,用以解決現(xiàn)有技術(shù)中用于生成詞向量的算法或者無(wú)法用于中文,或者雖能用于中文,但是,所生成中文詞的詞向量的實(shí)用效果較差的問(wèn)題。

為解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例是這樣實(shí)現(xiàn)的:

本申請(qǐng)實(shí)施例提供的一種詞向量處理方法,包括:

對(duì)語(yǔ)料分詞得到各詞;

確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

本申請(qǐng)實(shí)施例提供的一種詞向量處理裝置,包括:

分詞模塊,對(duì)語(yǔ)料分詞得到各詞;

確定模塊,確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

初始化模塊,建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

訓(xùn)練模塊,根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

本申請(qǐng)實(shí)施例提供的另一種詞向量處理方法,包括:

步驟1,對(duì)語(yǔ)料分詞,并建立通過(guò)所述分詞得到的各詞構(gòu)成的詞匯表,其中,所述各詞不包括在所述語(yǔ)料中出現(xiàn)次數(shù)少于設(shè)定次數(shù)的詞;跳轉(zhuǎn)步驟2;

步驟2,根據(jù)所述詞匯表,建立n元倉(cāng)頡碼字符映射表,所述映射表包含所述各詞與n元倉(cāng)頡碼字符之間的映射關(guān)系,所述n元倉(cāng)頡碼字符表征其映射的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;跳轉(zhuǎn)步驟3;

步驟3,根據(jù)所述n元倉(cāng)頡碼字符映射表,建立并初始化所述各詞的詞向量,以及所述各詞映射的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;跳轉(zhuǎn)步驟4;

步驟4,遍歷分詞后的所述語(yǔ)料,分別將遍歷到的每個(gè)詞作為當(dāng)前詞w并對(duì)當(dāng)前詞w執(zhí)行步驟5,若遍歷完成則結(jié)束,否則繼續(xù)遍歷;

步驟5,以當(dāng)前詞w為中心,向兩側(cè)分別滑動(dòng)至多k個(gè)詞建立窗口,遍歷所述窗口中除當(dāng)前詞w以外的所有詞,分別將遍歷到的每個(gè)詞作為當(dāng)前詞w的當(dāng)前上下文詞c并對(duì)當(dāng)前上下文詞c執(zhí)行步驟6,若遍歷完成則繼續(xù)步驟4的執(zhí)行,否則繼續(xù)遍歷;

步驟6,按照如下公式計(jì)算當(dāng)前詞w與當(dāng)前上下文詞c的相似度:

其中,s(w)表示所述n元倉(cāng)頡碼字符映射表中當(dāng)前詞w映射的各n元倉(cāng)頡碼字符集合,q表示s(w)中的各n元倉(cāng)頡碼字符,sim(w,c)表示當(dāng)前詞w與當(dāng)前上下文詞c的相似度;表示q的倉(cāng)頡碼字符向量與當(dāng)前上下文詞語(yǔ)c的詞向量的向量點(diǎn)積;跳轉(zhuǎn)步驟7;

步驟7,隨機(jī)抽取λ個(gè)詞作為負(fù)樣例詞,按照如下?lián)p失函數(shù)計(jì)算對(duì)應(yīng)的損失表征值l(w,c):

其中,c’是隨機(jī)抽取的負(fù)樣例詞,而ec'∈p(v)[x]是指隨機(jī)抽取的負(fù)樣例詞c’滿足概率分布p(v)的情況下,表達(dá)式x的期望值,σ(·)是神經(jīng)網(wǎng)絡(luò)激勵(lì)函數(shù),定義為

根據(jù)計(jì)算出的損失表征值l(w,c)計(jì)算所述損失函數(shù)對(duì)應(yīng)的梯度,根據(jù)所述梯度,對(duì)q的倉(cāng)頡碼字符向量和當(dāng)前上下文詞語(yǔ)c的詞向量進(jìn)行更新。

本申請(qǐng)實(shí)施例提供的一種電子設(shè)備,包括:

至少一個(gè)處理器;以及,

與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,

所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠:

對(duì)語(yǔ)料分詞得到各詞;

確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:可以實(shí)現(xiàn)通過(guò)詞對(duì)應(yīng)的n元倉(cāng)頡碼字符更精細(xì)地表現(xiàn)該詞的特征,尤其可以表現(xiàn)該詞的字形形態(tài)特征,進(jìn)而有利于提高中文詞的詞向量的準(zhǔn)確度,實(shí)用效果較好,因此,可以部分或全部地解決現(xiàn)有技術(shù)中的問(wèn)題。

附圖說(shuō)明

為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本申請(qǐng)實(shí)施例提供的一種詞向量處理方法的流程示意圖;

圖2為本申請(qǐng)實(shí)施例提供的實(shí)際應(yīng)用場(chǎng)景下,所述詞向量處理方法的一種具體實(shí)施方案的流程示意圖;

圖3為本申請(qǐng)實(shí)施例提供的圖2中流程所使用的部分語(yǔ)料的相關(guān)處理動(dòng)作示意圖;

圖4為本申請(qǐng)實(shí)施例提供的另一種詞向量處理方法的流程示意圖;

圖5為本申請(qǐng)實(shí)施例提供的對(duì)應(yīng)于圖1的一種詞向量處理裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

本申請(qǐng)實(shí)施例提供詞向量處理方法、裝置以及電子設(shè)備。

為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)中的技術(shù)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。

本申請(qǐng)的方案適用于中文詞的詞向量,也適用于類似中文的某些其他語(yǔ)言的詞的詞向量,比如,韓文、日文等字形形態(tài)特征較明顯的語(yǔ)言的詞的詞向量等,對(duì)于非中文的情況,需要按照倉(cāng)頡碼的編碼規(guī)則相應(yīng)地進(jìn)行編碼。

為了便于描述,以下各實(shí)施例主要針對(duì)中文詞的場(chǎng)景,對(duì)本申請(qǐng)的方案進(jìn)行說(shuō)明。

圖1為本申請(qǐng)實(shí)施例提供的一種詞向量處理方法的流程示意圖。從程序角度而言,該流程的執(zhí)行主體可以是具有詞向量生成功能和/或訓(xùn)練功能的程序等;從設(shè)備角度而言,該流程的執(zhí)行主體可以包括但不限于可搭載所述程序的以下至少一種設(shè)備:個(gè)人計(jì)算機(jī)、大中型計(jì)算機(jī)、計(jì)算機(jī)集群、手機(jī)、平板電腦、智能可穿戴設(shè)備、車機(jī)等。

圖1中的流程可以包括以下步驟:

s101:對(duì)語(yǔ)料分詞得到各詞。

在本申請(qǐng)實(shí)施例中,所述各詞具體可以是:語(yǔ)料中至少出現(xiàn)過(guò)一次的詞中的至少部分詞。為了便于后續(xù)處理,可以將各詞保存在詞匯表中,需要使用時(shí)從詞匯表中讀取詞即可。

s102:確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符。

倉(cāng)頡碼是漢字的一種編碼(也是一種編碼方式),其依據(jù)視覺(jué)辨識(shí)原理,來(lái)反映漢字的細(xì)微特征,幾乎所有不同字形或異體字,都有不同的倉(cāng)頡碼,其重碼率是目前各種漢字編碼方式中比較低的一種。本質(zhì)上,倉(cāng)頡碼編碼了漢字的字形形態(tài)信息,需要強(qiáng)調(diào)的是,倉(cāng)頡碼是根據(jù)漢字的結(jié)構(gòu)復(fù)雜度進(jìn)行拆分,拆分區(qū)域個(gè)數(shù)不確定,這種動(dòng)態(tài)的拆分原則使得倉(cāng)頡碼成為編碼量較低的一種漢字編碼方式。

倉(cāng)頡碼的字符一般有25或者26種,通過(guò)“由上而下,由左而右,由外而內(nèi)”等原則將任意漢字分拆成字型結(jié)構(gòu),再以對(duì)應(yīng)的所述字符構(gòu)成字符序列作為該漢字對(duì)應(yīng)的倉(cāng)頡碼,其中,可以將該字符序列稱為倉(cāng)頡碼字符序列,該倉(cāng)頡碼字符序列中的每一個(gè)字符稱為一個(gè)倉(cāng)頡碼字符。

例如,“吃”字的倉(cāng)頡碼為“ron”,包含3個(gè)倉(cāng)頡碼字符,“飯”字的倉(cāng)頡碼為“nvhe”,包含4個(gè)倉(cāng)頡碼字符。

進(jìn)一步地,中文詞一般由多個(gè)漢字組成,則將這多個(gè)漢字的倉(cāng)頡碼依次連接也可以得到該中文詞對(duì)應(yīng)的倉(cāng)頡碼字符序列,則詞對(duì)應(yīng)的n元倉(cāng)頡碼字符為:該詞對(duì)應(yīng)的倉(cāng)頡碼字符序列中的連續(xù)n個(gè)倉(cāng)頡碼字符。

沿用上例,對(duì)于詞“吃飯”,其對(duì)應(yīng)的倉(cāng)頡碼字符序列為“ronnvhe”,據(jù)此可知:其對(duì)應(yīng)的3元倉(cāng)頡碼字符為:“ron”(第1~3個(gè)倉(cāng)頡碼字符)、“onn”(第2~4個(gè)倉(cāng)頡碼字符)、“vhe”(第5~7個(gè)倉(cāng)頡碼字符)等;其對(duì)應(yīng)的4元倉(cāng)頡碼字符為:“ronn”(第1~4個(gè)倉(cāng)頡碼字符)、“onnv”(第2~5個(gè)倉(cāng)頡碼字符)、“nnvh”(第3~6個(gè)倉(cāng)頡碼字符)等;其對(duì)應(yīng)的5元倉(cāng)頡碼字符為:“ronnv”(第1~5個(gè)倉(cāng)頡碼字符)、“onnvh”(第2~6個(gè)倉(cāng)頡碼字符)、“nnvhe”(第3~7個(gè)倉(cāng)頡碼字符)。

在本申請(qǐng)實(shí)施例中,n的取值可以是動(dòng)態(tài)可調(diào)的。對(duì)于同一個(gè)詞,在確定該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符時(shí),n的取值可以只取1個(gè)(比如,只確定該詞對(duì)應(yīng)的各3元倉(cāng)頡碼字符),也可以取多個(gè)(比如,確定該詞對(duì)應(yīng)的各3元倉(cāng)頡碼字符和各4元倉(cāng)頡碼字符等)。當(dāng)n的取值恰好為字或者詞對(duì)應(yīng)的倉(cāng)頡碼字符序列包含的倉(cāng)頡碼字符總數(shù)時(shí),n元倉(cāng)頡碼字符恰好為該倉(cāng)頡碼字符序列。

在本申請(qǐng)實(shí)施例中,為了便于計(jì)算機(jī)處理,n元倉(cāng)頡碼字符也可以用數(shù)字進(jìn)行表示。比如,可以將不同的倉(cāng)頡碼字符分別用一個(gè)數(shù)字表示,則n元倉(cāng)頡碼字符相應(yīng)地可以表示為數(shù)字串,其中,該數(shù)字與數(shù)字串或者倉(cāng)頡碼字符之間有映射關(guān)系。

s103:建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量。

在本申請(qǐng)實(shí)施例中,倉(cāng)頡碼字符向量指用于表示n元倉(cāng)頡碼字符的向量。每個(gè)n元倉(cāng)頡碼字符可以分別用一個(gè)倉(cāng)頡碼字符向量來(lái)表示,就如同每個(gè)詞可以分別用一個(gè)詞向量來(lái)表示。

在本申請(qǐng)實(shí)施例中,為了保證方案的效果,在初始化詞向量和倉(cāng)頡碼字符向量時(shí),可能會(huì)有一些限制條件。比如,不能將各詞向量和各倉(cāng)頡碼字符向量都初始化為相同的向量;又比如,某些詞向量或倉(cāng)頡碼字符向量中的向量元素取值不能全為0;等等。

在本申請(qǐng)實(shí)施例中,可以采用隨機(jī)初始化的方式或者按照指定概率分布初始化的方式,初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,其中,相同n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量也相同。比如,所述指定概率分布可以是0-1分布等。

另外,若之前已經(jīng)基于其他語(yǔ)料,訓(xùn)練過(guò)某些詞對(duì)應(yīng)的詞向量及倉(cāng)頡碼字符向量,則在進(jìn)一步地基于圖1中的語(yǔ)料訓(xùn)練這些詞對(duì)應(yīng)的詞向量及倉(cāng)頡碼字符向量時(shí),可以不再重新建立并初始化這些詞對(duì)應(yīng)的詞向量及倉(cāng)頡碼字符向量,而是基于圖1中的語(yǔ)料和之前的訓(xùn)練結(jié)果,再進(jìn)行訓(xùn)練即可。

s104:根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

在本申請(qǐng)實(shí)施例中,所述訓(xùn)練可以是通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的,所述神經(jīng)網(wǎng)絡(luò)可以是淺層神經(jīng)網(wǎng)絡(luò)或者深層神經(jīng)網(wǎng)絡(luò)等。本申請(qǐng)對(duì)采用的神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)并不做限定。

通過(guò)圖1的方法,可以實(shí)現(xiàn)通過(guò)詞對(duì)應(yīng)的n元倉(cāng)頡碼字符更精細(xì)地表現(xiàn)該詞的特征,尤其可以表現(xiàn)該詞的字形形態(tài)特征,進(jìn)而有利于提高中文詞的詞向量的準(zhǔn)確度,實(shí)用效果較好,因此,可以部分或全部地解決現(xiàn)有技術(shù)中的問(wèn)題。

基于圖1的方法,本申請(qǐng)實(shí)施例還提供了該方法的一些具體實(shí)施方案,以及擴(kuò)展方案,下面進(jìn)行說(shuō)明。

在本申請(qǐng)實(shí)施例中,對(duì)于步驟s102,所述確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,具體可以包括:根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)的詞;

分別針對(duì)所述確定的互不相同的每個(gè)詞,執(zhí)行:

確定該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,該詞對(duì)應(yīng)的n元倉(cāng)頡碼字符表征

該詞連續(xù)的n個(gè)倉(cāng)頡碼字符,n為一個(gè)正整數(shù)或多個(gè)不同的正整數(shù)。

在本申請(qǐng)實(shí)施例中,對(duì)于相同的詞,它們對(duì)應(yīng)的各n元倉(cāng)頡碼字符也是相同的,因此,對(duì)于上一段中的步驟,分別針對(duì)確定的互不相同的每個(gè)詞執(zhí)行即可,而對(duì)于重復(fù)的詞,可以直接沿用已有結(jié)果,而無(wú)需重復(fù)執(zhí)行,從而可以節(jié)省資源。

進(jìn)一步地,考慮到若某個(gè)詞在語(yǔ)料中出現(xiàn)的次數(shù)太少,則基于該語(yǔ)料訓(xùn)練時(shí)對(duì)應(yīng)的訓(xùn)練樣本與訓(xùn)練次數(shù)也較少,會(huì)給訓(xùn)練結(jié)果的可信度帶來(lái)不利影響,因此,可以將這類詞篩除,暫不訓(xùn)練。后續(xù)可以在其他語(yǔ)料中進(jìn)行訓(xùn)練。

基于這樣的思路,所述根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)的詞,具體可以包括:根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)且出現(xiàn)次數(shù)不少于設(shè)定次數(shù)的詞。設(shè)定次數(shù)具體是多少次可以根據(jù)實(shí)際情況確定。

在本申請(qǐng)實(shí)施例中,對(duì)于步驟s104,具體的訓(xùn)練方式可以有多種,比如基于上下文詞的訓(xùn)練方式、基于指定近義詞或同義詞的訓(xùn)練方式等,為了便于理解,以前一種方式為例進(jìn)行詳細(xì)介紹。

所述根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練,具體可以包括:確定分詞后的所述語(yǔ)料中的指定詞,以及所述指定詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞;根據(jù)所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,以及所述上下文詞的詞向量,確定所述指定詞與所述上下文詞的相似度;根據(jù)所述指定詞與所述上下文詞的相似度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

本申請(qǐng)對(duì)確定相似度的具體方式并不做限定。比如,可以基于向量的夾角余弦運(yùn)算計(jì)算相似度,可以基于向量的平方和運(yùn)算計(jì)算相似度,等等。

所述指定詞可以有多個(gè),指定詞可以重復(fù)而在語(yǔ)料中的位置不同,可以分別針對(duì)每個(gè)指定詞執(zhí)行上一段中的處理動(dòng)作。優(yōu)選地,可以分別將分詞后的語(yǔ)料中包含的每個(gè)詞都作為一個(gè)指定詞。

在本申請(qǐng)實(shí)施例中,步驟s104中的訓(xùn)練可以使得:指定詞與上下文詞的相似度相對(duì)變高(在這里,相似度可以反映關(guān)聯(lián)度,詞與其上下文詞的關(guān)聯(lián)度相對(duì)較高,而且詞義相同或相近的各詞分別對(duì)應(yīng)的上下文詞往往也是相同或相近的),而指定詞與非上下文詞的相似度相對(duì)地變低,非上下文詞可以作為下述的負(fù)樣例詞,則上下文詞相對(duì)地可以作為正樣例詞。

由此可見(jiàn),在訓(xùn)練過(guò)程中,需要確定一些負(fù)樣例詞作為對(duì)照??梢栽诜衷~后的語(yǔ)料中隨機(jī)選擇一個(gè)或多個(gè)詞作為負(fù)樣例詞,也可以嚴(yán)格地選擇非上下文詞作為負(fù)樣例詞。以前一種方式為例,所述根據(jù)所述指定詞與所述上下文詞的相似度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新,具體可以包括:從所述各詞中選擇一個(gè)或多個(gè)詞,作為負(fù)樣例詞;確定所述指定詞與各所述負(fù)樣例詞的相似度;根據(jù)指定的損失函數(shù)、所述指定詞與所述上下文詞的相似度,以及所述指定詞與各所述負(fù)樣例詞的相似度,確定所述指定詞對(duì)應(yīng)的損失表征值;根據(jù)所述損失表征值,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

其中,所述損失表征值用于衡量當(dāng)前的向量值與訓(xùn)練目標(biāo)之間的誤差程度。所述損失函數(shù)的參數(shù)可以以上述的幾種相似度作為參數(shù),具體的損失函數(shù)表達(dá)式本申請(qǐng)并不做限定,后面會(huì)詳細(xì)舉例說(shuō)明。

在本申請(qǐng)實(shí)施例中,對(duì)詞向量和倉(cāng)頡碼字符向量更新實(shí)際上對(duì)所述誤差程度的修正。當(dāng)采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)本申請(qǐng)的方案時(shí),這種修正可以基于反向傳播和梯度下降法實(shí)現(xiàn)。在這種情況下,所述梯度即為損失函數(shù)對(duì)應(yīng)的梯度。

則所述根據(jù)所述損失表征值,對(duì)所述指定詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新,具體可以包括:根據(jù)所述損失表征值,確定所述損失函數(shù)對(duì)應(yīng)的梯度;根據(jù)所述梯度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

在本申請(qǐng)實(shí)施例中,對(duì)詞向量和倉(cāng)頡碼字符向量的訓(xùn)練過(guò)程可以是基于分詞后的語(yǔ)料中的至少部分詞迭代進(jìn)行的,從而可以使詞向量和倉(cāng)頡碼字符向量逐漸地收斂,直至完成訓(xùn)練。

以基于分詞后的語(yǔ)料中的全部詞進(jìn)行訓(xùn)練為例。對(duì)于步驟s104,所述根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練,具體可以包括:

對(duì)分詞后的所述語(yǔ)料進(jìn)行遍歷,分別對(duì)分詞后的所述語(yǔ)料中的每個(gè)詞執(zhí)行:

確定該詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞;

分別根據(jù)每個(gè)所述上下文詞,執(zhí)行:

根據(jù)該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,以及該上下文詞的詞向量,確定該詞與該上下文詞的相似度;

根據(jù)該詞與該上下文詞的相似度,對(duì)該上下文詞的詞向量和該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

具體如何進(jìn)行更新上面已經(jīng)進(jìn)行說(shuō)明,不再贅述。

進(jìn)一步地,為了便于計(jì)算機(jī)處理,可以基于窗口實(shí)現(xiàn)上面的遍歷過(guò)程。

例如,所述確定該詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞,具體可以包括:在分詞后的所述語(yǔ)料中,通過(guò)以該詞為中心,向左和/或向右滑動(dòng)指定數(shù)量個(gè)詞的距離,建立窗口;將所述窗口中該詞以外的詞確定為該詞的上下文詞。

當(dāng)然,也可以以分詞后的所述語(yǔ)料的第一個(gè)詞為開(kāi)始位置,建立一個(gè)設(shè)定長(zhǎng)度的窗口,窗口中包含第一個(gè)詞以及之后連續(xù)的設(shè)定數(shù)量個(gè)詞;處理完窗口內(nèi)的各詞后,將窗口向后滑動(dòng)以處理該語(yǔ)料中的下一批詞,直至遍歷完該語(yǔ)料。

上面對(duì)本申請(qǐng)實(shí)施例提供的一種詞向量處理方法進(jìn)行了說(shuō)明。為了便于理解,基于上述說(shuō)明,本申請(qǐng)實(shí)施例還提供了實(shí)際應(yīng)用場(chǎng)景下,所述詞向量處理方法的一種具體實(shí)施方案的流程示意圖,如圖2所示。

圖2中的流程主要包括以下步驟:

步驟1,使用分詞工具對(duì)中文語(yǔ)料進(jìn)行分詞,掃描分詞后的中文語(yǔ)料,統(tǒng)計(jì)所有出現(xiàn)過(guò)的詞以建立詞匯表,刪除出現(xiàn)次數(shù)小于b次(也即,上述的設(shè)定次數(shù))的詞語(yǔ);跳轉(zhuǎn)步驟2;

步驟2,逐一掃描詞匯表,提取每一個(gè)詞對(duì)應(yīng)的n元倉(cāng)頡碼字符,建立n元倉(cāng)頡碼字符表,以及詞與對(duì)應(yīng)的n元倉(cāng)頡碼字符的映射表;跳轉(zhuǎn)步驟3;

步驟3,針對(duì)詞匯表中每個(gè)詞都建立一個(gè)維度為d的詞向量,對(duì)n元倉(cāng)頡碼字符表中的每個(gè)n元倉(cāng)頡碼字符都建立一個(gè)維度也為d的倉(cāng)頡碼字符向量,隨機(jī)初始化建立的所有向量;跳轉(zhuǎn)步驟4;

步驟4,從完成分詞的中文語(yǔ)料中,從第一個(gè)詞開(kāi)始逐一滑動(dòng),每次選擇一個(gè)詞作為“當(dāng)前詞w(也即,上述的指定詞)”,若w遍歷過(guò)整個(gè)語(yǔ)料所有詞,則結(jié)束;否則跳轉(zhuǎn)步驟5;

步驟5,以當(dāng)前詞w為中心,向兩側(cè)滑動(dòng)k個(gè)詞建立窗口,從窗口內(nèi)的第一個(gè)詞到最后一個(gè)詞(除當(dāng)前詞w以外),每次選擇一個(gè)詞作為“上下文詞c”,若c遍歷過(guò)窗口內(nèi)的所有詞,則跳轉(zhuǎn)步驟4;否則,跳轉(zhuǎn)步驟6;

步驟6,對(duì)于當(dāng)前詞w,根據(jù)步驟2中的詞與對(duì)應(yīng)的n元倉(cāng)頡碼字符映射表,找到當(dāng)前詞w對(duì)應(yīng)的各n元倉(cāng)頡碼字符,按照公式(1)計(jì)算當(dāng)前詞w與上下文詞c的相似度:

其中,公式中s表示步驟2中建立的n元倉(cāng)頡碼字符表,s(w)表示步驟2中映射表里當(dāng)前詞w所對(duì)應(yīng)的n元倉(cāng)頡碼字符集合,q表示集合s(w)中的元素(即某個(gè)n元倉(cāng)頡碼字符)。sim(w,c)表示當(dāng)前詞w與上下文單詞c的相似度得分;表示n元倉(cāng)頡碼字符q與上下文詞語(yǔ)c的向量點(diǎn)積運(yùn)算;跳轉(zhuǎn)步驟7;

步驟7,隨機(jī)抽取λ個(gè)詞作為負(fù)樣例詞,并且按照公式(2)(也即,上述的損失函數(shù))計(jì)算損失得分l(w,c),損失得分即可以作為上述的損失表征值:

其中,log是對(duì)數(shù)函數(shù),c’是隨機(jī)抽取的負(fù)樣例詞語(yǔ),而ec'∈p(v)[x]是指隨機(jī)抽取的負(fù)樣例詞c’滿足概率分布p(v)的情況下,表達(dá)式x的期望值,σ(·)是神經(jīng)網(wǎng)絡(luò)激勵(lì)函數(shù),詳細(xì)參見(jiàn)公式(3):

其中,若x是一個(gè)實(shí)數(shù),則σ(x)也是一個(gè)實(shí)數(shù);根據(jù)l(w,c)的值計(jì)算梯度,更新n元倉(cāng)頡碼字符向量和上下文詞語(yǔ)的向量跳轉(zhuǎn)步驟5。

上述步驟1~7中,步驟6和步驟7是較關(guān)鍵的步驟。為了便于理解,結(jié)合圖3舉例說(shuō)明。

圖3為本申請(qǐng)實(shí)施例提供的圖2中流程所使用的部分語(yǔ)料的相關(guān)處理動(dòng)作示意圖。

如圖3所示,假定語(yǔ)料中有語(yǔ)句“治理霧霾刻不容緩”,分詞得到該語(yǔ)句中的三個(gè)詞語(yǔ)“治理”、“霧霾”、“刻不容緩”。

假定此時(shí)選定“霧霾”為當(dāng)前詞w,選定“治理”為上下文詞c,提取當(dāng)前詞w映射的所有n元倉(cāng)頡碼字符s(w),比如,“霧霾”映射的5元倉(cāng)頡碼字符包括“mbhes”、“bhesm”、“hesmb”、“esmbb”等,“治理”映射的5元倉(cāng)頡碼字符包括“eirmg”、“irmgw”、“rmgwg”。然后,根據(jù)公式(1)、公式(2)和公式(3)計(jì)算損失得分l(w,c),進(jìn)而計(jì)算梯度,以更新c的詞向量和w對(duì)應(yīng)的所有的倉(cāng)頡碼字符向量。

基于與圖1同樣的發(fā)明思路以及圖2中的實(shí)施方式,本申請(qǐng)實(shí)施例提供了另一種詞向量處理方法。

圖4為本申請(qǐng)實(shí)施例提供的另一種詞向量處理方法的流程示意圖。

圖4中的流程可以包括以下步驟:

步驟1,對(duì)語(yǔ)料分詞,并建立通過(guò)所述分詞得到的各詞構(gòu)成的詞匯表,其中,所述各詞不包括在所述語(yǔ)料中出現(xiàn)次數(shù)少于設(shè)定次數(shù)的詞;跳轉(zhuǎn)步驟2;

步驟2,根據(jù)所述詞匯表,建立n元倉(cāng)頡碼字符映射表,所述映射表包含所述各詞與n元倉(cāng)頡碼字符之間的映射關(guān)系,所述n元倉(cāng)頡碼字符表征其映射的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;跳轉(zhuǎn)步驟3;

步驟3,根據(jù)所述n元倉(cāng)頡碼字符映射表,建立并初始化所述各詞的詞向量,以及所述各詞映射的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;跳轉(zhuǎn)步驟4;

步驟4,遍歷分詞后的所述語(yǔ)料,分別將遍歷到的每個(gè)詞作為當(dāng)前詞w并對(duì)當(dāng)前詞w執(zhí)行步驟5,若遍歷完成則結(jié)束,否則繼續(xù)遍歷;

步驟5,以當(dāng)前詞w為中心,向兩側(cè)分別滑動(dòng)至多k個(gè)詞建立窗口,遍歷所述窗口中除當(dāng)前詞w以外的所有詞,分別將遍歷到的每個(gè)詞作為當(dāng)前詞w的當(dāng)前上下文詞c并對(duì)當(dāng)前上下文詞c執(zhí)行步驟6,若遍歷完成則繼續(xù)步驟4的執(zhí)行,否則繼續(xù)遍歷;

步驟6,按照如下公式計(jì)算當(dāng)前詞w與當(dāng)前上下文詞c的相似度:

其中,s(w)表示所述n元倉(cāng)頡碼字符映射表中當(dāng)前詞w映射的各n元倉(cāng)頡碼字符集合,q表示s(w)中的各n元倉(cāng)頡碼字符,sim(w,c)表示當(dāng)前詞w與當(dāng)前上下文詞c的相似度;表示q的倉(cāng)頡碼字符向量與當(dāng)前上下文詞語(yǔ)c的詞向量的向量點(diǎn)積;跳轉(zhuǎn)步驟7;

步驟7,隨機(jī)抽取λ個(gè)詞作為負(fù)樣例詞,按照如下?lián)p失函數(shù)計(jì)算對(duì)應(yīng)的損失表征值l(w,c):

其中,c’是隨機(jī)抽取的負(fù)樣例詞,而ec'∈p(v)[x]是指隨機(jī)抽取的負(fù)樣例詞c’滿足概率分布p(v)的情況下,表達(dá)式x的期望值,σ(·)是神經(jīng)網(wǎng)絡(luò)激勵(lì)函數(shù),定義為

根據(jù)計(jì)算出的損失表征值l(w,c)計(jì)算所述損失函數(shù)對(duì)應(yīng)的梯度,根據(jù)所述梯度,對(duì)q的倉(cāng)頡碼字符向量和當(dāng)前上下文詞語(yǔ)c的詞向量進(jìn)行更新。

所述另一種詞向量處理方法中各步驟可以由相同或者不同的模塊執(zhí)行,本申請(qǐng)對(duì)此并不做具體限定。

需要說(shuō)明的是,除了倉(cāng)頡碼以外,其他可以表現(xiàn)該詞的字形形態(tài)特征的字或者詞的編碼同樣也適用于本申請(qǐng)的方案,比如,漢字的鄭碼等,將該編碼替換上述各方案中的倉(cāng)頡碼即可。

上面為本申請(qǐng)實(shí)施例提供的詞向量處理方法,基于同樣的發(fā)明思路,本申請(qǐng)實(shí)施例還提供了對(duì)應(yīng)的裝置,如圖5所示。

圖5為本申請(qǐng)實(shí)施例提供的對(duì)應(yīng)于圖1的一種詞向量處理裝置的結(jié)構(gòu)示意圖,該裝置可以位于圖1中流程的執(zhí)行主體,包括:

分詞模塊501,對(duì)語(yǔ)料分詞得到各詞;

確定模塊502,確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

初始化模塊503,建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

訓(xùn)練模塊504,根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

可選地,所述確定模塊502確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,具體包括:

所述確定模塊502根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)的詞;

分別針對(duì)所述確定的每個(gè)詞,執(zhí)行:

確定該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,該詞對(duì)應(yīng)的n元倉(cāng)頡碼字符表征

該詞連續(xù)的n個(gè)倉(cāng)頡碼字符,n為一個(gè)正整數(shù)或多個(gè)不同的正整數(shù)。

可選地,所述確定模塊502根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)的詞,具體包括:

所述確定模塊502根據(jù)對(duì)所述語(yǔ)料分詞的結(jié)果,確定在所述語(yǔ)料中出現(xiàn)過(guò)且出現(xiàn)次數(shù)不少于設(shè)定次數(shù)的詞。

可選地,所述初始化模塊503初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,具體包括:

所述初始化模塊503采用隨機(jī)初始化的方式或者按照指定概率分布初始化的方式,初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,其中,相同n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量也相同。

可選地,所述訓(xùn)練模塊504根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練,具體包括:

所述訓(xùn)練模塊504確定分詞后的所述語(yǔ)料中的指定詞,以及所述指定詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞;

根據(jù)所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,以及所述上下文詞的詞向量,確定所述指定詞與所述上下文詞的相似度;

根據(jù)所述指定詞與所述上下文詞的相似度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

可選地,所述訓(xùn)練模塊504根據(jù)所述指定詞與所述上下文詞的相似度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新,具體包括:

所述訓(xùn)練模塊504從所述各詞中選擇一個(gè)或多個(gè)詞,作為負(fù)樣例詞;

確定所述指定詞與各所述負(fù)樣例詞的相似度;

根據(jù)指定的損失函數(shù)、所述指定詞與所述上下文詞的相似度,以及所述指定詞與各所述負(fù)樣例詞的相似度,確定所述指定詞對(duì)應(yīng)的損失表征值;

根據(jù)所述損失表征值,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

可選地,所述訓(xùn)練模塊504根據(jù)所述損失表征值,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新,具體包括:

所述訓(xùn)練模塊504根據(jù)所述損失表征值,確定所述損失函數(shù)對(duì)應(yīng)的梯度;

根據(jù)所述梯度,對(duì)所述上下文詞的詞向量和所述指定詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

可選地,所述訓(xùn)練模塊504從所述各詞中選擇一個(gè)或多個(gè)詞,作為負(fù)樣例詞,具體包括:

所述訓(xùn)練模塊504從所述各詞中隨機(jī)選擇一個(gè)或多個(gè)詞,作為負(fù)樣例詞。

可選地,所述訓(xùn)練模塊504根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練,具體包括:

所述訓(xùn)練模塊504對(duì)分詞后的所述語(yǔ)料進(jìn)行遍歷,分別對(duì)分詞后的所述語(yǔ)料中的每個(gè)詞執(zhí)行:

確定該詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞;

分別根據(jù)每個(gè)所述上下文詞,執(zhí)行:

根據(jù)該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量,以及該上下文詞的詞向量,確定該詞與該上下文詞的相似度;

根據(jù)該詞與該上下文詞的相似度,對(duì)該上下文詞的詞向量和該詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量進(jìn)行更新。

可選地,所述訓(xùn)練模塊504確定該詞在分詞后的所述語(yǔ)料中的一個(gè)或多個(gè)上下文詞,具體包括:

所述訓(xùn)練模塊504在分詞后的所述語(yǔ)料中,通過(guò)以該詞為中心,向左和/或向右滑動(dòng)指定數(shù)量個(gè)詞的距離,建立窗口;

將所述窗口中該詞以外的詞確定為該詞的上下文詞。

可選地,所述詞為中文詞,所述詞向量為中文詞的詞向量,所述倉(cāng)頡碼字符為倉(cāng)頡碼字符。

基于同樣的發(fā)明思路,本申請(qǐng)實(shí)施例還提供了對(duì)應(yīng)的一種電子設(shè)備,包括:

至少一個(gè)處理器;以及,

與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,

所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠:

對(duì)語(yǔ)料分詞得到各詞;

確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

基于同樣的發(fā)明思路,本申請(qǐng)實(shí)施例還提供了對(duì)應(yīng)的一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令設(shè)置為:

對(duì)語(yǔ)料分詞得到各詞;

確定所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符,所述n元倉(cāng)頡碼字符表征其對(duì)應(yīng)的詞的連續(xù)n個(gè)倉(cāng)頡碼字符;

建立并初始化所述各詞的詞向量,以及所述各詞對(duì)應(yīng)的各n元倉(cāng)頡碼字符的倉(cāng)頡碼字符向量;

根據(jù)所述詞向量、所述倉(cāng)頡碼字符向量,以及分詞后的所述語(yǔ)料,對(duì)所述詞向量和所述倉(cāng)頡碼字符向量進(jìn)行訓(xùn)練。

本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于裝置、電子設(shè)備、非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。

本申請(qǐng)實(shí)施例提供的裝置、電子設(shè)備、非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)與方法是對(duì)應(yīng)的,因此,裝置、電子設(shè)備、非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)也具有與對(duì)應(yīng)方法類似的有益技術(shù)效果,由于上面已經(jīng)對(duì)方法的有益技術(shù)效果進(jìn)行了詳細(xì)說(shuō)明,因此,這里不再贅述對(duì)應(yīng)裝置、電子設(shè)備、非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)的有益技術(shù)效果。

在20世紀(jì)90年代,對(duì)于一個(gè)技術(shù)的改進(jìn)可以很明顯地區(qū)分是硬件上的改進(jìn)(例如,對(duì)二極管、晶體管、開(kāi)關(guān)等電路結(jié)構(gòu)的改進(jìn))還是軟件上的改進(jìn)(對(duì)于方法流程的改進(jìn))。然而,隨著技術(shù)的發(fā)展,當(dāng)今的很多方法流程的改進(jìn)已經(jīng)可以視為硬件電路結(jié)構(gòu)的直接改進(jìn)。設(shè)計(jì)人員幾乎都通過(guò)將改進(jìn)的方法流程編程到硬件電路中來(lái)得到相應(yīng)的硬件電路結(jié)構(gòu)。因此,不能說(shuō)一個(gè)方法流程的改進(jìn)就不能用硬件實(shí)體模塊來(lái)實(shí)現(xiàn)。例如,可編程邏輯器件(programmablelogicdevice,pld)(例如現(xiàn)場(chǎng)可編程門(mén)陣列(fieldprogrammablegatearray,fpga))就是這樣一種集成電路,其邏輯功能由用戶對(duì)器件編程來(lái)確定。由設(shè)計(jì)人員自行編程來(lái)把一個(gè)數(shù)字系統(tǒng)“集成”在一片pld上,而不需要請(qǐng)芯片制造廠商來(lái)設(shè)計(jì)和制作專用的集成電路芯片。而且,如今,取代手工地制作集成電路芯片,這種編程也多半改用“邏輯編譯器(logiccompiler)”軟件來(lái)實(shí)現(xiàn),它與程序開(kāi)發(fā)撰寫(xiě)時(shí)所用的軟件編譯器相類似,而要編譯之前的原始代碼也得用特定的編程語(yǔ)言來(lái)撰寫(xiě),此稱之為硬件描述語(yǔ)言(hardwaredescriptionlanguage,hdl),而hdl也并非僅有一種,而是有許多種,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)與verilog。本領(lǐng)域技術(shù)人員也應(yīng)該清楚,只需要將方法流程用上述幾種硬件描述語(yǔ)言稍作邏輯編程并編程到集成電路中,就可以很容易得到實(shí)現(xiàn)該邏輯方法流程的硬件電路。

控制器可以按任何適當(dāng)?shù)姆绞綄?shí)現(xiàn),例如,控制器可以采取例如微處理器或處理器以及存儲(chǔ)可由該(微)處理器執(zhí)行的計(jì)算機(jī)可讀程序代碼(例如軟件或固件)的計(jì)算機(jī)可讀介質(zhì)、邏輯門(mén)、開(kāi)關(guān)、專用集成電路(applicationspecificintegratedcircuit,asic)、可編程邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存儲(chǔ)器控制器還可以被實(shí)現(xiàn)為存儲(chǔ)器的控制邏輯的一部分。本領(lǐng)域技術(shù)人員也知道,除了以純計(jì)算機(jī)可讀程序代碼方式實(shí)現(xiàn)控制器以外,完全可以通過(guò)將方法步驟進(jìn)行邏輯編程來(lái)使得控制器以邏輯門(mén)、開(kāi)關(guān)、專用集成電路、可編程邏輯控制器和嵌入微控制器等的形式來(lái)實(shí)現(xiàn)相同功能。因此這種控制器可以被認(rèn)為是一種硬件部件,而對(duì)其內(nèi)包括的用于實(shí)現(xiàn)各種功能的裝置也可以視為硬件部件內(nèi)的結(jié)構(gòu)?;蛘呱踔粒梢詫⒂糜趯?shí)現(xiàn)各種功能的裝置視為既可以是實(shí)現(xiàn)方法的軟件模塊又可以是硬件部件內(nèi)的結(jié)構(gòu)。

上述實(shí)施例闡明的系統(tǒng)、裝置、模塊或單元,具體可以由計(jì)算機(jī)芯片或?qū)嶓w實(shí)現(xiàn),或者由具有某種功能的產(chǎn)品來(lái)實(shí)現(xiàn)。一種典型的實(shí)現(xiàn)設(shè)備為計(jì)算機(jī)。具體的,計(jì)算機(jī)例如可以為個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、蜂窩電話、相機(jī)電話、智能電話、個(gè)人數(shù)字助理、媒體播放器、導(dǎo)航設(shè)備、電子郵件設(shè)備、游戲控制臺(tái)、平板計(jì)算機(jī)、可穿戴設(shè)備或者這些設(shè)備中的任何設(shè)備的組合。

為了描述的方便,描述以上裝置時(shí)以功能分為各種單元分別描述。當(dāng)然,在實(shí)施本申請(qǐng)時(shí)可以把各單元的功能在同一個(gè)或多個(gè)軟件和/或硬件中實(shí)現(xiàn)。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。

計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤(pán)只讀存儲(chǔ)器(cd-rom)、數(shù)字多功能光盤(pán)(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤(pán)存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。

還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、商品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、商品或者設(shè)備中還存在另外的相同要素。

本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本申請(qǐng)可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本申請(qǐng),在這些分布式計(jì)算環(huán)境中,由通過(guò)通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。

本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。

以上所述僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1