本發(fā)明實施例涉及分詞模型處理技術領域,尤其涉及一種基于人工智能的分詞模型的定制方法、裝置、設備和介質。
背景技術:
人工智能(artificialintelligence),英文縮寫為ai。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產(chǎn)出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
中文分詞指的是將一個漢字序列切分成一個一個單獨的詞。中文分詞是文本挖掘的基礎,對于輸入的一段中文,成功的進行中文分詞,可以達到電腦自動識別語句含義的效果。
現(xiàn)有的中文分詞模型一般都是通用分詞模型,無法針對專業(yè)領域或特定場景對文本進行準確的分詞?,F(xiàn)有技術中一般是通過使用專業(yè)領域或特定場景的分詞訓練語料重新訓練現(xiàn)有的通用分詞模型,得到專業(yè)領域或特定場景對應的分詞模型。
上述獲取專業(yè)領域或特定場景對應的分詞模型的方法,費時費力,且難以保證分詞質量。
技術實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法、裝置、設備和介質,以解決現(xiàn)有技術中通過對現(xiàn)有分詞模型進行重新訓練以獲得針對專業(yè)領域或特定場景的分詞模型費時費力的技術缺陷。
在第一方面,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法,包括:
獲取定制分詞訓練語料;
根據(jù)所述定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與所述定制分詞訓練語料對應的定制分詞模型。
在第二方面,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制裝置,包括:
訓練語料獲取模塊,用于獲取定制分詞訓練語料;
分詞模型修正模塊,用于根據(jù)所述定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與所述定制分詞訓練語料對應的定制分詞模型。
在第三方面,本發(fā)明實施例提供了一種設備,所述設備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法。
在第四方面,本發(fā)明實施例提供了一種包含計算機可執(zhí)行指令的存儲介質,所述計算機可執(zhí)行指令在由計算機處理器執(zhí)行時用于執(zhí)行本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法。
本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法、裝置、設備和介質,通過先獲取定制分詞訓練語料,然后根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型,解決了現(xiàn)有技術中通過對現(xiàn)有分詞模型進行重新訓練以獲得針對專業(yè)領域或特定場景的分詞模型費時費力的技術缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進行修正,獲得滿足用戶特定分詞需求的分詞模型。
附圖說明
圖1是本發(fā)明實施例一提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖2是本發(fā)明實施例二提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖3是本發(fā)明實施例三提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖4是本發(fā)明實施例四提供的一種基于人工智能的分詞模型的定制裝置的結構圖;
圖5是本發(fā)明實施例五中的一種設備的結構圖。
具體實施方式
為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖對本發(fā)明具體實施例作進一步的詳細描述??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。
另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部內(nèi)容。在更加詳細地討論示例性實施例之前應當提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時實施。此外,各項操作的順序可以被重新安排。當其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應于方法、函數(shù)、規(guī)程、子例程、子程序等等。
實施例一
圖1為本發(fā)明實施例一提供的一種基于人工智能的分詞模型的定制法的流程圖,本實施例的方法可以由基于人工智能的分詞模型的定制裝置來執(zhí)行,該裝置可通過硬件和/或軟件的方式實現(xiàn),并一般可集成于提供分詞模型定制的服務器中。本實施例的方法具體包括:
110、獲取定制分詞訓練語料。
在本實施例中,定制分詞訓練語料具體是指分詞方法符合專業(yè)領域要求、符合特定場景要求或是滿足用戶的特殊需求的已分詞語料。定制分詞訓練語料的獲取方式具體可以是用戶直接輸入,也可以是從用戶輸入的鏈接地址下載,還可以是從內(nèi)部存儲的分詞語料中提取等,本實施例對此不進行限制。
120、根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
在本實施例中,第一設定分詞模型具體可以是通用分詞模型、也可以是專用分詞模型,本實施例對此不進行限制,當然,第一設定分詞模型也可以是經(jīng)過本實施例的步驟110和步驟120生成的定制分詞模型,也就是說,可以對定制分詞模型再次進行定制。
進一步地,在本實施例中,第一設定分詞模型的獲取方式具體可以是用戶輸入,也可以是從用戶輸入的鏈接地址下載,還可以是從內(nèi)部存儲的分詞模型中選取等,本實施例對此不進行限制。
本領域技術人員可以理解的是,現(xiàn)有的分詞模型一般都是通用分詞模型,通用分詞模型對日常用語,常用詞組等內(nèi)容的分詞結果較為準確,但是,對于專業(yè)領域的專業(yè)詞組以及某些特定場景下的特有分詞難以進行準確地劃分,因此,本實施例中使用定制分詞訓練語料對第一設定分詞模型進行修正,以使修正后的分詞模型可以依據(jù)定制分詞訓練語料中的分詞方式對文本進行正確的分詞處理。
在本實施例中,使用增量訓練法修正第一設定分詞模型的過程具體可以是:使用第一設定分詞模型對定制分詞訓練語料進行分詞處理,得到分詞結果;比較分詞結果和定制分詞訓練語料,根據(jù)設定規(guī)則獲取更新參數(shù);根據(jù)更新參數(shù),更新第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
在本實施例中,使用權值干預法修正第一設定分詞模型的過程具體可以是:根據(jù)定制分詞訓練語料,生成分詞模型修正參數(shù);根據(jù)分詞模型修正參數(shù)和第一設定分詞模型的模型參數(shù),生成與定制分詞訓練語料對應的定制分詞模型。
在本實施例中,在得到與定制分詞訓練語料對應的定制分詞模型之后,可以將定制分詞模型存儲在設定存儲區(qū)域中,也可以將定制分詞模型輸出給用戶,還可以依據(jù)用戶的需求將定制分詞模型存儲在設定服務器中,上述三種方式也可以同時實施,也可以任選其中兩種方法同時實施。
進一步地,在本實施例中,在得到與定制分詞訓練語料對應的定制分詞模型之后,還可以將定制分詞訓練語料存儲在設定存儲區(qū)域中,進一步地,還可以在設定的時間點或接收到操作指令之后,對存儲的所有定制分詞訓練語料進行統(tǒng)計分析,然后根據(jù)統(tǒng)計分析的結果對第一設定分詞模型或其他分詞模型進行修正,修正的方法具體可以是增量訓練法等。
本發(fā)明實施例一提供了一種基于人工智能的分詞模型的定制方法,通過先獲取定制分詞訓練語料,然后根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型,解決了現(xiàn)有技術中通過對現(xiàn)有分詞模型進行重新訓練以獲得針對專業(yè)領域或特定場景的分詞模型費時費力的技術缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進行修正,獲得滿足用戶特定分詞需求的分詞模型。
實施例二
圖2是本發(fā)明實施例二提供的一種基于人工智能的分詞模型的定制方法的流程圖。本實施例以上述實施例為基礎進行優(yōu)化,在本實施例中,將根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型,具體化為:使用第一設定分詞模型對定制分詞訓練語料進行分詞處理,得到分詞結果;根據(jù)設定規(guī)則比較分詞結果和定制分詞訓練語料,獲取更新參數(shù);根據(jù)更新參數(shù),更新第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
進一步地,還具體包括:存儲定制分詞訓練語料以及定制分詞模型。
進一步地,還具體包括:依據(jù)設定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓練語料,生成標準分詞訓練語料;根據(jù)標準分詞訓練語料,使用增量訓練法修正第二設定分詞模型。
相應的,本實施例的方法具體包括:
210、獲取定制分詞訓練語料。
220、使用第一設定分詞模型對定制分詞訓練語料進行分詞處理,得到分詞結果。
在本實施例中,在獲取定制分詞訓練語料之后,會依據(jù)用戶的操作指令獲取第一設定分詞模型,然后使用第一設定分詞模型對定制分詞訓練語料進行分詞處理。
在本實施例中,使用第一設定分詞模型對定制分詞訓練語料進行分詞處理的方法可以是:首先根據(jù)第一設定分詞模型獲取轉移矩陣并根據(jù)第一設定分詞模型和定制分詞訓練語料獲取發(fā)射矩陣,然后,對發(fā)射矩陣和轉移矩陣進行馬爾可夫解碼,進而獲得分詞結果。
230、根據(jù)設定規(guī)則比較分詞結果和定制分詞訓練語料,獲取更新參數(shù)。
在本實施例中,設定規(guī)則具體可以是隨機梯度下降法等。更新參數(shù)具體是指第一設定分詞模型的各個模型參數(shù)需要更正的數(shù)值。
240、根據(jù)更新參數(shù),更新第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
在本實施例中,在獲取更新參數(shù)之后,會根據(jù)更新參數(shù)對第一設定分詞模型的模型參數(shù)進行修正,得到與定制分詞訓練語料對應的定制分詞模型,修正后的第一設定分詞模型不但可以實現(xiàn)原有分詞效果,同時還可以實現(xiàn)對定制分詞需訓練語料中的詞組的準確分詞。
250、存儲定制分詞訓練語料以及定制分詞模型。
在本實施例中,在得到與定制分詞訓練語料對應的定制分詞模型之后,會將該定制分詞模型存儲在設定存儲區(qū)域中或根據(jù)用戶的指令存儲在設定的服務器中。另外,定制分詞訓練語料和定制分詞模型可以存儲在相同的設定存儲區(qū)域中,也可以存儲在不同的設定存儲區(qū)域中,本實施例對此不進行限制。
進一步地,當將定制分詞模型根據(jù)用戶的指令存儲在設定的服務器中時,會將存儲地址以鏈接的形式告知用戶,以便用戶之后進行下載等操作,其中,設定的服務器具體可以是云服務器等。
260、依據(jù)設定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓練語料,生成標準分詞訓練語料。
本實施例的步驟260和步驟270給出了對第二設定分詞進行修正的過程,也就是說,在本實施例中,在獲取定制分詞模型之后,還會對第二設定分詞模型進行修正,其中,第二設定分詞模型具體可以是步驟240中得到的定制分詞模型,也可以是第一設定分詞模型。
在本實施例中,會依據(jù)設定的時間周期或在獲取用戶輸入的修正指令后,首先會獲取存儲的所有定制分詞訓練語料,然后對獲取的所有定制分詞訓練語料進行統(tǒng)計分析,最后根據(jù)統(tǒng)計分析的結果生成標準分詞訓練語料。
270、根據(jù)標準分詞訓練語料,使用增量訓練法修正第二設定分詞模型。
在本實施例中,使用增量訓練法修正第二設定分詞模型的方法具體可以是:使用第二設定分詞模型對標準分詞訓練語料進行分詞處理,得到分詞結果;根據(jù)設定規(guī)則比較分詞結果和標準分詞訓練語料,獲取更新參數(shù);根據(jù)更新參數(shù),更新第二設定分詞模型,得到與標準分詞訓練語料對應的定制分詞模型。
本發(fā)明實施例二提供了一種基于人工智能的分詞模型的定制方法,具體化了第一設定分詞模型的修正方法,可以簡便、快速地獲得定制分詞模型,還優(yōu)化增加了對定制分詞訓練語料和定制分詞模型的存儲,進一步地,優(yōu)化增加了根據(jù)存儲的定制分詞訓練語料對第二設定分詞模型進行修正,對第二設定分詞模型進行了優(yōu)化。利用該方法可以無需對第一設定分詞模型進行重新訓練,即可簡便、快速地獲得與定制分詞訓練語料對應的定制分詞模型,同時,還可以根據(jù)存儲的定制分詞訓練語料不斷地對分詞模型進行優(yōu)化,提升分詞效果,從而形成一個良好的循環(huán),同時節(jié)省了收集語料和標注語料的時間和成本。
實施例三
圖3是本發(fā)明實施例三提供的一種基于人工智能的分詞模型的定制方法的流程圖。本實施例以上述實施例為基礎進行優(yōu)化,在本實施例中,將根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型,具體化為:根據(jù)定制分詞訓練語料,生成分詞模型修正參數(shù);根據(jù)分詞模型修正參數(shù)和第一設定分詞模型的模型參數(shù),生成與定制分詞訓練語料對應的定制分詞模型。
進一步地,將存儲定制分詞訓練語料以及定制分詞模型,具體化為:將定制分詞模型存儲在自身的設定存儲區(qū)域;依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或將定制分詞模型存儲至外部設定服務器。
相應的,本實施例的方法具體包括:
310、獲取定制分詞訓練語料。
320、根據(jù)定制分詞訓練語料,生成分詞模型修正參數(shù)。
在本實施例中,分詞模型修正參數(shù)的獲取方法具體可以是將定制分詞訓練語料的特征權值作為分詞模型修正參數(shù)等。其中,定制分詞訓練語料的特征權值可以通過神經(jīng)網(wǎng)絡獲取。
330、根據(jù)分詞模型修正參數(shù)和第一設定分詞模型的模型參數(shù),生成與定制分詞訓練語料對應的定制分詞模型。
在本實施例中,生成與定制分詞訓練語料對應的定制分詞模型的方法具體可以是將分詞模型修正參數(shù)與第一設定分詞模型的模型參數(shù)合并,但是各自的數(shù)值不做任何改變,由此獲得與定制分詞訓練語料對應的定制分詞模型的模型參數(shù),根據(jù)該模型參數(shù)可進而獲得與定制分詞訓練語料對應的定制分詞模型。
在一個具體的例子中,分詞模型修正參數(shù)用矩陣
340、將定制分詞模型存儲在自身的設定存儲區(qū)域。
在本實施例中,在生成定制分詞模型之后,會將定制分詞模型存儲在自身的設定存儲區(qū)域中。
350、依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或將定制分詞模型存儲至外部設定服務器。
在本實施例中,存儲規(guī)則具體是指用戶輸入的對定制分詞模型存儲方式的操作指令。具體來說,上述操作指令具體可以有三種:第一種是僅將定制分詞模型輸出至客戶端;第二種是僅將定制分詞模型存儲至外部設定服務器中;第三種是不但要將定制分詞模型輸出至客戶端,同時也要講定制分詞模型存儲至外部設定服務器中。其中,外部設定服務器具體可以是云服務器。當將定制分詞模型存儲至外部設定服務器中時,存儲完成之后,會將存儲地址以鏈接的形式告知用戶,以便用戶之后進行下載等操作。
本發(fā)明實施例三提供了一種基于人工智能的分詞模型的定制方法,具體化了第一設定分詞模型的修正方法,簡單、快速地獲得與定制分詞訓練語料對應的定制分詞模型,同時,還具體化了定制分詞模型的存儲方式,增加了定制分詞模型存儲的靈活性。利用該方法可以無需對第一設定分詞模型進行重新訓練,即可簡單、快速地獲得與定制分詞訓練語料對應的定制分詞模型,同時,還可以給用戶提供多種定制分詞模型的存儲方式,以便用戶以后對定制分詞模型進行使用和修正。
實施例四
圖4是本發(fā)明實施例四提供的一種基于人工智能的分詞模型的定制裝置的結構圖。如圖4所示,所述裝置包括:訓練語料獲取模塊401以及分詞模型修正模塊402,其中:
訓練語料獲取模塊401,用于獲取定制分詞訓練語料;
分詞模型修正模塊402,用于根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
本發(fā)明實施例四提供了一種基于人工智能的分詞模型的定制裝置,通過先獲取定制分詞訓練語料,然后根據(jù)定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型,解決了現(xiàn)有技術中通過對現(xiàn)有分詞模型進行重新訓練以獲得針對專業(yè)領域或特定場景的分詞模型費時費力的技術缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進行修正,獲得滿足用戶特定分詞需求的分詞模型。
在上述各實施例的基礎上,分詞模型修正模塊可以包括:
分詞處理單元,用于使用第一設定分詞模型對定制分詞訓練語料進行分詞處理,得到分詞結果;
更新參數(shù)獲取單元,用于比較分詞結果和定制分詞訓練語料,根據(jù)設定規(guī)則獲取更新參數(shù);
模型更新單元,用于根據(jù)更新參數(shù),更新第一設定分詞模型,得到與定制分詞訓練語料對應的定制分詞模型。
在上述各實施例的基礎上,分詞模型修正模塊可以包括:
修正參數(shù)生成單元,用于根據(jù)定制分詞訓練語料,生成分詞模型修正參數(shù);
第一模型修正單元,用于根據(jù)所詞模型修正參數(shù)和第一設定分詞模型的模型參數(shù),生成與定制分詞訓練語料對應的定制分詞模型。
在上述各實施例的基礎上,還可以包括:
語料存儲模塊,用于存儲定制分詞訓練語料以及定制分詞模型。
在上述各實施例的基礎上,還可以包括:
標準分詞訓練語料生成單元,用于依據(jù)設定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓練語料,生成標準分詞訓練語料;
第二模型修正單元,用于根據(jù)標準分詞訓練語料,使用增量訓練法修正第二設定分詞模型。
在上述各實施例的基礎上,語料存儲模塊可以包括:
模型存儲單元,用于將定制分詞模型存儲在自身的設定存儲區(qū)域;
模型輸出單元,用于依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或將定制分詞模型存儲至外部設定服務器。
本發(fā)明實施例所提供的基于人工智能的分詞模型的定制裝置可用于執(zhí)行本發(fā)明任意實施例提供的基于人工智能的分詞模型的定制方法,具備相應的功能模塊,實現(xiàn)相同的有益效果。
實施例五
圖5為本發(fā)明實施例五提供的一種設備的結構示意圖。圖5示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性設備12的框圖。圖5顯示的設備12僅僅是一個示例,不應對本發(fā)明實施例的功能和使用范圍帶來任何限制。
如圖5所示,設備12以通用計算設備的形式表現(xiàn)。設備12的組件可以包括但不限于:一個或者多個處理器或者處理單元16,系統(tǒng)存儲器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
總線18表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限于工業(yè)標準體系結構(isa)總線,微通道體系結構(mac)總線,增強型isa總線、視頻電子標準協(xié)會(vesa)局域總線以及外圍組件互連(pci)總線。
設備12典型地包括多種計算機系統(tǒng)可讀介質。這些介質可以是任何能夠被設備12訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。
系統(tǒng)存儲器28可以包括易失性存儲器形式的計算機系統(tǒng)可讀介質,例如隨機存取存儲器(ram)30和/或高速緩存存儲器32。設備12可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統(tǒng)存儲介質。僅作為舉例,存儲系統(tǒng)34可以用于讀寫不可移動的、非易失性磁介質(圖c未顯示,通常稱為“硬盤驅動器”)。盡管圖5中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅動器,以及對可移動非易失性光盤(例如cd-rom,dvd-rom或者其它光介質)讀寫的光盤驅動器。在這些情況下,每個驅動器可以通過一個或者多個數(shù)據(jù)介質接口與總線18相連。存儲器28可以包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實施例的功能。
具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括但不限于操作系統(tǒng)、一個或者多個應用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包括網(wǎng)絡環(huán)境的實現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實施例中的功能和/或方法。
設備12也可以與一個或多個外部設備14(例如鍵盤、指向設備、顯示器24等)通信,還可與一個或者多個使得用戶能與該設備12交互的設備通信,和/或與使得該設備12能與一個或多個其它計算設備進行通信的任何設備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進行。并且,設備12還可以通過網(wǎng)絡適配器20與一個或者多個網(wǎng)絡(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡,例如因特網(wǎng))通信。如圖所示,網(wǎng)絡適配器20通過總線18與設備12的其它模塊通信。應當明白,盡管圖中未示出,可以結合設備12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設備驅動器、冗余處理單元、外部磁盤驅動陣列、raid系統(tǒng)、磁帶驅動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理單元16通過運行存儲在系統(tǒng)存儲器28中的程序,從而執(zhí)行各種功能應用以及數(shù)據(jù)處理,例如實現(xiàn)本發(fā)明實施例所提供的基于人工智能的分詞模型的定制方法,所述基于人工智能的分詞模型的定制方法包括:
獲取定制分詞訓練語料;
根據(jù)所述定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與所述定制分詞訓練語料對應的定制分詞模型。
實施例六
本發(fā)明實施例六還提供了一種包含計算機可執(zhí)行指令的存儲介質,所述計算機可執(zhí)行指令在由計算機處理器執(zhí)行時用于執(zhí)行如本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法,所述基于人工智能的分詞模型的定制方法包括:
獲取定制分詞訓練語料;
根據(jù)所述定制分詞訓練語料,使用增量訓練法或權值干預法修正第一設定分詞模型,得到與所述定制分詞訓練語料對應的定制分詞模型。
本發(fā)明實施例的計算機存儲介質,可以采用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用。
計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用的程序。
計算機可讀介質上包含的程序代碼可以用任何適當?shù)慕橘|傳輸,包括——但不限于無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設計語言包括面向對象的程序設計語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設計語言—諸如”c”語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務提供商來通過因特網(wǎng)連接)。
注意,上述僅為本發(fā)明的較佳實施例及所運用技術原理。本領域技術人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領域技術人員來說能夠進行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護范圍。因此,雖然通過以上實施例對本發(fā)明進行了較為詳細的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權利要求范圍決定。