本發(fā)明涉及人機(jī)交互技術(shù)領(lǐng)域,具體地說,涉及一種面向智能機(jī)器人開發(fā)的自定義意圖實(shí)現(xiàn)方法及裝置。
背景技術(shù):
隨著科學(xué)技術(shù)的不斷發(fā)展,信息技術(shù)、計(jì)算機(jī)技術(shù)以及人工智能技術(shù)的引入,機(jī)器人的研究已經(jīng)逐步走出工業(yè)領(lǐng)域,逐漸擴(kuò)展到了醫(yī)療、保健、家庭、娛樂以及服務(wù)行業(yè)等領(lǐng)域。人們對(duì)于機(jī)器人的要求也從簡(jiǎn)單重復(fù)的機(jī)械動(dòng)作提升為具有高度智能型、自主性及與其他智能體交互的智能機(jī)器人。
為了滿足人們?nèi)找嬖鲩L(zhǎng)的需求,本領(lǐng)域技術(shù)人員需要不斷提高智能機(jī)器人的交互能力和智能性,使智能機(jī)器人的用戶體驗(yàn)越來越好。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法,包括:
獲取用戶輸入的針對(duì)目標(biāo)應(yīng)用的意圖識(shí)別解析樣例及對(duì)應(yīng)需識(shí)別意圖;
對(duì)所述解析樣例進(jìn)行語義理解,根據(jù)實(shí)體詞庫識(shí)別所述解析樣例中的實(shí)體詞,獲取所述實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,結(jié)合確定的實(shí)體名稱,生成匹配參數(shù),使用所述匹配參數(shù)替換所述解析樣例中的實(shí)體詞,生成規(guī)則句式;
獲取待意圖識(shí)別的文本數(shù)據(jù),根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例,結(jié)合所述規(guī)則實(shí)例與所述解析樣例的相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖;
當(dāng)匹配成功時(shí),執(zhí)行所述需識(shí)別意圖對(duì)應(yīng)的控制指令。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例包括:
提取所述待意圖識(shí)別的文本數(shù)據(jù)中,與所述匹配參數(shù)對(duì)應(yīng)的實(shí)體詞;
使用所提取的實(shí)體詞替換所述規(guī)則句式中的匹配參數(shù),生成規(guī)則實(shí)例。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,本發(fā)明提供的面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法還包括:
獲取用戶輸入的所述需識(shí)別意圖對(duì)應(yīng)的相似度閾值;當(dāng)存在多個(gè)需匹配意圖時(shí),所述根據(jù)所述相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖,包括:
確定與所述文本數(shù)據(jù)的相似度最高的規(guī)則實(shí)例;
判斷其相似度是否超過該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值,
當(dāng)所述相似度超過所述相似度閾值時(shí),判斷所述文本數(shù)據(jù)與該規(guī)則實(shí)例對(duì)應(yīng)的需識(shí)別意圖匹配。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述比較所述規(guī)則實(shí)例與所述文本數(shù)據(jù)的相似度,包括:
對(duì)所述規(guī)則實(shí)例及所述文本數(shù)據(jù)進(jìn)行分詞;
對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注;
結(jié)合無關(guān)詞標(biāo)注結(jié)果,比較所述規(guī)則實(shí)例及所述文本數(shù)據(jù)的相似度。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,結(jié)合詞性、詞頻及詞的前后關(guān)系,通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
本發(fā)明實(shí)施例還提供一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)裝置,包括:
獲取模塊,用于獲取用戶輸入的針對(duì)目標(biāo)應(yīng)用的意圖識(shí)別解析樣例及對(duì)應(yīng)需識(shí)別意圖;
規(guī)則生成模塊,用于對(duì)所述解析樣例進(jìn)行語義理解,根據(jù)實(shí)體詞庫識(shí)別所述解析樣例中的實(shí)體詞,獲取所述實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,結(jié)合確定的實(shí)體名稱,生成匹配參數(shù),使用所述匹配參數(shù)替換所述解析樣例中的實(shí)體詞,生成規(guī)則句式;
意圖識(shí)別模塊,用于獲取待意圖識(shí)別的文本數(shù)據(jù),根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例,結(jié)合所述規(guī)則實(shí)例與所述解析樣例的相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖;
指令執(zhí)行模塊,用于當(dāng)匹配成功時(shí),執(zhí)行所述需識(shí)別意圖對(duì)應(yīng)的控制指令。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述規(guī)則生成模塊根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例包括:
提取所述待意圖識(shí)別的文本數(shù)據(jù)中,與所述匹配參數(shù)對(duì)應(yīng)的實(shí)體詞;
使用所提取的實(shí)體詞替換所述規(guī)則句式中的匹配參數(shù),生成規(guī)則實(shí)例。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述獲取模塊還用于:
獲取用戶輸入的所述需識(shí)別意圖對(duì)應(yīng)的相似度閾值;
當(dāng)存在多個(gè)需匹配意圖時(shí),所述意圖識(shí)別模塊根據(jù)所述相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖,包括:
確定與所述文本數(shù)據(jù)的相似度最高的規(guī)則實(shí)例;
判斷其相似度是否超過該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值,
當(dāng)所述相似度超過所述相似度閾值時(shí),判斷所述文本數(shù)據(jù)與該規(guī)則實(shí)例對(duì)應(yīng)的需識(shí)別意圖匹配。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述意圖識(shí)別模塊比較所述規(guī)則實(shí)例與所述文本數(shù)據(jù)的相似度,包括:
對(duì)所述規(guī)則實(shí)例及所述文本數(shù)據(jù)進(jìn)行分詞;
對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注;
結(jié)合無關(guān)詞標(biāo)注結(jié)果,比較所述規(guī)則實(shí)例及所述文本數(shù)據(jù)的相似度。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,
結(jié)合詞性、詞頻及詞的前后關(guān)系,通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
本發(fā)明提供了一種面向智能機(jī)器人開發(fā)的自定義意圖實(shí)現(xiàn)方法及裝置,可以使智能機(jī)器人應(yīng)用的開發(fā)者根據(jù)自己的需求進(jìn)行意圖識(shí)別的自定義,增加了智能機(jī)器人應(yīng)用的開發(fā)靈活度,并且可以使應(yīng)用的開發(fā)者通過簡(jiǎn)單的設(shè)定實(shí)現(xiàn)應(yīng)用意圖識(shí)別的設(shè)計(jì),可以令更多的應(yīng)用開發(fā)者加入到智能機(jī)器人的應(yīng)用開發(fā)中,提高了智能機(jī)器人技術(shù)的發(fā)展速度,用戶體驗(yàn)越來越好,通過規(guī)則實(shí)例與待意圖識(shí)別的文本數(shù)據(jù)的相似度匹配,來實(shí)現(xiàn)意圖識(shí)別,可以有效提高意圖識(shí)別的準(zhǔn)確率,進(jìn)而令智能機(jī)器人的交互能力和智能性越來越強(qiáng),能夠滿足更多人的需求。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要的附圖做簡(jiǎn)單的介紹:
圖1是本申請(qǐng)實(shí)施例提供的一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法流程圖;
圖2是本申請(qǐng)實(shí)施例提供的一種意圖識(shí)別方法流程圖;
圖3是本發(fā)明實(shí)施例提供的一種確定相似度方法流程圖;
圖4是本發(fā)明實(shí)施例提供的一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)裝置結(jié)構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例提供的另一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。需要說明的是,只要不構(gòu)成沖突,本發(fā)明中的各個(gè)實(shí)施例以及各實(shí)施例中的各個(gè)特征可以相互結(jié)合,所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。
同時(shí),在以下說明中,出于解釋的目的而闡述了許多具體細(xì)節(jié),以提供對(duì)本發(fā)明實(shí)施例的徹底理解。然而,對(duì)本領(lǐng)域的技術(shù)人員來說顯而易見的是,本發(fā)明可以不用這里的具體細(xì)節(jié)或者所描述的特定方式來實(shí)施。
另外,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
目前,智能機(jī)器人技術(shù)在不斷提高,越來越多的開發(fā)者加入了智能機(jī)器人應(yīng)用開發(fā)的行列,然而,由于智能機(jī)器人的交互方式與傳統(tǒng)的交互方式不同,與傳統(tǒng)的手機(jī)和電腦等移動(dòng)終端的觸控式或者鼠標(biāo)的操作方式相比,安裝在智能機(jī)器人上的應(yīng)用,由于智能機(jī)器人的智能性和類人性要求,需要主動(dòng)響應(yīng)用戶的語音或者文字輸入的意圖,這就需要智能機(jī)器人有較強(qiáng)的意圖識(shí)別能力。
由于開發(fā)者可能開發(fā)的應(yīng)用多種多樣,智能機(jī)器人很難對(duì)每個(gè)開發(fā)者開發(fā)的應(yīng)用都進(jìn)行準(zhǔn)確度較高的意圖識(shí)別,并且并不是所有的應(yīng)用開發(fā)者都具有獨(dú)立的開發(fā)整個(gè)機(jī)器人的能力,能夠針對(duì)其應(yīng)用單獨(dú)開發(fā)可意圖識(shí)別的機(jī)器人,因此,如何實(shí)現(xiàn)讓機(jī)器人能夠?qū)Ω鲬?yīng)用開發(fā)者設(shè)定的意圖都能理解,滿足應(yīng)用開發(fā)者可通過簡(jiǎn)單、快捷的方式進(jìn)行機(jī)器人應(yīng)用開發(fā),即可滿足其應(yīng)用的意圖識(shí)別自定義需求,縮短開發(fā)周期,是本領(lǐng)域技術(shù)人員亟需解決的問題。
為了解決這個(gè)問題,本發(fā)明提供了一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法,通過本發(fā)明,智能機(jī)器人應(yīng)用的開發(fā)者可以設(shè)定針對(duì)其應(yīng)用的意圖識(shí)別規(guī)則,從而使智能機(jī)器人的意圖識(shí)別能力滿足其應(yīng)用的需求。
本申請(qǐng)?zhí)峁┑姆椒ê脱b置意圖服務(wù)于智能機(jī)器人應(yīng)用的開發(fā)者,因此,本文中所述用戶為智能機(jī)器人應(yīng)用的開發(fā)者。本申請(qǐng)中的智能機(jī)器人可以是智能硬件、實(shí)體機(jī)器人以及微信公眾號(hào)和移動(dòng)應(yīng)用等第三方平臺(tái),本申請(qǐng)中智能機(jī)器人中的應(yīng)用,可以是安裝在實(shí)體機(jī)器人中的可從應(yīng)用商店下載的客戶端軟件app,也可以是用于微信公知號(hào),網(wǎng)絡(luò)平臺(tái),或移動(dòng)應(yīng)用上,實(shí)現(xiàn)家居場(chǎng)景,或者客服場(chǎng)景上某一具有交互功能的應(yīng)用模塊,或者其他任何基于人工智能技術(shù),通過意圖識(shí)別以實(shí)現(xiàn)與人的交互的應(yīng)用或功能。本申請(qǐng)?zhí)峁┑姆椒ǖ膱?zhí)行主體可以是用于智能機(jī)器人應(yīng)用開發(fā)的平臺(tái)或者系統(tǒng)。
如圖1所示,本發(fā)明實(shí)施例提供的一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法,包括:
s101、獲取用戶輸入的針對(duì)目標(biāo)應(yīng)用的意圖識(shí)別解析樣例及對(duì)應(yīng)需識(shí)別意圖;
s102、對(duì)所述解析樣例進(jìn)行語義理解,根據(jù)實(shí)體詞庫識(shí)別所述解析樣例中的實(shí)體詞,獲取所述實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,結(jié)合確定的實(shí)體名稱,生成匹配參數(shù),使用所述匹配參數(shù)替換所述解析樣例中的實(shí)體詞,生成規(guī)則句式;
s103、獲取待意圖識(shí)別的文本數(shù)據(jù),根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例,結(jié)合所述規(guī)則實(shí)例與所述解析樣例的相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖;
s104、當(dāng)匹配成功時(shí),執(zhí)行所述需識(shí)別意圖對(duì)應(yīng)的控制指令。
(1)以天氣查詢應(yīng)用為例,用戶輸入的意圖識(shí)別解析樣例可以是“北京今天天氣怎么樣”,對(duì)應(yīng)的需識(shí)別意圖可以是“查天氣”;
(2)接收到這樣的解析樣例(“北京今天天氣怎么樣”)之后,本發(fā)明提供的自定義意圖識(shí)別方法,可以通過語義理解并結(jié)合實(shí)體詞庫對(duì)解析樣例進(jìn)行解析,例如,“北京今天天氣怎么樣”,其中的實(shí)體詞包括“北京”,“今天”,進(jìn)一步,確定各實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,例如,“北京”的實(shí)體名稱可以為“城市”,“今天”的實(shí)體名稱可以為“時(shí)間”。
(3)獲取了解析樣例中各實(shí)體的實(shí)體名稱后,可以跟據(jù)該實(shí)體名稱,生成匹配參數(shù),如實(shí)體名稱為“城市”,生成的對(duì)應(yīng)匹配參數(shù)可以為“city”,實(shí)體名稱為“時(shí)間”,匹配參數(shù)可以為“time”,匹配參數(shù)的生成規(guī)則不進(jìn)行具體限定,匹配參數(shù)可以用來替換解析樣例中的實(shí)體名稱對(duì)應(yīng)的實(shí)體詞,來生成規(guī)則句式,例如“北京今天天氣怎么樣”,生成的規(guī)則句式,可以是“<city><time>天氣怎么樣”。
需要說明的是,所述匹配參數(shù)與實(shí)體名稱相關(guān)聯(lián),而一個(gè)實(shí)體名稱可能對(duì)應(yīng)多個(gè)匹配參數(shù),例如,應(yīng)用開發(fā)者要開發(fā)查列車班次這一應(yīng)用,輸入的解析樣例可以為“北京到上海的列車班次”,解析并提取到“北京”的實(shí)體名稱“城市”,對(duì)應(yīng)的匹配參數(shù)可以為“fromcity”,“上海”的實(shí)體名稱為“城市”,對(duì)應(yīng)的匹配參數(shù)可以為“tocity”,其中“fromcity”與實(shí)體名稱“城市”相關(guān)聯(lián),“tocity”也與實(shí)體名稱“城市”相關(guān)聯(lián)。生成匹配參數(shù)時(shí),可以僅根據(jù)實(shí)體名稱生成匹配參數(shù),例如將匹配參數(shù)生成為“city1”和“city2”,也可以結(jié)合“北京到上海的列車班次”這一解析樣例的解析結(jié)果,將匹配參數(shù)生成為“fromcity”和“tocity”。
綜上所述,對(duì)于匹配參數(shù)的形式,生成規(guī)則,本申請(qǐng)不進(jìn)行限定,本領(lǐng)域技術(shù)人員可以根據(jù)需求進(jìn)行匹配參數(shù)的設(shè)定,只要能滿足生成規(guī)則句式的需要即可。
進(jìn)一步,本申請(qǐng)實(shí)施例提供的意圖識(shí)別方法,可以通過相似度計(jì)算實(shí)現(xiàn),在接收到待意圖識(shí)別的文本數(shù)據(jù)時(shí),提取意圖識(shí)別文本數(shù)據(jù)中的,與匹配參數(shù)對(duì)應(yīng)的實(shí)體詞,再使用提取的實(shí)體詞替換規(guī)則句式中的匹配參數(shù),生成該文本數(shù)據(jù)對(duì)應(yīng)的規(guī)則實(shí)例。
其中,待意圖識(shí)別的文本數(shù)據(jù),可以是應(yīng)用開發(fā)者輸入的測(cè)試文本,也可以是安裝該應(yīng)用的機(jī)器人通過語音識(shí)別獲取到的文本數(shù)據(jù),當(dāng)然,也可以是獲取到的其他需要進(jìn)行意圖識(shí)別的文本數(shù)據(jù),本申請(qǐng)不進(jìn)行限定。
意圖識(shí)別的過程中,假如輸入的待意圖識(shí)別的文本數(shù)據(jù)為“上海明天天氣好么”,那么獲取到文本數(shù)據(jù)中的與匹配參數(shù)對(duì)應(yīng)的實(shí)體詞可以為“上海”和“明天”,那么生成的規(guī)則實(shí)例可以是“上海明天天氣怎么樣”,再對(duì)規(guī)則實(shí)例“上海明天天氣怎么樣”和待意圖識(shí)別的文本數(shù)據(jù)“上海明天天氣好么”,進(jìn)行相似度比對(duì)。
當(dāng)存在多個(gè)需匹配意圖時(shí),可以通過比較該文本數(shù)據(jù),與各需匹配意圖對(duì)應(yīng)的規(guī)則實(shí)例的相似度,來確定與該文本數(shù)據(jù)最貼近的意圖,即:查天氣。
例如,當(dāng)查天氣意圖,和查列車班次意圖并存時(shí),查天氣意圖的規(guī)則句式為“<city><time>天氣怎么樣”,而查列車班次的規(guī)則句式為“從<fromcity>到<tocity>的列車班次”,那么當(dāng)獲取到的待意圖識(shí)別文本數(shù)據(jù)為“北京今天天氣好不好”,此時(shí)查天氣意圖對(duì)應(yīng)的規(guī)則實(shí)例為“北京今天天氣怎么樣”,而查列車班次意圖對(duì)應(yīng)的規(guī)則實(shí)例為“從北京到<tocity>的列車班次”,進(jìn)而可以計(jì)算兩個(gè)意圖對(duì)應(yīng)的規(guī)則實(shí)例,與待意圖識(shí)別文本數(shù)據(jù)之間的相似度。
相似度的比較結(jié)果是,查天氣意圖對(duì)應(yīng)的規(guī)則實(shí)例,與該待意圖識(shí)別文本數(shù)據(jù)之間的相似度較高,則進(jìn)一步判斷相似度是否超過了該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值,該相似度閾值,可以為用戶自定義的相似度閾值,則本發(fā)明實(shí)施例提供的面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法,還包括:獲取用戶輸入的所述需識(shí)別意圖對(duì)應(yīng)的相似度閾值,其中,由于需識(shí)別意圖與規(guī)則實(shí)例相對(duì)應(yīng),因此,該解析樣例對(duì)應(yīng)的相似度閾值,即為該需識(shí)別意圖對(duì)應(yīng)的相似度閾值。
如圖2所示,根據(jù)所述相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖,包括:
s201、確定與所述文本數(shù)據(jù)的相似度最高的規(guī)則實(shí)例;
s202、判斷其相似度是否超過該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值;
s203、當(dāng)所述相似度超過所述相似度閾值時(shí),判斷所述文本數(shù)據(jù)與該規(guī)則實(shí)例對(duì)應(yīng)的需識(shí)別意圖匹配。
實(shí)際應(yīng)用中,本領(lǐng)域技術(shù)人員可以采用多種方式比較規(guī)則實(shí)例與文本數(shù)據(jù)的相似度,較佳的,如圖3所示,本申請(qǐng)?zhí)峁┑囊环N比較規(guī)則實(shí)例與文本數(shù)據(jù)相似度的方法包括:
s301、對(duì)所述規(guī)則實(shí)例及所述文本數(shù)據(jù)進(jìn)行分詞;
s302、對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注;
s303、結(jié)合無關(guān)詞標(biāo)注結(jié)果,比較所述規(guī)則實(shí)例及所述文本數(shù)據(jù)的相似度。
實(shí)際應(yīng)用中,獲取到的解析樣例,和待意圖識(shí)別的文本數(shù)據(jù)中,可能存在大量的無關(guān)詞,例如如果輸入的文本數(shù)據(jù)為“麻煩你告訴我一下北京人口數(shù)”,而查天氣意圖對(duì)應(yīng)的規(guī)則句式為“麻煩你告訴我一下<city>天氣”,查人口數(shù)的規(guī)則句式為“<city>人口是多少”,如果直接根據(jù)分詞結(jié)果獲得的集合進(jìn)行相似度比對(duì),則得出的結(jié)果為文本數(shù)據(jù)與查天氣的意圖匹配,進(jìn)而輸出查天氣的結(jié)果。
為了解決這一問題,本申請(qǐng)首先對(duì)分詞結(jié)果中的無關(guān)詞進(jìn)行標(biāo)注,將文本數(shù)據(jù)和規(guī)則句式中的“麻煩/你/告訴/我/一下”標(biāo)注為無關(guān)詞,進(jìn)而能夠基于核心詞匯進(jìn)行相似度比對(duì),從而避免意圖識(shí)別結(jié)果受太多無關(guān)音素的干擾,影響意圖識(shí)別的準(zhǔn)確度。
進(jìn)一步,本申請(qǐng)中進(jìn)一步采用條件隨機(jī)場(chǎng)crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注,包括:
結(jié)合詞性、詞頻及詞的前后關(guān)系,通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
由于本發(fā)明的方法描述的是在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)的。該計(jì)算機(jī)系統(tǒng)例如可以設(shè)置在機(jī)器人的控制核心處理器中。例如,本文所述的方法可以實(shí)現(xiàn)為能以控制邏輯來執(zhí)行的軟件,其由機(jī)器人控制系統(tǒng)中的cpu來執(zhí)行。本文所述的功能可以實(shí)現(xiàn)為存儲(chǔ)在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中的程序指令集合。當(dāng)以這種方式實(shí)現(xiàn)時(shí),該計(jì)算機(jī)程序包括一組指令,當(dāng)該組指令由計(jì)算機(jī)運(yùn)行時(shí)其促使計(jì)算機(jī)執(zhí)行能實(shí)施上述功能的方法??删幊踢壿嬁梢詴簳r(shí)或永久地安裝在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中,例如只讀存儲(chǔ)器芯片、計(jì)算機(jī)存儲(chǔ)器、磁盤或其他存儲(chǔ)介質(zhì)。除了以軟件來實(shí)現(xiàn)之外,本文所述的邏輯可利用分立部件、集成電路、與可編程邏輯設(shè)備(諸如,現(xiàn)場(chǎng)可編程門陣列(fpga)或微處理器)結(jié)合使用的可編程邏輯,或者包括它們?nèi)我饨M合的任何其他設(shè)備來體現(xiàn)。所有此類實(shí)施例旨在落入本發(fā)明的范圍之內(nèi)。
本申請(qǐng)?zhí)峁┑拿嫦蛑悄軝C(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)方法,可以用于應(yīng)用開發(fā)平臺(tái),應(yīng)用開發(fā)服務(wù)器,或者可用于機(jī)器人應(yīng)用開發(fā)的機(jī)器人本身,可以通過應(yīng)用開發(fā)網(wǎng)站,應(yīng)用開發(fā)器的形式,為智能機(jī)器人的應(yīng)用開發(fā)者提供服務(wù)。
本發(fā)明實(shí)施例還提供一種自定義面向智能機(jī)器人的意圖識(shí)別的實(shí)現(xiàn)裝置,該實(shí)現(xiàn)裝置的具體實(shí)施例可參考本發(fā)明實(shí)施中的自定義面向智能機(jī)器人的意圖識(shí)別的實(shí)現(xiàn)方法的實(shí)施例,在此不做重復(fù)限定,本發(fā)明實(shí)施例提供的自定義面向智能機(jī)器人的意圖識(shí)別的實(shí)現(xiàn)裝置可以裝載在網(wǎng)絡(luò)服務(wù)器,以平臺(tái)的形式服務(wù)于應(yīng)用開發(fā)者,也可以存在于可進(jìn)行應(yīng)用開發(fā)的機(jī)器人上,可以實(shí)現(xiàn)智能硬件、實(shí)體機(jī)器人以及微信公眾號(hào)和移動(dòng)應(yīng)用等第三方平臺(tái)上的自定義意圖識(shí)別的實(shí)現(xiàn),如圖4所示,該實(shí)現(xiàn)裝置的結(jié)構(gòu)包括:
獲取模塊401,用于獲取用戶輸入的針對(duì)目標(biāo)應(yīng)用的意圖識(shí)別解析樣例及對(duì)應(yīng)需識(shí)別意圖;
規(guī)則生成模塊402,用于對(duì)所述解析樣例進(jìn)行語義理解,根據(jù)實(shí)體詞庫識(shí)別所述解析樣例中的實(shí)體詞,獲取所述實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,結(jié)合確定的實(shí)體名稱,生成匹配參數(shù),使用所述匹配參數(shù)替換所述解析樣例中的實(shí)體詞,生成規(guī)則句式;
意圖識(shí)別模塊403,用于獲取待意圖識(shí)別的文本數(shù)據(jù),根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例,結(jié)合所述規(guī)則實(shí)例與所述解析樣例的相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖;
指令執(zhí)行模塊404,用于當(dāng)匹配成功時(shí),執(zhí)行所述需識(shí)別意圖對(duì)應(yīng)的控制指令。
所述規(guī)則生成模塊根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例包括:
提取所述待意圖識(shí)別的文本數(shù)據(jù)中,與所述匹配參數(shù)對(duì)應(yīng)的實(shí)體詞;
使用所提取的實(shí)體詞替換所述規(guī)則句式中的匹配參數(shù),生成規(guī)則實(shí)例。
進(jìn)一步,所述獲取模塊還用于:
獲取用戶輸入的所述需識(shí)別意圖對(duì)應(yīng)的相似度閾值;
當(dāng)存在多個(gè)需匹配意圖時(shí),所述意圖識(shí)別模塊根據(jù)所述相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖,包括:
確定與所述文本數(shù)據(jù)的相似度最高的規(guī)則實(shí)例;
判斷其相似度是否超過該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值,
當(dāng)所述相似度超過所述相似度閾值時(shí),判斷所述文本數(shù)據(jù)與該規(guī)則實(shí)例對(duì)應(yīng)的需識(shí)別意圖匹配。
所述意圖識(shí)別模塊比較所述規(guī)則實(shí)例與所述文本數(shù)據(jù)的相似度,包括:
對(duì)所述規(guī)則實(shí)例及所述文本數(shù)據(jù)進(jìn)行分詞;
對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注;
結(jié)合無關(guān)詞標(biāo)注結(jié)果,比較所述規(guī)則實(shí)例及所述文本數(shù)據(jù)的相似度。
進(jìn)一步,意圖識(shí)別模塊可以通過條件隨機(jī)場(chǎng)crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
較佳的,意圖識(shí)別模塊可以結(jié)合詞性、詞頻及詞的前后關(guān)系,通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
如圖5所示,本申請(qǐng)還提供一種面向智能機(jī)器人的自定義意圖識(shí)別的實(shí)現(xiàn)裝置,包括存儲(chǔ)器501和一個(gè)或多個(gè)處理器502,其中,存儲(chǔ)器501存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)可讀程序代碼,所述一個(gè)或多個(gè)處理器502用于執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)可讀程序代碼以實(shí)現(xiàn):
獲取用戶輸入的針對(duì)目標(biāo)應(yīng)用的意圖識(shí)別解析樣例及對(duì)應(yīng)需識(shí)別意圖;
對(duì)所述解析樣例進(jìn)行語義理解,根據(jù)實(shí)體詞庫識(shí)別所述解析樣例中的實(shí)體詞,獲取所述實(shí)體詞對(duì)應(yīng)的實(shí)體名稱,結(jié)合確定的實(shí)體名稱,生成匹配參數(shù),使用所述匹配參數(shù)替換所述解析樣例中的實(shí)體詞,生成規(guī)則句式;
獲取待意圖識(shí)別的文本數(shù)據(jù),根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例,結(jié)合所述規(guī)則實(shí)例與所述解析樣例的相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖;
當(dāng)匹配成功時(shí),執(zhí)行所述需識(shí)別意圖對(duì)應(yīng)的控制指令。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述根據(jù)所述規(guī)則句式,解析所述文本數(shù)據(jù)生成對(duì)應(yīng)的規(guī)則實(shí)例包括:
提取所述待意圖識(shí)別的文本數(shù)據(jù)中,與所述匹配參數(shù)對(duì)應(yīng)的實(shí)體詞;
使用所提取的實(shí)體詞替換所述規(guī)則句式中的匹配參數(shù),生成規(guī)則實(shí)例。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述一個(gè)或多個(gè)處理器502還用于執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)可讀程序代碼以實(shí)現(xiàn):
獲取用戶輸入的所述需識(shí)別意圖對(duì)應(yīng)的相似度閾值;當(dāng)存在多個(gè)需匹配意圖時(shí),所述根據(jù)所述相似度,判斷所述文本數(shù)據(jù)是否匹配所述需識(shí)別意圖,包括:
確定與所述文本數(shù)據(jù)的相似度最高的規(guī)則實(shí)例;
判斷其相似度是否超過該規(guī)則實(shí)例對(duì)應(yīng)的相似度閾值,
當(dāng)所述相似度超過所述相似度閾值時(shí),判斷所述文本數(shù)據(jù)與該規(guī)則實(shí)例對(duì)應(yīng)的需識(shí)別意圖匹配。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述比較所述規(guī)則實(shí)例與所述文本數(shù)據(jù)的相似度,包括:
對(duì)所述規(guī)則實(shí)例及所述文本數(shù)據(jù)進(jìn)行分詞;
對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注;
結(jié)合無關(guān)詞標(biāo)注結(jié)果,比較所述規(guī)則實(shí)例及所述文本數(shù)據(jù)的相似度。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,通過條件隨機(jī)場(chǎng)crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注,包括:
結(jié)合詞性、詞頻及詞的前后關(guān)系,通過crf對(duì)分詞結(jié)果進(jìn)行無關(guān)詞標(biāo)注。
應(yīng)該理解的是,本發(fā)明所公開的實(shí)施例不限于這里所公開的特定結(jié)構(gòu)、處理步驟或材料,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語僅用于描述特定實(shí)施例的目的,而并不意味著限制。
說明書中提到的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,說明書通篇各個(gè)地方出現(xiàn)的短語“一個(gè)實(shí)施例”或“實(shí)施例”并不一定均指同一個(gè)實(shí)施例。
雖然上述示例用于說明本發(fā)明在一個(gè)或多個(gè)應(yīng)用中的原理,但對(duì)于本領(lǐng)域的技術(shù)人員來說,在不背離本發(fā)明的原理和思想的情況下,明顯可以在形式上、用法及實(shí)施的細(xì)節(jié)上作各種修改而不用付出創(chuàng)造性勞動(dòng)。因此,本發(fā)明由所附的權(quán)利要求書來限定。