【技術(shù)領(lǐng)域】
本發(fā)明涉及計算機應用技術(shù)領(lǐng)域,尤其涉及一種修改源的定位方法及裝置、計算機設備及可讀介質(zhì)。
背景技術(shù):
為了更加方便用戶使用應用(application;app),現(xiàn)有技術(shù)中,很多應用均支持語音輸入,這樣,用戶在使用時僅需要向該app輸入語音數(shù)據(jù)即可,操作簡單,使用方便。
例如,用戶在文本編輯時,app可以接收用戶輸入的語音糾錯指令,然后根據(jù)用戶的語音糾錯指令的語義解析信息,在待修改文本中精確定位修改源,并后續(xù)進行文本糾錯?,F(xiàn)有技術(shù)中,可以采用模板匹配定位的方法,根據(jù)預先設置的定位修改源的模塊,從語音糾錯指令的語義解析信息中定位修改源。
但是,現(xiàn)有技術(shù)的采用模板匹配定位的方法,僅能夠支持有限的特定模板,修改源的定位方式較為死板,且定位修改源的效率較低。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種修改源的定位方法及裝置、計算機設備及可讀介質(zhì),用于豐富修改源定位的靈活性,提高修改源的定位效率。
本發(fā)明提供一種修改源的定位方法,所述方法包括:
從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及所述修改源的限定參數(shù);
根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源。
進一步可選地,如上所述的方法中,根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源,具體包括:
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第一目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的方法中,還包括:
若從所述待糾錯的文本中未查找所述第一目標詞,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位。
進一步可選地,如上所述的方法中,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位,具體包括:
將所述第一目標詞進行同語義轉(zhuǎn)換,得到第二目標詞;
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第二目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的方法中,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述目標詞進行文本模糊定位,具體包括:
將所述第一目標詞進行相似性轉(zhuǎn)換,得到所述第三目標詞,且所述第三目標詞與所述第一目標詞之間的編輯距離與所述第一目標詞的最大編輯距離的比例,小于或者等于預設編輯距離比例閾值;
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第三目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的方法中,還包括:
若在所述文本模糊定位中未定位到所述修改源,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位。
進一步可選地,如上所述的方法中,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位,具體包括:
將所述第一目標詞中每個字進行真實注音;
根據(jù)所述第一目標詞中的各字的真實注音,為具有混淆發(fā)音的各字擴展混淆注音;
根據(jù)所述第一目標詞中各字的所述真實注音和所述混淆注音,生成對應的所述字的注音集;
根據(jù)所述限定參數(shù),按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第一疑似目標詞,所述第一疑似目標詞中各字的讀音依次與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息;
否則,進一步根據(jù)所述限定參數(shù),按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第二疑似目標詞;所述第二疑似目標詞中,讀音與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配的字的數(shù)量,占所述第一目標詞包括的字的總數(shù)的比例,大于或者等于預設字比例閾值;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的方法中,所述限定參數(shù)包括精確位置、相對位置、覆蓋范圍、相對位置關(guān)聯(lián)詞以及描述詞中的至少一種參數(shù)類別;
進一步地,根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源,具體包括:
根據(jù)所述限定參數(shù)所包括的參數(shù)類別,獲取對應的定位接口;
向所述定位接口發(fā)送所述第一目標詞以及所述限定參數(shù),由所述定位接口根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源。
本發(fā)明提供一種修改源的定位裝置,所述裝置包括:
獲取模塊,用于從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及所述修改源的限定參數(shù);
定位模塊,用于根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源。
進一步可選地,如上所述的裝置中,所述定位模塊,具體用于:
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第一目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的裝置中,所述定位模塊,具體還用于若從所述待糾錯的文本中未查找所述第一目標詞,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位。
進一步可選地,如上所述的裝置中,所述定位模塊,具體還用于:
將所述第一目標詞進行同語義轉(zhuǎn)換,得到第二目標詞;
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第二目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的裝置中,所述定位模塊,具體還用于:
將所述第一目標詞進行相似性轉(zhuǎn)換,得到所述第三目標詞,且所述第三目標詞與所述第一目標詞之間的編輯距離與所述第一目標詞的最大編輯距離的比例,小于或者等于預設編輯距離比例閾值;
根據(jù)所述限定參數(shù),從所述待糾錯的文本中查找所述第三目標詞;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的裝置中,所述定位模塊,具體還用于若在所述文本模糊定位中未定位到所述修改源,根據(jù)所述限定參數(shù),從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位。
進一步可選地,如上所述的裝置中,所述定位模塊,具體還用于:
將所述第一目標詞中每個字進行真實注音;
根據(jù)所述第一目標詞中的各字的真實注音,為具有混淆發(fā)音的各字擴展混淆注音;
根據(jù)所述第一目標詞中各字的所述真實注音和所述混淆注音,生成對應的所述字的注音集;
根據(jù)所述限定參數(shù),按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第一疑似目標詞,所述第一疑似目標詞中各字的讀音依次與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息;
否則,進一步根據(jù)所述限定參數(shù),按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第二疑似目標詞;所述第二疑似目標詞中,讀音與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配的字的數(shù)量,占所述第一目標詞包括的字的總數(shù)的比例,大于或者等于預設字比例閾值;
若查找到,則確定定位到所述修改源,并返回所述修改源的位置信息。
進一步可選地,如上所述的裝置中,所述限定參數(shù)包括精確位置、相對位置、覆蓋范圍、相對位置關(guān)聯(lián)詞以及描述詞中的至少一種參數(shù)類別;
進一步地,所述定位模塊,具體還用于:
根據(jù)所述限定參數(shù)所包括的參數(shù)類別,獲取對應的定位接口;
向所述定位接口發(fā)送所述第一目標詞以及所述限定參數(shù),由所述定位接口根據(jù)所述第一目標詞以及所述限定參數(shù),從待糾錯的文本中定位所述修改源。
本發(fā)明還提供一種計算機設備,所述設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如上所述的修改源的定位方法。
本發(fā)明還提供一種計算機可讀介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如上所述的修改源的定位方法。
本發(fā)明的修改源的定位方法及裝置、計算機設備及可讀介質(zhì),通過從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數(shù);根據(jù)第一目標詞以及修改源的限定參數(shù),從待糾錯的文本中定位修改源。與現(xiàn)有技術(shù)的采用模板匹配定位的方案相比,本發(fā)明的技術(shù)方案能夠支持任意形式的語音糾錯指令,修改源的定位方式較為靈活,從而能夠有效地提高修改源的定位效率。
【附圖說明】
圖1為本發(fā)明的修改源的定位方法實施例一的流程圖。
圖2為本發(fā)明的三個修改源的限定參數(shù)的示例圖。
圖3為本發(fā)明的修改源的定位方法實施例二的流程圖。
圖4為本發(fā)明的修改源定位的使用場景圖。
圖5為本發(fā)明的修改源定位的流程示意圖。
圖6為本發(fā)明的修改源的定位裝置實施例一的結(jié)構(gòu)圖。
圖7為本發(fā)明的修改源的定位裝置實施例二的結(jié)構(gòu)圖。
圖8為本發(fā)明的計算機設備實施例的結(jié)構(gòu)圖。
圖9為本發(fā)明提供的一種計算機設備的示例圖。
【具體實施方式】
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述。
圖1為本發(fā)明的修改源的定位方法實施例一的流程圖。如圖1所示,本實施例的修改源的定位方法,具體可以包括如下步驟:
100、從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數(shù);
本實施例的修改源的定位方法的執(zhí)行主體為修改源的定位裝置,本實施例的修改源的定位裝置應用在支持語音輸入的應用或者平臺中。具體地,修改源的定位裝置可以接收用戶輸入的語音糾錯指令,并將語音糾錯指令解析為文本形式的語義解析信息?;蛘哂尚薷脑吹亩ㄎ谎b置所嵌入的應用或者平臺來接收用戶輸入的語音糾錯指令,并對用戶輸入的語音糾錯指令進行解析,得到文本形式的語義解析信息。然后由修改源的定位裝置根據(jù)該語義解析信息,進行修改源的定位。本實施例中,用戶輸入的語音糾錯指令中具體可以包括修改源。但是考慮到語義解析時,難免會有解析誤差,因此對語音糾錯指令解析得到的語義解析信息中包括的第一目標詞本身是用于標識修改源,或者也可以說是描述修改源。但如果正確標識了,該第一目標詞就等于修改源,若存在解析誤差,該第一目標詞便不能正確標識該修改源,此時該第一目標詞便不等同于修改源。因此,本實施例中,語義解析信息中包括的第一目標詞僅能夠標識修改源,未必等于修改源。
本實施例中的修改源的限定參數(shù)可以包括多種類別,具體用于描述修改源,便于確定修改源的位置的一些參數(shù)。例如修改源的限定參數(shù)中可以包括修改源的精確位置、修改源的相對位置、修改源的覆蓋范圍、修改源的相對位置關(guān)聯(lián)詞以及修改源的描述詞中的至少一種參數(shù)類別。例如,用戶的語音糾錯指令可以為“將第一個我們之后的組裝的組字修改為祖宗的祖字”,“把第5個字改成藍”,“在你后加個不好”等等。所有的糾錯指令中都包括糾錯意圖,即增加、修改或者刪除。本實施例的技術(shù)方案,主要用于對糾錯意圖為修改的修改源進行定位。糾錯指令中除了糾錯意圖還可以包括修改源的各類別的限定參數(shù),如下述表1所示,解釋修改源的5種類別的限定參數(shù)以及標識修改源的第一目標詞。
表1
例如圖2為本發(fā)明的三個修改源的限定參數(shù)的示例圖。根據(jù)上述修改源的各種類別的限定參數(shù)的描述,可以知道,在例1.1中,“第三個我們”中,精確位置actual_pos為3,第一目標詞pre_ope_error為我們。在例1.2中,“南京后面的好”中,第一目標詞pre_ope_error為好,描述詞pre_ope_word為南京,相對位置relative_pos為after。在例1.3中,“南京的南”中,第一目標詞pre_ope_error為南,描述詞pre_ope_word為南京。其它語音糾錯指令的語義解析可以按照各限定參數(shù)的定義,從語義解析中獲取修改源的各限定參數(shù)。
101、根據(jù)第一目標詞以及修改源的限定參數(shù),從待糾錯的文本中定位修改源。
由于修改源的限定參數(shù)用于限定修改源,第一目標詞用于標識修改源,因此,可以根據(jù)第一目標詞以及修改源的限定參數(shù),在待糾錯的文本中定位修改源。
本實施例的修改源的定位方法,通過從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數(shù);根據(jù)第一目標詞以及修改源的限定參數(shù),從待糾錯的文本中定位修改源。與現(xiàn)有技術(shù)的采用模板匹配定位的方案相比,能夠支持任意形式的語音糾錯指令,修改源的定位方式較為靈活,從而能夠有效地提高修改源的定位效率。
圖3為本發(fā)明的修改源的定位方法實施例二的流程圖。如圖3所示,本實施例的修改源的定位方法,具體可以包括如下步驟:
200、從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數(shù);
201、根據(jù)限定參數(shù),從待糾錯的文本中查找第一目標詞;
202、判斷從待糾錯的文本中是否查找到第一目標詞,若查找到,執(zhí)行步驟203;若未查找到,執(zhí)行步驟204;
203、確定定位到修改源,并返回修改源的位置信息,結(jié)束。
此時定位的修改源等于第一目標詞,定位到修改源之后,表示定位成功,此時可以返回修改源的位置信息。例如,本實施例的修改源的位置信息可以為結(jié)構(gòu)化的位置信息。定位到修改源的位置信息之后,通過返回修改源的位置信息,后續(xù)可以根據(jù)修改源的位置信息,進行修改。
204、根據(jù)限定參數(shù),從待糾錯的文本中對第一目標詞進行文本模糊定位;執(zhí)行步驟205;
205、判斷文本模糊定位是否成功,若定位成功,執(zhí)行步驟203;否則若定位未成功,執(zhí)行步驟206;
本實施例的從待糾錯的文本中對第一目標詞進行文本模糊定位成功時,此時修改源不等于第一目標詞。
具體地,根據(jù)限定參數(shù),從待糾錯的文本中對第一目標詞進行文本模糊定位,具體可以包括如下兩種方式:
第一種方式為對第一目標詞進行同義轉(zhuǎn)換之后進行文本模糊定位。此時步驟204具體可以包括如下步驟:
(a1)將第一目標詞進行同語義轉(zhuǎn)換,得到第二目標詞;
(a2)根據(jù)限定參數(shù),從待糾錯的文本中查找第二目標詞;若查找到,文本模糊定位成功,則執(zhí)行步驟203;若未查找到,文本模糊定位未成功,繼續(xù)執(zhí)行步驟206。
此時步驟203確定定位到的是包括第二目標詞的修改源,并返回修改源的位置信息。也就是說,此時第二目標詞等于修改源。
本實施例中,對于將待糾錯的文本與需要定位的第一目標詞的內(nèi)容出現(xiàn)不一致時,將第一目標詞的內(nèi)容同語義轉(zhuǎn)換后進行匹配,例如,本實施例的同語義轉(zhuǎn)換可以包括特殊符號、數(shù)字等進行全半角轉(zhuǎn)換。例如以前是全角,轉(zhuǎn)換為半角,以前是半角轉(zhuǎn)換為全角等。還可以包括文字到符號轉(zhuǎn)換,數(shù)字轉(zhuǎn)換、標點符號省略等等。例如,將文本數(shù)字“一百”轉(zhuǎn)換成阿拉伯數(shù)字“100”;這些轉(zhuǎn)換都不改變第一目標詞的語義,所以統(tǒng)稱為同語義轉(zhuǎn)換,并將轉(zhuǎn)換之后的目標詞稱為第二目標詞。此時根據(jù)限定參數(shù),從待糾錯的文本中查找第二目標詞;若查找到,則表示定位到的是包括第二目標詞的修改源,定位成功,此時返回修改源的位置信息。否則可以再次對第一目標詞進行同語義轉(zhuǎn)換,直到完成對第一目標詞的所有同語義轉(zhuǎn)換之后,還未定位到修改源,此時可以確定定位失敗,此時再執(zhí)行步驟206。
第二種方式為對第一目標詞進行相似性轉(zhuǎn)換,得到第三目標詞之后進行文本模糊定位。
此時步驟204具體可以包括如下步驟:
(b1)將第一目標詞進行相似性轉(zhuǎn)換,得到第三目標詞;
(b2)根據(jù)限定參數(shù),從待糾錯的文本中查找第三目標詞;若查找到,文本模糊定位成功,則執(zhí)行步驟203;若未查找到,文本模糊定位未成功,繼續(xù)執(zhí)行步驟206。
此時步驟203確定定位到的是包括第三目標詞的修改源,并返回修改源的位置信息。也就是說,此時第三目標詞等于修改源。
其中的第三目標詞與第一目標詞之間的編輯距離與第一目標詞的最大編輯距離的比例,小于或者等于預設編輯距離比例閾值。其中第一目標詞的最大編輯距離可以為將第一目標詞全部修改的距離,若第一目標詞包括五個字,那么最大編輯距離便為5。修改第一目標詞中的一個字,對應的編輯距離為1,修改第一目標詞中的兩個字,對應的編輯距離為2,以此類推。也就是說,本實施例的相似性轉(zhuǎn)換允許對第一目標詞進行少許編輯,得到第三目標詞。但是編輯的距離與第一目標詞的最大編輯距離的比例,必須小于或者等于預設編輯距離比例閾值,否則修改后的第三目標詞不被認同。然后,可以根據(jù)限定參數(shù),從待糾錯的文本中查找第三目標詞;若查找到,則確定定位到修改源,并返回修改源的位置信息。否則可以再次對第一目標詞進行相似性轉(zhuǎn)換,直到完成對第一目標詞的所有相似性轉(zhuǎn)換之后,還未定位到修改源,此時可以確定定位失敗,此時再執(zhí)行步驟206。
本實施例通過編輯距離進行相似性轉(zhuǎn)換,定位相似文本,可以召回由于語義識別導致相同內(nèi)容被識別成不同文本的case和用戶通過相似文本做修改的case。例如,相似性轉(zhuǎn)換時,可以將“7748”修改后“7788”,可以實現(xiàn)在滿足預設編輯距離比例閾值的情況下,定位到修改源,并返回修改源的結(jié)構(gòu)化的位置信息,在保證準確率的同時提高召回率。
206、根據(jù)限定參數(shù),從待糾錯的文本中對第一目標詞進行注音模糊定位;執(zhí)行步驟207;
207、判斷注音模糊定位是否成功,若定位成功,執(zhí)行步驟203;否則若定位未成功,返回定位未成功的提示消息。
由于本實施例中的第一目標詞為從對用戶輸入的語音糾錯指令進行語義解析得到的語義解析信息中提取的,由于在語音識別中,對于相同的發(fā)音在上下文不同的情況下可能會被識別成不同的文本,這樣的case可以通過注音模糊定位來召回。再例如,有的用戶帶有一定的口音,例如有的用戶卷舌和平舌不分,例如,“zh”和“z”、“sh”和“s”、“l(fā)”和“n”等不分,所以造成用戶輸入的語音糾錯指令中描述的修改源是錯誤的,本實施例中通過注音模糊定位,可以提高對修改源的定位效率,提高信息召回率,增強定位的容錯率。
例如,本實施例的根據(jù)限定參數(shù),從待糾錯的文本中對第一目標詞進行注音模糊定位,具體可以包括如下步驟:
(c1)將第一目標詞中每個字進行真實注音;
(c2)根據(jù)第一目標詞中的各字的真實注音,為具有混淆發(fā)音的各字擴展混淆注音;
本實施例的混淆發(fā)音可以為所有帶有平舌音的注音對應的卷舌音的注音,以及所有帶有卷舌音的注音對應的平舌音的注音。
(c3)根據(jù)第一目標詞中各字的真實注音和混淆注音,生成對應的字的注音集;
對于第一目標詞中的每個字,可以將該字的真實注音以及該字的所有混淆注音生成該字的一個注音字。這樣,在后續(xù)查找時,某個字只要與注音集中該字的一個注音(不論是真實注音還是混淆注音)相匹配,就認為與該字相匹配。
(c4)根據(jù)限定參數(shù),按照第一目標詞中各字的順序,從待糾錯的文本中查找第一疑似目標詞,其中第一疑似目標詞中各字的讀音依次與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配;若查找到,執(zhí)行步驟203;否則,若未查找到,執(zhí)行步驟(c5)
也就是說,第一目標詞與第一疑似目標詞中包括的字數(shù)是相同的,且第一疑似目標詞的第一個字的讀音與第一目標詞中第一個字的注音集中的真實注音或者混淆注音相同;同理,第一疑似目標詞的第二個字的讀音與第一目標詞中第二個字的注音集中的真實注音或者混淆注音相同;依次類推,第一疑似目標詞的每一個位置的字的讀音均與第一目標詞中對應位置的字的注音集中的真實注音或者混淆注音相同,這樣,才可以確定從待糾錯的文本中查找第一疑似目標詞。
此時步驟203確定定位到包括第一疑似目標詞的修改源,并返回修改源的結(jié)構(gòu)化位置信息;也就是說,此時第一疑似目標詞等于修改源。
(c5)根據(jù)限定參數(shù),按照第一目標詞中各字的順序,從待糾錯的文本中查找第二疑似目標詞;其中第二疑似目標詞中,讀音與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配的字的數(shù)量,占第一目標詞包括的字的總數(shù)的比例,大于或者等于預設字比例閾值;若查找到,執(zhí)行步驟203;否則,定位未成功,返回定位未成功的提示消息。
此時步驟203確定定位到包括第二疑似目標詞的修改源,并返回所述修改源的位置信息。也就是說,此時第二疑似目標詞等于修改源。
具體地,本實施例中,第二疑似目標詞與第一疑似目標詞相比,不是每一個字的讀音均與第一目標詞的對應位置的字的注音集中的真實注音或者混淆注音相匹配。而是只要相匹配的字的數(shù)量,占第一目標詞包括的字的總數(shù)的比例,大于或者等于預設字比例閾值;此時也可以認為定位成功,采用該技術(shù)方案,可以進一步提高信息的召回率,增強了定位修改源的容錯率。
本實施例的修改源的定位方法,通過采用上述技術(shù)方案,可以在根據(jù)限定參數(shù),從待糾錯的文本中未查找第一目標詞的時候,進一步采用文本模糊定位和注音模糊定位實現(xiàn)對修改源的定位,能夠進一步提高信息的召回率,保證定位準確率的同時,提高對修改源定位的容錯率。
圖4為本發(fā)明的修改源定位的使用場景圖。如圖4所示,為本發(fā)明的修改源定位方法的一種示例。在該修改源的定位裝置可以采用上述圖1-圖3所示實施例的修改源的定位方法。具體地,在使用時,源文本的內(nèi)容可以包括“真好,我也覺得南京號有文化底蘊”。對應地用戶輸入的語音糾錯指令對應的語義解析信息即指令文本可以包括“把南京后邊的好改成好壞的好”。此時修改源的定位裝置可以根據(jù)指令文本在源文本中對修改源進行定位,詳細可以參考上述圖1-圖3所示實施例的方法實現(xiàn)對修改源的定位,在此不再贅述。
進一步可選地,上述實施例中為修改源的定位裝置直接對各種類別的限定參數(shù)對應的修改源進行定位。實際應用中,修改源的定位裝置還可以設置多個定位接口,分別對各種類別的限定參數(shù)進行修改源定位。例如,本實施例中限定參數(shù)可以包括精確位置、相對位置、覆蓋范圍、相對位置關(guān)聯(lián)詞以及描述詞中五種類別中的至少一種參數(shù)類別。語音糾錯指令中可以包括任意一種、兩種或者多種參數(shù)類別。此時根據(jù)五種類別的限定參數(shù),共可以得到2*2*2*2*2=32種限定參數(shù)的搭配。在設置定位接口(locater)時,可以針對每一種搭配,設置一種定位接口,這樣,共可以設置32種定位接口如locater_1、locater_2……locater_32。例如,圖5為本發(fā)明的修改源定位的流程示意圖。如圖5所示,修改源定位裝置獲取到各個限定參數(shù)之后,5種類別的限定參數(shù)對應采用不同的id來表示,例如本實施例中,采用1、2、3、4和5分別表示精確位置actual_pos、相對位置relative_pos、相對位置關(guān)聯(lián)詞relative_pos_word、描述詞pre_ope_word、以及覆蓋范圍與數(shù)量ope_word_num。如圖5所示,第一目標詞pre_ope_error為號,相對位置關(guān)聯(lián)詞relative_pos_word以及描述詞pre_ope_word分別為after和“南京”,此時對應的id3和4具有數(shù)值,因此,可以標識為1和1,此時可以采用對應的定位接口locater_6來進行修改源定位,即定位接口locater_6僅處理具有相對位置關(guān)聯(lián)詞relative_pos_word以及描述詞pre_ope_word兩種類別的限定參數(shù)的修改源的定位。本實施例中通過設置多個定位接口,可以避免修改源定位裝置對所有類別的限定參數(shù)都進行定位,處理過程繁瑣,通過根據(jù)不同類別的限定參數(shù)選擇不同的定位接口,可以將定位任務分發(fā),操作非常簡單。實際應用中,限定參數(shù)的類別的數(shù)量發(fā)生變化時,定位接口的數(shù)量也發(fā)生變化,實際應用中,當包括定位接口時,可以設置至少兩個定位接口。否則定位接口的設置沒有意義。或者實際應用中還可以采用其他方式來設置定位接口,例如,還可以為若包括前三個參數(shù)由第一個定位接口負責對修改源進行定位處理,若包括后兩個參數(shù)由第二定位接口負責對修改源進行定位處理。
即,對于上述實施例中的步驟101“根據(jù)第一目標詞以及修改源的限定參數(shù),從待糾錯的文本中定位所述修改源”,具體可以包括如下步驟:
(d1)根據(jù)限定參數(shù)所包括的參數(shù)類別,獲取對應的定位接口;
(d2)向定位接口發(fā)送第一目標詞以及限定參數(shù),由定位接口根據(jù)第一目標詞以及限定參數(shù),從待糾錯的文本中定位修改源。且本實施例中每一種定位接口的定位方法與上述圖1-圖3所示實施例相同,詳細可以參考上述圖1所示實施例的定位方法,在此不再贅述。
圖6為本發(fā)明的修改源的定位裝置實施例一的結(jié)構(gòu)圖。如圖6所示,本實施例的修改源的定位裝置,具體可以包括:獲取模塊10和定位模塊11。
獲取模塊10用于從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數(shù);
定位模塊11用于根據(jù)獲取模塊10獲取的第一目標詞以及限定參數(shù),從待糾錯的文本中定位修改源。
本實施例的修改源的定位裝置,通過采用上述模塊實現(xiàn)修改源的定位的實現(xiàn)原理以及技術(shù)效果與上述相關(guān)方法實施例的實現(xiàn)相同,詳細可以參考上述相關(guān)方法實施例的記載,在此不再贅述。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體用于:
根據(jù)獲取模塊10獲取的限定參數(shù),從待糾錯的文本中查找獲取模塊10獲取的第一目標詞;
若查找到,則確定定位到修改源,并返回修改源的位置信息。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用于若從待糾錯的文本中未查找獲取模塊10獲取的第一目標詞,根據(jù)獲取模塊10獲取的限定參數(shù),從待糾錯的文本中對獲取模塊10獲取的第一目標詞進行文本模糊定位。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用于:
將獲取模塊10獲取的第一目標詞進行同語義轉(zhuǎn)換,得到第二目標詞;
根據(jù)獲取模塊10獲取的限定參數(shù),從待糾錯的文本中查找第二目標詞;
若查找到,則確定定位到修改源,并返回修改源的位置信息。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用于:
將獲取模塊10獲取的第一目標詞進行相似性轉(zhuǎn)換,得到第三目標詞,且第三目標詞與第一目標詞之間的編輯距離與第一目標詞的最大編輯距離的比例,小于或者等于預設編輯距離比例閾值;
根據(jù)獲取模塊10獲取的限定參數(shù),從待糾錯的文本中查找第三目標詞;
若查找到,則確定定位到修改源,并返回修改源的位置信息。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用于若在文本模糊定位中未定位到修改源,根據(jù)獲取模塊10獲取的限定參數(shù),從待糾錯的文本中對獲取模塊10獲取的第一目標詞進行注音模糊定位。
進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用于:
將獲取模塊10獲取的第一目標詞中每個字進行真實注音;
根據(jù)第一目標詞中的各字的真實注音,為具有混淆發(fā)音的各字擴展混淆注音;
根據(jù)第一目標詞中各字的真實注音和混淆注音,生成對應的字的注音集;
根據(jù)限定參數(shù),按照第一目標詞中各字的順序,從待糾錯的文本中查找第一疑似目標詞,第一疑似目標詞中各字的讀音依次與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配;
若查找到,則確定定位到修改源,并返回修改源的位置信息;
否則,進一步根據(jù)獲取模塊10獲取的限定參數(shù),按照第一目標詞中各字的順序,從待糾錯的文本中查找第二疑似目標詞;第二疑似目標詞中,讀音與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配的字的數(shù)量,占第一目標詞包括的字的總數(shù)的比例,大于或者等于預設字比例閾值;
若查找到,則確定定位到修改源,并返回修改源的位置信息。
圖7為本發(fā)明的修改源的定位裝置實施例二的結(jié)構(gòu)圖。如圖7所示,本實施例的修改源的定位裝置,在上述圖6所示實施例的技術(shù)方案的基礎上,還可以包括至少兩個定位接口12。各定位接口12可以與修改源的限定參數(shù)所包括的參數(shù)類別對應。
本實施例中的限修改源的限定參數(shù)包括精確位置、相對位置、覆蓋范圍、相對位置關(guān)聯(lián)詞以及描述詞中的至少一種參數(shù)類別;可以設置至少兩個定位接口,分別與一定的參數(shù)類別的組合相對應,例如,5種參數(shù)類別的不同組合,可以對應32個定位接口,詳細可以參考上述相關(guān)實施例的記載,在此不再贅述。
進一步地,此時,定位模塊11具體用于根據(jù)限定參數(shù)所包括的參數(shù)類別,獲取對應的定位接口12;并向?qū)亩ㄎ唤涌?2發(fā)送獲取模塊10獲取的第一目標詞以及限定參數(shù),由定位接口12根據(jù)第一目標詞以及限定參數(shù),從待糾錯的文本中定位修改源。此時定位模塊11具有分發(fā)的功能,而不執(zhí)行具體的修改原的定位,而由各定位接口12執(zhí)行修改源的定位。其中定位接口12根據(jù)第一目標詞以及限定參數(shù),從待糾錯的文本中定位修改源的方式,可以參考上述實施例中的定位模塊11根據(jù)第一目標詞以及限定參數(shù),從待糾錯的文本中定位修改源的記載,在此不再贅述。
圖8為本發(fā)明的計算機設備實施例的結(jié)構(gòu)圖。如圖8所示,本實施例的計算機設備,包括:一個或多個處理器30,以及存儲器40,存儲器40用于存儲一個或多個程序,當存儲器40中存儲的一個或多個程序被一個或多個處理器30執(zhí)行,使得一個或多個處理器30實現(xiàn)如上圖1-圖7所示實施例的修改源的定位方法。圖8所示實施例中以包括多個處理器30為例。
例如,圖9為本發(fā)明提供的一種計算機設備的示例圖。圖9示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機設備12a的框圖。圖9顯示的計算機設備12a僅僅是一個示例,不應對本發(fā)明實施例的功能和使用范圍帶來任何限制。
如圖9所示,計算機設備12a以通用計算設備的形式表現(xiàn)。計算機設備12a的組件可以包括但不限于:一個或者多個處理器16a,系統(tǒng)存儲器28a,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28a和處理器16a)的總線18a。
總線18a表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標準體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強型isa總線、視頻電子標準協(xié)會(vesa)局域總線以及外圍組件互連(pci)總線。
計算機設備12a典型地包括多種計算機系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計算機設備12a訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動的和不可移動的介質(zhì)。
系統(tǒng)存儲器28a可以包括易失性存儲器形式的計算機系統(tǒng)可讀介質(zhì),例如隨機存取存儲器(ram)30a和/或高速緩存存儲器32a。計算機設備12a可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34a可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖9未顯示,通常稱為“硬盤驅(qū)動器”)。盡管圖9中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動器,以及對可移動非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這些情況下,每個驅(qū)動器可以通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18a相連。系統(tǒng)存儲器28a可以包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明上述圖1-圖7各實施例的功能。
具有一組(至少一個)程序模塊42a的程序/實用工具40a,可以存儲在例如系統(tǒng)存儲器28a中,這樣的程序模塊42a包括——但不限于——操作系統(tǒng)、一個或者多個應用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包括網(wǎng)絡環(huán)境的實現(xiàn)。程序模塊42a通常執(zhí)行本發(fā)明所描述的上述圖1-圖7各實施例中的功能和/或方法。
計算機設備12a也可以與一個或多個外部設備14a(例如鍵盤、指向設備、顯示器24a等)通信,還可與一個或者多個使得用戶能與該計算機設備12a交互的設備通信,和/或與使得該計算機設備12a能與一個或多個其它計算設備進行通信的任何設備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22a進行。并且,計算機設備12a還可以通過網(wǎng)絡適配器20a與一個或者多個網(wǎng)絡(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡,例如因特網(wǎng))通信。如圖所示,網(wǎng)絡適配器20a通過總線18a與計算機設備12a的其它模塊通信。應當明白,盡管圖中未示出,可以結(jié)合計算機設備12a使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設備驅(qū)動器、冗余處理器、外部磁盤驅(qū)動陣列、raid系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理器16a通過運行存儲在系統(tǒng)存儲器28a中的程序,從而執(zhí)行各種功能應用以及數(shù)據(jù)處理,例如實現(xiàn)上述實施例所示的修改源的定位方法。
本發(fā)明還提供一種計算機可讀介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如上述實施例所示的修改源的定位方法。
本實施例的計算機可讀介質(zhì)可以包括上述圖9所示實施例中的系統(tǒng)存儲器28a中的ram30a、和/或高速緩存存儲器32a、和/或存儲系統(tǒng)34a。
隨著科技的發(fā)展,計算機程序的傳播途徑不再受限于有形介質(zhì),還可以直接從網(wǎng)絡下載,或者采用其他方式獲取。因此,本實施例中的計算機可讀介質(zhì)不僅可以包括有形的介質(zhì),還可以包括無形的介質(zhì)。
本實施例的計算機可讀介質(zhì)可以采用一個或多個計算機可讀的介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設計語言包括面向?qū)ο蟮某绦蛟O計語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設計語言—諸如”c”語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務提供商來通過因特網(wǎng)連接)。
在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory,ram)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明保護的范圍之內(nèi)。