本發(fā)明涉及語義識別技術(shù)領(lǐng)域,尤其涉及一種語義識別方法。
背景技術(shù):
現(xiàn)有技術(shù)中的語義識別技術(shù)可以應用到智能設(shè)備尤其是智能機器人中,能夠拉近使用者和智能機器人之間的“距離”,使得使用者對智能機器人的控制更便捷,更直接。
但是現(xiàn)有技術(shù)中的語義識別技術(shù),其精確度較差,無法準確地識別使用者說話的內(nèi)容,因此非但無法提升控制的便捷性,反而提高了使用者的控制難度,降低了使用者的使用體驗。
技術(shù)實現(xiàn)要素:
根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種語義識別方法的技術(shù)方案,具體包括:
一種語義識別方法,適用于智能設(shè)備;其中:利用語義識別模型輔助實現(xiàn)使用者與智能設(shè)備之間的人機交互;
所述語義識別模型包括:基本子模型、句型關(guān)系子模型、通用子模型常識識別庫以及語義關(guān)系子模型;
所述基本子模型中包括預先定義的基本概念以及與所述基本概念對應的預先定義的擴展概念;
所述通用子模型包括預先定義的通用概念、對應于所述通用概念的關(guān)聯(lián)領(lǐng)域以及至少一個所述通用概念的關(guān)聯(lián)組合;
所述語義關(guān)系子模型包括與所述基本子模型、所述句型關(guān)系子模型以及所述通用子模型相關(guān)的關(guān)系以及模糊語義關(guān)系;
所述語音識別方法具體包括:
步驟s1,所述智能設(shè)備接收用戶輸入的語音信號,并利用語音識別技術(shù)將所述語音信號轉(zhuǎn)變?yōu)榭勺R別文本;
步驟s2,采用預先設(shè)置的密鑰對所述可識別文本進行加密,并將加密后的所述可識別文本上傳至一服務端;
步驟s3,在所述服務端對所述可識別文本進行解密;
步驟s4,于所述服務端中預設(shè)對應不同的關(guān)鍵詞的解析模板,所述服務端在所述可識別文本中提取多個所述關(guān)鍵詞,并分別對照所述解析模板將將所述可識別文本轉(zhuǎn)變?yōu)榭蛇M行語義識別的可識別內(nèi)容;
步驟s5,利用所述語義關(guān)系子模型和所述基本子模型對所述可識別內(nèi)容進行精確語義匹配,獲取相應的第一匹配結(jié)果;
步驟s6,所述服務端將所述第一匹配結(jié)果返回至所述智能設(shè)備,以控制所述智能設(shè)備執(zhí)行所述第一匹配結(jié)果中包含的指令,或者向使用者提示所述第一匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中,所述步驟s5中,如果未獲得所述第一匹配結(jié)果,則利用所述語義關(guān)系子模型、所述句型關(guān)系子模型以及所述基本子模型對所述可識別內(nèi)容進行關(guān)系語義匹配,獲取相應的第二匹配結(jié)果;
則所述步驟s6中,所述服務端將所述第二匹配結(jié)果返回至所述智能設(shè)備,以控制所述智能設(shè)備執(zhí)行所述第二匹配結(jié)果中包含的指令,或者向使用者提示所述第二匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中,所述步驟s5中,如果未獲得所述第二匹配結(jié)果,則:
利用所述語義關(guān)系子模型中的模糊語義關(guān)系進行模糊語義識別、所述句型關(guān)系子模型以及所述基本子模型,獲得相應的第三匹配結(jié)果;或者
利用所述語義關(guān)系子模型和所述通用子模型常識識別庫對所述可識別內(nèi)容進行模糊關(guān)系匹配,獲得所述第三匹配結(jié)果;
則所述步驟s6中,所述服務端將所述第三匹配結(jié)果返回至所述智能設(shè)備,以控制所述智能設(shè)備執(zhí)行所述第三匹配結(jié)果中包含的指令,或者向使用者提示所述第三匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中:所述語義關(guān)系子模型包括所述基本概念與所述擴展概念之間的對應關(guān)系。
優(yōu)選的,該語義識別方法,其中:所述步驟s5中,獲取所述第一匹配結(jié)果的步驟具體包括:
根據(jù)所述語義關(guān)系子模型中的與所述基本子模型中的基本概念相關(guān)的關(guān)系,判斷再所述語義識別模型中的基本子模型中是否能夠查找到與所述可識別內(nèi)容直接精確匹配的基本概念:
若是,則根據(jù)直接精確匹配的所述基本概念獲得所述第一匹配結(jié)果;
若否,則根據(jù)所述對應關(guān)系在所述基本子模型中查找得到與所述可識別內(nèi)容直接精確匹配的所述擴展概念,并進而獲得所述第一匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中:所述步驟s5中,獲取所述第二匹配結(jié)果的步驟具體包括:
根據(jù)所述語義關(guān)系子模型中與所述句型關(guān)系子模型相關(guān)的關(guān)系,在所述句型關(guān)系子模型中查找與所述可識別內(nèi)容直接匹配的句型關(guān)系,根據(jù)查找到的句型關(guān)系對所述可識別內(nèi)容重新界定,再利用所述基本子模型對經(jīng)過重新界定后的所述可識別內(nèi)容進行語義匹配并獲取所述第二匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中:所述步驟s5中,利用所述語義關(guān)系子模型中的模糊語義關(guān)系進行模糊語義識別、所述句型關(guān)系子模型以及所述基本子模型獲得相應的第三匹配結(jié)果的步驟具體包括:
根據(jù)所述語義關(guān)系子模型中的模糊語義關(guān)系對所述可識別內(nèi)容與所述句型關(guān)系網(wǎng)絡進行關(guān)聯(lián)識別,將所述可識別內(nèi)容依賴于所述句型關(guān)系子模型中的其中一種所述句型關(guān)系,根據(jù)所依賴的所述句型關(guān)系對所述可識別內(nèi)容重新界定,再利用所述基本子模型對經(jīng)過重新界定后的所述可識別內(nèi)容進行語義匹配并獲取所述第三匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中:所述模糊語義關(guān)系包括上下文關(guān)系、概念聚類分類關(guān)系、領(lǐng)域分類關(guān)系、常用場景分類關(guān)系、語境關(guān)聯(lián)關(guān)系或組合關(guān)聯(lián)關(guān)系。
優(yōu)選的,該語義識別方法,其中:對所述可識別文本的內(nèi)容進行預處理的方式包括:
對所述可識別文本進行分詞、噪聲詞去除或?qū)S蓄I(lǐng)域知識標注的處理。
優(yōu)選的,該語義識別方法,其中:所述語義識別模型還包括背景子模型;
所述服務端依據(jù)所述背景子模型對所述可識別文本進行分詞的處理;
所述背景子模型中包括通用詞庫和專有領(lǐng)域詞庫。
優(yōu)選的,該語義識別方法,其中:所述步驟s5中,利用所述語義關(guān)系 子模型和所述通用子模型常識識別庫對所述可識別內(nèi)容進行模糊關(guān)系匹配獲得所述第三匹配結(jié)果的步驟具體包括:
根據(jù)所述語義關(guān)系子模型中與所述通用子模型相關(guān)的關(guān)系并利用所述通用子模型進行通用常識的訓練,根據(jù)訓練結(jié)果得到所述第三匹配結(jié)果;
所述第三匹配結(jié)果中包括語義識別結(jié)果或推理知識結(jié)果;
則所述步驟s6中,所述服務端將所述第三匹配結(jié)果返回至所述智能設(shè)備,以控制所述智能設(shè)備執(zhí)行所述第三匹配結(jié)果中包含的指令,或者向使用者提示所述第三匹配結(jié)果。
優(yōu)選的,該語義識別方法,其中:所述語義識別模型的建立過程包括:
步驟a1,利用交互學習機制結(jié)合互聯(lián)網(wǎng)信息或用戶行為數(shù)據(jù)建立初始的所述語義識別模型;
步驟a2,對所述互聯(lián)網(wǎng)信息或所述用戶行為數(shù)據(jù)進行識別、歸類,并依據(jù)歸類好的數(shù)據(jù)對初始的所述語義識別模型進行更新,以得到最終的所述語義識別模型并保存。
優(yōu)選的,該語義識別方法,其中:所述語義識別模型的建立過程包括:
步驟b1,利用交互學習機制對特定領(lǐng)域、特定人群或用戶個體的互聯(lián)網(wǎng)信息或用戶行為習慣與偏好進行處理;
步驟b2,依據(jù)處理得到的數(shù)據(jù)對所述語義識別模型進行更新。
優(yōu)選的,該語義識別方法,其中,對所述語義識別模型進行更新的過程中包括對所述語義識別模型的基本子模型、句型關(guān)系子模型、通用子模型常識識別庫以及語義關(guān)系子模型進行更新。
優(yōu)選的,該語義識別方法,其中:所述語義識別模型還包括詞表,所述詞表中包括可進行語義識別的詞的id以及每個詞所對應的關(guān)系號,根據(jù)所述可識別內(nèi)容中的詞在所述詞表中的關(guān)系號,在所述語義關(guān)系子模型中查找相應的關(guān)系,并在與此關(guān)系對應的基本子模型、句型關(guān)系子模型或通用子模型常識識別庫中進行語義匹配。
上述技術(shù)方案的有益效果是:提供一種語義識別方法,能夠提升語義識別的精確性,同時能夠更快速簡捷地實現(xiàn)從語音識別到語義識別的跨度,縮短語義識別的過程,提升使用者的使用體驗。
附圖說明
圖1是本發(fā)明的較佳的實施例中,一種語義識別方法的總體流程示意圖;
圖2-3是本發(fā)明的較佳的實施例中,獲取第三匹配結(jié)果的流程示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
需要說明的是,在不沖突的情況下,本發(fā)明中的實施例及實施例中的特征可以相互組合。
下面結(jié)合附圖和具體實施例對本發(fā)明作進一步說明,但不作為本發(fā)明的限定。
本發(fā)明的較佳的實施例中,基于現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種語義識別方法,適用于智能設(shè)備。
該語義識別方法中,利用語義識別模型輔助實現(xiàn)使用者與智能設(shè)備之間的人機交互,即利用一個預先形成的語義識別模型輔助對使用者輸入的語音內(nèi)容進行語義識別,并依據(jù)識別結(jié)果指示智能設(shè)備執(zhí)行相應的操作,從而完成使用者和智能設(shè)備之間的人機交互;
則本發(fā)明的較佳的實施例中,上述語義識別模型包括:基本子模型、句型關(guān)系子模型、通用子模型常識識別庫以及語義關(guān)系子模型;
其中:
1)基本子模型中包括預先定義的基本概念以及與基本概念對應的預先定義的擴展概念;
2)通用子模型包括預先定義的通用概念、對應于通用概念的關(guān)聯(lián)領(lǐng)域以及至少一個通用概念的關(guān)聯(lián)組合;
3)語義關(guān)系子模型包括與基本子模型、句型關(guān)系子模型以及通用子模型相關(guān)的關(guān)系以及模糊語義關(guān)系;
則本發(fā)明的較佳的實施例中,上述語義識別方法的具體步驟如圖1所示,包括:
步驟s1,智能設(shè)備接收用戶輸入的語音信號,并利用語音識別技術(shù)將語音信號轉(zhuǎn)變?yōu)榭勺R別文本;
步驟s2,采用預先設(shè)置的密鑰對可識別文本進行加密,并將加密后的可識別文本上傳至一服務端;
步驟s3,在服務端對可識別文本進行解密;
步驟s4,于服務端中預設(shè)對應不同的關(guān)鍵詞的解析模板,服務端在可識別文本中提取多個關(guān)鍵詞,并分別對照解析模板將將可識別文本轉(zhuǎn)變?yōu)榭蛇M行語義識別的可識別內(nèi)容;
步驟s5,利用語義關(guān)系子模型和基本子模型對可識別內(nèi)容進行精確語義匹配,獲取相應的第一匹配結(jié)果;
步驟s6,服務端將第一匹配結(jié)果返回至智能設(shè)備,以控制智能設(shè)備執(zhí)行第一匹配結(jié)果中包含的指令,或者向使用者提示第一匹配結(jié)果。
具體地,如上文中所述,本發(fā)明技術(shù)方案提出的語義識別方法中,只需要利用預先定義的語義識別模型輔助實現(xiàn)使用者和智能設(shè)備之間的人機交互。上述語義識別模型被預先設(shè)置在一個遠程連接于智能設(shè)備的服務端上,則上述語義識別的過程均在服務端上進行。
本發(fā)明的較佳的實施例中,所謂語義識別模型,是一種典型的人工智能的識別模型結(jié)構(gòu),其具備識別推理功能和訓練學習的能力,而且該語義識別模型不同于傳統(tǒng)的人工智能模型,其主要針對知識庫設(shè)計。換言之,為了實現(xiàn)對用戶輸入的自然語言進行識別,首先需要將搜集到的不同的應用領(lǐng)域的專業(yè)知識轉(zhuǎn)化為可供識別推理的識別語句,并根據(jù)這些識別語句形成語義識別模型。在上述語義識別模型中至少包括基本子模型、句型關(guān)系子模型、通用子模型以及語義關(guān)系子模型。上述語義關(guān)系子模型包括與基本子模型、句型關(guān)系子模型以及通用子模型相關(guān)的關(guān)系以及模糊語義關(guān)系,這些關(guān)系例如可以用關(guān)系號來標示。
本發(fā)明的較佳的實施例中,上述步驟s1中,使用者向智能設(shè)備輸入的包括自然語言的語音信號通常通過智能設(shè)備的人機交互接口被采集得到,該接口可以為例如智能設(shè)備上的麥克風或者其他拾音器。
進一步地,上述步驟s1中,通過智能設(shè)備上的拾音器獲取語音信號后,采用傳統(tǒng)的語音識別技術(shù)將這些語音信號轉(zhuǎn)換為可識別文本,該文本可以為 文本數(shù)據(jù),即根據(jù)傳統(tǒng)的語音識別技術(shù)將語音信號轉(zhuǎn)換為相應的文本數(shù)據(jù)信號?,F(xiàn)有技術(shù)中存在較多用于實現(xiàn)語音識別技術(shù)的技術(shù)方案,因此在此不再贅述。
本發(fā)明的較佳的實施例中,在將語音信號轉(zhuǎn)換為可識別文本之后,智能設(shè)備會將可識別文本上傳至遠程連接該智能設(shè)備的服務端進行語義識別。上傳至服務端進行語義識別的好處在于:服務端的存儲容量和計算能力要遠遠大于一個智能設(shè)備,因此將語義識別的處理過程放在服務端進行有助于語義識別的精確性。
進一步地,本發(fā)明的較佳的實施例中,在將上述可識別文本上傳至服務端之前,智能設(shè)備首先根據(jù)預設(shè)的密鑰對上述可識別文本進行加密。上述密鑰可以為預先設(shè)置的,例如預先設(shè)置一串密鑰序列,從中選擇一個密鑰作為本次上傳的加密密鑰,也可以為根據(jù)當前時間或者根據(jù)當前隨機數(shù)隨機生成的密鑰。則上述步驟s3中,上述服務端預先獲取智能設(shè)備作為本次上傳文本所用的加密密鑰,并根據(jù)該加密密鑰對接收到的可識別文本進行解密。
隨后,本發(fā)明的較佳的實施例中,在服務端預先設(shè)置對應不同關(guān)鍵詞的解析模板。換言之,利用不同的解析模板,可以將不同的關(guān)鍵詞解析形成相應的可進行語義分析的可識別內(nèi)容。例如,將可識別文本進行分詞,以將其以關(guān)鍵詞為單位劃分為多個部分,并對每個部分依照對應的解析模板進行解析,并最終將解析結(jié)果經(jīng)過預處理以合成可進行語義識別的可識別內(nèi)容。
本發(fā)明的較佳的實施例中,如上文中所述,預先設(shè)置多個解析模板,并在對可識別文本進行解析時直接依據(jù)劃分的關(guān)鍵詞套用這些解析模板,能夠直接快速地對可識別文本進行解析,提供解析效率。
本發(fā)明的較佳的實施例中,上述步驟s5中,利用語義關(guān)系子模型和基本子模型對可識別內(nèi)容進行精確語義匹配,獲取相應的第一匹配結(jié)果。該步驟被稱為語義識別過程中的精確語義匹配步驟。具體地,該步驟s5中,由于語義識別模型中的基本子模型包含了含義精確的條目,例如:基本概念、基本概念的擴展概念,從而可以與可進行語義識別的內(nèi)容進行精確匹配,實現(xiàn)語義識別的目的。
例如,基本子模型包含精確的控制指令概念、應用名稱概念、影視名稱概念、音樂名稱概念、導演演員名稱概念、電視臺名稱概念等一系列基本概 念,以及基本概念的擴展概念,例如,對電影類型概念“動作片”擴展得出的“武打片”、“功夫片”等,屬于基本概念的擴展概念,基本概念及其基本概念的擴展概念構(gòu)成含義精確的條目。而基本概念與擴展概念之間的對應關(guān)系存放在語義關(guān)系子模型中,語義關(guān)系還存放有基本概念本身的關(guān)系,這些關(guān)系都可以由對應的關(guān)系號來標示,例如100標示電影類型概念,100a標示電影類型概念的擴展概念等等。
進一步地,上述步驟s5中,首先根據(jù)語義關(guān)系子模型中的與基本子模型中的基本概念相關(guān)的關(guān)系,在語義識別模型中的基本子模型中查找與上述可識別內(nèi)容可直接精確匹配的基本概念:
若能夠查找到,則根據(jù)直接精確匹配的基本概念獲得第一匹配結(jié)果;
若不能查找到,則根據(jù)語義關(guān)系子模型中的基本概念與擴展概念之間的對應關(guān)系在基本子模型的擴展概念中查找與可識別內(nèi)容直接精確匹配的擴展概念,獲得第一匹配結(jié)果。
換言之,本發(fā)明的較佳的實施例中,首先在基本子模型中查找是否存在與可識別內(nèi)容直接精確匹配的基本概念:若存在,則直接根據(jù)這些相匹配的基本概念獲取第一匹配結(jié)果;若不存在,則轉(zhuǎn)向基本子模型中的擴展概念并同樣查找是否存在直接精確匹配的擴展概念,找到并根據(jù)相匹配的擴展概念獲取第一匹配結(jié)果。
具體地,本發(fā)明的一個較佳的實施例中,如果輸入的語音內(nèi)容被預處理為“動作片”,且該“動作片”并無上下文邏輯,則利用語義關(guān)系子模型中電影類型概念的關(guān)系在基本子模型中的電影類型概念中找到“動作片”這一基本概念,從而認為,語音輸入的內(nèi)容可被精確匹配,無需進行后續(xù)語義識別過程即可確定用戶的意圖。
如果輸入的語音內(nèi)容被預處理為“武打片”,且該“武打片”并無上下文邏輯,在基本子模型的電影類型概念中查找不到“武打片”,那么根據(jù)上述基本子模型中與電影類型這個基本概念相對應的擴展概念的關(guān)系即可在基本子模型中的電影類型的擴展概念中查找到“武打片”這一擴展概念,從而認為語音輸入的內(nèi)容可以被精確匹配,無需進行后續(xù)語義識別過程即可確定用戶的意圖。
本發(fā)明的較佳的實施例中,上述語義識別模型中還包括詞表,詞表中包 括可進行語義識別的詞的序號(id)以及每個詞所對應的關(guān)系號。例如,在對于電視功能進行控制的應用中,將針對人名、應用名、控制詞匯、影視名等采用多對多的方式進行構(gòu)建。在每一步的語義識別過程中,每個詞所對應的關(guān)系號根據(jù)具體適用場景進行預設(shè),亦可根據(jù)需要擴充關(guān)系數(shù)量,增加關(guān)系定義。每個詞的id都是唯一的,因此可以根據(jù)可識別內(nèi)容中的詞在詞表中查找到與該次對應的關(guān)系號,再根據(jù)關(guān)系號在語義關(guān)系子模型中查找相應的關(guān)系。
本發(fā)明的較佳的實施例中,這些關(guān)系可能會指向基本子模型、句型關(guān)系子模型或通用子模型中的一個。在上述實施例中,上述關(guān)系指向基本子模型,例如上文中所述的“武打片”在詞表中的id對應的關(guān)系號被預設(shè)為100,而在語義關(guān)系子模型中該關(guān)系號100的基本概念表示的是電影類型,因此就可以在基本子模型中的電影類型的基本概念里查找。
本發(fā)明的較佳的實施例中,上述步驟s4中,若無法獲取第一匹配結(jié)果,即對基本概念和擴展概念進行精確匹配后均無法得到匹配結(jié)果,則繼續(xù)執(zhí)行下述步驟:
利用語義關(guān)系子模型、句型關(guān)系子模型以及基本子模型對可識別內(nèi)容進行關(guān)系語義匹配,獲取相應的第二匹配結(jié)果;
則在上述步驟s6中,服務端將第二匹配結(jié)果返回至智能設(shè)備,以控制智能設(shè)備執(zhí)行第二匹配結(jié)果中包含的指令,或者向使用者提示第二匹配結(jié)果。
具體地,本發(fā)明的較佳的實施例中,上述處理過程被稱為語義識別過程中的關(guān)系語義匹配步驟。于上述步驟s5中,根據(jù)語義關(guān)系子模型中與句型關(guān)系子模型相關(guān)的關(guān)系,在句型關(guān)系子模型中查找與可識別內(nèi)容的句型關(guān)系直接匹配的句型關(guān)系,根據(jù)所匹配的句型關(guān)系對可識別內(nèi)容重新界定,再利用語義識別模型中的基本子模型對經(jīng)過重新界定的可識別內(nèi)容進行語義匹配以獲取第二匹配結(jié)果。
換言之,本發(fā)明的較佳的實施例中,語義識別模型根據(jù)句型關(guān)系子模型對可識別內(nèi)容進行重新進行界定后還需要利用基本子模型對經(jīng)過重新界定的可識別內(nèi)容進行語義匹配并獲取第二匹配結(jié)果。即先通過語義關(guān)系子模型的處理,再執(zhí)行基本子模型的處理,最終得到第二匹配結(jié)果。
本發(fā)明的較佳的實施例中,上述步驟s5中,可識別內(nèi)容如果無法獲得 精確語義匹配結(jié)果,可以分為三種情況;
第一類內(nèi)容是沒有上下文關(guān)系,但是仍無法獲得第一匹配結(jié)果。
第二類內(nèi)容是具有上下文關(guān)系,并可以由句型關(guān)系對其內(nèi)容做出界定的內(nèi)容。
第三類內(nèi)容是具有上下文關(guān)系,無法直接通過句型關(guān)系對其進行界定。
針對第一類內(nèi)容,由于其沒有上下文關(guān)系,可以通過詞頻關(guān)系、計算距離等方式將其與基本子模型中的概念進行語義關(guān)聯(lián),如果關(guān)聯(lián)度可以限定在一定閾值范圍內(nèi),則可以認為得到了第二匹配結(jié)果。如果這樣仍很難得到第二匹配結(jié)果,還是可以通過模糊匹配進行語義識別。
針對第二類內(nèi)容,由于句型關(guān)系子模型中包括各種句型關(guān)系,通過將可識別內(nèi)容與句型關(guān)系進行匹配,如果符合某一種句型關(guān)系,則在一定程度上可以界定內(nèi)容的所屬語義分類,然后再根據(jù)其中內(nèi)容的具體詞語并利用詞表找到這些詞的關(guān)系號,在語義關(guān)系子模型中找到對應的基本子模型中的關(guān)系,最后在基本子模型進行匹配,確定具體語義,獲得第二匹配結(jié)果。
對于上述第三類內(nèi)容,在下文中會詳述。
本發(fā)明的較佳的實施例中,上述步驟s5中,若經(jīng)過關(guān)系匹配也無法獲得第二匹配結(jié)果(即上述第三類內(nèi)容),則繼續(xù)執(zhí)行下述步驟:
利用語義關(guān)系子模型中的模糊語義關(guān)系進行模糊語義識別、句型關(guān)系子模型以及基本子模型,獲得相應的第三匹配結(jié)果;或者
利用語義關(guān)系子模型和通用子模型常識識別庫對可識別內(nèi)容進行模糊關(guān)系匹配,獲得第三匹配結(jié)果;
則步驟s6中,服務端將第三匹配結(jié)果返回至智能設(shè)備,以控制智能設(shè)備執(zhí)行第三匹配結(jié)果中包含的指令,或者向使用者提示第三匹配結(jié)果。
具體地,本發(fā)明的較佳的實施例中,上述步驟為模糊關(guān)系匹配步驟。該模糊關(guān)系匹配步驟中用到的模糊語義關(guān)系通常可以包括上下文關(guān)系、概念聚類分類關(guān)系、領(lǐng)域分類關(guān)系、常用場景分類關(guān)系、語境關(guān)聯(lián)關(guān)系或組合關(guān)聯(lián)關(guān)系等,并且還可以根據(jù)應用場景的變化對關(guān)系進行補充。
本發(fā)明的較佳的實施例中,上述通用子模型中可以包括:常識概念、常識概念的關(guān)聯(lián)領(lǐng)域以及常識概念的關(guān)聯(lián)組合。上述通用子模型可以通過交互學習機制結(jié)合互聯(lián)網(wǎng)信息與用戶行為數(shù)據(jù)建立,實現(xiàn)通用子模型的自我更新, 將其中符合用戶習慣的知識作為學習結(jié)果加入常用通用子模型,剩余知識作為備用通用子模型存在,形成通用子模型。進一步的,通用子模型還可以進入用戶個性化提取機制,對特定群體、領(lǐng)域用戶或個體用戶的使用個性進行提取,以實現(xiàn)個性化的用戶需求。
需要說明的是,整個語義識別模型,包括其中的基本子模型、語義關(guān)系子模型、句型關(guān)系子模型等都可以通過上述方式進行更新,即采用如圖2中所述的步驟進行更新:
步驟a1,利用交互學習機制結(jié)合互聯(lián)網(wǎng)信息或用戶行為數(shù)據(jù)建立初始的語義識別模型;
步驟a2,對互聯(lián)網(wǎng)信息或用戶行為數(shù)據(jù)進行識別、歸類,并依據(jù)歸類好的數(shù)據(jù)對初始的語義識別模型進行更新,以得到最終的語義識別模型并保存。
進一步地,本發(fā)明的較佳的實施例中,同樣可以利用交互學習機制根據(jù)特定領(lǐng)域、特定人群或用戶個體的互聯(lián)網(wǎng)信息或用戶行為習慣與偏好對語義識別模型進行更新,包括對語義識別模型的基本子模型、句型關(guān)系子模型、通用子模型或語義關(guān)系子模型進行更新。即語義識別模型的更新過程還可以進一步地如圖3所示,包括:
步驟b1,利用交互學習機制對特定領(lǐng)域、特定人群或用戶個體的互聯(lián)網(wǎng)信息或用戶行為習慣與偏好進行處理;
步驟b2,依據(jù)處理得到的數(shù)據(jù)對語義識別模型進行更新。
模糊語義匹配給出的結(jié)果并不一定準確,但是必然會輸出一個系統(tǒng)認為最匹配的結(jié)果。在此過程中,可以使用上下文語境識別技術(shù)、詞性關(guān)系識別技術(shù)、常識知識匹配技術(shù)、自動學習技術(shù)、用戶習慣抽取技術(shù)等。
具體地,回到模糊關(guān)系匹配步驟中,本發(fā)明的較佳的實施例中,實現(xiàn)模糊關(guān)系匹配的關(guān)鍵在于通過上下文的語境識別對關(guān)鍵詞進行模糊匹配。例如對于下述“教育孩子”、“教育要面向現(xiàn)代化”、“興辦教育”這三句話中關(guān)于“教育”的理解可以通過上下文的語境識別技術(shù)實現(xiàn)。具體地,
1)“教育”作為一個基本概念,與可以表征為兒童的基本概念“孩子”后續(xù)連接時,可以認為這句話的意圖是把“教育”作為一個動作,而“孩子”是動作的受體。
2)“教育要面向現(xiàn)代化”中同樣是教育,但后續(xù)連接的是“面向”和“現(xiàn)代 化”這兩個詞,則可以判斷這兩個詞不應該作為動作的受體。同時“現(xiàn)代化”可以作為一個修飾語存在,進而判斷“教育”在其中的真正意義是做一個被修飾語。
3)在“興辦教育”中的“教育”有前續(xù)連接詞“興辦”,通過對“興辦”的詞性和“教育”的詞性識別可以確定“教育”在本句話中作為名詞。
通過上述上下文的語境識別,將確定好的詞性、詞語關(guān)系以及語境與通用子模型中的通用概念,通用概念的關(guān)聯(lián)領(lǐng)域和通用概念的關(guān)聯(lián)組合進行匹配得到模糊語義匹配結(jié)果,也可以將確定好的釋義與語義識別模型中的基本子模型、句型關(guān)系子模型進行匹配,從而獲得模糊語義匹配結(jié)果。
本發(fā)明的較佳的實施例中,上述三個步驟(精確語義匹配步驟、關(guān)系語義匹配步驟以及模糊語義匹配步驟)并不是都需要執(zhí)行的。
本發(fā)明的一個較佳的實施例中,在一個完整的語義識別過程中,若通過精確語義匹配步驟可以得到第一匹配結(jié)果,則直接根據(jù)第一匹配結(jié)果進行后續(xù)操作,無需再執(zhí)行關(guān)系語義匹配步驟和模糊語義匹配步驟。
本發(fā)明的一個較佳的實施例中,在一個完整的語義識別過程中,若通過精確語義匹配步驟無法得到第一匹配結(jié)果,則轉(zhuǎn)而執(zhí)行關(guān)系語義匹配步驟并得到第二匹配結(jié)果。此時可以直接根據(jù)第二匹配結(jié)果進行后續(xù)操作,而無需再執(zhí)行模糊語義匹配步驟。
本發(fā)明的一個較佳的實施例中,在一個完整的語義識別過程中,若通過精確語義匹配步驟和關(guān)系語義匹配步驟均無法得到匹配結(jié)果,則轉(zhuǎn)而執(zhí)行模糊語義匹配步驟并得到第三匹配結(jié)果,并進而根據(jù)第三匹配結(jié)果執(zhí)行后續(xù)操作。
換言之,本發(fā)明的較佳的實施例中,上述三個步驟可以為依序進行的,若根據(jù)其中一個步驟已經(jīng)可以得到相應的匹配結(jié)果,則無需再進行后續(xù)的匹配步驟,因此上述三個步驟并不一定都存在于一次完整的語義識別過程中。
本發(fā)明的較佳的實施例中,上文中所述的步驟s6中,服務端最終向智能設(shè)備回傳識別得到的匹配結(jié)果(第一匹配結(jié)果,或者第二匹配結(jié)果或者第三匹配結(jié)果),智能設(shè)備根據(jù)匹配結(jié)果中包括的不同內(nèi)容執(zhí)行不同的操作。例如:
1)如果使用者先前輸入到智能設(shè)備中的語音信號為指令性信號,例如開 啟某某程序、更換桌面等,則最終服務端匹配得到的匹配結(jié)果中同樣包括相應的指令,即服務端通過語義識別的過程將使用者期望指示的指令進行標準化輸出至智能設(shè)備,以控制智能設(shè)備執(zhí)行使用者期望的操作。
2)如果使用者先前輸入到智能設(shè)備中的語音信號是詢問或者查找等類型的信號,則最終服務端匹配得到的匹配結(jié)果中包括語義識別后給出的推理結(jié)果或者對應于詢問或者查找的回答結(jié)果。服務端將上述推理結(jié)果或者回答結(jié)果返回給智能設(shè)備,則智能設(shè)備將這些推理結(jié)果或者回答結(jié)果顯示給使用者查看。
本發(fā)明技術(shù)方案中提供的語義識別方法將使用者輸入的語音內(nèi)容經(jīng)過語音識別之后,按照從精確到模糊的順序進行語義識別,具有系統(tǒng)化、高擴展性和高可行性的特點,可以有效地對使用者輸入的自然語言進行識別和推理,支持對使用者輸入的語言進行精確或者模糊識別,使使用者能夠更自然、方便地與智能設(shè)備進行交互。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,對于系統(tǒng)類實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者裝置中還存在另外的相同要素。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明, 任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當可利用上述揭示的技術(shù)內(nèi)容做出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。