亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)的制作方法

文檔序號:6524059閱讀:214來源:國知局
檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)的制作方法
【專利摘要】一種檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng),此檢索系統(tǒng)包括:結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫包含多個記錄,其中每個記錄包括標題字段以及內(nèi)容字段,而標題字段內(nèi)包括至少一分字段,每一分字段包括指引字段以及數(shù)值字段。前述記錄的指引字段儲存指引數(shù)據(jù)、數(shù)值字段儲存數(shù)值數(shù)據(jù)、內(nèi)容字段則儲存內(nèi)容細節(jié)數(shù)據(jù)。搜尋引擎針對用戶請求信息所產(chǎn)生的關(guān)鍵字,對結(jié)構(gòu)化數(shù)據(jù)庫的記錄進行全文檢索,并將檢索結(jié)果傳送至一知識輔助理解模塊以確定用戶的意圖,并在確認用戶意圖后將用戶所要的信息回傳給用戶。
【專利說明】檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種檢索技術(shù),特別是涉及一種對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索的檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)。
【背景技術(shù)】
[0002]在計算機的自然語言理解(Nature Language Understanding)中,通常會使用特定的語法來抓取用戶的輸入語句的意圖或信息。因此,若數(shù)據(jù)庫中儲存有足夠多的用戶輸入語句的數(shù)據(jù),便能做到合理的判斷。
[0003]在現(xiàn)有的作法中,有一種是利用內(nèi)置的固定詞列表來抓取用戶的輸入語句,而固定詞列表中包含了特定的意圖或信息所使用的特定用語,而用戶需依照此特定用語來表達其意圖或信息,其意圖或信息才能被系統(tǒng)正確識別。然而,迫使用戶去記住固定詞列表的每個特定用語是相當不人性化的作法。例如:現(xiàn)有技術(shù)使用固定詞列表的實施方式,要求用戶在詢問天氣的時候必須說:“上海(或北京)明天(或后天)天氣如何? ”,而若用戶使用其他比較自然的口語化表達也想詢問天氣狀況時,比如是“上海明天怎么樣???”,因為語句中未出現(xiàn)“天氣”,所以現(xiàn)有技術(shù)就會理解成“上海有個叫明天的地方”,這樣顯然沒有抓到用戶的真正意圖。另外,用戶所使用的語句種類是十分復雜的,并且又時常有所變化,甚至有時用戶可能會輸入錯誤的語句,在此情況下必須要藉由模糊匹配的方式來抓取用戶的輸入語句。因此,僅提供僵化輸入規(guī)則的固定詞列表所能達到的效果就更差了。
[0004]此外,當利用自然語言理解來處理多種類型的用戶意圖時,有些相異的意圖的語法結(jié)構(gòu)卻是相同的,例如當用戶的輸入語句為"我要看三國演義",其用戶意圖有可能是想看三國演義的電影,或是想看三國演義的書,因此通常在此情況中,便會匹配到兩種可能意圖來讓用戶做選擇。然而,在很多情況下,提供不必要的可能意圖來讓用戶做選擇是十分多余且沒效率的。例如,當用戶的輸入語句為〃我想看超級星光大道〃時,將使用者的意圖匹配為看超級星光大道的書或者畫作是十分沒必要的(因為超級星光大道是電視節(jié)目)。
[0005]再者,一般而言,在全文檢索中所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)內(nèi)的信息是分散且不具關(guān)聯(lián)的,例如,在google或百度等搜尋引擎輸入關(guān)鍵字后,所獲得的網(wǎng)頁搜尋結(jié)果就是非結(jié)構(gòu)化數(shù)據(jù),因為搜尋結(jié)果必須通過人為的逐項閱讀才能找到當中的有用信息,而這樣的作法不僅浪費用戶的時間,而且可能漏失想要的信息,所以在實用性上會受到很大的限制。

【發(fā)明內(nèi)容】

[0006]本發(fā)明提供一種檢索方法以及檢索系統(tǒng),其對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索,而使全文檢索所獲得的搜尋結(jié)果是非常有意義的結(jié)構(gòu)化的數(shù)據(jù)。
[0007]本發(fā)明又提供一種自然語言理解系統(tǒng),藉由對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索來輔助判斷用戶的請求信息所表示的意圖。
[0008]本發(fā)明提出一種檢索系統(tǒng),其包括:結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫儲存具有多個記錄。搜尋引擎對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索,其中結(jié)構(gòu)化數(shù)據(jù)庫每個記錄內(nèi)部的所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且數(shù)值數(shù)據(jù)共同用以表達來自用戶的請求信息對該記錄的意圖。該搜尋引擎用以對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,其中在該數(shù)值數(shù)據(jù)被匹配時,對應于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)被輸出以確認該請求信息的意圖。
[0009]本發(fā)明提出一種自然語言理解系統(tǒng),其包括:自然語言處理器、知識輔助理解模塊以及檢索系統(tǒng)。自然語言處理器將用戶的請求信息,分析成至少一可能意圖語法數(shù)據(jù),每一可能意圖語法數(shù)據(jù)包括至少一關(guān)鍵字及意圖數(shù)據(jù)。耦接至自然語言處理器的知識輔助理解模塊用以求得至少一可能意圖語法數(shù)據(jù)中的確定意圖語法數(shù)據(jù),以表達用戶的請求信息的意圖。前述檢索系統(tǒng)包括結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫儲存多個記錄。搜尋引擎對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索。知識輔助理解模塊傳送關(guān)鍵字給檢索系統(tǒng),藉由檢索系統(tǒng)的回應,以輔助求得確定意圖語法數(shù)據(jù)。
[0010]本發(fā)明提出一種檢索方法,此方法首先提供結(jié)構(gòu)化數(shù)據(jù)庫,此結(jié)構(gòu)化數(shù)據(jù)庫儲存具有多個記錄。而后,對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索。
[0011]根據(jù)本發(fā)明的一實施例中,前述的每個記錄包括了標題字段,此標題字段內(nèi)包括至少一分字段,每一分字段包括指引字段以及數(shù)值字段,前述記錄的指引字段儲存指引數(shù)據(jù),前述記錄的數(shù)值字段儲存數(shù)值數(shù)據(jù)。
[0012]根據(jù)本發(fā)明的一實施例中,前述的每個記錄還包括內(nèi)容字段,前述記錄的內(nèi)容字段儲存前述記錄的內(nèi)容細節(jié)數(shù)據(jù)。
[0013]根據(jù)本發(fā)明的一實施例中,當前述記錄的標題字段中儲存有多個分字段的數(shù)據(jù)時,于各分字段的數(shù)據(jù)間儲存第一特殊字符,用以分隔各分字段的數(shù)據(jù),于指引字段與數(shù)值字段的數(shù)據(jù)間儲存第二特殊字符,用以分隔指引字段與數(shù)值字段的數(shù)據(jù)。
[0014]根據(jù)本發(fā)明的一實施例中,標題字段中的分字段具有固定位數(shù)。
[0015]本發(fā)明提出一種檢索系統(tǒng),包括一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲存至少一記錄,其中每個該記錄包含至少一字段,其中該字段所儲存的數(shù)據(jù)是共同用以描述該記錄的屬性;以及一搜尋引擎,用以依據(jù)一請求信息的一關(guān)鍵字對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,其中在該結(jié)構(gòu)化數(shù)據(jù)庫的至少一該記錄與該關(guān)鍵字產(chǎn)生匹配時,輸出對應于該字段的一指引數(shù)據(jù)以確認該請求信息的意圖。
[0016]本發(fā)明提出一種檢索方法,包括:輸入一關(guān)鍵字,其中該關(guān)鍵字是由一請求信息所產(chǎn)生;以及依據(jù)該關(guān)鍵字對一結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,其中該結(jié)構(gòu)化數(shù)據(jù)庫儲存至少一記錄,其中每個該記錄包含至少一字段,其中該字段所儲存的數(shù)據(jù)是共同用以描述該記錄的屬性;其中在該結(jié)構(gòu)化數(shù)據(jù)庫的至少一該記錄與該關(guān)鍵字產(chǎn)生匹配時,輸出對應于該字段的一指引數(shù)據(jù)以確認該請求信息的意圖。
[0017]基于上述,本發(fā)明藉由將用戶的請求信息所包括的關(guān)鍵字,來對結(jié)構(gòu)化數(shù)據(jù)庫中具有特定數(shù)據(jù)結(jié)構(gòu)的記錄進行全文檢索,以輔助判斷出用戶在請求信息中所表示的意圖。
[0018]為使本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并結(jié)合附圖詳細說明如下。
【專利附圖】

【附圖說明】
[0019]圖1為根據(jù)本發(fā)明的一實施例的自然語言理解系統(tǒng)的方塊圖。[0020]圖2為根據(jù)本發(fā)明的一實施例的自然語言處理器對用戶的各種請求信息的分析結(jié)果的示意圖。
[0021]圖3A是根據(jù)本發(fā)明的一實施例的結(jié)構(gòu)化數(shù)據(jù)庫所儲存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個記錄的示意圖。
[0022]圖3B是根據(jù)本發(fā)明的另一實施例的結(jié)構(gòu)化數(shù)據(jù)庫所儲存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個記錄的示意圖。
[0023]圖3C是根據(jù)本發(fā)明的一實施例的指引數(shù)據(jù)儲存裝置所儲存的指引數(shù)據(jù)的示意圖。
[0024]圖4A為根據(jù)本發(fā)明的一實施例的檢索方法的流程圖。
[0025]圖4B為根據(jù)本發(fā)明的另一實施例的自然語言理解系統(tǒng)工作過程的流程圖。
[0026]圖5A是依照本發(fā)明一實施例所繪示的自然語言對話系統(tǒng)的方塊圖。
[0027]圖5B是依照本發(fā)明一實施例所繪示的自然語言理解系統(tǒng)的方塊圖。
[0028]圖5C是依照本發(fā)明另一實施例所繪示的自然語言對話系統(tǒng)的方塊圖。
[0029]圖6是依照本發(fā)明一實施例所繪示的修正語音應答的方法流程圖。
[0030]圖7A是依照本發(fā)明一實施例所繪示的自然語言對話系統(tǒng)的方塊圖。
[0031]圖7B是依照本發(fā)明另一實施例所繪示的自然語言對話系統(tǒng)的方塊圖。
[0032]圖8A是依照本發(fā)明一實施例所繪示的自然語言對話方法流程圖。
[0033]圖SB是根據(jù)本發(fā)明的再一實施例的結(jié)構(gòu)化數(shù)據(jù)庫所儲存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個記錄的示意圖。
[0034]圖9為依據(jù)本發(fā)明一實施例的移動終端裝置的系統(tǒng)示意圖。
[0035]圖10為依據(jù)本發(fā)明一實施例的信息系統(tǒng)的系統(tǒng)示意圖。
[0036]圖11為依據(jù)本發(fā)明一實施例的基于語音識別的選擇方法的流程圖。
[0037]圖12是依照本發(fā)明一實施例所繪示的語音操控系統(tǒng)的方塊圖。
[0038]圖13是依照本發(fā)明另一實施例所繪示的語音操控系統(tǒng)的方塊圖。
[0039]圖14是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。
[0040]附圖符號說明
[0041]100、520、520’、720、720’:自然語言理解系統(tǒng)
[0042]102、503、503’、703、902、902’:請求信息
[0043]104:分析結(jié)果
[0044]106:可能意圖語法數(shù)據(jù)
[0045]108、509、509,、711、904、904,:關(guān)鍵字
[0046]110:回應結(jié)果
[0047]112:意圖數(shù)據(jù)
[0048]114:確定意圖語法數(shù)據(jù)
[0049]116:分析結(jié)果輸出模塊
[0050]200:檢索系統(tǒng)
[0051]220:結(jié)構(gòu)化數(shù)據(jù)庫
[0052]240:搜尋引擎
[0053]260:檢索接口單元[0054]280:指引數(shù)據(jù)儲存裝置
[0055]300:自然語言處理器
[0056]302、832、834、836、838:記錄
[0057]304:標題字段
[0058]306:內(nèi)容字段
[0059]308:分字段
[0060]310:指引字段
[0061]312:數(shù)值字段
[0062]314:來源字段
[0063]316:熱度字段
[0064]318,852,854:喜好字段
[0065]320,862,864:厭惡字段
[0066]400:知識輔助理解模塊
[0067]500、500’、700、700’:自然語言對話系統(tǒng)
[0068]501、701:語首輸入
[0069]507、507,、707:語音應答
[0070]510、710:語音取樣模塊
[0071]511、511’、711、906、906’:回報答案
[0072]513、513’、713:語音
[0073]522、722:語音識別模塊
[0074]524、724:自然語言處理模塊
[0075]526、726:語音合成模塊
[0076]530,740:語音合成數(shù)據(jù)庫
[0077]702:語音綜合處理模塊
[0078]715:用戶喜好數(shù)據(jù)
[0079]717:用戶喜好記錄
[0080]730:特性數(shù)據(jù)庫
[0081]872、874:字段
[0082]900、1010:移動終端裝置
[0083]908>908>:候選列表
[0084]910、1011:語音接收單元
[0085]920、1013:數(shù)據(jù)處理單元
[0086]9:30、1015:顯示單元
[0087]940:存儲單元
[0088]1000:信息系統(tǒng)
[0089]1020:伺服器
[0090]SPl:第一語音
[0091]SP2:第二語音
[0092]1200、1300:語音操控系統(tǒng)[0093]1210:輔助啟動裝置
[0094]1212、1222:無線傳輸模塊
[0095]1214:觸發(fā)模塊
[0096]1216:無線充電電池
[0097]12162:電池單元
[0098]12164:無線充電模塊
[0099]1220、1320:移動終端裝置
[0100]1221:語音系統(tǒng)
[0101]1224:語音取樣模塊
[0102]1226:語音合成模塊
[0103]1227:語音輸出接口
[0104]1228:通訊模塊
[0105]1230:(云端)伺服器
[0106]1232:語音理解模塊
[0107]12322:語音識別模塊
[0108]12324:語音處理模塊
[0109]S410?S450:根據(jù)本發(fā)明一實施例的檢索方法的步驟
[0110]S510?S590:根據(jù)本發(fā)明一實施例的自然語言理解系統(tǒng)工作過程的步驟
[0111]S602、S604、S606、S608、S610、S612:修正語音應答的方法各步驟
[0112]S802?S890:根據(jù)本發(fā)明一實施例的自然語言對話方法各步驟
[0113]SllOO?S1190:依據(jù)本發(fā)明一實施例的基于語音識別的選擇方法的各步驟
[0114]S1402?S1412:依據(jù)本發(fā)明一實施例的語音操控方法的各步驟
【具體實施方式】
[0115]由于現(xiàn)有運用固定詞列表的實施方式只能提供僵化的輸入規(guī)則,對于用戶多變的輸入語句的判斷能力十分不足,所以常導致對用戶的意圖判斷錯誤而找不到所需的信息、或是因為判斷力不足而輸出不必要的信息給用戶等問題。此外,現(xiàn)有的搜尋引擎只能對用戶提供分散、且相關(guān)不強的搜尋結(jié)果,于是用戶還要花時間逐條檢視才能過濾出所需信息,不僅浪費時間而且可能漏失所需信息。本發(fā)明即針對現(xiàn)有技術(shù)的前述問題提出一結(jié)構(gòu)化數(shù)據(jù)的檢索方法與系統(tǒng),在結(jié)構(gòu)化數(shù)據(jù)提供特定的字段來儲存不同類型的數(shù)據(jù)元素,俾提供用戶使用自然語音輸入信息進行檢索時,能快速且正確地判斷用戶的意圖,進而提供所需信息予用戶、或提供更精確訊息供其選取。
[0116]圖1為根據(jù)本發(fā)明的一實施例的自然語言理解系統(tǒng)的方塊圖。如圖1所示,自然語言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語言處理器300以及知識輔助理解模塊400,知識輔助理解模塊400耦接自然語言處理器300以及檢索系統(tǒng)200,檢索系統(tǒng)200還包括結(jié)構(gòu)化數(shù)據(jù)庫220、搜尋引擎240以及檢索接口單元260,其中搜尋引擎240耦接結(jié)構(gòu)化數(shù)據(jù)庫220以及檢索接口單元260。在本實施例中,檢索系統(tǒng)200包括有檢索接口單元260,但非以限定本發(fā)明,某些實施例中可能沒有檢索接口單元260,而以其他方式(例如通過API (Application Interface)呼叫接收關(guān)鍵詞108)使搜尋引擎240對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索。
[0117]當用戶對自然語言理解系統(tǒng)100發(fā)出請求信息102時,自然語言處理器300可分析請求信息102,并在將所分析的可能意圖語法數(shù)據(jù)106送往知識輔助理解模塊400,其中可能意圖語法數(shù)據(jù)106包含關(guān)鍵字108與意圖數(shù)據(jù)112。隨后,知識輔助理解模塊400取出可能意圖語法數(shù)據(jù)106中的關(guān)鍵字108并送往檢索系統(tǒng)200并將意圖數(shù)據(jù)112儲存在知識輔助理解模塊400內(nèi)部,而檢索系統(tǒng)200中的搜尋引擎240將依據(jù)關(guān)鍵字108對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索之后,再將全文檢索的回應結(jié)果110回傳至知識輔助理解模塊400。接著,知識輔助理解模塊400依據(jù)回應結(jié)果110對所儲存的意圖數(shù)據(jù)112進行比對,并將所求得的確定意圖語法數(shù)據(jù)114送往分析結(jié)果輸出模塊116,而分析結(jié)果輸出模塊116再依據(jù)確定意圖語法數(shù)據(jù)114,傳送分析結(jié)果104至伺服器(未顯示),隨后在查詢到用戶所需的數(shù)據(jù)后將其送給用戶。應注意的是,分析結(jié)果104可包含關(guān)鍵字108,亦可輸出包含關(guān)鍵字108的記錄(例如圖3A/3B的記錄)的部分信息(例如記錄302的編號)、或是全部的信息。此外,分析結(jié)果104可直接被伺服器轉(zhuǎn)換成語音輸出予用戶、或是再經(jīng)過特定處理后再輸出對應語音予用戶(后文會再詳述“特定處理”的方式與所包含的內(nèi)容與信息),本領(lǐng)域的技術(shù)人員可依據(jù)實際需求設(shè)計檢索系統(tǒng)200所輸出的信息,本發(fā)明對此不予以限制。
[0118]上述的分析結(jié)果輸出模塊116可視情況與其他模塊相結(jié)合,例如在一實施例中可并入知識輔助理解模塊400中、或是在另一實施例中分離于自然語言理解系統(tǒng)100而位于伺服器(例如包含自然語言理解系統(tǒng)100者)中,于是伺服器將直接接收意圖語法數(shù)據(jù)114再進行處理。此外,自然語言理解系統(tǒng)100可將意圖數(shù)據(jù)112儲存在模塊內(nèi)部的儲存裝置中、在自然語言理解系統(tǒng)100中、伺服器中(例如包含自然語言理解系統(tǒng)100者)、或是在任何可供知識輔助理解模塊400可以擷取到的儲存器中,本發(fā)明對此并不加以限定。再者,自然語言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語言處理器300以及知識輔助理解模塊400可以用硬件、軟件、固件、或是上述方式的各種結(jié)合方式來構(gòu)筑,本發(fā)明亦未對此進行限制。
[0119]前述自然語言理解系統(tǒng)100可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器,甚或是位于個人計算機、移動計算機裝置(如筆記型計算機)或移動通訊裝置(如手機)等。自然語言理解系統(tǒng)100或檢索系統(tǒng)200中的各構(gòu)件也不一定需設(shè)置在同一機器中,而可視實際需要分散在不同裝置或系統(tǒng)通過各種不同的通訊協(xié)議來連結(jié)。例如,自然語言理解處理器300及知識輔助理解模塊400可配置于同一智能型手機內(nèi),而檢索系統(tǒng)200可配置在另一云端伺服器中;或者是,檢索接口單元260、自然語言理解處理器300及知識輔助理解模塊400可配置于同一筆記型計算機內(nèi),而搜尋引擎240及結(jié)構(gòu)化數(shù)據(jù)庫220可配置于區(qū)域網(wǎng)路中的另一伺服器中。此外,當自然語言理解系統(tǒng)100皆位于伺服器時(不論是云端伺服器或區(qū)域網(wǎng)路伺服器),可以將檢索系統(tǒng)200、自然語言理解處理器300、以及知識輔助理解模塊400配置不同的計算機主機中,并由伺服器主系統(tǒng)來統(tǒng)籌其相互間的訊息與數(shù)據(jù)的傳送。當然,檢索系統(tǒng)200、自然語言理解處理器300、以及知識輔助理解模塊400亦可視實際需求而將其中兩者或全部合并在一計算機主機中,本發(fā)明并不對這部分的配置進行限制。
[0120]在本發(fā)明的實施例中,用戶可以用各種方式來向自然語言處理器300發(fā)出請求信息,例如用說話的語音輸入或是文字描述等方式來發(fā)出請求信息。舉例來說,若自然語言理解系統(tǒng)100是位于云端或區(qū)域網(wǎng)路中的伺服器(未顯示)內(nèi),則用戶可先藉由移動裝置(例如手機、PDA、平板計算機或類似系統(tǒng))來輸入請求信息102,接著再通過電信系統(tǒng)業(yè)者來將請求信息102傳送至伺服器中的自然語言理解系統(tǒng)100,來讓自然語言處理器300進行請求信息102的分析,最后伺服器于確認用戶意圖后,再通過分析結(jié)果輸出模塊116將對應的分析結(jié)果104通過伺服器的處理后,將用戶所請求的信息傳回用戶的移動裝置。舉例來說,請求信息102可以是用戶希望藉由自然語言理解系統(tǒng)100來求得答案的問題(例如"明天上海的天氣怎么樣啊〃),而自然語言理解系統(tǒng)100在分析出用戶的意圖是查詢上海明天的天氣時,將通過分析結(jié)果輸出模塊116將所查詢的天氣數(shù)據(jù)作為輸出結(jié)果104送給用戶。此夕卜,若用戶對自然語言理解系統(tǒng)100所下的指令為〃我要看讓子彈飛〃、〃我想聽一起走過的日子〃時,因為“讓子彈飛”或“一起走過的日子”可能包含不同的領(lǐng)域,所以自然語言處理器300會將用戶的請求信息102分析成一個或一個以上的可能意圖語法數(shù)據(jù)106,此可能意圖語法數(shù)據(jù)106包括有關(guān)鍵字108及意圖數(shù)據(jù)112,然后再經(jīng)由對檢索系統(tǒng)220中的結(jié)構(gòu)化數(shù)據(jù)240進行全文檢索后,進而確認用戶的意圖。
[0121]進一步來說,當用戶的請求信息102為〃明天上海的天氣怎么樣啊?〃時,自然語言處理器300經(jīng)過分析后,可產(chǎn)生一個可能意圖語法數(shù)據(jù)106:
[0122]//<queryweather>,〈city〉=上海,〈時間 >=明天"。
[0123]在一實施例中,如果自然語言理解系統(tǒng)100認為用戶的意圖已相當明確,便可以直接將用戶的意圖(亦即查詢明天上海的天氣)通過分析結(jié)果輸出模塊116輸出分析結(jié)果104至伺服器,而伺服器可在查詢到用戶所指定的天氣候傳送給用戶。又例如,當用戶的請求信息102為〃我要看三國演義〃時,自然語言處理器300經(jīng)過分析后,可產(chǎn)生出三個可能意圖語法數(shù)據(jù)106:
[0124]〃〈readbook>,〈bookname〉=三國演義”;
[0125]〃〈watchTV>,〈TVname〉=三國演義〃;以及
[0126]〃〈watchfilm>,〈filmname〉=三國演義"。
[0127]這是因為可能意圖語法數(shù)據(jù)106中的關(guān)鍵字108(亦即“三國演義”)可能屬于不同的領(lǐng)域,亦即書籍(〈readbook〉)、電視劇(〈watchTV〉)、以及電影(〈readfilm〉)三個領(lǐng)域,所以一個請求信息102可分析成多個可能意圖語法數(shù)據(jù)106,因此需要通過知識輔助理解模塊400做進一步分析,來確認用戶的意圖。再舉另一個例子來說,若用戶輸入"我要看讓子彈飛〃時,因其中的〃讓子彈飛〃有可能是電影名稱或是書名稱,所以也可能出現(xiàn)至少以下兩個可能意圖語法數(shù)據(jù)106:
[0128]〃〈readbook>,〈bookname〉=讓子彈飛〃;以及
[0129]〃〈watchfilm>,〈filmname〉=讓子彈飛";
[0130]其分別屬于書籍與電影兩個領(lǐng)域。上述的可能意圖語法數(shù)據(jù)106隨后需通過知識輔助理解模塊400做進一步分析,并從中求得確定意圖語法數(shù)據(jù)114,來表達用戶的請求信息的明確意圖。當知識輔助理解模塊400分析可能意圖語法數(shù)據(jù)106時,知識輔助理解模塊400可通過檢索接口 260傳送關(guān)鍵字108 (例如上述的“三國演義”或“讓子彈飛”)給檢索系統(tǒng)200。檢索系統(tǒng)200中的結(jié)構(gòu)化數(shù)據(jù)庫220儲存了具有特定數(shù)據(jù)結(jié)構(gòu)的多個記錄,而搜尋引擎240能藉由檢索接口單元260所接收的關(guān)鍵字108來對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索,并將全文檢索所獲得的回應結(jié)果110回傳給知識輔助理解模塊400,隨后知識輔助理解模塊400便能藉由此回應結(jié)果110來求得確定意圖語法數(shù)據(jù)114。至于對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索以確定意圖語法數(shù)據(jù)114的細節(jié),將在后面通過圖3A、圖3B與相關(guān)段落做更詳細的描述。
[0131]在本發(fā)明的概念中,自然語言理解系統(tǒng)100能先擷取用戶的請求信息102中的關(guān)鍵字108,并藉由結(jié)構(gòu)化數(shù)據(jù)庫220的全文檢索結(jié)果來判別關(guān)鍵字108的領(lǐng)域?qū)傩?,例如上述輸入“我要看三國演義”時,會產(chǎn)生分別屬于書籍、電視劇、電影三個領(lǐng)域的可能意圖語法數(shù)據(jù)106,隨后再進一步分析并確認用戶的明確意圖。因此用戶能夠很輕松地以口語化方式來表達出其意圖或信息,而不需要特別熟記特定用語,例如現(xiàn)有作法中關(guān)于固定詞列表的特定用語。
[0132]圖2為根據(jù)本發(fā)明的一實施例的自然語言處理器300對用戶的各種請求信息的分析結(jié)果的示意圖。
[0133]如圖2所示,當用戶的請求信息102為〃明天上海的天氣怎么樣啊〃時,自然語言處理器300經(jīng)過分析后,可產(chǎn)生出可能意圖語法數(shù)據(jù)106為:
[0134]//<queryweather>,〈city〉=上海,〈時間 >=明天”
[0135]其中意圖數(shù)據(jù)112為〃〈queryweather>〃、而關(guān)鍵字108為〃上?!ㄅc〃明天〃。由于經(jīng)自然語言處理器300的分析后只取得一組意圖語法數(shù)據(jù)106(查詢天氣<queryweather>),因此在一實施例中,知識輔助理解模塊400可直接取出關(guān)鍵字108〃上?!ㄅc〃明天〃作為分析結(jié)果104送往伺服器來查詢天氣的信息(例如查詢明天上海天氣概況、包含氣象、氣溫…等信息),而不需要對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索來判定用戶意圖(如果知識輔助理解 模塊400在通過解析請求信息102所產(chǎn)生的可能意圖語法數(shù)據(jù)106即可確認用戶意圖的話)。當然,在一實施例中,仍可對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索做更精確的用戶意圖判定,本領(lǐng)域的技術(shù)人員可依據(jù)實際需求進行變更。
[0136]此外,當用戶的請求信息102為〃我要看讓子彈飛〃時,因為可產(chǎn)生出兩個可能意圖語法數(shù)據(jù)106:
[0137]〃〈readbook>,〈bookname〉=讓子彈飛〃;以及
[0138]〃〈watchfilm>,〈filmname〉=讓子彈飛";
[0139]與兩個對應的意圖數(shù)據(jù)112〃〈readbook>〃與〃〈watchfilm>〃、以及兩個相同的關(guān)鍵字108〃讓子彈飛〃,來表示其意圖可能是看〃讓子彈飛〃的書籍或是看〃讓子彈飛〃的電影。為進一步確認用戶的意圖,將通過知識輔助理解模塊400傳送關(guān)鍵字108〃讓子彈飛〃給檢索接口單元260,接著搜尋引擎240藉由此關(guān)鍵字108〃讓子彈飛〃來對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索,以確認"讓子彈飛"應該是書名稱或是電影名稱,藉以確認用戶的意圖。
[0140]再者,當用戶的請求信息102為〃我想聽一起走過的日子〃時,可產(chǎn)生出兩個可能意圖語法數(shù)據(jù)106:
[0141]"〈p I aymu s i c >,〈 s i nger >= — 起走過,〈songname〉=日子";//<playmusic>, <songname>= 一起走過的日子"
[0142]兩個對應的相同的意圖數(shù)據(jù)112〃〈playmusic>〃、以及兩組對應的關(guān)鍵字108〃 一起走過〃與〃日子〃及〃 一起走過的日子〃,來分別表示其意圖可能是聽歌手〃 一起走過〃所唱的歌曲〃日子〃、或是聽歌曲〃 一起走過的日子〃,此時知識輔助理解模塊400可傳送第一組關(guān)鍵字108〃 一起走過〃與〃日子〃以及第二組關(guān)鍵字〃 一起走過的日子〃給檢索接口單元260,來確認是否有〃一起走過〃這位歌手所演唱的〃日子〃這首歌(第一組關(guān)鍵字所隱含的用戶意圖)、或是否有"一起走過的日子"這首歌(第二組關(guān)鍵字所隱含的用戶意圖),藉以確認用戶的意圖。然而,本發(fā)明并不限于在此所表示的各可能意圖語法數(shù)據(jù)與意圖數(shù)據(jù)所對應的格式與名稱。
[0143]圖3A是根據(jù)本發(fā)明的一實施例的結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個記錄的示意圖。
[0144]一般而言,在一些現(xiàn)有的全文檢索作法中,所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)(例如通過google或百度所搜尋的結(jié)果),因其搜尋結(jié)果的各項信息是分散且不具關(guān)聯(lián)的,所以用戶必須再對各項信息逐一檢視,因此造成實用性的限制。然而,在本發(fā)明的概念中,能藉由結(jié)構(gòu)化數(shù)據(jù)庫來有效增進檢索的效率與正確性。因為本發(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫中的每個記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且這些數(shù)值數(shù)據(jù)共同用以表達該記錄的屬性。于是在搜尋引擎對結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索時,可在記錄的數(shù)值數(shù)據(jù)與關(guān)鍵字產(chǎn)生匹配時,輸出對應于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù),作為確認該請求信息的意圖。這部分的實施細節(jié)將通過下列實例作更進一步的描述。
[0145]在本發(fā)明的實施例中,結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的每個記錄302包括標題字段304及內(nèi)容字段306,標題字段304內(nèi)包括多個分字段308,各分字段包括指引字段310以及數(shù)值字段312,所述多個記錄302的指引字段310用以儲存指引數(shù)據(jù),而所述多個記錄302的數(shù)值字段312用以儲存數(shù)值數(shù)據(jù)。在此以圖3A所示的記錄I來舉例說明,記錄I的標題字段304中的三個分字段308分別儲存了:
[0146]^singerg uid:劉德華"、
[0147]^songnameguid:一起走過的日子〃;及
[0148]^songtypeguid:港臺,粵語,流行";
[0149]各分字段308的指引字段310分別儲存了指引數(shù)據(jù)"singerguid"、"songnameguid"及"songtypeguid〃、而其對應分字段308的數(shù)值字段312則分別儲存了數(shù)值數(shù)據(jù)〃劉德華〃、〃 一起走過的日子〃及〃港臺,粵語,流行〃。指引數(shù)據(jù)"singerguid"代表數(shù)值數(shù)據(jù)〃劉德華〃的領(lǐng)域種類為歌手名稱(singer),指引數(shù)據(jù)"songnameguid"代表數(shù)值數(shù)據(jù)〃 一起走過的日子〃的領(lǐng)域種類為歌曲名稱(song),指引數(shù)據(jù)"songtypeguid〃代表數(shù)值數(shù)據(jù)〃港臺,粵語,流行〃的領(lǐng)域種類為歌曲類型(song type)。在此的各指引數(shù)據(jù)實際上可分別用不同的特定一串數(shù)字或字來表示,在本發(fā)明中不以此為限。記錄I的內(nèi)容字段306則是儲存了 〃一起走過的日子〃這首歌的歌詞內(nèi)容或儲存其他的數(shù)據(jù)(例如作曲/詞者…等),然而各記錄的內(nèi)容字段306中的真實數(shù)據(jù)并非本發(fā)明所強調(diào)的重點,因此在圖3A中僅示意性地來描述之。
[0150]前述的實施例中,每個記錄包括標題字段304及內(nèi)容字段306,且標題字段304內(nèi)的分字段308包括指引字段310以及數(shù)值字段312,但非以限定本發(fā)明,某些實施例中也可以沒有內(nèi)容字段306,甚或是有些實施例中可以沒有指引字段310。
[0151 ] 除此之外,在本發(fā)明的實施例中,于各分字段308的數(shù)據(jù)間儲存有第一特殊字符來分隔各分字段308的數(shù)據(jù),于指引字段310與該數(shù)值字段312的數(shù)據(jù)間儲存有第二特殊字符來分隔指引字段與數(shù)值字段的數(shù)據(jù)。舉例來說,如圖3A所示,"singerguid"與〃劉德華〃之間、"songnameguid"與〃 一起走過的日子〃之間、以及"songtypeguid"與〃港臺,粵語,流行〃之間是利用第二特殊字符〃:"來做分隔,而記錄I的各分字段308間是利用第一特殊字符〃 I 〃來做分隔,然而本發(fā)明并不限于以〃:"或〃 I 〃來做為用以分隔的特殊字符。
[0152]另一方面,在本發(fā)明的實施例中,標題字段304中的各分字段308可具有固定位數(shù),例如各分字段308的固定位數(shù)可以是32個字,而其中的指引字段310的固定位數(shù)可以是7或8個位(最多用來指引128或256種不同的指引數(shù)據(jù)),此外,因第一特殊字符與第二特殊字符所需要的位數(shù)可以是固定的,所以分字段308的固定位數(shù)在扣除指引字段310、第一特殊字符、第二特殊字符所占去的位數(shù)后,剩下的位數(shù)便可悉數(shù)用來儲存數(shù)值字段312的數(shù)值數(shù)據(jù)。再者,由于分字段308的位數(shù)固定,加上分字段308儲存數(shù)據(jù)的內(nèi)容可如圖3A所示依序為指引字段310 (指引數(shù)據(jù)的指標)、第一特殊字符、數(shù)值字段312的數(shù)值數(shù)據(jù)、第二特殊字符,而且如前所述,這四個數(shù)據(jù)的位數(shù)量也是固定的,于是在實作上可跳過指引字段310的位(例如跳過前7或8個位)、以及第二特殊字符的位數(shù)(例如再跳過I個字,亦即8個位)后,再扣掉第一特殊字符所占的位數(shù)(例如最后I個字、8個位)之后,最后便可直接取得數(shù)值字段312的數(shù)值數(shù)據(jù)(例如在記錄I的第一個分字段308中直接取出數(shù)值數(shù)據(jù)”劉德華”,此時還有32-3=29個字可供儲存數(shù)值字段312的數(shù)值數(shù)據(jù),算式中的3 (亦即1+1+1)代表被指引字段310的指引數(shù)據(jù)、第一特殊字符、第二特殊字符所分別占去的I個字),接著再進行所需的領(lǐng)域種類判斷即可。于是,在目前所取出的數(shù)值數(shù)據(jù)比對完畢后(不論是否比對成功與否),可以再依據(jù)上述取出數(shù)值數(shù)據(jù)的方式取出下一個分字段308的數(shù)值數(shù)據(jù)(例如在記錄I的第二個分字段308中直接取出數(shù)值數(shù)據(jù)“一起走過的日子”),來進行比對領(lǐng)域種類的比對。上述取出數(shù)值數(shù)據(jù)的方式可以從記錄I開始進行比對,并在比對完記錄I所有的數(shù)值數(shù)據(jù)后,再取出記錄2的標題字段308中第一個分字段308的數(shù)值數(shù)據(jù)(例如“馮小剛”)進行比對。上述比對程序?qū)⒊掷m(xù)進行,直到所有記錄的數(shù)值數(shù)據(jù)都被比對過為止。
[0153]應注意的是,上述的分字段308的位數(shù)、以及指引字段310、第一特殊字符、第二特殊字符個使用的位數(shù)可依實際應用改變,本發(fā)明對此并未加以限制。前述利用比對來取出數(shù)值數(shù)據(jù)的方式只是一種實施例,但非用以限定本發(fā)明,另一實施例可以使用全文檢索的方式(例如以“字符逐一比對”的方式)來進行。此外,上述跳過指引字段310、第二特殊字符、第一特殊字符的實作方式,可以使用位平移(例如除法)來達成,此部分的實施可以用硬件、軟件、或兩者結(jié)合的方式進行,本領(lǐng)域的技術(shù)人員可依實際需求而變更。在本發(fā)明的另一實施例中,標題字段304中的各分字段308可具有固定位數(shù),分字段308中的指引字段310可具有另一固定位數(shù),并且標題字段304中可不包括第一特殊字符以及第二特殊字符,由于各分字段308以及各指引字段310的位數(shù)為固定,所以可利用跳過特定位數(shù)的方式或是使用位平移(例如除法)的方式來直接取出各分字段308中的指引數(shù)據(jù)或數(shù)值數(shù)據(jù)。
[0154]應注意的是,由于前面已提到分字段308具有一定的位數(shù),所以可以在自然語言理解系統(tǒng)100中(或是包含自然語言理解系統(tǒng)100的伺服器中)使用計數(shù)器來記錄目前所比對的是某一記錄的某分字段308。此外,比對的記錄亦可使用另一計數(shù)器來儲存其順序。舉例來說,當分別使用一第一計數(shù)器記錄來表示目前所比對的記錄順序、并使用一第二計數(shù)器來表示目前所比對的分字段順序時,若目前比對的是圖3A的記錄2的第3個分字段308(亦即比對“filenameguid:華誼兄弟”)時,第一計數(shù)器所儲存的數(shù)值將是2 (表示目前比對的是記錄2),第二計數(shù)器所儲存的數(shù)值則為3(表示目前比對的是第3個分字段308)。再者,上述僅以7或8個位儲存指引字段310的指引數(shù)據(jù)的方式,是希望將分字段308的大多數(shù)字都用來儲存數(shù)值數(shù)據(jù),而實際的指引數(shù)據(jù)則可通過這7、8個位當作指標,再據(jù)以從檢索系統(tǒng)200所儲存的指引數(shù)據(jù)儲存裝置280中讀取實際的指引數(shù)據(jù),其中指引數(shù)據(jù)是以表格的方式進行儲存,但其他任何可供檢索系統(tǒng)200存取的方式皆可用在本發(fā)明中。于是,在實際操作時,除了可直接取出數(shù)值數(shù)據(jù)進行比對之外,亦可在產(chǎn)生匹配結(jié)果時,直接依據(jù)上述兩個計數(shù)器的數(shù)值,直接取出指引數(shù)據(jù)作為回應結(jié)果110送給知識輔助理解模塊400。舉例來說,當記錄6的第2個分字段308 (亦即“songnameguid:背叛”)匹配成功時,將得知目前的第一計數(shù)器/第二計數(shù)器的數(shù)值分別為6與2,因此可以依據(jù)這兩個數(shù)值前往儲存圖3C所示的指引數(shù)據(jù)儲存裝置280,由記錄6的分字段2查詢出指引數(shù)據(jù)為“songnameguid”。在一實施例中,可以將分字段308的位數(shù)固定后,再將分字段308的所有位都用來儲存數(shù)值數(shù)據(jù),于是可以完全除去指引字段、第一特殊字符、第二特殊字符,而搜尋引擎240只要知道每越過固定位數(shù)就是另一個分字段308,并在第二計數(shù)器中加一即可(當然,每換下一個記錄進行檢索時亦需將第一計數(shù)器的儲存值加一),例如在一實施例中,每個記錄的大小可設(shè)定在一預定數(shù)值,而其所包含的分字段308數(shù)目可固定在一預定數(shù)量,因此搜索引擎220在一記錄中分析了預定數(shù)值的數(shù)據(jù)后,便可以輕易地知道已拜訪至記錄終點。在另一實施例中,可在紀錄最后儲存一個特定的第三特殊字符(例如句號或其他類似符號等),而搜索引擎220在發(fā)現(xiàn)這個特殊符號時亦知道已拜訪至記錄終點,這樣的實施方式可以提供更多的位數(shù)來儲存數(shù)值數(shù)據(jù)。
[0155]再舉一個實例來說明比對產(chǎn)生匹配結(jié)果時,回傳匹配記錄110至知識輔助理解模塊400做進一步處理的過程。對應于上述記錄302的數(shù)據(jù)結(jié)構(gòu),在本發(fā)明的實施例中,當用戶的請求信息102為〃我要看讓子彈飛〃時,可產(chǎn)生出兩個可能意圖語法數(shù)據(jù)106:
[0156]〃〈readbook>,〈bookname〉=讓子彈飛〃;與
[0157]〃〈watchfilm>,〈filmname〉=讓子彈飛";
[0158]搜尋引擎240便藉由檢索接口單元260所接收的關(guān)鍵字108〃讓子彈飛〃來對圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的記錄的標題字段304進行全文檢索。全文檢索中,在標題字段304中找到了儲存有數(shù)值數(shù)據(jù)〃讓子彈飛〃的記錄5,因此產(chǎn)生了匹配結(jié)果。接下來,檢索系統(tǒng)200將回傳記錄5標題字段304的第三個分字段308中,對應于關(guān)鍵字108“讓子彈飛”的指引數(shù)據(jù)“filmnameguid”作為回應結(jié)果110并回傳至知識輔助理解模塊400。由于在記錄5的標題字段中,包含對應數(shù)值數(shù)據(jù)〃讓子彈飛〃的指引數(shù)據(jù)"filmnameguid",所以知識輔助理解模塊400藉由比對記錄5的指引數(shù)據(jù)"filmnameguid"與上述可能意圖語法數(shù)據(jù)106先前已儲存的意圖數(shù)據(jù)112〃〈watchfilm>〃或〃〈readbook>〃,便能判斷出此次請求信息的確定意圖語法數(shù)據(jù)114為"〈watchfilm〉,〈filmname〉=讓子彈飛〃(因為都包含“film”在其中)。換句話說,此次用戶的請求信息102中所描述數(shù)據(jù)〃讓子彈飛〃是電影名稱,而數(shù)據(jù)用戶的請求信息102的意圖為看電影"讓子彈飛〃,而非閱讀書籍。確認后的〃〈watchfilm>,〈filmname〉=讓子彈飛〃被當成確定意圖語法數(shù)據(jù)114并送往分析結(jié)果輸出模塊116做進一步處理。
[0159]再舉一個實例作更進一步的說明。當用戶的請求信息102為〃我想聽一起走過的日子〃時,可產(chǎn)生出兩個可能意圖語法數(shù)據(jù)106:[0160]//<playmusic>, <singer>= 一起走過,<songname>=日子";與
[0161]〃〈playmusic>,〈songname〉=一起走過的日子”;
[0162]搜尋引擎240便藉由檢索接口單元260所接收的兩組關(guān)鍵字108:
[0163]〃 一起走過〃與〃日子〃;以及
[0164]〃一起走過的日子〃
[0165]來對圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的記錄的標題字段304進行全文檢索。由于全文檢索中,并未在所有記錄的標題字段304中找到對應于第一組關(guān)鍵字108" —起走過〃與〃日子〃的匹配結(jié)果,而是找到了對應于第二組關(guān)鍵字108〃 一起走過的日子〃的記錄1,于是檢索系統(tǒng)200將記錄I標題字段304中對應于第二組關(guān)鍵字108的指引數(shù)據(jù)"songnameguid",作為匹配記錄110且回傳至知識輔助理解模塊400。接下來,知識輔助理解模塊400在接收對應數(shù)值數(shù)據(jù)〃 一起走過的日子〃的指引數(shù)據(jù)"songnameguid"后,便與可能意圖語法數(shù)據(jù)106 (亦即〃〈playmusic>,〈singer〉= 一起走過,〈songname〉=日子〃與〃〈playmusic〉,〈songname〉= 一起走過的日子〃)中的意圖數(shù)據(jù)112 (亦即〈singer〉、〈songname〉等)進行比對,于是便發(fā)現(xiàn)此次用戶的請求信息102中并未描述有歌手名稱的數(shù)據(jù),而是描述有歌曲名稱為〃 一起走過的日子〃的數(shù)據(jù)(因為只有〈songname〉比對成功)。所以,知識輔助理解模塊400可藉由上述比對而判斷出此次請求信息102的確定意圖語法數(shù)據(jù)114為〃〈playmusic>,〈songname〉= 一起走過的日子〃,而用戶的請求信息102的意圖為聽歌曲〃 一起走過的日子"。
[0166]在本發(fā)明的另一實施例中,檢索而得的回應結(jié)果110可以是與關(guān)鍵字108完全匹配的完全匹配記錄、或是與關(guān)鍵字108部分匹配的部分匹配記錄。舉例來說,如果用戶的請求信息102為〃我想聽蕭敬騰的背叛〃,同樣地,自然語言處理器300經(jīng)過分析后,產(chǎn)生出兩個可能意圖語法數(shù)據(jù)106:
[0167]〃〈playmusic>,〈singer〉=蕭敬騰,〈songname〉=背叛〃;及"〈playmusic〉,〈songname〉=蕭敬騰的背叛”;
[0168]并傳送兩組關(guān)鍵字108:
[0169]〃蕭敬騰〃與〃背叛〃;以及
[0170]〃蕭敬騰的背叛〃;
[0171]給檢索接口單元260,搜尋引擎240接著藉由檢索接口單元260所接收的關(guān)鍵字108來對圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的記錄302的標題字段304進行全文檢索。由于在全文檢索中,對應第二組關(guān)鍵字108"蕭敬騰的背叛〃并未匹配到任何記錄,但是對應第一組關(guān)鍵字108〃蕭敬騰〃與〃背叛〃找到了記錄6與記錄7的匹配結(jié)果。由于第二組關(guān)鍵字108"蕭敬騰〃與〃背叛〃僅與記錄6中的數(shù)值數(shù)據(jù)〃蕭敬騰〃相匹配,而未匹配到其他數(shù)值數(shù)據(jù)〃楊宗緯〃及〃曹格〃,因此記錄6為部分匹配記錄(請注意上述對應請求信息102〃我要看讓子彈飛〃的記錄5以及對應請求信息〃我想聽一起走過的日子〃的記錄I皆為部分匹配記錄),而關(guān)鍵字〃蕭敬騰〃與〃背叛〃完全匹配了記錄7的數(shù)值數(shù)據(jù)(因為第二組關(guān)鍵字108〃蕭敬騰〃與〃背叛〃皆匹配成功),所以記錄7為完全匹配記錄。在本發(fā)明的實施例中,當該檢索接口單元260輸出多個匹配記錄110至知識輔助理解模塊400時,可依序輸出完全匹配記錄(亦即全部的數(shù)值數(shù)據(jù)都被匹配)及部分匹配記錄(亦即僅有部分的數(shù)值數(shù)據(jù)被匹配)的匹配記錄110,其中完全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。因此,在檢索接口單元260輸出記錄6與記錄I的匹配記錄110時,記錄7的輸出優(yōu)先順序會大于記錄6的輸出優(yōu)先順序,因為記錄7全部的數(shù)值數(shù)據(jù)〃蕭敬騰〃與〃背叛〃都產(chǎn)生匹配結(jié)果,但記錄6還包含〃楊宗緯〃與〃曹格〃未產(chǎn)生匹配結(jié)果。也就是說,結(jié)構(gòu)化數(shù)據(jù)庫220中所儲存的記錄對其請求信息102中的關(guān)鍵字108的匹配程度越高,越容易優(yōu)先被輸出,以便用戶進行查閱或挑選對應的確定意圖語法數(shù)據(jù)114。在另一實施例中,可直接輸出優(yōu)先順序最高的記錄所對應的匹配記錄110,做為確定意圖語法數(shù)據(jù)114之用。前述非以限定本發(fā)明,因為在另一實施例中可能采取只要搜尋到有匹配記錄即輸出的方式(例如,以"我想聽蕭敬騰的背叛"為請求信息102而言,當檢索到記錄6即產(chǎn)生匹配結(jié)果時,即輸出記錄6對應的指引數(shù)據(jù)做匹配記錄110),而沒有包含優(yōu)先順序的排序,以加快檢索的速度。在另一實施例中,可對優(yōu)先順序最高的記錄,直接執(zhí)行其對應的處理方式并提供予用戶。例如當優(yōu)先順序最高的為播放三國演義的電影時,可直接播放電影與用戶。此外,若優(yōu)先順序最高的為蕭敬騰演唱的背叛時,可直接將此歌曲播放與用戶。應注意的是,本發(fā)明在此僅作說明,并非對此加以限定。
[0172]在本發(fā)明的再一實施例中,如果用戶的請求信息102為〃我要聽劉德華的背叛",則其可能意圖語法數(shù)據(jù)106的其中之一為:
[0173]〃〈playmusic>,〈singer〉=劉德華,〈songname〉=背叛,,;
[0174]若檢索接口單元260將關(guān)鍵字108"劉德華〃與〃背叛〃輸入搜尋引擎240,并不會在圖3A的數(shù)據(jù)庫中找到任何的匹配結(jié)果。在本發(fā)明的又一實施例中,檢索接口單元260可分別將關(guān)鍵字108〃劉德華〃以及〃背叛〃輸入搜尋引擎240,并且分別對應求得〃劉德華〃是歌手名稱(指引數(shù)據(jù)singerguid)以及〃背叛〃是歌曲名稱(指引數(shù)據(jù)songnameguid,且歌手可能是曹格或是蕭敬騰、楊宗緯與曹格合唱)。此時,自然語言理解系統(tǒng)100可進一步提醒用戶:“背叛這首歌曲是否為蕭敬騰所唱(依據(jù)記錄7的匹配結(jié)果)?”,或者,“是否為蕭敬騰、楊宗緯與曹格所合唱(依據(jù)記錄6的匹配結(jié)果)?”。
[0175]在本發(fā)明的再一實施例中,結(jié)構(gòu)化數(shù)據(jù)庫220所儲存記錄可還包括有來源字段314及熱度字段316。如圖3B所示的數(shù)據(jù)庫,其除了圖3A的各項字段之外,還包含來源字段314熱度字段316、喜好字段318與厭惡字段。各記錄的來源字段314可用以儲存此記錄是出自哪一個結(jié)構(gòu)化數(shù)據(jù)庫的指示或指標(請注意在此圖中僅顯示結(jié)構(gòu)化數(shù)據(jù)庫220,而實際上可存在更多不同的結(jié)構(gòu)化數(shù)據(jù)庫)、或是哪一個用戶、伺服器所提供的來源值。并且,自然語言理解系統(tǒng)100可根據(jù)用戶在之前的請求訊息102中所透漏的喜好,來檢索特定來源的結(jié)構(gòu)化數(shù)據(jù)庫(例如以請求信息102中的關(guān)鍵字108進行全文檢索產(chǎn)生匹配時,便對該記錄的熱度值加一)。而各記錄302的熱度字段316用以儲存此記錄302的搜尋熱度值或是熱門程度值(例如該記錄在特定時間里被單一用戶、特定用戶群組、所有用戶的匹配次數(shù)或機率),以供知識輔助理解模塊400判斷用戶意圖時的參考,至于喜好字段318與厭惡字段的使用方式后文會再詳述。詳細而論,當用戶的請求信息102為"我要看三國演義〃時,自然語言處理器300經(jīng)過分析后,可產(chǎn)生出多個可能意圖語法數(shù)據(jù)106:
[0176]〃〈readbook>,〈bookname〉=三國演義”;
[0177]〃〈watchTV>,〈TVname〉=三國演義〃;以及
[0178]〃〈watchfilm>,〈filmname〉=三國演義"。
[0179]若檢索系統(tǒng)200在用戶的請求信息102的歷史記錄中(例如利用通過熱度字段316儲存該筆記錄302被某用戶所點選的次數(shù)),統(tǒng)計出其大部份的請求為看電影(假設(shè)在結(jié)構(gòu)化數(shù)據(jù)庫中各只有一筆對應于三國演義書籍、電視劇、電影的記錄,其中看電影的記錄其熱度字段316較其他兩者為高),則檢索系統(tǒng)200可針對儲存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫來做檢索(此時來源字段314中的來源值,是記錄儲存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫的代碼),從而可優(yōu)先判定〃〈watchf i lm>, <f i lmname>=三國演義〃為確定意圖語法數(shù)據(jù)114。舉例來說,在一實施例中亦可在每個記錄302被匹配一次,就可在后面的熱度字段316加一,作為用戶的歷史記錄。于是在依據(jù)關(guān)鍵字108 “三國演義”做全文檢索時,可以從所有匹配結(jié)果中挑選熱度字段316中數(shù)值最高的記錄302,作為判斷用戶意圖之用。在一實施例中,若檢索系統(tǒng)200在關(guān)鍵字108〃三國演義〃的檢索結(jié)果中,判定對應〃三國演義〃這出電視節(jié)目的記錄的熱度字段316所儲存的搜尋熱度值最高,則便可優(yōu)先判定〃〈watchTV>,〈TVname〉=三國演義"為確定意圖語法數(shù)據(jù)114。在又一實施例中,若每個領(lǐng)域有對個記錄與其對應時,檢索系統(tǒng)200可對所有記錄的檢索系統(tǒng)200的數(shù)值進行統(tǒng)計。舉例來說,若在結(jié)構(gòu)化數(shù)據(jù)庫220中有多個記錄分別對應至三國演義的書籍、電視劇、與電影,檢索系統(tǒng)200可這些對應記錄的熱度值先進行統(tǒng)計,并判斷哪個領(lǐng)域具有最高值。例如三國演義的書籍、電視劇、與電影的對應記錄共有5,13,16個,而這5,13,16個記錄的熱度值加總分別為30,18,25。因此,檢索系統(tǒng)200可在與三國演義的書籍相關(guān)的五個記錄中,挑選熱度字段316的數(shù)值最高的記錄,并其對應的指引字段的數(shù)據(jù)(可包含來源字段314中的來源值)將傳送給知識輔助理解模塊400做進一步處理。此外,儲存在來源字段314中的來源值亦可作為匹配記錄110的一部分并輸出至知識輔助理解模塊400,用以顯示予用戶可到哪里存取所需的電視劇。再者,上述對熱度字段316所儲存數(shù)值的變更方式,可通過自然語言理解系統(tǒng)100所在的計算機系統(tǒng)進行變更,本發(fā)明對此并不加以限制。此外、熱度字段316的數(shù)值亦可隨時間遞減,以表示用戶對某項記錄302的熱度已逐漸降低,本發(fā)明對這部分亦不加以限制。
[0180] 再舉另一個實例來說,在另一實施例中,由于用戶可能在某段時間中特別喜歡看三國演義的電視劇,由于電視劇的長度可能很長而用戶無法短時間看完,因此在短時間中可能重復點選(假設(shè)每匹配一次就將熱度字段316內(nèi)的數(shù)值加一的話),因此造成某個記錄302被重復匹配,這部分都可通過分析熱度字段316的數(shù)據(jù)而得知。再者,在另一實施例中,電信業(yè)者也可以利用熱度字段316來表示某一來源所提供數(shù)據(jù)被取用的熱度,而此數(shù)據(jù)供應者的編碼可以用來源字段314進行儲存。舉例來說,若某位供應“三國演義電視劇”的供應者的被點選的機率最高,所以當某用戶輸入“我要看三國演義”的請求信息102時,雖然在對圖3B的數(shù)據(jù)庫進行全文檢索時會找到閱讀三國演義的書籍(記錄8)、觀看三國演義電視劇(記錄9)、觀看三國演義電影(記錄10)三個匹配結(jié)果,但由于熱度字段316中的數(shù)據(jù)顯示觀看三國演義電影是現(xiàn)在最熱門的選項(亦即記錄8、9、10的熱度字段的數(shù)值分別為
2、5、8),所以將先提供記錄10的指引數(shù)據(jù)做匹配記錄110輸出至知識輔助理解系統(tǒng)400,作為判定用戶意圖的最優(yōu)先選項。在一實施例中,可同時將來源字段314的數(shù)據(jù)顯示給用戶,讓用戶判斷他所想要觀看的電視劇是否為某位供應者所提供(而用戶可鏈接至該供應者以讀取并播放電視劇來觀看)。在另一實施例中,如果有一個以上的記錄提供三國演義的影片,檢索系統(tǒng)200可傳送這些記錄中,其熱度字段316具有最高值的來源字段314所儲存數(shù)據(jù)給知識輔助理解模塊400。應注意的是,上述對來源字段314所儲存數(shù)據(jù)以及其變更方式,亦可通過自然語言理解系統(tǒng)100所在的計算機系統(tǒng)進行變更,本發(fā)明對此并不加以限制。應注意的是,本領(lǐng)域的技術(shù)人員應知,可進一步將圖3B中的熱度字段316、喜好字段318、厭惡字段320所儲存的信息進一步切割成與用戶個人相關(guān)以及與全體用戶相關(guān)兩部分,并將與用戶個人相關(guān)的熱度字段316、喜好字段318、厭惡字段320信息將儲存在用戶的手機,而伺服器則儲存與全體用戶相關(guān)的熱度字段316、喜好字段318、厭惡字段320等信息。這樣一來,僅與用戶個人的選擇或意圖相關(guān)的個人喜好相關(guān)信息就只儲存在用戶個人的移動通訊裝置(例如手機、平板計算機、或是小筆電…等)中,而伺服器則儲存與用戶全體相關(guān)的信息,這樣不僅可節(jié)省伺服器的儲存空間,也保留用戶個人喜好的隱密性。
[0181]明顯的,本發(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫中的每個記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性(例如記錄I中的數(shù)值數(shù)據(jù)“劉德華”、“一起走過的日子”、“港臺,粵語,流行”都是用來描述記錄I的特征),且這些數(shù)值數(shù)據(jù)(與對應的指引數(shù)據(jù))共同用以表達來自用戶的請求信息對該記錄的意圖(例如對“一起走過的日子”產(chǎn)生匹配結(jié)果時,表示用戶的意圖可能是對記錄I的數(shù)據(jù)存取),于是在搜尋引擎對結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索時,可在記錄的數(shù)值數(shù)據(jù)被匹配時,輸出對應于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)(例如輸出“songnameguid”作為回應結(jié)果110),進而確認該請求信息的意圖(例如在知識輔助理解模塊400中進行比對)。
[0182]基于上述示范性實施例所揭示或教示的內(nèi)容,圖4A為根據(jù)本發(fā)明的一實施例的檢索方法的流程圖。請參閱圖4A,本發(fā)明的實施例的檢索方法包括以下步驟:
[0183]提供結(jié)構(gòu)化數(shù)據(jù)庫,且結(jié)構(gòu)化數(shù)據(jù)庫儲存多個記錄(步驟S410);
[0184]接收至少一關(guān)鍵字(步驟S420); [0185]藉由關(guān)鍵字來對多個記錄的標題字段進行全文檢索(步驟S430)。舉例來說,將關(guān)鍵字108輸入檢索接口單元260來讓搜尋引擎240對結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的多個記錄302的標題字段304進行全文檢索,至于檢索方式可如對圖3A或圖3B所進行的檢索方式、或是不變更其精神的方式來進行;
[0186]判斷全文檢索是否有匹配結(jié)果(步驟S440)。舉例來說,藉由搜尋引擎240來判斷此關(guān)鍵字108所對應的全文檢索是否有匹配結(jié)果;以及
[0187]若有匹配結(jié)果,依序輸出完全匹配記錄及部分匹配記錄(步驟S450)。舉例來說,若結(jié)構(gòu)化數(shù)據(jù)庫220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的完全匹配記錄及部分匹配記錄中的指引數(shù)據(jù)(可通過對圖3C的指引數(shù)據(jù)儲存裝置280而取得)作為回應結(jié)果110送往知識輔助理解系統(tǒng)400 (在另一實施例中,回應結(jié)果110可包含相關(guān)于匹配記錄的其他信息,例如儲存于熱度字段316的數(shù)值,用以顯示予用戶作轉(zhuǎn)往其他數(shù)據(jù)之用),其中完全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。
[0188]另一方面,若未有匹配結(jié)果,則自然語言理解系統(tǒng)100可以直接通知用戶匹配失敗并結(jié)束流程、通知用戶未發(fā)現(xiàn)匹配結(jié)果并要求做更進一步的輸入、或是列舉可能選項給用戶做進一步選擇(例如前述以"劉德華"與"背叛"做全文檢索未產(chǎn)生匹配結(jié)果的例子)(步驟460)。
[0189]前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除,例如,在本發(fā)明的另一實施例中,可藉由位于檢索系統(tǒng)200外的匹配判斷模塊(未繪示于圖中)來執(zhí)行步驟S440 ;或是在本發(fā)明的另一實施例中,可忽略上述步驟S450,其依序輸出完全匹配記錄及部分匹配記錄的動作可以藉由位于檢索系統(tǒng)200外的匹配結(jié)果輸出模塊(未繪示于圖中),來執(zhí)行步驟S450中依序輸出完全匹配記錄及部分匹配記錄的動作。
[0190]基于上述示范性實施例所揭示或教示的內(nèi)容,圖4B為根據(jù)本發(fā)明的另一實施例的自然語言理解系統(tǒng)100工作過程的流程圖。請參閱圖4B,本發(fā)明的另一實施例的自然語言理解系統(tǒng)100工作過程包括以下步驟:
[0191]接收請求信息(步驟S510)。舉例來說,用戶將具有語音內(nèi)容或文字內(nèi)容的請求信息102傳送至自然語言理解系統(tǒng)100 ;
[0192]提供結(jié)構(gòu)化數(shù)據(jù)庫,且結(jié)構(gòu)化數(shù)據(jù)庫儲存多個記錄(步驟S520);
[0193]將請求信息語法化(步驟S530)。舉例來說,自然語言處理器300分析用戶的請求信息102后,進而轉(zhuǎn)為對應的可能意圖語法數(shù)據(jù)106 ;
[0194]辨別關(guān)鍵字的可能屬性(步驟S540)。舉例來說,知識輔助理解模塊400辨別出可能意圖語法數(shù)據(jù)106中的至少一關(guān)鍵字108的可能屬性,例如,關(guān)鍵字108〃三國演義〃可能是書、電影及電視節(jié)目;
[0195]藉由關(guān)鍵字108來對多個記錄的標題字段304進行全文檢索(步驟S550)。舉例來說,將關(guān)鍵字108輸入檢索接口單元260來讓搜尋引擎240對結(jié)構(gòu)化數(shù)據(jù)庫220所儲存的多個記錄的標題字段304進行全文檢索;
[0196]判斷全文檢索是否有匹配結(jié)果(步驟S560)。舉例來說,藉由搜尋引擎240來判斷此關(guān)鍵字108所對應的全文檢索是否有匹配結(jié)果;
[0197]若有匹配結(jié)果,依序輸出完全匹配記錄及部分匹配記錄(步驟S570)所對應的指引數(shù)據(jù)為回應結(jié)果110。舉例來說,若結(jié)構(gòu)化數(shù)據(jù)庫220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的完全匹配記錄及部分匹配記錄所對應的指引數(shù)據(jù)為回應結(jié)果110,
[0198]其中完全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序;以及
[0199]依序輸出對應的確定意圖語法數(shù)據(jù)(步驟S580)。舉例來說,知識輔助理解模塊400藉由依序輸出的完全匹配記錄及部分匹配記錄,藉以輸出對應的確定意圖語法數(shù)據(jù)114。
[0200]另一方面,若在步驟S560未產(chǎn)生匹配結(jié)果,亦可運用類似步驟S460的方式來處理,例如直接通知用戶匹配失敗并結(jié)束流程、通知用戶未發(fā)現(xiàn)匹配結(jié)果并要求做更進一步的輸入、或是列舉可能選項給用戶做進一步選擇(例如前述以"劉德華"與"背叛"做全文檢索未產(chǎn)生匹配結(jié)果的例子)(步驟S590)。
[0201 ] 前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除。
[0202]綜上所述,本發(fā)明藉由取出用戶的請求信息所包括的關(guān)鍵字,并且針對結(jié)構(gòu)化數(shù)據(jù)庫中的具有特定數(shù)據(jù)結(jié)構(gòu)的記錄的標題字段(諸如具有圖3A與圖3B的結(jié)構(gòu))來進行全文檢索,若產(chǎn)生匹配結(jié)果,便可判斷出關(guān)鍵字所屬的領(lǐng)域種類(與指引字段的數(shù)據(jù)做比對),藉以確定用戶在請求信息所表示的意圖。
[0203]接下來針對以上結(jié)構(gòu)化數(shù)據(jù)庫在語音識別上的應用做更多的說明。首先針對在自然語言對話系統(tǒng)中,可通過自然語言理解系統(tǒng)100以根據(jù)用戶的語音輸入來修正錯誤的語音應答,并進一步找出其他可能的答案來回報給用戶的應用做說明。
[0204]如前所述,雖然現(xiàn)今的移動通訊裝置已可提供自然語言對話功能,以讓用戶發(fā)出語音來和移動通訊裝置溝通。然而在目前的語音對話系統(tǒng),當用戶的語音輸入不明確時,由于同一句語音輸入可能意指多個不同的意圖或目的,故系統(tǒng)容易會輸出不符合語音輸入的語音應答。因此在很多對話情境中,用戶難以得到符合其意圖的語音應答。為此,本發(fā)明提出一種修正語音應答的方法以及自然語言對話系統(tǒng),其中自然語言對話系統(tǒng)可根據(jù)用戶的語音輸入來修至錯誤的語音應答,并進一步找出其他可能的答案來回報給用戶。為了使本發(fā)明的內(nèi)容更為明了,以下特舉實施例作為本發(fā)明確實能夠據(jù)以實施的范例。
[0205]圖5A是依照本發(fā)明一實施例所繪示的自然語言對話系統(tǒng)的方塊圖。請參照圖5A,自然語言對話系統(tǒng)500包括語音取樣模塊510、自然語言理解系統(tǒng)520、以及語音合成數(shù)據(jù)庫530。在一實施例中,語音取樣模塊510用以接收第一語音輸入501 (例如來自用戶的語音),隨后對其進行解析而產(chǎn)生第一請求信息503,而自然語言理解系統(tǒng)520會再對第一請求信息503進行解析而取得其中的第一關(guān)鍵字509,并在找到符合第一請求信息503的第一回報答案511后(依據(jù)圖1的描述,第一請求信息503可運用請求信息102相同的方式做處理,亦即請求信息102在分析后會產(chǎn)生可能意圖語法數(shù)據(jù)106,而其中的關(guān)鍵字108會用來對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索而獲得回應結(jié)果110,此回應結(jié)果110再與可能意圖語法數(shù)據(jù)106中的意圖數(shù)據(jù)112作比對而產(chǎn)生確定意圖語法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116送出分析結(jié)果104,此分析結(jié)果104可作為圖5A中的第一回報答案511),依據(jù)此第一回報答案511對語音合成數(shù)據(jù)庫530進行對應的語音查詢(因為做為第一回答案511的分析結(jié)果104可包含完全/部分匹配的記錄302的相關(guān)數(shù)據(jù)(例如儲存在指引字段310的指引數(shù)據(jù)、在數(shù)值字段312的數(shù)值數(shù)據(jù)、以及在內(nèi)容字段306的數(shù)據(jù)…等),因此可利用這些數(shù)據(jù)進行語音查詢),再輸出所查詢的第一語音513產(chǎn)生對應于第一語音輸入501的第一語音應答507予用戶。其中,倘若用戶認為自然語言理解系統(tǒng)520所輸出的第一語音應答507不符合第一語音輸入501中的第一請求信息503時,用戶將輸入另一個語音輸入,例如第二語音輸入501’,來指示此事。自然語言理解系統(tǒng)520會利用上述對第一語音輸入501的相同處理方式來處理第二語音輸入501’以產(chǎn)生第二請求信息503’,隨后對第二請求信息503’進行解 析、取得其中的第二關(guān)鍵字509’、找到符合第二請求信息503’的第二回報答案511’、找出對應的第二語音513’、最后再依據(jù)第二語音513’產(chǎn)生對應的第二語音應答507’輸出予用戶,作為修正第一回報答案511之用。明顯的,自然語言理解系統(tǒng)520可以圖1的自然語言理解系統(tǒng)100為基礎(chǔ),并再增加新的模塊(將結(jié)合后續(xù)的圖5B做解說)來達成根據(jù)用戶的語音輸入來修正錯誤的語音應答的目的。
[0206]前述自然語言對話系統(tǒng)500中的各構(gòu)件可配置在同一機器中。舉例而言,語音取樣模塊510與自然語言理解系統(tǒng)520例如是配置于同一電子裝置。其中,電子裝置可以是移動電話(Cell phone)、個人數(shù)字助理(Personal Digital Assistant, PDA)手機、智能型手機(Smart phone)等移動通訊裝置、掌上型計算機(Pocket PC)、平板型計算機(TabletPC)、筆記型計算機、個人計算機、或是其他具備通訊功能或安裝有通訊軟件的電子裝置,在此并不限制其范圍。此外,上述電子裝置可使用Android操作系統(tǒng)、Microsoft操作系統(tǒng)、Android操作系統(tǒng)、Linux操作系統(tǒng)等等,不限于此。當然,前述自然語言對話系統(tǒng)500中的各構(gòu)件也不一定需設(shè)置在同一機器中,而可分散在不同裝置或系統(tǒng)并通過各種不同的通訊協(xié)議來連結(jié)。舉例而言,自然語言理解系統(tǒng)520可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器。此外,自然語言理解系統(tǒng)520中的各構(gòu)件也可分散在不同的機器,例如自然語言理解系統(tǒng)520中的各構(gòu)件可位于與語音取樣模塊510相同或不同的機器。[0207]在本實施例中,語音取樣模塊510用以接收語音輸入,此語音取樣模塊510可以為麥克風(Microphone)等接收音訊的裝置,而第一語音輸入501/第二語音輸入501’可以是來自用戶的語音。
[0208]此外,本實施例的自然語言理解系統(tǒng)520可由一個或數(shù)個邏輯門組合而成的硬件電路來實作。或者,在本發(fā)明另一實施例中,自然語言理解系統(tǒng)520可以通過計算機程序碼來實作。舉例來說,自然語言理解系統(tǒng)520例如是由程序語言所撰寫的程序碼片段來實作于應用程序、操作系統(tǒng)或驅(qū)動程序等,而這些程序碼片段儲存在儲存單元中,并藉由處理單元(圖5A未顯示)來執(zhí)行的。為了使本領(lǐng)域的技術(shù)人員進一步了解本實施例的自然語言理解系統(tǒng)520,底下舉實例來進行說明。然而,本發(fā)明在此僅為舉例說明,并不以此為限,例如運用硬件、軟件、固件、或是此三種實施方式的混合結(jié)合等方式,皆可運用來實施本發(fā)明。
[0209]圖5B是依照本發(fā)明一實施例所繪示的自然語言理解系統(tǒng)520的方塊圖。請參照圖5B,本實施例的自然語言理解系統(tǒng)520可包括語音識別模塊522、自然語言處理模塊524以及語音合成模塊526。其中,語音識別模塊522會接收從語音取樣模塊510傳來的請求信息,例如對第一語音輸入501進行解析的第一請求信息503,并取出一個或多個第一關(guān)鍵字509 (例如圖1A的關(guān)鍵字108或字句等)。自然語言處理模塊524可再對這些第一關(guān)鍵字509進行解析,而獲得至少包含一個回報答案的候選列表(與圖5A的處理方式相同,亦即例如通過圖1A的檢索系統(tǒng)200對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索,并在取得回應結(jié)果110且對意圖數(shù)據(jù)112比對后產(chǎn)生確定意圖語法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104來產(chǎn)生回報答案),并且會從候選列表所有的回報答案中選出一個較符合第一語音輸入501的答案以做為第一回報答案511 (例如挑選完全匹配記錄…等)。由于第一回報答案511是自然語言理解系統(tǒng)520在內(nèi)部分析而得的答案,所以還必須將它轉(zhuǎn)換成語音輸出才能 輸出予用戶,這樣用戶才能進行判斷。于是語音合成模塊526會依據(jù)第一回報答案511來查詢語音合成數(shù)據(jù)庫530,而此語音合成數(shù)據(jù)庫530例如是記錄有文字以及其對應的語音信息,可使得語音合成模塊526能夠找出對應于第一回報答案511的第一語音513,藉以合成出第一語音應答507。之后,語音合成模塊526可將合成的第一語音應答507通過語音輸出接口(未繪示)(其中語音輸出接口例如為喇叭、揚聲器、或耳機等裝置)輸出予用戶。應注意的是,語音合成模塊526在依據(jù)第一回報答案511查詢語音合成數(shù)據(jù)庫530時,可能需要先將第一回報答案511進行格式轉(zhuǎn)換,然后通過語音合成數(shù)據(jù)庫530所規(guī)定的接口進行呼叫。由于呼叫語音合成數(shù)據(jù)庫530時是否需要進行格式轉(zhuǎn)換與語音合成數(shù)據(jù)庫530本身的定義相關(guān),因這部分屬于本領(lǐng)域的技術(shù)人員所熟知的技術(shù),故在此不予詳述。
[0210]接下來列舉實例來說明,若用戶輸入的是“我要看三國演義”的第一語音輸入501話,語音識別模塊522會接收從語音取樣模塊510傳來的對第一語音輸入501進行解析的第一請求信息503,然后取出例如是包含“三國演義”的第一關(guān)鍵字509。自然語言處理模塊524則可再對這個第一關(guān)鍵字509 “三國演義”進行解析(例如通過圖1A的檢索系統(tǒng)200對結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索,并在取得回應結(jié)果110且對意圖數(shù)據(jù)112比對后產(chǎn)生確定意圖語法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104),進而產(chǎn)生包含“三國演義”的三個意圖選項的回報答案,并將其整合成一候選列表(假設(shè)每個意圖選項只有一個回報答案,其分別歸類于“看書”、“看電視劇”、以及“看電影”三個選項),接著再從候選列表的這三個回報答案中選出一個在熱度字段316具有最高值(例如挑選圖3B的記錄10)做為第一回報答案511。在一實施例中,可以直接執(zhí)行熱度字段316具有最高值的所對應的方式(例如先前所提的直接播放蕭敬騰所演唱的“背叛”予用戶),本發(fā)明并不對此加以限制。
[0211]此外,自然語言處理模塊524還可藉由解析后續(xù)所接收的第二語音輸入501’(因為與先前的語音輸入501運用同樣的方式饋入語音取樣模塊510),而判斷前次的第一回報答案511是否正確。因為第二語音輸入501’是用戶針對先前提供予用戶的第一語音應答507所做的回應,其包含用戶認為先前的第一語音應答507正確與否的信息。倘若在分析第二語音輸入501’后是表示用戶認為第一回報答案511不正確,自然語言處理模塊524可選擇上述候選列表中的其他回報答案做為第二回報答案511’,例如從候選列表中剔除第一回報答案511后,并在剩余的回報答案重新挑選一第二回報答案511’,再利用語音合成模塊526找出對應于第二回報答案511’的第二語音513’,最后通過語音合成模塊526將第二語音513’合成為第二語音應答507’播放予用戶。
[0212]延續(xù)先前用戶輸入“我要看三國演義”的例子來說,若用戶想要看三國演義的電視劇,所以先前輸出予用戶的圖3B記錄10的選項(因為是看“三國演義”的電影)就不是用戶想要的,于是用戶可能再輸入“我要看三國演義電視劇”(用戶明確指出想看的是電視劇)、或是“我不要看三國演義電影”(用戶只否定目前選項)…等作為第二語音輸入501’。于是第二語音輸入501’將在解析而取得其第二請求信息503’ (或是第二關(guān)鍵字509’)后,會發(fā)現(xiàn)第二請求信息503’中的第二關(guān)鍵字509’將包含“電視劇”(用戶有明確指示)或是“不要電影”(用戶只否定目前選項),因此將判斷第一回報答案511不符合用戶的需求。是以,此時可以從候選列表再選出另一個回報答案做為第二回報答案511’并輸出對應的第二語音應答507’,例如輸出“我現(xiàn)在為您播放三國演義電視劇”的第二語音應答507’ (如果用戶明確指出想觀看三國演義 電視劇)、或是輸出“您想要的是哪個選項”(如果用戶只否定目前選項)的第二語音應答507’,并結(jié)合候選列表中其他的選項供用戶選取(例如“挑選熱度字段316數(shù)值次高的回報答案作為第二回報答案511’)。再者,在另一實施例中,若是用戶所輸入的第二語音輸入501’包含“選擇”的訊息,例如顯示“觀看三國演義書籍”、“觀看三國演義電視劇”、以及“觀看三國演義電影”三個選項給用戶做選擇時,用戶可能輸入“我要看電影”的第二語音輸入501’時,將在分析第二語音輸入501’的第二請求信息503’并發(fā)現(xiàn)用戶的意圖后(例如從第二關(guān)鍵字509’發(fā)現(xiàn)用戶選擇“觀看電影”),于是第二語音輸入501’將在解析而取得其第二請求信息503’后,輸出“我現(xiàn)在為您播放三國演義電影”的第二語音應答507’(如果用戶想觀看三國演義電影)然后直接播放電影予用戶。當然,若用戶所輸入的是“我要第三個選項”時(假設(shè)此時用戶所選擇的是閱讀書籍),將執(zhí)行第三選所對應的應用程序,亦即輸出“您想要的是閱讀三國演義書籍”的第二語音應答507’,并結(jié)合顯示三國演義的電子書予用戶的動作。
[0213]在本實施例中,前述自然語言理解系統(tǒng)520中的語音識別模塊522、自然語言處理模塊524以及語音合成模塊526可與語音取樣模塊510配置在同一機器中。在其他實施例中,語音識別模塊522、自然語言處理模塊524以及語音合成模塊526亦可分散在不同的機器(例如計算機系統(tǒng)、伺服器或類似裝置/系統(tǒng))中。例如圖5C所示的自然語言理解系統(tǒng)520’,語音合成模塊526可與語音取樣模塊510配置在同一機器502,而語音識別模塊522、自然語言處理模塊524可配置在另一機器。此外,在圖5C的架構(gòu)下,自然語言處理模塊524會將第一回報答案511/第二回報答案511’傳送至語音合成模塊526,其隨即以第一回報答案511/第二回報答案511’送往語音合成數(shù)據(jù)庫以尋找對應的第一語音513/第二語音513’,作為產(chǎn)生第一語音應答507/第二語音應答507’的依據(jù)。
[0214]圖6是依照本發(fā)明一實施例所繪示的修正第一語音應答507的方法流程圖。在本實施例中的修正第一語音應答507的方法中,當用戶認為目前所播放的第一語音應答507不符合其先前所輸入的第一請求信息503時,會再輸入第二語音輸入501’并饋入語音取樣模塊510,隨后再由自然語言理解系統(tǒng)520分析而得知先前播放予用戶的第一語音應答507并不符合用戶的意圖時,自然語言理解系統(tǒng)520可再次輸出第二語音應答507’,藉以修正原本的第一語音應答507。為了方便說明,在此僅舉圖5A的自然語言對話系統(tǒng)500為例,但本實施例的修正第一語音應答507的方法亦可適用于上述圖5C的自然語言對話系統(tǒng)500’。
[0215]請同時參照圖5A及圖6,于步驟S602中,語音取樣模塊510會接收第一語音輸入501 (亦同樣饋入語音取樣模塊510)。其中,第一語音輸入501例如是來自用戶的語音,且第一語音輸入501還可具有用戶的第一請求信息503。具體而言,來自用戶的第一語音輸入501可以是詢問句、命令句或其他請求信息等,例如「我要看三國演義」、「我要聽忘情水的音樂」或 「今天溫度幾度」等等。
[0216]于步驟S604中,自然語言理解系統(tǒng)520會解析第一語音輸入501中所包括的至少一個第一關(guān)鍵字509而獲得候選列表,其中候選列表具有一個或多個回報答案。舉例來說,當用戶的第一語音輸入501為「我要看三國演義」時,自然語言理解系統(tǒng)520經(jīng)過分析后所獲得的第一關(guān)鍵字509例如是「『三國演義』、『看』」。又例如,當用戶的第一語音輸入501為「我要聽忘情水的歌」時,自然語言理解系統(tǒng)520經(jīng)過分析后所獲得的第一關(guān)鍵字509例如是「『忘情水』、『聽』、『歌』」。
[0217]接后,自然語言理解系統(tǒng)520可依據(jù)上述第一關(guān)鍵字509自結(jié)構(gòu)化數(shù)據(jù)庫220進行查詢,而獲得至少一筆搜尋結(jié)果(例如圖1的分析結(jié)果104),據(jù)以做為候選列表中的回報答案。至于從多個回報答案中選擇第一回報答案511的方式可如圖1A所述,在此不予以贅述。由于第一關(guān)鍵字509可能包含不同的知識領(lǐng)域(例如電影類、書籍類、音樂類或游戲類等等),且同一知識領(lǐng)域中亦可進一步分成多種類別(例如同一電影或書籍名稱的不同作者、同一歌曲名稱的不同演唱者、同一游戲名稱的不同版本等等),故針對第一關(guān)鍵字509而言,自然語言理解系統(tǒng)520可在結(jié)構(gòu)化數(shù)據(jù)庫中查詢到一筆或多筆相關(guān)于此第一關(guān)鍵字509的搜尋結(jié)果(例如分析結(jié)果104),其中每一筆搜尋結(jié)果中可包括相關(guān)于此第一關(guān)鍵字509的指引數(shù)據(jù)(例如以“蕭敬騰”、“背叛”為關(guān)鍵字108在圖3A、3B的結(jié)構(gòu)化數(shù)據(jù)庫220進行全文檢索時,將得到例如圖3A的記錄6與7兩組匹配結(jié)果,它們分別包含“singerguid”、“songnameguid”的指引數(shù)據(jù),此指引數(shù)據(jù)為儲存在指引字段310的數(shù)據(jù))與其他數(shù)據(jù)。其中,其他數(shù)據(jù)例如是在搜尋結(jié)果中,除了與第一關(guān)鍵字709相關(guān)以外的其他關(guān)鍵字等等(例如以“一起走過的日子”為關(guān)鍵字且在圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220做全文檢索而得到記錄I為匹配結(jié)果時,“劉德華”與“港臺,粵語,流行”兩者即為其他數(shù)據(jù))。因此從另一觀點來看,當用戶所輸入的第一語音輸入501具有多個第一關(guān)鍵字509時,則表示用戶的第一請求信息503較明確,使得自然語言理解系統(tǒng)520較能查詢到與第一請求信息503接近的搜尋結(jié)果O
[0218]舉例來說,當?shù)谝魂P(guān)鍵字509為「三國演義」時(例如用戶輸入“我要看三國演義”的語音輸入時),自然語言理解系統(tǒng)520分析后可能產(chǎn)生三個可能意圖語法數(shù)據(jù)106 (如圖1所示):
[0219]〃〈readbook>,〈bookname〉=三國演義”;
[0220]〃〈watchTV>,〈TVname〉=三國演義〃;以及
[0221]〃〈watchfilm>,〈filmname〉=三國演義"。
[0222]因此查訊到的搜尋結(jié)果是關(guān)于「...『三國演義』...『書籍』」(意圖數(shù)據(jù)為〈readbook〉)、「...『三國演義』...『電視劇』」(意圖數(shù)據(jù)為〈watchTV〉)、「...『三國演義』...『電影』」(意圖數(shù)據(jù)為〈watchfilm〉)的記錄(例如圖3B的記錄8、9、10),其中『電視劇』及『書籍』、『電影』分別列舉對應的用戶意圖)。又例如,當?shù)谝魂P(guān)鍵字509為「『忘情水』、『音樂』」(例如用戶輸入“我要聽忘情水的音樂”的語音輸入)時,自然語言理解系統(tǒng)520分析后可能產(chǎn)生以下的可能意圖語法數(shù)據(jù):
[0223]〃〈playmusic>,〈songname〉=忘情水";
[0224]所查訊到的搜尋結(jié)果例如關(guān)于「...『忘情水』...『劉德華』」的記錄(例如圖3B的記錄11)、「...『忘情水』...『李翊君』」的記錄(例如圖3B的記錄12),其中『劉德華』及『李翊君』為對應于用戶的意圖數(shù)據(jù)。換言之,每一筆搜尋結(jié)果可包括第一關(guān)鍵字509以及相關(guān)于第一關(guān)鍵字509的意圖數(shù)據(jù),而自然語言理解系統(tǒng)520會依據(jù)所查詢到的搜尋結(jié)果,將搜尋結(jié)果中所包括的數(shù)據(jù)轉(zhuǎn)換成回報答案,并將回報答案記錄于候選列表中,以供后續(xù)步驟使用。 [0225]于步驟S606中,自然語言理解系統(tǒng)520會自候選列表中選擇至少一第一回報答案511,并依據(jù)第一回報答案511輸出對應的第一語音應答507。在本實施例中,自然語言理解系統(tǒng)520可按照優(yōu)先順序排列候選列表中的回報答案,并依據(jù)優(yōu)先順序自候選列表中選出回報答案,據(jù)以輸出第一語音應答507。
[0226]舉例來說,當?shù)谝魂P(guān)鍵字509為「三國演義」時,假設(shè)自然語言理解系統(tǒng)520查詢到很多筆關(guān)于「...『三國演義』...『書籍』」的記錄(亦即以查詢到的數(shù)據(jù)數(shù)量多寡做優(yōu)先順序,例如20筆關(guān)于書籍的記錄),其次為「...『三國演義』...『音樂』」的記錄(例如18筆),而關(guān)于「...『三國演義』...『電視劇』」的記錄數(shù)量最少(例如10筆),則自然語言理解系統(tǒng)520會將「三國演義的書籍」做為第一回報答案(最優(yōu)先選擇的回報答案),「三國演義的音樂」做為第二回報答案(第二優(yōu)先選擇的回報答案),「三國演義的電視劇」做為第三回報答案(第三優(yōu)先選擇的回報答案)。當然,若相關(guān)于「三國演義的書籍」的第一回報答案不只一筆記錄時,還可以依據(jù)應先順序(例如被點選次數(shù)多寡或熱度字段316的數(shù)值最高者)來挑選第一回報答案511,相關(guān)細節(jié)前面已提過,在此不予贅述。
[0227]接著,于步驟S608,語音取樣模塊510會接收第二語音輸入501’,而自然語言理解系統(tǒng)520會解析此第二語音輸入501’,并判斷先前所選出的第一回報答案511是否正確。在此,語音取樣模塊510會對第二語音輸入501’進行解析,以解析出第二語音輸入501’所包括的第二關(guān)鍵字509’,其中此第二關(guān)鍵字509’例如是用戶進一步提供的關(guān)鍵字(例如時間、意圖、知識領(lǐng)域…等等)。并且,當?shù)诙Z音輸入501’中的第二關(guān)鍵字509’與第一回報答案511中所相關(guān)的意圖數(shù)據(jù)不相符時,自然語言理解系統(tǒng)520會判斷先前所選出的第一回報答案511為不正確。至于判斷第二語音輸入501’的第二請求信息503’包含的是“正確”或“否定”第一語音應答507的方式前面已提過,在此不予贅述。[0228]進一步而言,自然語言理解系統(tǒng)520所解析的第二語音輸入501’可包括或不包括明確的第二關(guān)鍵字509’。舉例來說,語音取樣模塊510例如是接收到來自用戶所說的「我不是指三國演義的書籍」(情況A)、「我不是指三國演義的書籍,我是指三國演義的電視劇」(情況B)、「我是指三國演義的電視劇」(情況C)等等。上述情況A中的第二關(guān)鍵字509’例如為「『不是』、『三國演義』、『書籍』」,情況B中的關(guān)鍵字509例如為「『不是』、『三國演義』、『書籍』,『是』、『三國演義』、『電視劇』」,而情況C中的第二關(guān)鍵字509’例如為「『是』、『三國演義』、『電視劇』」。為了方便說明,上述僅列舉情況A、B及C為例,但本實施例并不限于此。
[0229]接著,自然語言理解系統(tǒng)520會依據(jù)上述第二語音輸入501’所包括的第二關(guān)鍵字509’,來判斷第一回報答案511中相關(guān)的意圖數(shù)據(jù)是否正確。也就是說,倘若斷第一回報答案511為「三國演義的書籍」,而上述第二關(guān)鍵字509’為「『三國演義』、『電視劇』」,則自然語言理解系統(tǒng)520會判斷第一回報答案511中相關(guān)的意圖數(shù)據(jù)(即用戶想看三國演義『書籍』)不符合來自用戶第二語音輸入501’的第二關(guān)鍵字509’(即用戶想看三國演義『電視劇』),藉以判斷第一回報答案511不正確。類似地,倘若判斷回報答案為「三國演義的書籍」,而上述第二關(guān)鍵字509’為「『不是』、『三國演義』、『書籍』」,則自然語言理解系統(tǒng)520亦會判斷出第一回報答案511不正確。
[0230]當自然語言理解系統(tǒng)520解析第二語音輸入501之后,判斷之前輸出的第一語音應答501為正確時,則如步驟S610所示,自然語言理解系統(tǒng)520會做出對應于第二語音輸入501’的回應。舉例來說,假設(shè)來自用戶的第二語音輸入501’為「是的,是三國演義的書籍」,則自然語言理解系統(tǒng)520可以是輸出「正在幫您開啟三國演義的書籍」的第二語音應答507’。或者,自然語言理解系統(tǒng)520可在播放第二語音應答507’的同時,直接通過處理單元(未繪示)來載入三國演 義的書籍內(nèi)容。
[0231]然而,當自然語言理解系統(tǒng)520解析第二語音輸入501’之后,判斷之前輸出的第一語音應答507 (亦即回報答案511)不正確時,則如步驟S612所示,自然語言理解系統(tǒng)520會自候選列表中選擇第一回報答案511之外的另一者,并依據(jù)所選擇的結(jié)果輸出第二語音應答507’。在此,倘若用戶所提供的第二語音輸入501’中不具有明確的第二關(guān)鍵字509’(如上述情況A的第二語音輸入501’),則自然語言理解系統(tǒng)520可依據(jù)優(yōu)先順序從候選列表中選出第二優(yōu)先選擇的回報答案?;蛘?,倘若用戶所提供的第二語音輸入501’中具有明確的第二關(guān)鍵字509’(如上述情況B及C的第二語音輸入501’),則自然語言理解系統(tǒng)520可直接依據(jù)用戶所指引的第二關(guān)鍵字509’,在從候選列表中選出對應的回報答案。
[0232]另一方面,倘若用戶所提供的第二語音輸入501’中具有明確的第二關(guān)鍵字509’(如上述情況B及C的第二語音輸入),但自然語言理解系統(tǒng)520在候選列表中查無符合此第二關(guān)鍵字509的回報答案,則自然語言理解系統(tǒng)520會輸出第三語音應答,例如「查無此書」或「我不知道」等。
[0233]為了使本領(lǐng)域的技術(shù)人員進一步了解本實施例的修正語音應答的方法以及自然語言對話系統(tǒng),以下再舉一實施例進行詳細的說明。
[0234]首先,假設(shè)語音取樣模塊510接收的第一語音輸入501為「我要看三國演義」(步驟S602),接著,自然語言理解系統(tǒng)520可解析出為「『看』、『三國演義』」的第一關(guān)鍵字509,并獲得具有多個第一回報答案的候選列表,其中每一個回報答案具有相關(guān)的關(guān)鍵字與其他數(shù)據(jù)(其他數(shù)據(jù)可儲存于圖3A/3B的內(nèi)容字段306中、或是各記錄302的數(shù)值字段312的一部份)(步驟S604),如表一所示(假設(shè)搜尋結(jié)果中關(guān)于三國演義的書籍/電視劇/音樂/電影各只有一筆數(shù)據(jù))。
[0235]表一
[0236]
【權(quán)利要求】
1.一種檢索系統(tǒng),包括: 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲存具有一數(shù)據(jù)結(jié)構(gòu)的多個記錄;以及 一搜尋引擎,用以對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索, 其中該數(shù)據(jù)結(jié)構(gòu)包括一標題字段,該標題字段內(nèi)包括至少一分字段,每一分字段包括一指引字段以及一數(shù)值字段,這些記錄的該指引字段儲存一指引數(shù)據(jù),這些記錄的該數(shù)值字段儲存一數(shù)值數(shù)據(jù)。
2.如權(quán)利要求1所述的檢索系統(tǒng),其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容字段,這些記錄的該內(nèi)容字段儲存各這些記錄的內(nèi)容細節(jié)數(shù)據(jù)。
3.如權(quán)利要求1所述的檢索系統(tǒng),其中當這些記錄的該標題字段中儲存有多個該分字段的數(shù)據(jù)時,于各該分字段的數(shù)據(jù)間儲存一第一特殊字符,用以分隔各該分字段的數(shù)據(jù),于該指引字段與該數(shù)值字段的數(shù)據(jù)間儲存一第二特殊字符,用以分隔該指引字段與該數(shù)值字段的數(shù)據(jù)。
4.如權(quán)利要求1所述的檢索系統(tǒng),其中該標題字段中的該分字段具有固定位數(shù)。
5.如權(quán)利要求1所述的檢索系統(tǒng),還包括一檢索接口單元,耦接該搜尋引擎,用以接收至少一關(guān)鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對這些記錄的該標題字段進行該全文檢索,以及反應該搜尋引擎的一匹配結(jié)果,輸出這些記錄中的至少一檢索匹配記錄。
6.如權(quán)利要求5所述的檢索系統(tǒng),其中該檢索匹配記錄為與該至少一關(guān)鍵字完全匹配的一全匹配記錄或與該至少一關(guān)鍵字部分匹配的一部分匹配記錄。
7.如權(quán)利要求6所述的檢索系統(tǒng),其中當該檢索接口單元輸出多個檢索匹配記錄時,其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。`
8.如權(quán)利要求1所述的檢索系統(tǒng),其中每個該記錄的大小皆等于一特定數(shù)值,且該搜尋引擎在搜尋該特定數(shù)值后,即對前往目前所搜尋的記錄的下一個記錄進行全文檢索。
9.如權(quán)利要求1所述的檢索系統(tǒng),其中每個該記錄的該標題字段的最后一個分字段之后儲存一第三特殊字符,當搜尋引擎在全文檢索時發(fā)現(xiàn)該第三特殊字符時,即對該記錄的下一個記錄進行全文檢索。
10.一種自然語言理解系統(tǒng),包括: 一自然語言處理器,用以將一用戶的一請求信息,分析成至少一可能意圖語法數(shù)據(jù),每一可能意圖語法數(shù)據(jù)包括至少一關(guān)鍵字及一意圖數(shù)據(jù); 一知識輔助理解模塊,耦接該自然語言處理器,用以求得該至少一可能意圖語法數(shù)據(jù)中的一確定意圖語法數(shù)據(jù),以表達該用戶的該請求信息的意圖;以及 一檢索系統(tǒng),包括: 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲存具有一數(shù)據(jù)結(jié)構(gòu)的多個記錄;以及 一搜尋引擎,用以對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,該數(shù)據(jù)結(jié)構(gòu)包括一標題字段,該標題字段內(nèi)包括至少一分字段,每一分字段包括一指引字段以及一數(shù)值字段,這些記錄的該指引字段儲存一指引數(shù)據(jù),這些記錄的該數(shù)值字段儲存一數(shù)值數(shù)據(jù); 其中,該知識輔助理解模塊傳送該關(guān)鍵字給該檢索系統(tǒng),藉由該檢索系統(tǒng)的回應,以輔助求得該確定意圖語法數(shù)據(jù)。
11.如權(quán)利要求10所述的自然語言理解系統(tǒng),其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容字段,這些記錄的該內(nèi)容字段儲存各這些記錄的內(nèi)容細節(jié)數(shù)據(jù)。
12.如權(quán)利要求10所述的自然語言理解系統(tǒng),其中當這些記錄的該標題字段中儲存有多個該分字段的數(shù)據(jù)時,于各該分字段的數(shù)據(jù)間儲存一第一特殊字符,用以分隔各該分字段的數(shù)據(jù),于該指引字段與該數(shù)值字段的數(shù)據(jù)間儲存一第二特殊字符,用以分隔該指引字段與該數(shù)值字段的數(shù)據(jù)。
13.如權(quán)利要求10所述的自然語言理解系統(tǒng),其中該標題字段中的該分字段具有固定位數(shù)。
14.如權(quán)利要求10所述的自然語言理解系統(tǒng),其中該檢索系統(tǒng)還包括一檢索接口單元,耦接該搜尋引擎以及該知識輔助理解模塊,用以接收該關(guān)鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對這些記錄的該標題字段進行該全文檢索,以及反應該搜尋引擎的一匹配結(jié)果,輸出這些記錄中的至少一檢索匹配記錄,該知識輔助理解模塊藉由比對該至少一檢索匹配記錄中該標題字段所儲存的該指引數(shù)據(jù)與該至少一可能意圖語法數(shù)據(jù)所包括的該意圖數(shù)據(jù),從而判斷出該用戶的該請求信息的意圖。
15.如權(quán)利要求14所述的自然語言理解系統(tǒng),其中該檢索匹配記錄為與該關(guān)鍵字完全匹配的一全匹配記錄或與該關(guān)鍵字部分匹配的一部分匹配記錄。
16.如權(quán)利要求15所述的自然語言理解系統(tǒng),其中當該檢索接口單元輸出多個檢索匹配記錄時,其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
17.如權(quán)利 要求10所述的自然語言理解系統(tǒng),其中每個該記錄的大小皆等于一特定數(shù)值,且該搜尋引擎在搜尋該特定數(shù)值后,即對前往目前所搜尋的記錄的下一個記錄進行全文檢索。
18.如權(quán)利要求10所述的自然語言理解系統(tǒng),其中每個該記錄的該標題字段的最后一個分字段之后儲存一第三特殊字符,當搜尋引擎在全文檢索時發(fā)現(xiàn)該第三特殊字符時,即對該記錄的下一個記錄進行全文檢索。
19.一種檢索方法,包括: 提供一結(jié)構(gòu)化數(shù)據(jù)庫,該結(jié)構(gòu)化數(shù)據(jù)庫儲存具有一數(shù)據(jù)結(jié)構(gòu)的多個記錄;以及 對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索, 其中該數(shù)據(jù)結(jié)構(gòu)包括一標題字段,該標題字段內(nèi)包括至少一分字段,每一分字段包括一指引字段以及一數(shù)值字段,這些記錄的該指引字段儲存一指引數(shù)據(jù),這些記錄的該數(shù)值字段儲存一數(shù)值數(shù)據(jù)。
20.如權(quán)利要求19所述的檢索方法,其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容字段,這些記錄的該內(nèi)容字段儲存各這些記錄的內(nèi)容細節(jié)數(shù)據(jù)。
21.如權(quán)利要求19所述的檢索方法,其中當這些記錄的該標題字段中儲存有多個該分字段的數(shù)據(jù)時,于各該分字段的數(shù)據(jù)間儲存一第一特殊字符,用以分隔各該分字段的數(shù)據(jù),于該指引字段與該數(shù)值字段的數(shù)據(jù)間儲存一第二特殊字符,用以分隔該指引字段與該數(shù)值字段的數(shù)據(jù)。
22.如權(quán)利要求19所述的檢索方法,其中該標題字段中的該分字段具有固定位數(shù)。
23.如權(quán)利要求19所述的檢索方法,其中對該結(jié)構(gòu)化數(shù)據(jù)庫進行全文檢索的步驟,還包括:接收至少一關(guān)鍵字; 藉由該關(guān)鍵字來對這些記錄的該標題字段進行該全文檢索;以及 若該全文檢索有一匹配結(jié)果,輸出這些記錄中的至少一檢索匹配記錄。
24.如權(quán)利要求23所述的檢索方法,其中該檢索匹配記錄為與該關(guān)鍵字完全匹配的一全匹配記錄或與該關(guān)鍵字部分匹配的一部分匹配記錄。
25.如權(quán)利要求24所述的檢索方法,其中輸出這些記錄中的這些檢索匹配記錄的步驟,還包括: 依序輸出該全匹配記錄及該部分匹配記錄, 其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
26.如權(quán)利要求19所述的檢索方法,其中每個該記錄的大小皆等于一特定數(shù)值,且該搜尋引擎在搜尋該特定數(shù)值后,即對前往目前所搜尋的記錄的下一個記錄進行全文檢索。
27.如權(quán)利要求19所述的檢索方法,其中每個該記錄的該標題字段的最后一個分字段之后儲存一第三特殊字符,當搜尋引擎在全文檢索時發(fā)現(xiàn)該第三特殊字符時,即對該記錄的下一個記錄進行全文檢索。
28.—種檢索系統(tǒng),包括: 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲存至少一記錄,其中每個該記錄包含至少一字段,其中該字段所儲存的數(shù)據(jù)是共同用以描述該記錄的屬性;以及 一搜尋引擎,用以依據(jù)一請求信息的一關(guān)鍵字對該結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,其中在該結(jié)構(gòu)化數(shù)據(jù)庫的至少一該記錄與該關(guān)鍵字產(chǎn)生匹配時,輸出對應于該字段的一指引數(shù)據(jù)以確認該請求信息的意圖。
29.如權(quán)利要求28所述的檢索系統(tǒng),其中該字段包括至少一分字段,每一分字段至少包括一數(shù)值字段,該數(shù)值字段儲存一數(shù)值數(shù)據(jù),其中該全文檢索是依據(jù)該關(guān)鍵字與該數(shù)值數(shù)據(jù)進行匹配。
30.如權(quán)利要求29所述的檢索系統(tǒng),其中每個該數(shù)值字段對應于一指引字段,且當該關(guān)鍵字與該數(shù)值數(shù)據(jù)匹配時,輸出該數(shù)值字段所對應的該指引字段所儲存的指引數(shù)據(jù)以確認該請求信息的該意圖。
31.如權(quán)利要求30所述的檢索系統(tǒng),其中當該請求信息的意圖數(shù)據(jù)與該指引數(shù)據(jù)產(chǎn)生匹配時,即確認該指引數(shù)據(jù)所對應的該記錄為該請求信息所意圖者。
32.如權(quán)利要求29所述的檢索系統(tǒng),其中該關(guān)鍵字與該數(shù)值數(shù)據(jù)的該匹配,包含該關(guān)鍵字與該數(shù)值數(shù)據(jù)完全匹配的一全匹配記錄或與該關(guān)鍵字與該數(shù)值數(shù)據(jù)部分匹配的一部分匹配記錄。
33.如權(quán)利要求32所述的檢索系統(tǒng),其中確認該請求信息的該意圖時,該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
34.如權(quán)利要求29所述的檢索系統(tǒng),其中當該記錄儲存有多個該分字段時,于各該分字段的數(shù)據(jù)間儲存一第一特殊字符,用以分隔各該分字段的數(shù)據(jù)。
35.如權(quán)利要求34所述的檢索系統(tǒng),其中該分字段還包含一指引字段,且在該指引字段與該數(shù)值字段間儲存一第二特殊字符,用以分隔該指引字段的指引數(shù)據(jù)與該數(shù)值字段的該數(shù)值數(shù)據(jù)。
36.如權(quán)利要求29所述的檢索系統(tǒng),其中該該分字段具有固定位數(shù)。
37.如權(quán)利要求28所述的檢索系統(tǒng),其中該字段包括一內(nèi)容字段,用以儲存對應的該記錄的內(nèi)容細節(jié)數(shù)據(jù)。
38.如權(quán)利要求28所述的檢索系統(tǒng),其中該請求信息是來自用戶所輸入的語音。
39.如權(quán)利要求37所述的檢索系統(tǒng),其中該語音是經(jīng)由一移動通訊裝置所輸入。
40.如權(quán)利要求28所述的檢索系統(tǒng),還包含一檢索接口單元,耦接該搜尋引擎,用以接收該關(guān)鍵字來傳送給該搜尋引擎。
41.如權(quán)利要求28所述的檢索系統(tǒng),其中每個該記錄的大小皆等于一特定數(shù)值,且該搜尋引擎在搜尋該特定數(shù)值后,即對前往目前所搜尋的記錄的下一個記錄進行全文檢索。
42.如權(quán)利要求28所述的檢索系統(tǒng),其中每個該記錄的該標題字段的最后一個分字段之后儲存一第三特殊字符,當搜尋引擎在全文檢索時發(fā)現(xiàn)該第三特殊字符時,即對該記錄的下一個記錄進行全文檢索。
43.一種檢索方法,包括: 輸入一關(guān)鍵字,其中該關(guān)鍵字是由一請求信息所產(chǎn)生;以及 依據(jù)該關(guān)鍵字對一結(jié)構(gòu)化數(shù)據(jù)庫進行一全文檢索,其中該結(jié)構(gòu)化數(shù)據(jù)庫儲存至少一記錄,其中每個該記錄包含至少一字段,其中該字段所儲存的數(shù)據(jù)是共同用以描述該記錄的屬性; 其中在該結(jié)構(gòu)化數(shù)據(jù)庫的至少一該記錄與該關(guān)鍵字產(chǎn)生匹配時,輸出對應于該字段的一指引數(shù)據(jù)以確認該請求信息的意圖。
44.如權(quán)利要求43所述的檢索方法,其中該字段包括至少一分字段,每一分字段至少包括一數(shù)值字段,該數(shù)值字段儲存一數(shù)值數(shù)據(jù),其中該全文檢索是依據(jù)該關(guān)鍵字與該數(shù)值數(shù)據(jù)進行匹配。
45.如 權(quán)利要求44所述的檢索方法,其中每個該數(shù)值字段對應于一指引字段,且當該關(guān)鍵字與該數(shù)值數(shù)據(jù)匹配時,輸出該數(shù)值字段所對應的該指引字段所儲存的指引數(shù)據(jù)以確認該請求信息的該意圖。
46.如權(quán)利要求45所述的檢索方法,其中當該請求信息的意圖數(shù)據(jù)與該指引數(shù)據(jù)產(chǎn)生匹配時,即確認該指引數(shù)據(jù)所對應的該記錄為該請求信息所意圖者。
47.如權(quán)利要求44所述的檢索方法,其中該關(guān)鍵字與該數(shù)值數(shù)據(jù)的該匹配,包含該關(guān)鍵字與該數(shù)值數(shù)據(jù)完全匹配的一全匹配記錄或與該關(guān)鍵字與該數(shù)值數(shù)據(jù)部分匹配的一部分匹配記錄。
48.如權(quán)利要求47所述的檢索方法,其中確認該請求信息的該意圖時,該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
49.如權(quán)利要求44所述的檢索方法,其中當該記錄儲存有多個該分字段時,于各該分字段的數(shù)據(jù)間儲存一第一特殊字符,用以分隔各該分字段的數(shù)據(jù)。
50.如權(quán)利要求49所述的檢索方法,其中該分字段還包含一指引字段,且在該指引字段與該數(shù)值字段間儲存一第二特殊字符,用以分隔該指引字段的指引數(shù)據(jù)與該數(shù)值字段的該數(shù)值數(shù)據(jù)。
51.如權(quán)利要求44所述的檢索方法,其中該該分字段具有固定位數(shù)。
52.如權(quán)利要求43所述的檢索方法,其中該字段包括一內(nèi)容字段,用以儲存對應的該記錄的內(nèi)容細節(jié)數(shù)據(jù)。
53.如權(quán)利要求43所述的檢索方法,其中該請求信息是來自用戶所輸入的語音。
54.如權(quán)利要求53所述的檢索方法,其中該語音是經(jīng)由一移動通訊裝置所輸入。
55.如權(quán)利要求43所述的檢索方法,還包含一檢索接口單元,耦接該搜尋引擎,用以接收該關(guān)鍵字來傳送給該搜尋引擎。
56.如權(quán)利要求43所述的檢索方法,其中每個該記錄的大小皆等于一特定數(shù)值,且該搜尋引擎在搜尋該特定數(shù)值后,即對前往目前所搜尋的記錄的下一個記錄進行全文檢索。
57.如權(quán)利要求43所述的檢索方法,其中每個該記錄的該標題字段的最后一個分字段之后儲存一第三特殊字符,當搜尋引擎在全文檢索時發(fā)現(xiàn)該第三特殊字符時,即對該記錄的下一個記錄進行全文檢索。`
【文檔編號】G06F17/30GK103761242SQ201310690513
【公開日】2014年4月30日 申請日期:2013年12月13日 優(yōu)先權(quán)日:2012年12月31日
【發(fā)明者】張國峰, 朱逸斐 申請人:威盛電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1