品或服務(wù)來(lái)新增知識(shí)點(diǎn)或補(bǔ)充實(shí)體屬性。
[0038]在本發(fā)明的知識(shí)圖譜中,每個(gè)知識(shí)點(diǎn)都有獨(dú)立的入度點(diǎn)和出度點(diǎn),根據(jù)相同的入讀點(diǎn)和出度點(diǎn)建立起一級(jí)、二級(jí)、三級(jí)的知識(shí)關(guān)系,最后建立起一張知識(shí)無(wú)向圖。再次參考圖3所示出的知識(shí)圖譜為例,其中“體育”是一級(jí)的知識(shí)點(diǎn),“足球”是二級(jí)的知識(shí)點(diǎn),“梅西”、“巴塞羅那”、“C羅”、“皇家馬德里”是三級(jí)的知識(shí),三級(jí)的知識(shí)允許有其他高級(jí)別的知識(shí)來(lái)做入度點(diǎn),比如,“梅西”是人物,“巴塞羅那”是倶樂(lè)部等等?;谑纠闹R(shí)圖譜,可以由“梅西”推理出他是“體育”領(lǐng)域的人物或者是“足球”領(lǐng)域的人物,通過(guò)同級(jí)之間的關(guān)系可以推理出“梅西”效力于“巴塞羅那”,并且“梅西”和“皇家馬德里”當(dāng)前沒(méi)有交集等等。
[0039]在本發(fā)明的知識(shí)圖譜中,通過(guò)每個(gè)知識(shí)點(diǎn)的不同級(jí)別的入度點(diǎn)來(lái)訪問(wèn)該知識(shí)點(diǎn),在通過(guò)該知識(shí)點(diǎn)的出度點(diǎn)來(lái)訪問(wèn)同級(jí)的知識(shí)點(diǎn)。知識(shí)點(diǎn)之間的連線體現(xiàn)了每個(gè)知識(shí)點(diǎn)之間的關(guān)系,比如“李淵”和“李世民”會(huì)通過(guò)“父子”關(guān)系而相連,而“灌籃高手”和“井上雄彥”會(huì)通過(guò)“作者”關(guān)系而相連。
[0040]在利用知識(shí)圖譜對(duì)通過(guò)所述實(shí)體抽取所得到的實(shí)體信息進(jìn)行知識(shí)推理的步驟ST30中,優(yōu)選地,當(dāng)包括一條實(shí)體信息時(shí),在所述知識(shí)圖譜中查找對(duì)應(yīng)于所述實(shí)體信息的知識(shí)點(diǎn);在獲得所述知識(shí)點(diǎn)之后,結(jié)束所述推理的步驟,并給出與所述知識(shí)點(diǎn)所對(duì)應(yīng)的內(nèi)容信息,以及為了能夠快速檢索到所述知識(shí)點(diǎn),給出所述知識(shí)點(diǎn)在所述知識(shí)圖譜中的位置信息;以及當(dāng)遍歷所述知識(shí)圖譜而沒(méi)有找到所述知識(shí)點(diǎn)時(shí),結(jié)束所述推理的步驟,并給出無(wú)相應(yīng)結(jié)果的反饋。
[0041]仍以圖3所示出的知識(shí)圖譜為例,例如用戶輸入的語(yǔ)句是“梅西是誰(shuí)”,經(jīng)過(guò)分詞處理后會(huì)變成“梅西/是/誰(shuí)”,實(shí)體抽取處理后會(huì)變成“梅西:人物、足球運(yùn)動(dòng)員,誰(shuí):代詞,人物”。在知識(shí)推理時(shí),在知識(shí)圖譜中找到對(duì)應(yīng)于實(shí)體信息“梅西”的知識(shí)點(diǎn),并給出對(duì)應(yīng)于“人物”的信息“足球運(yùn)動(dòng)員”,推理結(jié)束。再例如用戶輸入的語(yǔ)句是“蘇亞雷斯是誰(shuí)”,經(jīng)過(guò)分詞處理后會(huì)變成“蘇亞雷斯/是/誰(shuí)”,在當(dāng)前知識(shí)圖譜中無(wú)法找到對(duì)應(yīng)于實(shí)體信息“蘇亞雷斯”的知識(shí)點(diǎn),因此推理結(jié)束,并給出“無(wú)相應(yīng)結(jié)果”的反饋。
[0042]在利用知識(shí)圖譜對(duì)通過(guò)所述實(shí)體抽取所得到的實(shí)體信息進(jìn)行知識(shí)推理的步驟ST30中,優(yōu)選地,當(dāng)包括多條實(shí)體信息時(shí),a)在所述知識(shí)圖譜中查找對(duì)應(yīng)于所述實(shí)體信息中的一個(gè)的第一知識(shí)點(diǎn)山)通過(guò)所述第一知識(shí)點(diǎn)的出度點(diǎn),利用所述第一知識(shí)點(diǎn)與對(duì)應(yīng)于所述實(shí)體信息中的另一個(gè)的第二知識(shí)點(diǎn)之間的關(guān)系,在所述知識(shí)圖譜中查找所述第二知識(shí)點(diǎn);c)重復(fù)上述b步驟,直到對(duì)于對(duì)應(yīng)于所述實(shí)體信息中的全部的知識(shí)點(diǎn)已完成查找,結(jié)束所述推理的步驟,并給出與所述知識(shí)點(diǎn)所對(duì)應(yīng)的內(nèi)容信息;以及d)重復(fù)上述b步驟,當(dāng)遍歷所述知識(shí)圖譜而沒(méi)有找到要查找的知識(shí)點(diǎn)時(shí),結(jié)束所述推理的步驟,并給出無(wú)相應(yīng)結(jié)果的反饋。
[0043]仍以圖3所示出的知識(shí)圖譜為例,例如用戶輸入的語(yǔ)句是“梅西所在的倶樂(lè)部是”,經(jīng)過(guò)分詞處理后會(huì)變成“梅西/所在/倶樂(lè)部/是”,實(shí)體抽取處理后會(huì)變成“梅西:人物、足球運(yùn)動(dòng)員,倶樂(lè)部:足球、團(tuán)體、場(chǎng)所”。在知識(shí)推理時(shí),在知識(shí)圖譜中找到對(duì)應(yīng)于實(shí)體信息“梅西”的知識(shí)點(diǎn),通過(guò)以“梅西”作為出度點(diǎn),以“效力”作為關(guān)系詞,可以查找到“巴塞羅那”這一知識(shí)點(diǎn)作為入度點(diǎn),由此得到“梅西所在的倶樂(lè)部是巴塞羅那”,由此推理結(jié)束。對(duì)于前述的“灌籃高手的作者是誰(shuí)啊”的例子,在知識(shí)推理時(shí),在知識(shí)圖譜中找到對(duì)應(yīng)于實(shí)體信息“灌籃高手”的知識(shí)點(diǎn),通過(guò)以“灌籃高手”作為出度點(diǎn),找到被標(biāo)記為“人物”的知識(shí)點(diǎn)中與之關(guān)系為“作者”的對(duì)應(yīng)知識(shí)點(diǎn)作為入度點(diǎn),由此推理結(jié)束。
[0044]對(duì)于問(wèn)題“梅西所在的倶樂(lè)部是”,發(fā)明人在現(xiàn)有的未采用知識(shí)圖譜技術(shù)的搜索引擎頁(yè)面輸入上述問(wèn)題以與本發(fā)明的方法作比較?,F(xiàn)有的搜索引擎給出的結(jié)果包括了通過(guò)全字符匹配而在現(xiàn)有數(shù)據(jù)庫(kù)中查找到的語(yǔ)句,其中包括了“梅西所在的倶樂(lè)部是哪個(gè)”等類似問(wèn)題,而答案仍需用戶通過(guò)查閱相應(yīng)網(wǎng)頁(yè)來(lái)尋找,以及結(jié)果中也包括了關(guān)于“梅西”這一詞條所對(duì)應(yīng)的信息,而具體的針對(duì)性答案仍需要用戶通過(guò)閱讀對(duì)應(yīng)文字尋找得到。與之相比,根據(jù)本發(fā)明的方法則是對(duì)提問(wèn)給出了具體答案,這對(duì)于用戶來(lái)說(shuō)會(huì)更為直觀。
[0045]再例如用戶輸入的語(yǔ)句是“蘇亞雷斯所在的倶樂(lè)部是”,經(jīng)過(guò)分詞處理后會(huì)變成“蘇亞雷斯/所在/倶樂(lè)部/是”,在當(dāng)前圖3中所示例的知識(shí)圖譜中無(wú)法找到對(duì)應(yīng)于實(shí)體信息“蘇亞雷斯”的知識(shí)點(diǎn),因此推理結(jié)束,并給出“無(wú)相應(yīng)結(jié)果”的反饋。
[0046]再如,以“機(jī)械鍵盤為什么比普通鍵盤貴”為例,發(fā)明人在現(xiàn)有的未采用知識(shí)圖譜技術(shù)的人機(jī)問(wèn)答系統(tǒng)的交互頁(yè)面輸入了上述問(wèn)題以與本發(fā)明的方法作比較。現(xiàn)有的人機(jī)問(wèn)答系統(tǒng)給出的結(jié)果例如是“因供貨商不同,以及不同商家促銷等原因影響,商品價(jià)格可能存在不同”,這僅僅是針對(duì)于“貴”給出了一般性的普適解釋,而并沒(méi)有針對(duì)用戶輸入的兩個(gè)比對(duì)對(duì)象給出任何針對(duì)性的比較。
[0047]對(duì)于用戶輸入的上述問(wèn)題“機(jī)械鍵盤為什么比普通鍵盤貴”,根據(jù)本發(fā)明的方法會(huì)首先對(duì)其進(jìn)行分詞處理,經(jīng)過(guò)分詞處理后會(huì)變成“機(jī)械鍵盤/為什么/比/普通鍵盤/貴”,實(shí)體抽取處理后會(huì)變成“機(jī)械鍵盤:名詞、輸入產(chǎn)品,普通鍵盤:名詞、輸入產(chǎn)品”。在這里有“貴”和“比”的作為關(guān)系詞的關(guān)鍵字,在知識(shí)推理時(shí),會(huì)在知識(shí)圖譜中找到對(duì)應(yīng)于實(shí)體信息“機(jī)械鍵盤”和“普通鍵盤/薄膜鍵盤”的知識(shí)點(diǎn),通過(guò)對(duì)屬于兩者的屬性的造價(jià)進(jìn)行差值比較來(lái)做屬性比較,而得到關(guān)于例如產(chǎn)品的用料、使用壽命、用戶體驗(yàn)等等的比較結(jié)果來(lái)作為答案。
[0048]圖4是根據(jù)本發(fā)明的基于知識(shí)圖譜的人機(jī)問(wèn)答系統(tǒng)的示例框圖,其中所示出的人機(jī)問(wèn)答系統(tǒng)100包括:輸入模塊10,用于接收用戶輸入的語(yǔ)句;分詞模塊20,用于對(duì)用戶輸入的語(yǔ)句進(jìn)行分詞;實(shí)體抽取模塊30,用于對(duì)通過(guò)所述分詞所得到的詞進(jìn)行實(shí)體抽??;知識(shí)圖譜模塊40,用于存儲(chǔ)包括知識(shí)點(diǎn)以及知識(shí)點(diǎn)之間的關(guān)系的知識(shí)圖譜;知識(shí)推理模塊50,用于利用所述知識(shí)圖譜對(duì)通過(guò)所述實(shí)體抽取所得到的實(shí)體信息進(jìn)行知識(shí)推理;以及輸出模塊60,用于根據(jù)所述知識(shí)推理的結(jié)果對(duì)所述用戶輸入的語(yǔ)句給出反饋。
[0049]優(yōu)選地,在一個(gè)實(shí)施例中,輸入模塊10能夠接收以文字錄入、語(yǔ)音錄入、和/或本領(lǐng)域已知的其他方法錄入的用戶輸入的語(yǔ)句。
[0050]優(yōu)選地,在一個(gè)實(shí)施例中,分詞模塊20通過(guò)分詞算法對(duì)用戶輸入的語(yǔ)句進(jìn)行切害J,保留屬于關(guān)系特征詞的停用詞,并且去除其余的停用詞以及冗余信息。
[0051 ] 優(yōu)選地,在一個(gè)實(shí)施例中,實(shí)體抽取模塊30利用所得到的詞的實(shí)體屬性對(duì)其進(jìn)行標(biāo)記,其中,所述實(shí)體屬性包括所述詞的詞性、所述詞的字典釋義、或所述詞所對(duì)應(yīng)的產(chǎn)品分類。
[0052]優(yōu)選地,在一個(gè)實(shí)施例中,知識(shí)圖譜模塊40通過(guò)為每個(gè)所述知識(shí)點(diǎn)設(shè)置獨(dú)立的入度點(diǎn)和出度點(diǎn),根據(jù)相同的入度點(diǎn)和出度點(diǎn)建立所述知識(shí)點(diǎn)之間的分級(jí)的知識(shí)關(guān)系,在所述知識(shí)點(diǎn)之間建立知識(shí)無(wú)向圖,來(lái)存儲(chǔ)所述知識(shí)圖譜的知識(shí)點(diǎn)以及知識(shí)點(diǎn)之間的關(guān)系。
[0053]優(yōu)選地,在一個(gè)實(shí)施例中,知識(shí)推理模塊50當(dāng)通過(guò)在所述知識(shí)圖譜中查找而獲得對(duì)應(yīng)于所述實(shí)體信息的知識(shí)點(diǎn)時(shí),給出與所述知識(shí)點(diǎn)所對(duì)應(yīng)的內(nèi)容信息以及所述知識(shí)點(diǎn)在所述知識(shí)圖譜中的位置信息;以及當(dāng)遍歷所述知識(shí)圖譜而沒(méi)有找到所述知識(shí)點(diǎn)時(shí),給出無(wú)相應(yīng)結(jié)果的反饋。
[0054]優(yōu)選地,在一個(gè)實(shí)施例中,知識(shí)推理模塊50在所述知識(shí)圖譜中查找對(duì)應(yīng)于所述實(shí)體