專利名稱:用于問答系統(tǒng)的問答匹配方法及問答方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基于問答方式的信息交互技術(shù),例如支持移動設(shè)備接入的問答系統(tǒng),特別 是一種用于問答系統(tǒng)的問答匹配方法及問答方法和系統(tǒng),利用該方法或系統(tǒng),能夠為提問 用戶找到最合適的問題解答用戶,從而為提問用戶提供少量而精確的答案。
背景技術(shù):
互聯(lián)網(wǎng)技術(shù)和無線通訊技術(shù)的發(fā)展正深刻地改變著人類的生活和工作的方式。從使用 的網(wǎng)絡(luò)上來看,人們可以使用固定電話網(wǎng)絡(luò),各種制式的移動通訊網(wǎng)絡(luò)(GSM, GPRS, EGPRS, WCDMA, CDMA, CDMA2000等)以及互聯(lián)網(wǎng)絡(luò)(IPv4和IPv6網(wǎng)絡(luò))等。從所使用的終端來看, 人們可以使用固定電話,支持各種制式的移動設(shè)備和PDA,能訪問互聯(lián)網(wǎng)的計算機等。近年 來,移動和固定業(yè)務(wù)的融合使得人們溝通的方式更加豐富。除了語音電話外,人們可以發(fā) 送短消息(SMS和醒S)進行交流,可以通過電子郵件進行交流,可以通過網(wǎng)站比如BBS(電 子公告牌)等進行交流。人們還可以通過移動電話,方便地訪問互聯(lián)網(wǎng)。
互聯(lián)網(wǎng)技術(shù)和無線通訊技術(shù)的發(fā)展使得人類獲取信息變得更加容易?,F(xiàn)在已經(jīng)有很多 網(wǎng)絡(luò)服務(wù)提供商提供了各種各樣的問答系統(tǒng)。除了傳統(tǒng)的支持計算機接入的問答系統(tǒng)外, 支持移動設(shè)備接入的問答系統(tǒng)也得到了大量的應(yīng)用。比如,支持移動設(shè)備接入問答系統(tǒng)就 是一個很好的例子。提問用戶通過短消息或WAP方法向這些問答系統(tǒng)提交問題后,問答系 統(tǒng)將答案返回到移動設(shè)備上。另外,目前人們熟悉的支持移動設(shè)備接入的移動搜索引擎從 廣義上講也是一個問答系統(tǒng)。以基于關(guān)鍵字網(wǎng)頁搜索的系統(tǒng)為例,使用者通過短消息或MP 方法向這個系統(tǒng)提供一個或多個關(guān)鍵字,搜索引擎將返回需要的信息或指向這些信息的鏈 接。
由于無線傳輸速度及顯示設(shè)備尺寸的限制,支持移動設(shè)備接入的問答系統(tǒng)中需要解決 的一個關(guān)鍵問題是如何找到為提問用戶提供少量而精確的答案。目前常見的支持移動設(shè)備 接入的問答系統(tǒng)包括基于全文匹配技術(shù)的自動處理系統(tǒng)和基于歸類的專家問答系統(tǒng)。
在基于全文匹配技術(shù)的自動處理系統(tǒng)中,用戶提交的問題是一個關(guān)鍵詞或數(shù)個關(guān)鍵詞 的組合。問答系統(tǒng)接收到這些關(guān)鍵詞后,在其收集的答案信息中通過關(guān)鍵詞匹配的方式査 找合適的答案。為避免導(dǎo)致數(shù)量龐大的信息檢索結(jié)果返回到移動設(shè)備,該系統(tǒng)往往只收集 數(shù)量較少,篇幅較短的信息,比如某些分類信息。而設(shè)備用戶為了獲得更精確的信息,往往會輸入復(fù)雜的問題。利用常規(guī)的全文匹配技術(shù),往往很難在已收集的簡單信息中査找到 與用戶輸入復(fù)雜問題精確匹配的內(nèi)容。在基于歸類的專家問答系統(tǒng)中,用戶提交的問題往往是一個或多個符合自然語言語法 和句法的句子。每個領(lǐng)域安排了一些具有該領(lǐng)域知識的專家,用戶提出的問題都歸類到某 一領(lǐng)域并由該領(lǐng)域的專家進行處理。這類系統(tǒng)的主要困難在于分類。如果分類層次太淺, 則很難精確地找到合適的專家來處理用戶提出的問題。但如果分類層次太深,則不方便用 戶的使用,特別是移動設(shè)備用戶。本發(fā)明就是為了解決如何在問答系統(tǒng)中為提問用戶找到最合適的問題解答用戶,尤其 適用于支持移動設(shè)備接入的問答系統(tǒng)。為實現(xiàn)這個目的, 一些容易想到的,可能被應(yīng)用在 問答系統(tǒng)中的常規(guī)辦法主要有-a) 用于搜索引擎系統(tǒng)中的基于關(guān)鍵字的競價排名技術(shù)。 一個典型的例子是申請?zhí)枮?02117998.0 (公開號為CN1462003A)的專利申請中所公開的一種利用搜索引擎發(fā)布信息并 按競價排名的方法。在該技術(shù)中, 一個信息發(fā)布用戶可以購買某些關(guān)鍵詞,并預(yù)先提供給 搜索引擎系統(tǒng)。當(dāng)一個用戶通過向該系統(tǒng)請求搜索服務(wù)而且其輸入的一個或多個關(guān)鍵詞包 含此信息發(fā)布用戶購買的關(guān)鍵詞時,搜索引擎系統(tǒng)將提供信息發(fā)布用戶希望發(fā)布的信息作 為搜索結(jié)果。在這里,只有當(dāng)請求搜索服務(wù)的用戶的輸入包含信息發(fā)布用戶購買的關(guān)鍵詞 時,信息發(fā)布用戶希望發(fā)布的信息才可能返回給請求搜索服務(wù)的用戶。如果將此技術(shù)直接 應(yīng)用在問答系統(tǒng)中,則需要問題解答用戶事先提供一些關(guān)鍵詞,而當(dāng)提問用戶提交的問題 包含這些關(guān)鍵詞時,問題解答用戶的信息將被發(fā)送到提問用戶。而在實際問答系統(tǒng)中,往 往要求問題解答用戶提供盡可能多的詞語或句子以描述其能解答的問題的特征。在這種情 況下,提問用戶提交的問題的很難剛好包含所有這些用于描述問題解答用戶能夠解答的問 題的特征的詞語或句子,從而無法保證找到最合適的問題解答用戶解答提問用戶的問題。 相反,如果將此競價排名技術(shù)直接應(yīng)用在問答系統(tǒng)中,反而是提供少量用于描述其能夠解 答的問題的特征的詞語或句子的問題解答用戶容易被選中,作為問題的答案提供者。b) 用于基于短消息和關(guān)鍵詞的信息査詢系統(tǒng)。 一個典型的例子是http:〃isee. sina.net/ (2007-12-21)。在該技術(shù)中,手機用戶通過編輯關(guān)鍵詞,發(fā)送到 某一短信服務(wù)號碼,即可查詢到該關(guān)鍵詞的注冊內(nèi)容。該注冊內(nèi)容一般也是某些用戶(一 般是信息發(fā)布用戶)預(yù)先提供給該系統(tǒng)的希望通過該系統(tǒng)發(fā)布的信息。當(dāng)一個用戶通過向 該系統(tǒng)請求查詢服務(wù)而且其輸入的一個關(guān)鍵詞剛好是其它一個用戶購買的關(guān)鍵詞時,該查 詢系統(tǒng)將提供這個已購買該關(guān)鍵詞的用戶希望發(fā)布的信息作為查詢結(jié)果。在這里,只有當(dāng)請求查詢服務(wù)的用戶的輸入剛好是另外一個用戶購買的關(guān)鍵詞時,購買該關(guān)鍵詞的用戶希 望發(fā)布的信息才可能返回給請求查詢信息的用戶。如果將此技術(shù)直接應(yīng)用在問答系統(tǒng)中, 則需要問題解答用戶事先提供一個關(guān)鍵詞,而當(dāng)提問用戶提交的問題剛好是這些關(guān)鍵詞時, 問題解答用戶的信息將被發(fā)送到提問用戶。同樣,因為在實際問答系統(tǒng)中,往往要求問題 解答用戶提供盡可能多的詞語或句子以描述其能解答的問題的特征。在這種情況下,提問 用戶提交的問題的很難剛好是這些詞語或句子,從而無法保證找到最合適的問題解答用戶 解答提問用戶的問題。同樣,如果將此技術(shù)直接應(yīng)用在問答系統(tǒng)中,反而是提供少量用于 描述其能夠解答的問題的特征的詞語或句子的問題解答用戶容易被選中,作為問題的答案提供者。 發(fā)明內(nèi)容本發(fā)明針對現(xiàn)有技術(shù)中存在的缺陷或不足,提供一種用于問答系統(tǒng)的問答匹配方法及 問答方法和系統(tǒng),利用該方法或系統(tǒng),能夠為提問用戶找到最合適的問題解答用戶,從而 為提問用戶提供少量而精確的答案。在本發(fā)明提供的技術(shù)中,問題解答用戶可以提供問題 的答案外,還另外提供了一則專門用于問答匹配的若干個問題解答用戶各自預(yù)先設(shè)定的一 組詞語或句子。這些預(yù)先設(shè)定的一組詞語或句子可以盡可能詳細,以有利于問答系統(tǒng)確定 最匹配的問題解答用戶。問題解答用戶的答案并不是這些預(yù)先設(shè)定的一組詞語或句子,而 可以是一些很簡單但準(zhǔn)確的短語或句子。特別是對于移動設(shè)備用戶而言,這種方式有利于 滿足移動設(shè)備用戶的需要。本發(fā)明的技術(shù)方案如下用于問答系統(tǒng)的問答匹配方法,其特征在于包括在問題解答用戶數(shù)據(jù)模塊中,列表 存儲若干個問題解答用戶各自預(yù)先設(shè)定的一組詞語和/或句子;當(dāng)提問用戶提出一個問題 后,由匹配程度計算模塊將該問題所具有的詞語和/或句子,逐個與問題解答用戶預(yù)先設(shè)定 的一組詞語和/或句子,就完全相同或語義相同的部分進行計數(shù),分別得出問題解答用戶的 匹配程度值,從而根據(jù)匹配程度值確定響應(yīng)該問題的問題解答用戶。對于所述預(yù)先設(shè)定的一組詞語和/或句子,分別對其中的每個詞語和/或每個句子分配 權(quán)重值;所述計數(shù)可采用加權(quán)計數(shù)。所述問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子中,包括具有邏輯關(guān)系符的組合結(jié)構(gòu)。所述邏輯關(guān)系符包括以下一個或超過一個的組合表示邏輯與的"AND"或"*",表示邏輯或的"OR"或"+",表示邏輯非的"NOT"或"-",以及用于確定邏輯運算次序的 "),,和"("。所述權(quán)重值的分配與問題解答用戶的專業(yè)領(lǐng)域、經(jīng)驗、以及經(jīng)歷相關(guān),或者與問題解 答用戶所預(yù)先設(shè)定的一組詞語或句子的總的數(shù)量相關(guān),或者與關(guān)鍵詞的重要性相關(guān)。所述完全相同或語義相同的部分詞語和/或句子不包括一些太常用以至沒有任何匹配 價值的詞語和/或句子。一種用于問答系統(tǒng)的問答方法,其特征在于,包括如下步驟步驟l,在問題解答用戶數(shù)據(jù)模塊中,列表存儲若干個問題解答用戶各自預(yù)先設(shè)定的一組詞語和/或句子,或者還包括為其中的每個詞語和/或每個句子分配權(quán)重值; 步驟2,提問用戶通過用戶接口模塊提交問題到問答系統(tǒng);步驟3,由匹配程度計算模塊將該問題所具有的詞語或句子,逐個與問題解答用戶預(yù)先 設(shè)定的一組詞語和/或句子,就完全相同或語義相同的部分進行計數(shù)或加權(quán)計數(shù),分別得出 問題解答用戶的匹配程度值;步驟4,按照匹配程度值從高至低的次序,或者還包括限額條件,確定入選的問題解答 用戶;入選的問題解答用戶響應(yīng)該問題,將答案提供給提問用戶。所述將答案提供給提問用戶的方式,可以由問答系統(tǒng)將入選的問題解答用戶預(yù)先存儲 在問答系統(tǒng)中的答案直接發(fā)送給提問用戶。所述用戶接口模塊支持以下接入方式中的一種或超過一種的組合短消息接入,電子 郵件接入,網(wǎng)絡(luò)瀏覽器接入。對于每一種接入方式,問答系統(tǒng)都有一個或多個對應(yīng)的通訊地址用于與該接入類型的用戶進行通訊。所述問題解答用戶數(shù)據(jù)模塊中,還可以包括存儲有問題解答用戶提供的地址信息,通 過這些地址信息,問答系統(tǒng)可以轉(zhuǎn)發(fā)提問用戶提交的問題,并接收問題解答用戶的答案。 所述問題解答用戶入選的限額可以由問答系統(tǒng)指定,也可以由提問用戶指定。 所述完全相同或語義相同的部分詞語和/或句子不包括一些太常用以至沒有任何匹配 價值的詞語和/或句子。一種問答系統(tǒng),其特征在于包括用戶接口模塊,問題解答用戶數(shù)據(jù)模塊,匹配程度 計算模塊和答案獲取及轉(zhuǎn)發(fā)模塊;所述用戶接口模塊,用于傳輸問答系統(tǒng)與用戶之間的提問及答案等信息; 所述問題解答用戶數(shù)據(jù)模塊,用于存儲問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子; 所述匹配程度計算模塊,用于計算接收的問題即提問用戶通過用戶接口模塊提交的問 題,與每個問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子的匹配程度;所述答案獲取及轉(zhuǎn)發(fā)模塊,用于根據(jù)所述匹配程度的高低,確定問題解答用戶并將其 答案提供給提問用戶。所述問題解答用戶數(shù)據(jù)模塊,列表存儲若干個問題解答用戶各自預(yù)先設(shè)定的一組詞語 和/或句子,或者還包括為其中的每個詞語和/或每個句子分配權(quán)重值。所述匹配程度計算模塊,將提交問題所具有的詞語或句子,逐個與問題解答用戶預(yù)先 設(shè)定的一組詞語和/或句子,就完全相同或語義相同的部分進行計數(shù)或加權(quán)計數(shù),分別得出問題解答用戶的匹配程度值;所述答案獲取及轉(zhuǎn)發(fā)模塊按照匹配程度值從高至低的次序, 或者還包括限額條件,確定入選的問題解答用戶;入選的問題解答用戶響應(yīng)該問題,將答案提供給提問用戶。所述將答案提供給提問用戶的方式,可以由問答系統(tǒng)將入選的問題解答用戶預(yù)先存儲 在問答系統(tǒng)中的答案直接發(fā)送給提問用戶。所述完全相同或語義相同的部分詞語和/或句子不包括一些太常用以至沒有任何匹配 價值的詞語和/或句子。本發(fā)明的技術(shù)效果如下在本發(fā)明中,問題解答用戶提供兩組信息 一種是問題解答用戶預(yù)先設(shè)定的一組詞語 或句子,這些詞語或句子用于描述問題解答用戶可以解答的問題的特征,用于問答系統(tǒng)確 定最合適的問題解答用戶。這組詞語越精確,數(shù)量越多,越有利于為提問用戶找到合適的 問題解答用戶。另外一組是問題解答用戶真正發(fā)送到提問用戶用于回答提問用戶提問的答 案信息。因此,只有問題解答用戶可以預(yù)先提供盡可能多的,精確的詞語或句子來描述其 擅長解答的問題,而提問用戶也可以提供盡可能多的,精確的詞語或句子來描述其問題, 就越有利于為提問用戶找到合適的問題解答用戶。當(dāng)提問用戶是移動設(shè)備用戶時,問題解 答用戶預(yù)先設(shè)定的一組詞語或句子可以較詳細,但其答案可以比較簡單,以滿足移動設(shè)備 用戶的需要。
圖1是問題解答用戶實時提供答案的問答系統(tǒng)結(jié)構(gòu)框圖。圖2是問答系統(tǒng)與用戶通訊的地址舉例示意圖。圖3是問題解答用戶數(shù)據(jù)模塊中的列表存儲數(shù)據(jù)示意圖。圖4是問題解答用戶實時提供答案的問答方法流程圖。圖5是預(yù)先收集信息的問答系統(tǒng)結(jié)構(gòu)框圖。圖6是預(yù)先收集信息的答案獲取流程圖。
具體實施方式
本發(fā)明是一種用于問答系統(tǒng)的問答匹配方法及問答方法和系統(tǒng)。本發(fā)明的一個目的是提供了一種在問答系統(tǒng)中為提問用戶提供少量而精確的答案的方 法。本發(fā)明的另外一個目的是提供了一種在問答系統(tǒng)中為提問用戶提供少量而精確的答案 的系統(tǒng)。本發(fā)明提供的方法和系統(tǒng)特別適用于移動設(shè)備用戶,因為對于這些用戶, 一次問 題的結(jié)果的數(shù)量往往必須在一定的范圍內(nèi)。上述發(fā)明目的能夠通過如下方法及其步驟實現(xiàn)a) 問題解答用戶預(yù)先提供了一組詞語或句子。這些問題解答用戶預(yù)先設(shè)定的一組詞語或句子被存儲在問答系統(tǒng)中。在某些實施例中,所述的詞語還可以通過邏輯關(guān)系符組合起來的;邏輯關(guān)系符包括但不限于表示邏輯與的"AND"或"*",表示邏輯或的"OR"或 "+",表示邏輯非的"NOT"或"-",以及用于確定邏輯運算次序的")"和"("。這 些詞語或句子用于描述問題解答用戶可以解答的問題的特征。這些特征可以是問題解答用 戶所擅長解決的問題的領(lǐng)域或詞語等信息。在某些實施例中,問題解答用戶還向問答系統(tǒng) 提供了其地址信息,通過這些地址信息,問答系統(tǒng)可以轉(zhuǎn)發(fā)提問用戶提交的問題,并接收 問題解答用戶的答案。在某些實施例中,每個問題解答用戶還可以在問答系統(tǒng)預(yù)先存儲針 對某些特定問題的答案。b) 提問用戶提交問題到問答系統(tǒng)。用戶提交的問題至少包括一個或一個以上的詞語或 句子。這些詞語或句子可以是一些詞語的組合或符合自然語言語法和句法的短語或句子。 在某些實施例中,問答系統(tǒng)支持短消息接入,電子郵件接入,網(wǎng)絡(luò)瀏覽器或其它接入方式 中的一種或幾種。c) 計算該問題與每個問題解答用戶預(yù)先設(shè)定的一組詞語或句子的匹配程度。所述的匹 配程度是用于表征該問題與問題解答用戶預(yù)先設(shè)定的這組詞語或句子包含的相同的或具有 相同含義的詞語或句子的數(shù)量的一個數(shù)值或加權(quán)后的計數(shù)值。在某些實施例中,所述的匹 配程度等同于該問題與問題解答用戶預(yù)先設(shè)定的這組詞語或句子包含的相同的或具有相同 含義的詞語或句子的數(shù)量。而在某些實施例中,在計算所述的匹配程度還為不同詞語分配 不同的權(quán)值;在某些實施例中,在計算所述的匹配程度時還根據(jù)不同的問題解答用戶分配 不同的權(quán)值;在某些實施例中,所述完全相同或語義相同的部分詞語和/或句子不包括一些 太常用以至沒有任何匹配價值的詞語和/或句子。比如,"了"和"的"就可能是可以被忽 略的詞語。d) 根據(jù)所述匹配程度的高低,確定一個或多個可以為當(dāng)前問題提供答案的問題解答用 戶。只有提供了一組與當(dāng)前問題匹配程度較高的詞語或句子的一個或多個問題解答用戶可 以為當(dāng)前問題提供答案。在某些實施例中,只有所提供的問題解答用戶預(yù)先設(shè)定的一組詞 語或句子與問題匹配程度高的問題解答用戶提供可以看到或接收到該問題;在某些實施例 中,只有所提供的問題解答用戶預(yù)先設(shè)定的一組詞語或句子與問題匹配程度高的問題解答 用戶可以響應(yīng)該問題。e) 將步驟的d)所確定的問題解答用戶的答案提供給當(dāng)前提問用戶。在某些實施例中, 所提供的問題解答用戶預(yù)先設(shè)定的一組詞語或句子與問題匹配程度高的問題解答用戶提供 的答案優(yōu)先返回到提問用戶或優(yōu)先顯示給提問用戶。在某些實施例中,問答系統(tǒng)確定問題 解答用戶后,將該問題解答用戶預(yù)先存儲在該系統(tǒng)中的答案提供給提問用戶。在某些實施 例中,問答系統(tǒng)確定問題解答用戶后,將提問用戶提交的問題轉(zhuǎn)發(fā)給該問題解答用戶,然 后轉(zhuǎn)發(fā)該問題解答用戶提供的答案到提問用戶。上述發(fā)明目的能夠通過如下系統(tǒng)實現(xiàn)該系統(tǒng)包括但不限于用戶接口模塊,問題解 答用戶數(shù)據(jù)模塊,匹配程度計算模塊和答案獲取及轉(zhuǎn)發(fā)模塊。a) 用戶接口用于傳輸問答系統(tǒng)與用戶之間的提問及答案等信息。用戶提交的問題至 少包括一個或一個以上的詞語或句子。這些詞語或句子可以是一些詞語的組合或符合自然 語言語法和句法的短語或句子。在某些實施例中,問答系統(tǒng)支持短消息接入,電子郵件接 入,網(wǎng)絡(luò)瀏覽器或其它接入方式中的一種或幾種。b) 問題解答用戶數(shù)據(jù)模塊存儲問題解答用戶預(yù)先設(shè)定的一組詞語或句子。這些詞語 或句子用于描述問題解答用戶可以解答的問題的特征。在某些實施例中,所述的詞語還可以通過邏輯關(guān)系符組合起來的;邏輯關(guān)系符包括但不限于表示邏輯與的"認D"或"*", 表示邏輯或的"OR"或"+ ",表示邏輯非的"NOT"或,以及用于確定邏輯運算次序 的")"和"("。這些特征可以是問題解答用戶所擅長解決的問題的領(lǐng)域或詞語等信息。 在某些實施例中,問題解答用戶還向問答系統(tǒng)提供了其地址信息,通過這些地址信息,問 答系統(tǒng)可以轉(zhuǎn)發(fā)提問用戶提交的問題,并接收問題解答用戶的答案。在某些實施例中,每 個問題解答用戶還可以在問答系統(tǒng)預(yù)先存儲針對某些特定問題的答案。C)匹配程度計算模塊計算接收的問題與每個問題解答用戶預(yù)先設(shè)定的一組詞語或句子的匹配程度。所述的匹配程度是用于表征該問題與問題解答用戶預(yù)先設(shè)定的這組詞語或 句子包含的相同的或具有相同含義的詞語或句子的數(shù)量的一個數(shù)值或加權(quán)后的計數(shù)。在某 些實施例中,所述的匹配程度等同于該問題與問題解答用戶預(yù)先設(shè)定的這組詞語或句子包 含的相同的或具有相同含義的詞語或句子的數(shù)量。而在某些實施例中,在計算所述的匹配程度還為不同詞語分配不同的權(quán)值;在某些實施例中,在計算所述的匹配程度時還根據(jù)不 同的問題解答用戶分配不同的權(quán)值;在某些實施例中,所述完全相同或語義相同的部分詞 語和/或句子不包括一些太常用以至沒有任何匹配價值的詞語和/或句子。比如,"了"和 "的"就可能是可以被忽略的詞語。d)答案獲取及轉(zhuǎn)發(fā)模塊根據(jù)所述匹配程度的高低,確定問題解答用戶并將其答案提 供給當(dāng)前提問用戶,并將所確定的問題解答用戶的答案提供給當(dāng)前提問用戶。只有提供了 一組與當(dāng)前問題匹配程度較高的詞語或句子的一個或多個問題解答用戶可以為當(dāng)前問題提 供答案。在某些實施例中,只有所提供的問題解答用戶預(yù)先設(shè)定的一組詞語或句子與問題 匹配程度高的問題解答用戶提供可以看到或接收到該問題;在某些實施例中,只有所提供 的問題解答用戶預(yù)先設(shè)定的一組詞語或句子與問題匹配程度高的問題解答用戶可以響應(yīng)該 問題。在某些實施例中,所提供的問題解答用戶預(yù)先設(shè)定的一組詞語或句子與問題匹配程 度高的問題解答用戶提供的答案優(yōu)先返回到提問用戶或優(yōu)先顯示給提問用戶。在某些實施 例中,問答系統(tǒng)確定問題解答用戶后,將該問題解答用戶預(yù)先存儲在該系統(tǒng)中的答案提供 給提問用戶。在某些實施例中,問答系統(tǒng)確定問題解答用戶后,將提問用戶提交的問題轉(zhuǎn) 發(fā)給該問題解答用戶,然后轉(zhuǎn)發(fā)該問題解答用戶提供的答案到提問用戶。本發(fā)明包含以下一些關(guān)鍵技術(shù)1.問題解答用戶提供兩組信息 一種是問題解答用戶預(yù)先設(shè)定的一組詞語或句子,這 些詞語或句子用于描述問題解答用戶可以解答的問題的特征,用于問答系統(tǒng)確定最合適的問題解答用戶。這組詞語越精確,數(shù)量越多,越有利于為提問用戶找到合適的問題解答用 戶。另外一組是問題解答用戶真正發(fā)送到提問用戶用于回答提問用戶提問的答案信息。2. 用匹配程度計算的結(jié)果確定問題解答用戶。所述的匹配程度是由提問用戶的問題與 問題解答用戶預(yù)先設(shè)定的這組詞語或句子共同包含的相同的或相同含義的詞語或句子的數(shù) 量確定的,可選的,也可以為這些詞語或句子按一定的規(guī)則確定權(quán)值,并計算共同包含的 所有相同的或相同含義的詞語或句子的權(quán)值的總和作為匹配程度的度量。3. 與前面所述的搜索引擎中的競價排名及基于關(guān)鍵詞的手機信息査詢系統(tǒng)的主要區(qū)別 主要在于競價排名需要確定搜索請求是否包含其它用戶己購買的關(guān)鍵字;基于關(guān)鍵詞的 手機信息査詢系統(tǒng)需要確定查詢請求是否剛好是其它用戶己購買的關(guān)鍵字。而在本專利公 開的技術(shù)中,用戶提出的問題和問題解答用戶預(yù)先提供的詞語或句子之間沒有相互包含的 關(guān)系,而是采用匹配算法確定提問用戶的問題與問題解答用戶預(yù)先提供的一則詞語或句子 之間共有的完全相同的或語義相同的詞語或句子的數(shù)量,或采用某種加權(quán)方式后計算的表 征二者共有的完全相同的或語義相同的詞語或句子的數(shù)量。根據(jù)此計算結(jié)果確定問題解答用戶。為了進一步闡述本發(fā)明所采用的技術(shù)手段,下面結(jié)合優(yōu)選實施例作進一步的描述。圖l是根據(jù)本發(fā)明提供的技術(shù)實現(xiàn)的一種問答系統(tǒng)的實施例。該問答系統(tǒng)包括用戶接 口模塊(110),問題解答用戶數(shù)據(jù)模塊(111),匹配程度計算模塊(112)和答案獲取及轉(zhuǎn) 發(fā)模塊(113)。這些模塊的功能分別是-用戶接口模塊(110):用于傳輸問答系統(tǒng)與用戶之間的提問及答案等信息。用戶提交的 問題至少包括一個或一個以上的詞語或句子。這些詞語或句子可以是一些詞語的組合或符 合自然語言語法和句法的短語或句子。在某些實施例中,問答系統(tǒng)支持短消息接入,電子 郵件接入,網(wǎng)絡(luò)瀏覽器或其它接入方式中的一種或幾種。在本實施例中,問答系統(tǒng)同時支持短消息接入,電子郵件接入和網(wǎng)絡(luò)瀏覽器接入;用 戶提交問題可以是一組詞語或符合自然語言語法和句法的句子。在本實施例中,用戶接口 模塊還包含協(xié)議轉(zhuǎn)換部分,以保證采用不同接入方式的用戶之間也可以順利交互。如圖1 所示,用戶A (101),用戶B (102)和用戶C (103)都是該問答系統(tǒng)的用戶。注意這里的 用戶A (101),用戶B (102)和用戶C (103)僅僅是為了描述方便而列舉的該問答系統(tǒng)中 眾多用戶中的3個用戶。為說明方便,如圖2所示,假設(shè)用戶A (101),用戶B (102)和 用戶C (103)分別通過短消息(201),電子郵件(202)和網(wǎng)絡(luò)瀏覽器(203)接入該系統(tǒng)。對應(yīng)于每一種接入方式,該系統(tǒng)都有一個或多個對應(yīng)的通訊地址用于與該類型的用戶進行 通訊。圖2還列舉了用戶A( 101 ),用戶B( 102)和用戶C( 103)的地址分別是13683600172 (204), user—A@askother. com(205)和10. 10. 10. 2: :8080(206),并分別與問答系統(tǒng)的地址80000 (207) , ask@askother.com (208)和10. 10. 10. 1: :8080 (209)進行通訊。在本實施例 中,用戶的接入方式及地址信息保存在用戶接口模塊中。在另外某些實施例中,問答系統(tǒng)可以只支持短消息接入,電子郵件接入和網(wǎng)絡(luò)瀏覽器 接入等方式的一種或某幾種。問題解答用戶數(shù)據(jù)模塊(111):存儲問題解答用戶預(yù)先設(shè)定的一組詞語或句子。這些 詞語或句子用于描述問題解答用戶可以解答的問題的特征。在本實施例中,所述的詞語還 可以通過邏輯關(guān)系符組合起來的;邏輯關(guān)系符包括但不限于表示邏輯與的"AND"或、", 表示邏輯或的"OR"或"+",表示邏輯非的"NOT"或"-",以及用于確定邏輯運算次序 的")"和"("。這些特征可以是問題解答用戶所擅長解決的問題的領(lǐng)域或詞語等信息。 在本實施例中,問題解答用戶還向問答系統(tǒng)提供了其地址信息,通過這些地址信息,問答 系統(tǒng)可以轉(zhuǎn)發(fā)提問用戶提交的問題,并接收問題解答用戶的答案。在某些實施例中,某些 問題解答用戶還可以在問答系統(tǒng)預(yù)先存儲針對某些特定問題的答案。如圖3所示,在本實施例中,數(shù)據(jù)模塊中的信息包括問題解答用戶ID (301),預(yù)先 設(shè)定的一組詞語或句子(302)及其對應(yīng)的權(quán)值(324),問題解答用戶的通訊地址(303)。 對應(yīng)圖3所示三個用戶用戶D (304),用戶E (305),用戶F (306),該數(shù)據(jù)模塊存儲 著其預(yù)先設(shè)定的一組詞語或句子比如"聲卡(307) " , "375路公交車(313) ","硬 盤(308)","計算機維修(316)",".,"硬盤(309)","清華園(320)"…等以 及為每個短語或句子設(shè)定的權(quán)值。在本實施例中,這些權(quán)值用于計算匹配程度的高低。該 數(shù)據(jù)模塊還包括這些問題解答用戶的通訊地址,比如"13683600172 (310) " , "user—d@ askother.com (311) " , "10. 10. 10. 3: :8080 (312),,。在本實施例中,同一個問題解答用戶預(yù)先設(shè)定的詞語或句子可以有不同的權(quán)值。比如 "聲卡(307)"的權(quán)值為5,而"375路公交車(313)"的權(quán)值則為4。在本實施例中, 不同問題解答用戶預(yù)先設(shè)定的相同詞語也可以有不同的權(quán)值,比如用戶D(304)設(shè)定的"價格(314)"的權(quán)值為2,而用戶F (306)設(shè)定的"價格(323)"的權(quán)值則為1。這些權(quán)值 都應(yīng)用在匹配程度計算中,并影響計算的結(jié)果。注意,這里所述的問題及用戶數(shù)據(jù)模塊中的內(nèi)容僅僅是為了描述方便而作出的一些假 設(shè),并不一定代表真實的情況。匹配程度計算模塊(112):計算接收的問題與每個問題解答用戶預(yù)先設(shè)定的一組詞語或 句子的匹配程度。匹配程度,為確定由哪些問題解答用戶解答當(dāng)前問題提供依據(jù)。在本實 施例中,所述的匹配程度是由提問用戶的問題與問題解答用戶預(yù)先設(shè)定的這組詞語或句子 共同包含的相同的或相同含義的詞語或句子的數(shù)量確定的。在本實施例中,在計算所述的 匹配程度還為不同詞語分配不同的權(quán)值;在本實施例中,在計算所述的匹配程度時還根據(jù) 不同的問題解答用戶分配不同的權(quán)值。在本實施例中,對于任一解答用戶,對應(yīng)于某一問 題的匹配程度的計算為提問用戶的問題與該問題解答用戶預(yù)先設(shè)定的這組詞語或句子共 同包含的相同的或相同含義的詞語或句子的權(quán)值的和。仍然如圖3所示,假設(shè)有某一提問用戶的問題是"請問在中關(guān)村能買到硬盤嗎?", 對于問題解答用戶D (304),在其預(yù)先設(shè)定的一組詞語或句子中,與當(dāng)前問題的描述沒有 任何相同的詞語,因此匹配程度計算的結(jié)果為0。同樣的問題,對于問題解答用戶E(305), 其預(yù)先設(shè)定的詞語包含"硬盤"這個詞語(308),與當(dāng)前問題的描述有相同的一個詞語"硬 盤",而對應(yīng)該詞語的權(quán)值為5,因此其匹配程度為5。同樣的問題,對于問題解答用戶F(306), 其預(yù)先設(shè)定的詞語是"硬盤"(309),與當(dāng)前問題的描述有相同的兩個詞語"硬盤"和"中 關(guān)村",因此其匹配程度為IO。注意,這里所述的問題及用戶數(shù)據(jù)模塊中的內(nèi)容僅僅是為 了描述方便而作出的一些假設(shè),并不一定代表真實的情況。匹配程度計算模塊(112)計算的結(jié)果將提供給答案獲取及轉(zhuǎn)發(fā)模塊(113),用于確定問 題解答用戶并將其答案提供給當(dāng)前提問用戶。答案獲取及轉(zhuǎn)發(fā)模塊(113):根據(jù)所述匹配程度的高低,確定問題解答用戶并將其答案 提供給當(dāng)前提問用戶。在這個前提下,問題被轉(zhuǎn)發(fā)給所設(shè)定的一組詞語或句子與當(dāng)前問題 匹配程度較高的問題解答用戶。然后接收這些問題解答用戶提供的答案并轉(zhuǎn)發(fā)給提問用戶。 在本實施例中,在一定的時間范圍內(nèi),問題解答用戶提供的答案按所述匹配程度的高低, 按一定優(yōu)先級次序提供給提問用戶。根據(jù)所述匹配程度的高低,確定問題解答用戶并將其答案提供給當(dāng)前提問用戶,并將 所確定的問題解答用戶的答案提供給當(dāng)前提問用戶。只有提供了一組與當(dāng)前問題匹配程度 較高的詞語或句子的一個或多個問題解答用戶可以為當(dāng)前問題提供答案。在本實施例中, 對于任何一個問題,能夠提供答案的問題解答用戶的數(shù)目不能超過允許的最大值。在這個 前提下,問題被轉(zhuǎn)發(fā)給所設(shè)定的一組詞語或句子與當(dāng)前問題匹配程度較高的問題解答用戶。 然后接收這些問題解答用戶提供的答案并轉(zhuǎn)發(fā)給提問用戶。在本實施例中,在一定的時間 范圍內(nèi),問題解答用戶提供的答案按所述匹配程度的高低,按一定優(yōu)先級次序提供給提問 用戶。在另外一些實施例中,問答系統(tǒng)確定問題解答用戶后,將該問題解答用戶預(yù)先存儲 在該系統(tǒng)中的答案提供給提問用戶。仍以如圖3所示,假設(shè)有某一提問用戶的問題是"請問在中關(guān)村能買到硬盤嗎?", 匹配程度計算模塊(112)將匹配程度計算的結(jié)果提供給答案獲取及轉(zhuǎn)發(fā)模塊(113)。對應(yīng)于 問題解答用戶F(306),匹配程度最高,然后是問題解答用戶E(305)。在本實施例中,能夠提供答案的問題解答用戶的數(shù)目的不能超過允許的值。當(dāng)可以提 供答案的問題解答用戶的最大數(shù)目大于1的情況下,問題被轉(zhuǎn)發(fā)給問題解答用戶F(306)和 問題解答用戶E(305)。問題解答用戶F(306)和問題解答用戶E(305)分別響應(yīng)該問題,并將 其答案發(fā)送到問答系統(tǒng)。如果在一定信息內(nèi),問答系統(tǒng)同時收到這兩個響應(yīng),則優(yōu)先將問 題解答用戶F(306)的信息提供給提問用戶,然后才提供問題解答用戶F(306)的信息。如果 提問用戶是瀏覽器用戶,則問題解答用戶F(306)的信息將會被優(yōu)先顯示。如果提問用戶是 電子郵件用戶或短消息用戶,則問題解答用戶F(306)的信息被首先被發(fā)送到該提問用戶。 在本實施例中,如果可以提供答案的問題解答用戶的最大數(shù)目是1 ,只有問題解答用戶F(306) 能接收到并響應(yīng)該問題。在本實施例中,可以提供答案的問題解答用戶的最大數(shù)目是一個 固定的值。在本實施例中,這個值可以被提問用戶指定。在另外某些實施例中,提問用戶 指定希望接收到的答案的最大數(shù)目,問答系統(tǒng)根據(jù)經(jīng)驗參數(shù),據(jù)此計算出可以提供答案的 問題解答用戶的最大數(shù)目。在其它某些實施例中,在將問題發(fā)送到問題解答用戶,或?qū)栴}解答用戶的答案發(fā)送 到提問用戶時,問答系統(tǒng)還可以附加某些信息,比如廣告。如圖4所示,處理程序在問答系統(tǒng)開始工作后開始執(zhí)行(401)。步驟(402)讀取提 問用戶提交的一個問題并得到該提問用戶的地址及用戶ID等信息。然后處理程序執(zhí)行步驟 (403),通過計算該問題與所述問題解答用戶預(yù)先設(shè)定的一組詞語或句子的匹配程度,為 確定由哪些問題解答用戶提供信息并如何向提問用戶轉(zhuǎn)發(fā)信息提供依據(jù)。在本實施例中,所述的匹配程度是由提問用戶的問題與問題解答用戶預(yù)先設(shè)定的這組 詞語或句子共同包含的相同的或相同含義的詞語或句子的數(shù)量確定的。在本實施例中,在 計算所述的匹配程度還為不同詞語分配不同的權(quán)值;在本實施例中,在計算所述的匹配程 度時還根據(jù)不同的問題解答用戶分配不同的權(quán)值。在本實施例中,對于任一解答用戶,對 應(yīng)于某一問題的匹配程度的計算為提問用戶的問題與該問題解答用戶預(yù)先設(shè)定的這組詞 語或句子共同包含的相同的或相同含義的詞語或句子的權(quán)值的和。匹配程度計算的結(jié)果將用于確定問題解答用戶并將其答案提供給當(dāng)前提問用戶。在本 實施例中,能夠提供答案的問題解答用戶的數(shù)目的不能超過允許的值(為描述方便起見, 記為N)。因此,在步驟(404)中,如果匹配程度大于O的結(jié)果的數(shù)目大于N (405),則 只將此問題轉(zhuǎn)發(fā)給對應(yīng)于匹配程度最高的N個問題解答用戶(406)。否則(407),將問 題轉(zhuǎn)發(fā)給所有對應(yīng)于匹配程度大于O的問題解答用戶(408)。然后,進入步驟(409), 等待問題解答用戶的答案。因為問題解答用戶響應(yīng)問題需要一定的時間,因此在本實施例 中,在一定時間內(nèi),問答系統(tǒng)等待各個問題解答用戶提供的答案(409)。當(dāng)接收到所有問題解答用戶的答案(410)后,按一定優(yōu)先級次序?qū)@得的信息提供給 提問用戶(414)。在本實施例中,該優(yōu)先級次序取決于對應(yīng)的匹配程度的高低。匹配程度 越高,對應(yīng)的問題解答用戶的答案則越優(yōu)先提供給提問用戶。在本實施例中,如果等待時間超時(411),則無論是否收到所有問題解答用戶的答案, 都將目前收到的答案按優(yōu)先級次序提供給提問用戶(414)。如果沒有超時(413),則繼 續(xù)等待,直到接收到所有問題解答用戶的答案或等待時間超時(411)。在某些實施例中, 當(dāng)一個問題解答用戶的答案被接收到后,會馬上提供給提問用戶。在某些實施例中,在收 到提問用戶的指令后,問答系統(tǒng)才給該提問用戶提供獲取的信息。至此,完成了對當(dāng)前問17題的處理。如果還需要處理更多的問題,則回到步驟(402)。否則(416),結(jié)束程序的 執(zhí)行。圖5是根據(jù)本發(fā)明實現(xiàn)的另一種問答系統(tǒng)的實施例。在本實施例中,問題解答用戶的答案不是預(yù)先存儲在問答系統(tǒng)中的。與圖l所示問答系統(tǒng)相比,本實施例的不同之處在于1. 在本實施例中,有一個答案數(shù)據(jù)模塊(514)中。問題解答用戶的答案不是實時地提供 給提問用戶,而是預(yù)先存儲在問答系統(tǒng)的答案數(shù)據(jù)模塊(514)中。2. 在本實施例中,答案獲取及轉(zhuǎn)發(fā)模塊(513)的功能有所不同。在本實施例中,問答系 統(tǒng)確定問題解答用戶后,將該問題解答用戶預(yù)先存儲在該答案數(shù)據(jù)模塊(514)中的答案提供 給提問用戶。而不是如圖l所示實施例,問題會轉(zhuǎn)發(fā)到問題解答用戶,然后由問題解答用 戶實時提供答案。本實施例的其它模塊都與圖l所示實施例相同,此處不再贅言。圖6是結(jié)合圖5所示系統(tǒng)實現(xiàn)的一種問答方法的實施例。其中的步驟大部分與圖4所 示步驟相同。不同的是,在本實施例中,問答系統(tǒng)確定問題解答用戶后,將該問題解答用 戶預(yù)先存儲在該問答系統(tǒng)中的答案提供給提問用戶。而不是如圖5所示實施例,問題會轉(zhuǎn) 發(fā)到問題解答用戶,然后由問題解答用戶實時提供信息。具體步驟如下如圖6所示,處理程序在問答系統(tǒng)開始工作后開始執(zhí)行(601)。步驟(602)讀取提 問用戶提交的一個問題并得到該提問用戶的地址及用戶ID等信息。然后處理程序執(zhí)行步驟 (603),通過計算該問題與所述問題解答用戶預(yù)先設(shè)定的一組詞語或句子的匹配程度,為 確定由哪些問題解答用戶提供信息并如何向提問用戶轉(zhuǎn)發(fā)信息提供依據(jù)。在本實施例中,所述的匹配程度是由提問用戶的問題與問題解答用戶預(yù)先設(shè)定的這組 詞語或句子共同包含的相同的或相同含義的詞語或句子的數(shù)量確定的。在本實施例中,在 計算所述的匹配程度還為不同詞語分配不同的權(quán)值;在本實施例中,在計算所述的匹配程 度時還根據(jù)不同的問題解答用戶分配不同的權(quán)值。在本實施例中,對于任一解答用戶,對 應(yīng)于某一問題的匹配程度的計算為提問用戶的問題與該問題解答用戶預(yù)先設(shè)定的這組詞 語或句子共同包含的相同的或相同含義的詞語或句子的權(quán)值的和。匹配程度計算的結(jié)果將用于確定問題解答用戶并將其答案提供給當(dāng)前提問用戶。在本 實施例中,能夠提供答案的問題解答用戶的數(shù)目的不能超過允許的值(為描述方便起見, 記為N)。因此,在步驟(604)中,如果匹配程度大于O的結(jié)果的數(shù)目大于N (605),則査找答 案數(shù)據(jù)模塊,獲取對應(yīng)于匹配程度較高的N個問題解答用戶的答案(606)。否則(607), 查找答案數(shù)據(jù)模塊,獲取所有對應(yīng)于匹配程度大于O的問題解答用戶的答案(608)。然后, 進入步驟(609),按一定優(yōu)先級次序?qū)@得的答案提供給提問用戶(609)。在本實施例 中,該優(yōu)先級次序取決于對應(yīng)的所述匹配程度的高低。匹配程度越高,對應(yīng)的問題解答用 戶的答案則越優(yōu)先提供給提問用戶。在某些實施例中,在收到提問用戶的指令后,問答系 統(tǒng)才給該提問用戶提供獲取的信息。至此,完成了對當(dāng)前問題的處理。如果還需要處理更 多的問題,則回到步驟(602)。否則(611),結(jié)束程序的執(zhí)行。其它實施例在以上實施例基礎(chǔ)上作一些簡單的擴展的其它實施例包括但不限于如下幾種1. 在某些實施例中,同一個問題解答用戶可以同時提供若干組預(yù)先設(shè)定的詞語或句子 用作問答匹配,并由問答系統(tǒng)確定入選的問題解答用戶。2. 某些實施例是將圖1和圖5所示系統(tǒng)的組合,即某些答案是問題解答用戶預(yù)先設(shè)定 的,而另外一些答案由問題解答用戶實時提供。這些系統(tǒng)只是在所列舉實施例基礎(chǔ)上的簡 單組合。3. 某些實施例是將圖4和圖6所示方法的組合,即某些答案是問題解答用戶預(yù)先設(shè)定 的,而另外一些答案由問題解答用戶實時提供。這些系統(tǒng)只是在所列舉實施例基礎(chǔ)上的簡 單組合。4. 其它某些實施例在將問題發(fā)送到問題解答用戶,或?qū)栴}解答用戶的答案發(fā)送到提 問用戶時,還可以附加其他某些信息,比如廣告。
權(quán)利要求
1.用于問答系統(tǒng)的問答匹配方法,其特征在于包括在問題解答用戶數(shù)據(jù)模塊中,列表存儲若干個問題解答用戶各自預(yù)先設(shè)定的一組詞語和/或句子;當(dāng)提問用戶提出一個問題后,由匹配程度計算模塊將該問題所具有的詞語和/或句子,逐個與問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子,就完全相同或語義相同的部分進行計數(shù),分別得出問題解答用戶的匹配程度值,從而根據(jù)匹配程度值確定響應(yīng)該問題的問題解答用戶。
2. 根據(jù)權(quán)利要求1所述的用于問答系統(tǒng)的問答匹配方法,其特征在于對于所述預(yù)先 設(shè)定的一組詞語和/或句子,分別對其中的每個詞語和/或每個句子分配權(quán)重值;所述計數(shù) 可采用加權(quán)計數(shù)。
3. 根據(jù)權(quán)利要求1所述的用于問答系統(tǒng)的問答匹配方法,其特征在于所述問題解答 用戶預(yù)先設(shè)定的一組詞語和/或句子中,包括具有邏輯關(guān)系符的組合結(jié)構(gòu)。
4. 根據(jù)權(quán)利要求3所述的用于問答系統(tǒng)的問答匹配方法,其特征在于所述邏輯關(guān)系 符包括以下一個或超過一個的組合表示邏輯與的"AND"或"*",表示邏輯或的"OR"或"+ ",表示邏輯非的"NOT"或"-",以及用于確定邏輯運算次序的")"和"("。
5. 根據(jù)權(quán)利要求2所述的用于問答系統(tǒng)的問答匹配方法,其特征在于所述權(quán)重值的分配與問題解答用戶的專業(yè)領(lǐng)域、經(jīng)驗、以及經(jīng)歷相關(guān),或者與問題解答用戶所預(yù)先設(shè)定 的一組詞語或句子的總的數(shù)量相關(guān),或者與關(guān)鍵詞的重要性相關(guān)。
6. 根據(jù)權(quán)利要求1所述的用于問答系統(tǒng)的問答匹配方法,其特征在于對于所述預(yù)先設(shè)定的一組詞語和/或句子中包括的一些太常用以至沒有任何匹配價值的詞語和/或句子不 參與所述匹配程度值計算。
7.—種用于問答系統(tǒng)的問答方法,其特征在于,包括如下步驟步驟l,在問題解答用戶數(shù)據(jù)模塊中,列表存儲若干個問題解答用戶各自預(yù)先設(shè)定的一 組詞語和/或句子,或者還包括為其中的每個詞語和/或每個句子分配權(quán)重值; 步驟2 ,提問用戶通過用戶接口模塊提交問題到問答系統(tǒng);步驟3,由匹配程度計算模塊將該問題所具有的詞語或句子,逐個與問題解答用戶預(yù)先 設(shè)定的一組詞語和/或句子,就完全相同或語義相同的部分進行計數(shù)或加權(quán)計數(shù),分別得出 問題解答用戶的匹配程度值;步驟4,按照匹配程度值從高至低的次序,或者還包括限額條件,確定入選的問題解答用戶;入選的問題解答用戶響應(yīng)該問題,將答案提供給提問用戶。
8. 根據(jù)權(quán)利要求7所述的用于問答系統(tǒng)的問答方法,其特征在于所述將答案提供給 提問用戶的方式,可以由問答系統(tǒng)將入選的問題解答用戶預(yù)先存儲在問答系統(tǒng)中的答案直 接發(fā)送給提問用戶。
9. 根據(jù)權(quán)利要求7所述的用于問答系統(tǒng)的問答方法,其特征在于所述用戶接口模塊 支持以下接入方式中的一種或超過一種的組合短消息接入,電子郵件接入,網(wǎng)絡(luò)瀏覽器 接入。
10. 根據(jù)權(quán)利要求9所述的用于問答系統(tǒng)的問答方法,其特征在于對于每一種接入方 式,問答系統(tǒng)都有一個或多個對應(yīng)的通訊地址用于與該接入類型的用戶進行通訊。
11. 根據(jù)權(quán)利要求7所述的用于問答系統(tǒng)的問答方法,其特征在于所述問題解答用戶 數(shù)據(jù)模塊中,還可以包括存儲有問題解答用戶提供的地址信息,通過這些地址信息,問答 系統(tǒng)可以轉(zhuǎn)發(fā)提問用戶提交的問題,并接收問題解答用戶的答案。
12. 根據(jù)權(quán)利要求7所述的用于問答系統(tǒng)的問答方法,其特征在于所述問題解答用戶 入選的限額可以由問答系統(tǒng)指定,也可以由提問用戶指定。
13. 根據(jù)權(quán)利要求7所述的用于問答系統(tǒng)的問答方法,其特征在于對于所述預(yù)先設(shè)定 的一組詞語和/或句子中包括的一些太常用以至沒有任何匹配價值的詞語和/或句子不參與 所述匹配計算。
14. 一種問答系統(tǒng),其特征在于包括用戶接口模塊,問題解答用戶數(shù)據(jù)模塊,匹配程 度計算模塊和答案獲取及轉(zhuǎn)發(fā)模塊;所述用戶接口模塊,用于傳輸問答系統(tǒng)與用戶之間的提問及答案等信息; 所述問題解答用戶數(shù)據(jù)模塊,用于存儲問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子; 所述匹配程度計算模塊,用于計算接收的問題即提問用戶通過用戶接口模塊提交的問題,與每個問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子的匹配程度;所述答案獲取及轉(zhuǎn)發(fā)模塊,用于根據(jù)所述匹配程度的高低,確定問題解答用戶并將其答案提供給提問用戶。
15. 根據(jù)權(quán)利要求14所述的問答系統(tǒng),其特征在于所述問題解答用戶數(shù)據(jù)模塊,列 表存儲若干個問題解答用戶各自預(yù)先設(shè)定的一組詞語和/或句子,或者還包括為其中的每個 詞語和/或每個句子分配權(quán)重值。
16. 根據(jù)權(quán)利要求14所述的問答系統(tǒng),其特征在于所述匹配程度計算模塊,將提交問題所具有的詞語或句子,逐個與問題解答用戶預(yù)先設(shè)定的一組詞語和/或句子,就完全相 同或語義相同的部分進行計數(shù)或加權(quán)計數(shù),分別得出問題解答用戶的匹配程度值;所述答 案獲取及轉(zhuǎn)發(fā)模塊按照匹配程度值從高至低的次序,或者還包括限額條件,確定入選的問 題解答用戶;入選的問題解答用戶響應(yīng)該問題,將答案提供給提問用戶。
17. 根據(jù)權(quán)利要求16所述的問答系統(tǒng),其特征在于所述將答案提供給提問用戶的方 式,可以由問答系統(tǒng)將入選的問題解答用戶預(yù)先存儲在問答系統(tǒng)中的答案直接發(fā)送給提問 用戶。
18. 根據(jù)權(quán)利要求16所述的問答系統(tǒng),其特征在于對于所述預(yù)先設(shè)定的一組詞語和/ 或句子中包括的一些太常用以至沒有任何匹配價值的詞語和/或句子不參與所述匹配程度 值計算。
全文摘要
本發(fā)明公開了一種用于問答系統(tǒng)的問答匹配方法及問答方法和系統(tǒng),問題解答用戶預(yù)先向該系統(tǒng)提供了一組詞語或句子。當(dāng)提問用戶提交一個問題到問答系統(tǒng)后,計算該問題與每個問題解答用戶預(yù)先設(shè)定的這組詞語或句子的匹配程度;然后根據(jù)匹配程度的高低,確定一個或多個問題解答用戶,并將這些問題解答用戶的答案提供給當(dāng)前提問用戶。這種問答方法及其系統(tǒng)能夠保證找到最合適的問題解答用戶解答提問用戶的問題。
文檔編號H04Q7/22GK101257512SQ20081005748
公開日2008年9月3日 申請日期2008年2月2日 優(yōu)先權(quán)日2008年2月2日
發(fā)明者黃偉才 申請人:黃偉才