亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種問(wèn)題自動(dòng)生成的系統(tǒng)及其方法

文檔序號(hào):6463362閱讀:246來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::一種問(wèn)題自動(dòng)生成的系統(tǒng)及其方法
技術(shù)領(lǐng)域
:本發(fā)明涉及知識(shí)工程領(lǐng)域、自然語(yǔ)言處理領(lǐng)域及計(jì)算機(jī)網(wǎng)絡(luò)信息
技術(shù)領(lǐng)域
,特別是涉及一種問(wèn)題自動(dòng)生成的系統(tǒng)及其方法。
背景技術(shù)
:當(dāng)今的信息爆炸時(shí)代,用戶(hù)可通過(guò)多種渠道獲取信息,特別是通過(guò)互聯(lián)網(wǎng)或某些IT應(yīng)用系統(tǒng)的方式,已逐漸得到廣大用戶(hù)的青睞。但是,在提供信息的同時(shí),如何使用戶(hù)得到較高的理解程度也直接關(guān)系到用戶(hù)體驗(yàn),是信息提供商目前比較關(guān)心、希望解決的問(wèn)題。尤其當(dāng)頁(yè)面中顯示一段較長(zhǎng)的文字內(nèi)容時(shí),如果能夠根據(jù)文字內(nèi)容提供相關(guān)的提示或提問(wèn),將有助于用戶(hù)快速理解文章,評(píng)估自己對(duì)該文章的理解程度,以及進(jìn)一步學(xué)習(xí)。
發(fā)明內(nèi)容本發(fā)明所要解決的問(wèn)題是提供一種問(wèn)題自動(dòng)生成的系統(tǒng)及其方法,針對(duì)某一領(lǐng)域的文章,自動(dòng)生成相應(yīng)的該領(lǐng)域問(wèn)題。用戶(hù)可以利用生成的何題,評(píng)估自己對(duì)該文章的理解程度,以及進(jìn)一步學(xué)習(xí)。為了實(shí)現(xiàn)上述目的,本發(fā)明公開(kāi)了一種問(wèn)題自動(dòng)生成的方法,應(yīng)用于服務(wù)器中,當(dāng)所述服務(wù)器輸出一頁(yè)面時(shí),對(duì)于所述頁(yè)面中的文字內(nèi)容進(jìn)行分析,并自動(dòng)生成與所述文字內(nèi)容相關(guān)的問(wèn)題,所述方法包括如下歩驟步驟一,掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;步驟二,利用依存關(guān)系分析工具、該所屬領(lǐng)域的語(yǔ)義詞典、該所屬領(lǐng)域的語(yǔ)義分析工具分析各個(gè)句子,形成具有明確語(yǔ)義與語(yǔ)法關(guān)系的具體問(wèn)題源及問(wèn)題源表達(dá)式;步驟三,在一模板庫(kù)中,搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式,4獲取與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題及答案。所述步驟一中進(jìn)一步包括設(shè)置一概念-領(lǐng)域索引表,其中包含有多個(gè)領(lǐng)域概念與其對(duì)應(yīng)的領(lǐng)域之間的關(guān)聯(lián)度值;根據(jù)所述領(lǐng)域概念在所述概念-領(lǐng)域索弓I表中檢索對(duì)應(yīng)的關(guān)聯(lián)值;根據(jù)所述領(lǐng)域概念的關(guān)聯(lián)值獲得所述文字所屬的領(lǐng)域。所述步驟二進(jìn)一步包括利用依存關(guān)系分析工具分析句子的語(yǔ)法結(jié)構(gòu),對(duì)于符合名詞短語(yǔ)+動(dòng)詞短語(yǔ),名詞短語(yǔ)+介詞短語(yǔ)或者名詞短語(yǔ)+連接詞+名詞短語(yǔ)形式的句子,形成所述具體問(wèn)題源的步驟;利用語(yǔ)義詞典,獲取所述文字中每個(gè)語(yǔ)義概念在所述語(yǔ)義詞典中的概念類(lèi)型,作為語(yǔ)義標(biāo)簽,利用所述語(yǔ)義分析工具,分析句子的語(yǔ)義關(guān)系,獲得所述具體問(wèn)題源的問(wèn)題源表達(dá)式的步驟。所述模板庫(kù)包括問(wèn)題源表達(dá)式、與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題、答案。所述搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式的步驟進(jìn)一步包括:判斷動(dòng)詞是否相同、語(yǔ)義標(biāo)簽是否相同和語(yǔ)法結(jié)構(gòu)是否相同。本發(fā)明還公開(kāi)了一種問(wèn)題自動(dòng)生成的系統(tǒng),設(shè)置于服務(wù)器中,當(dāng)所述服務(wù)器輸出一頁(yè)面時(shí),所述系統(tǒng)用于對(duì)所述頁(yè)面中的文字內(nèi)容進(jìn)行分析,并自動(dòng)生成與所述文字內(nèi)容相關(guān)的問(wèn)題,所述系統(tǒng)包括領(lǐng)域概念識(shí)別模塊,用于掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;語(yǔ)法關(guān)系分析模塊,用于利用依存關(guān)系分析工具、該所屬領(lǐng)域的語(yǔ)義詞典、該所屬領(lǐng)域的語(yǔ)義分析工具,分析各個(gè)句子,形成具有明確語(yǔ)義與語(yǔ)法關(guān)系的具體問(wèn)題源及問(wèn)題源表達(dá)式;模板匹配模塊,用于在一模板庫(kù)中,搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式,以獲取與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題及答案。所述領(lǐng)域概念識(shí)別模塊中進(jìn)一步包括一概念-領(lǐng)域索引表,其中包含有多個(gè)領(lǐng)域概念與其對(duì)應(yīng)的領(lǐng)域之間的關(guān)聯(lián)度值,所述領(lǐng)域概念識(shí)別模塊根據(jù)所述領(lǐng)域概念在所述概念-領(lǐng)域索引表中檢索對(duì)應(yīng)的關(guān)聯(lián)值,并根據(jù)所述領(lǐng)域概念的關(guān)聯(lián)值獲得所述文字所屬的領(lǐng)域。所述依存關(guān)系分析工具,用于分析句子的語(yǔ)法結(jié)構(gòu),對(duì)于符合名詞短語(yǔ)+動(dòng)詞短語(yǔ),名詞短語(yǔ)+介詞短語(yǔ)或者名詞短語(yǔ)+連接詞+名詞短語(yǔ)形式的句子,形成所述具體問(wèn)題源;所述語(yǔ)義詞典,用于獲取所述文字中每個(gè)語(yǔ)義概念在所述語(yǔ)義詞典中的概念類(lèi)型,作為語(yǔ)義標(biāo)簽;所述語(yǔ)義分析工具,用于分析句子的語(yǔ)義關(guān)系,結(jié)合所述文字中每個(gè)語(yǔ)義概念的語(yǔ)義標(biāo)簽,獲得所述具體問(wèn)題源的問(wèn)題源表達(dá)式。所述模板庫(kù)中包括問(wèn)題源表達(dá)式、與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題、答案。所述模板匹配模塊根據(jù)動(dòng)詞是否相同、語(yǔ)義標(biāo)簽是否相同和語(yǔ)法結(jié)構(gòu)是否相同,判斷是否搜索到與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式。利用本發(fā)明的技術(shù)方案,可針對(duì)一頁(yè)面中顯示的文章,自動(dòng)生成與該文章內(nèi)容相關(guān)的問(wèn)題,幫助用戶(hù)高速有效的理解文章的內(nèi)容,提高閱讀效率。圖1所示為本發(fā)明的問(wèn)題自動(dòng)生成的系統(tǒng)的結(jié)構(gòu)示意圖;圖2所示為本發(fā)明的問(wèn)題自動(dòng)生成的方法的流程圖;圖3所示為本發(fā)明的實(shí)施例的依存關(guān)系結(jié)構(gòu)圖。具體實(shí)施方式以下配合實(shí)施例以及附圖,詳細(xì)描述本發(fā)明的技術(shù)特征。本發(fā)明公開(kāi)了一種問(wèn)題自動(dòng)生成系統(tǒng)及其方法。該系統(tǒng)用于對(duì)呈現(xiàn)給用戶(hù)終端的頁(yè)面中的文字內(nèi)容,自動(dòng)生成與該段文字內(nèi)容相匹配的問(wèn)題,以幫助用戶(hù)理解該段文字,評(píng)估理解程度,協(xié)助用戶(hù)進(jìn)行高效的學(xué)習(xí)。請(qǐng)參閱圖1所示為本發(fā)明的問(wèn)題自動(dòng)生成的系統(tǒng)的結(jié)構(gòu)示意圖。該問(wèn)題自動(dòng)生成系統(tǒng)10可設(shè)置于網(wǎng)絡(luò)服務(wù)器中,或IT應(yīng)用系統(tǒng)的控制管理單元中。該問(wèn)題自動(dòng)生成系統(tǒng)10包括功能控制模塊11、領(lǐng)域概念識(shí)別模塊12、語(yǔ)法關(guān)系分析模塊13、模板匹配模塊14、模板庫(kù)15。該功能控制模塊11用于控制是否啟動(dòng)該根據(jù)頁(yè)面內(nèi)容自動(dòng)生成問(wèn)題的功能,和/或,提供該問(wèn)題自動(dòng)生成系統(tǒng)10的參數(shù)設(shè)置功能。領(lǐng)域概念識(shí)別模塊12用于掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別該頁(yè)面中的文字所屬領(lǐng)域。該領(lǐng)域概念即一領(lǐng)域中的專(zhuān)用概念,如通信領(lǐng)域中的3G。語(yǔ)法關(guān)系分析模塊13用于分析頁(yè)面中的句子的語(yǔ)法結(jié)構(gòu)和語(yǔ)義標(biāo)簽間的語(yǔ)法關(guān)聯(lián),確定句子的語(yǔ)法及語(yǔ)義關(guān)系,獲得所述句子的具體問(wèn)題源及作為其抽象表示的問(wèn)題源表達(dá)式。語(yǔ)法關(guān)系分析模塊13包括有語(yǔ)義分析工具131、語(yǔ)義詞典132及依存關(guān)系分析工具133。該語(yǔ)義分析工具131可包括現(xiàn)有技術(shù)中常用的通信領(lǐng)域的d-EarParser、醫(yī)學(xué)領(lǐng)域的薩Tx,以及其他領(lǐng)域的常見(jiàn)語(yǔ)義分析工具;語(yǔ)義詞典132可包括信息處理領(lǐng)域的SKCC、醫(yī)學(xué)領(lǐng)域的UMLS中的Metathesaurus、英漢醫(yī)學(xué)詞典、醫(yī)學(xué)主題詞表,以及其他領(lǐng)域中的常見(jiàn)詞典。依存關(guān)系分析工具133可用于分析句子的語(yǔ)法成分、詞性及各個(gè)成分間的限定關(guān)系。模板匹配模塊14用于根據(jù)語(yǔ)法關(guān)系分析模塊13所確定的問(wèn)題源表達(dá)式,在模板庫(kù)15中查找匹配的問(wèn)題源表達(dá)式,并根據(jù)所找到的問(wèn)題源表達(dá)式獲取對(duì)應(yīng)的問(wèn)題以及答案。模板庫(kù)15中存儲(chǔ)有分屬不同領(lǐng)域的手工創(chuàng)建的模板,每個(gè)模板包括問(wèn)題源表達(dá)式、該問(wèn)題源表達(dá)式對(duì)應(yīng)的一個(gè)或多個(gè)問(wèn)題及每個(gè)問(wèn)題的正確答案。其中,問(wèn)題源表達(dá)式是一類(lèi)具有相同結(jié)構(gòu)及相關(guān)語(yǔ)義的(知識(shí))陳述句的泛化或抽象表示,包括若干語(yǔ)義標(biāo)簽以及用于限定語(yǔ)義關(guān)系的動(dòng)詞。問(wèn)題源表達(dá)式所屬的領(lǐng)域,由語(yǔ)義標(biāo)簽體現(xiàn),每個(gè)語(yǔ)義標(biāo)簽即對(duì)應(yīng)在自然語(yǔ)言形式的文字中,一語(yǔ)義概念在語(yǔ)義詞典中的概念類(lèi)型。該語(yǔ)義標(biāo)簽即為在語(yǔ)法關(guān)系的基礎(chǔ)上,對(duì)構(gòu)成語(yǔ)法關(guān)系的元素設(shè)置的用于標(biāo)識(shí)其對(duì)應(yīng)語(yǔ)義的標(biāo)簽。每個(gè)問(wèn)題源表達(dá)式對(duì)應(yīng)一個(gè)或多個(gè)問(wèn)題,選取問(wèn)題源表達(dá)式中的一個(gè)語(yǔ)義標(biāo)簽作為問(wèn)題目標(biāo)(即所期望的答案),即有了一個(gè)與該問(wèn)題目標(biāo)對(duì)應(yīng)的問(wèn)題,該問(wèn)題目標(biāo)即該問(wèn)題的正確答案。該語(yǔ)義標(biāo)簽對(duì)應(yīng)的語(yǔ)義概念即為具體的答案值。在模板庫(kù)中,對(duì)不同領(lǐng)域的模板分類(lèi)管理。在某些實(shí)施例中,也可不設(shè)置該功能控制模塊11,即默認(rèn)該問(wèn)題自動(dòng)生成功能處于開(kāi)啟狀態(tài),或者,不設(shè)置該領(lǐng)域概念識(shí)別模塊12,即保留特定領(lǐng)域的語(yǔ)義分析工具131及語(yǔ)義詞典132,僅為特定領(lǐng)域的內(nèi)容自動(dòng)生成問(wèn)題,或者,可設(shè)置自動(dòng)生成的問(wèn)題的數(shù)量。如圖2所示為本發(fā)明的問(wèn)題自動(dòng)生成的方法的流程圖。步驟201,當(dāng)功能控制模塊11捕捉到當(dāng)前顯示頁(yè)面發(fā)生改變的信號(hào)時(shí),判斷問(wèn)題自動(dòng)生成功能是否開(kāi)啟,如果是,執(zhí)行步驟202,如果否,重復(fù)執(zhí)行步驟201;步驟202,利用領(lǐng)域概念識(shí)別模塊12掃描頁(yè)面中的每個(gè)句子,識(shí)別文中的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;步驟203,對(duì)于每個(gè)句子,通過(guò)語(yǔ)法關(guān)系分析模塊13,分析句子的語(yǔ)法及語(yǔ)義關(guān)系,獲得所述句子的具體問(wèn)題源及其對(duì)應(yīng)的問(wèn)題源表達(dá)式;該步驟特別是利用了該語(yǔ)法關(guān)系分析模塊13中該文字所屬領(lǐng)域的語(yǔ)義分析工具、語(yǔ)義辭步驟204,模板匹配模塊14將分析得到的具體問(wèn)題源的問(wèn)題源表達(dá)式在模板庫(kù)15中的問(wèn)題源表達(dá)式進(jìn)行匹配;歩驟205,根據(jù)該匹配的問(wèn)題源表達(dá)式,獲取對(duì)應(yīng)的問(wèn)題以及答案,輸出至頁(yè)面。其中,管理員可通過(guò)功能控制模塊ll啟動(dòng)/關(guān)閉該問(wèn)題自動(dòng)生成系統(tǒng),設(shè)置對(duì)頁(yè)面的特定位置范圍內(nèi)的顯示內(nèi)容執(zhí)行該問(wèn)題自動(dòng)生成,設(shè)置該問(wèn)題自動(dòng)生成系統(tǒng)的運(yùn)行時(shí)間,和/或,設(shè)置為僅針對(duì)特定領(lǐng)域(例如僅針對(duì)醫(yī)學(xué)、法律等)的文字內(nèi)容生成問(wèn)題。以下詳細(xì)說(shuō)明本申請(qǐng)的實(shí)現(xiàn)過(guò)程。當(dāng)功能控制模塊11判斷問(wèn)題自動(dòng)生成功能處于開(kāi)啟狀態(tài)后,開(kāi)始以句號(hào)為標(biāo)志,掃描當(dāng)前頁(yè)面中的每個(gè)句子,以判斷該段文字所屬的領(lǐng)域。在服務(wù)器的存儲(chǔ)裝置中,事先存儲(chǔ)有一概念-領(lǐng)域索引表。該概念-領(lǐng)域索引表是根據(jù)事先所收集的不同領(lǐng)域的文章及語(yǔ)義詞典,針對(duì)每一領(lǐng)域,分別選取其中最能代表該領(lǐng)域、不存在跨領(lǐng)域的含義的代表性概念,S卩,領(lǐng)域概念,形成一領(lǐng)域概念集合。然后為該領(lǐng)域概念與其對(duì)應(yīng)的領(lǐng)域之間分別設(shè)定一個(gè)關(guān)聯(lián)度值,或概率,通過(guò)對(duì)當(dāng)前頁(yè)面中所包含的領(lǐng)域概念以及其對(duì)應(yīng)的關(guān)聯(lián)度值,可計(jì)算得到包含該領(lǐng)域概念的內(nèi)容屬于該領(lǐng)域的可能性。故而,在掃描過(guò)程中,對(duì)于掃描得到的每個(gè)單詞,首先將其于該領(lǐng)域概念集合中的每個(gè)單詞進(jìn)行匹配,對(duì)于匹配成功的單詞,根據(jù)該概念-領(lǐng)域索引表獲取于該單詞對(duì)應(yīng)的關(guān)聯(lián)度值。然后根據(jù)貝葉斯定理計(jì)算該文章屬于每個(gè)領(lǐng)域的概率,并取最大概率對(duì)應(yīng)的領(lǐng)域作為結(jié)果,或者取最大概率且概率高于一預(yù)定值的對(duì)應(yīng)領(lǐng)域作為結(jié)果。其中,具體的計(jì)算算法為<formula>formulaseeoriginaldocumentpage2</formula>T:一篇文章;w':文章中的第i個(gè)領(lǐng)域概念;m文章包含領(lǐng)域概念的數(shù)目;D"第j個(gè)領(lǐng)域;P(DJ":文章T屬于領(lǐng)域D'的概率;P(DJw'):包含第i個(gè)領(lǐng)域概念的文章屬于領(lǐng)域A的概率;A文章T應(yīng)屬于的領(lǐng)域。在獲得所屬領(lǐng)域后,接下來(lái)需利用該領(lǐng)域的依存關(guān)系分析工具133、該領(lǐng)域的領(lǐng)域的語(yǔ)義分析工具131及該領(lǐng)域的語(yǔ)義詞典132分析句子的語(yǔ)法及語(yǔ)義關(guān)系。例如作為掃描對(duì)象的文章包括一個(gè)句子為ARBdrugsarealsosuitableasfirstlineagentstotreathypertension.通過(guò)上述掃描過(guò)程,利用該概念-領(lǐng)域索引表,計(jì)算得到該文章屬于醫(yī)學(xué)領(lǐng)域的概率最高。故而,系統(tǒng)在后續(xù)將調(diào)用醫(yī)學(xué)領(lǐng)域的語(yǔ)義詞典,醫(yī)學(xué)語(yǔ)義分析工具。接下來(lái),利用斯坦福大學(xué)的依存關(guān)系分析工具,分析該句子的語(yǔ)法關(guān)系。語(yǔ)法關(guān)系是句子形式上的約束關(guān)系,在本發(fā)明中主要涉及到語(yǔ)法成分、詞性及各個(gè)成分間的限定關(guān)系。上例對(duì)應(yīng)的依存關(guān)系結(jié)構(gòu)為ARB/麗Pdrugs/NNSare/VBPalso/RBsuitable/JJas/INfirst/JJline/NNagents/NNSto/TOtreat/VBhypertension/NN./.如圖3所示。其中,NNP代表專(zhuān)有名詞,NNS代表名詞復(fù)數(shù),JJ代表形容詞,NN代表名9詞,VB代表動(dòng)詞,VBP代表動(dòng)詞第三人稱(chēng)單數(shù),PP代表介詞短語(yǔ),VP代表動(dòng)詞短語(yǔ),CC代表搭配,NP代表名詞短語(yǔ),RB代表副詞,ADVP代表副詞組。通過(guò)分析得到ARB是NNP、drugs是NN,它們一起構(gòu)成了一個(gè)名詞短語(yǔ);treat是VB,hypertension是NN,它們一起構(gòu)成了一個(gè)動(dòng)賓短語(yǔ)。具體的語(yǔ)法分析流程為,利用依存關(guān)系分析工具將句子進(jìn)行語(yǔ)法依存關(guān)系的分析匹配,得到如圖3所示的結(jié)果。對(duì)應(yīng)該流程,首先檢測(cè)句子的語(yǔ)法結(jié)構(gòu)是否滿(mǎn)足下面三種句式中的一種NP+VP,NP+PP或者NP+CC+NP,大部分的句子關(guān)系都可以通過(guò)這些形式發(fā)現(xiàn),不符合上述句式的句子將被忽略。圖3所述實(shí)施例,顯然符合NP+VP的結(jié)構(gòu)。進(jìn)而,對(duì)符合形式要求的句子,去掉ADVP,對(duì)于A(yíng)DVP以下包括的成分,刪除JJ,PP,RB,IN,TO等非主干成分。得到句子主干,即具體問(wèn)題源ARBdrugstreathypertension.下面利用醫(yī)學(xué)領(lǐng)域的語(yǔ)義詞典及語(yǔ)義分析工具,識(shí)別出具體問(wèn)題源中的語(yǔ)義概念,獲得其語(yǔ)義標(biāo)簽,以及分析具體問(wèn)題源的語(yǔ)義關(guān)系,以獲得具體問(wèn)題源的抽象表示,即問(wèn)題源表達(dá)式。在醫(yī)學(xué)領(lǐng)域中,作為語(yǔ)義詞典的統(tǒng)一醫(yī)學(xué)語(yǔ)言系統(tǒng)(UnifiedMedicalLanguageSystem,簡(jiǎn)稱(chēng)UMLS)是從語(yǔ)義網(wǎng)絡(luò)生成的,是為了理解醫(yī)學(xué)概念而建立的一個(gè)系統(tǒng)。UMLS系統(tǒng)中設(shè)計(jì)了索引詞典(Metathesaurus)和語(yǔ)義網(wǎng)絡(luò)(SemanticNetwork)兩個(gè)知識(shí)庫(kù),并建立一個(gè)系統(tǒng),來(lái)檢索問(wèn)題與各數(shù)據(jù)庫(kù)系統(tǒng)中所存有的大量生物醫(yī)學(xué)文獻(xiàn)間概念上的關(guān)聯(lián)。語(yǔ)義關(guān)系對(duì)應(yīng)著UMLS語(yǔ)義網(wǎng)絡(luò)中的關(guān)系,是句子邏輯上的知識(shí)結(jié)構(gòu),它將一個(gè)普通的句子用一種抽象的表達(dá)來(lái)揭示出其內(nèi)在的涵義。MetaMapTransfer(MMTx)是一個(gè)MetaMap的JAVA實(shí)現(xiàn),是一種醫(yī)學(xué)領(lǐng)域的語(yǔ)義分析工具。它可以把名詞短語(yǔ)映射到最匹配的UMLS術(shù)語(yǔ)(集)上。對(duì)于每個(gè)醫(yī)學(xué)短語(yǔ),MetaMap利用UMLS的專(zhuān)家語(yǔ)典可以得到它的同義詞、縮寫(xiě)形式、首字母縮寫(xiě)及其他拼寫(xiě)形式,這些不同形式都可以看作這一概念的候選。繼續(xù)上述例子,通過(guò)MMTx把ARBdrugs和hypertension映射到統(tǒng)一醫(yī)學(xué)語(yǔ)言系統(tǒng)(UMLS),發(fā)現(xiàn)它們所屬的類(lèi)型分別是〈Medicine〉和〈Disease〉。則將該類(lèi)型分別作為ARBdrugs和hypertension的語(yǔ)義標(biāo)簽。對(duì)于treat限定的這兩個(gè)醫(yī)學(xué)概念,左邊ARBdrugs短語(yǔ)是一種藥物,右邊hypertension短語(yǔ)是疾病,它們符合語(yǔ)義網(wǎng)絡(luò)語(yǔ)義限定。故而,可以得知該具體問(wèn)題源的語(yǔ)義關(guān)系為治療關(guān)系。將這些醫(yī)學(xué)概念用它們?cè)诮y(tǒng)一醫(yī)學(xué)語(yǔ)言系統(tǒng)中所屬的類(lèi)型代替,得到這些醫(yī)學(xué)具體問(wèn)題源的抽象表示,即問(wèn)題源表達(dá)式<Medicine>treat<Disease〉接下來(lái),結(jié)合具體問(wèn)題源,用具體問(wèn)題源的問(wèn)題源表達(dá)式匹配模板庫(kù)中的問(wèn)題源。模板庫(kù)中的問(wèn)題源為人工建立,具體建立過(guò)程例如為收集如下關(guān)于藥品治療的句子,然后利用醒Tx來(lái)識(shí)別出句子中的醫(yī)學(xué)概念。利用MetaMap將任意的文字映射到UMLS的索引詞典中,結(jié)果如下Asanaddedbenefit,<Substance>ACEinhibitors</Substance>mayreducean<Finding>enlargedheart</Finding〉(leftventricularhypertrophy)inpatientswith<Disease〉hypertension〈/Disease>.〈Medicine〉A(chǔ)cetaminophen〈/Medicine>isusedforthereliefof<Disease〉fever</Disease〉aswellasachesand<Symptom>pains〈Symptom>associatedwithmanyconditions.Inpatientswhohave<Disease〉hypertension</Disease〉inadditiontocertainseconddiseases,acombinationofan〈Medicine>ACEinhibitor〈/Medicine〉andan〈Medicine>ARB</Medicine〉drugmaybeeffectiveincontrollingthehypertensionandalsobenefitingtheseconddisease.通過(guò)對(duì)醫(yī)學(xué)領(lǐng)域文章的分析,得到與治療關(guān)系相關(guān)的概念類(lèi)型有藥品、癥狀、疾病,其中癥狀是輔助概念類(lèi)型,在問(wèn)題源中不列出這一元素。分析每個(gè)句子的語(yǔ)法結(jié)構(gòu),利用如上所述的依存關(guān)系分析工具,分析各個(gè)句子的語(yǔ)法關(guān)系,根據(jù)如上所述的流程去除非主干部分,得到句子主干,即具體問(wèn)題源,同時(shí),利用如上所述的方法,將具體問(wèn)題源中的語(yǔ)義概念映射到對(duì)應(yīng)的語(yǔ)義辭典,得到其語(yǔ)義標(biāo)簽,獲得具體問(wèn)題源的抽象表示,即問(wèn)題源表達(dá)式。在對(duì)大量句子的分析中,包括〈Medicine〉和〈Disease〉的問(wèn)題源表達(dá)式同樣可以包括reduce、treat、beeffectivein、bedrugsof、beusedfor等動(dòng)作詞匯?;谝陨系姆治?,模板庫(kù)中可包括如下藥物治療的問(wèn)題源表達(dá)式<Medicine〉[reduce,treat,beeffectivein,bedrugsof,beusedfor]〈Disease>則對(duì)應(yīng)該問(wèn)題源表達(dá)式可對(duì)應(yīng)設(shè)置如下問(wèn)題問(wèn)題1(動(dòng)作詞匯以treat為例)[]treat〈Disease〉。正確答案(問(wèn)題目標(biāo)):〈Medicine〉。問(wèn)題2(動(dòng)作詞匯以treat為例)〈Medicine〉treat[]。正確答案(問(wèn)題目標(biāo))〈Disease〉。在用具體問(wèn)題源的問(wèn)題源表達(dá)式匹配模板庫(kù)中的問(wèn)題源表達(dá)式的步驟中,包括判斷動(dòng)詞詞匯是否一致;具體問(wèn)題源的句子中所包含的語(yǔ)義概念的概念類(lèi)型已經(jīng)通過(guò)語(yǔ)義詞典來(lái)識(shí)別出來(lái),即已獲得語(yǔ)義標(biāo)簽,判斷它與模板庫(kù)中的問(wèn)題源表達(dá)式中包含的語(yǔ)義標(biāo)簽是否完全相同;動(dòng)詞詞匯與語(yǔ)義標(biāo)簽的限定關(guān)系,即語(yǔ)法結(jié)構(gòu)是否相同。如果匹配成功,根據(jù)匹配到模板庫(kù)中的問(wèn)題源對(duì)應(yīng)的具體問(wèn)題源中選取某個(gè)語(yǔ)義概念作為問(wèn)題目標(biāo)(同時(shí)也是正確答案),即可得到與該問(wèn)題目標(biāo)對(duì)應(yīng)的問(wèn)題,具體問(wèn)題源中的其他關(guān)聯(lián)的語(yǔ)義概念出現(xiàn)在問(wèn)題題干中。然后再?gòu)脑擃I(lǐng)域語(yǔ)義詞典中隨機(jī)選取若干與該問(wèn)題目標(biāo)不同的概念,與該問(wèn)題目標(biāo)一起作為該問(wèn)題的答案的選項(xiàng),供用戶(hù)選擇。例如,本申請(qǐng)中作為實(shí)施例的問(wèn)題源表達(dá)式的動(dòng)詞為treat,即可與模板庫(kù)中存在上述問(wèn)題源表達(dá)式匹配成功。故而,利用與該問(wèn)題源表達(dá)式對(duì)應(yīng)的具體問(wèn)題源中的語(yǔ)義概念,即可生成如下問(wèn)題問(wèn)題1:[]treathypertension.(或Whatcanbeusedforhypertension"A.ARBdrugsB.vitaminC.surgeonD.medicine答案A。問(wèn)題2:ARBdrugstreat[].(或WhatcanARBdrugsbeusedfor)A.vitaminB.hypertensionC.surgeonD.medicine答案B。在本發(fā)明的一個(gè)實(shí)施例中,針對(duì)100篇關(guān)于頭痛各個(gè)方面的醫(yī)學(xué)文章,用23個(gè)模板進(jìn)行測(cè)試。用戶(hù)有6人,對(duì)醫(yī)學(xué)知識(shí)和概念的了解水平都不盡相同。每個(gè)學(xué)習(xí)者做十余篇文章,籍此測(cè)試問(wèn)題生成的準(zhǔn)確度和幫助理解的作用。實(shí)驗(yàn)的結(jié)果如表1所示。表1.實(shí)驗(yàn)結(jié)果:文章模板問(wèn)題精確度準(zhǔn)確率1002388%83%從結(jié)果中可以發(fā)現(xiàn),文章中大多數(shù)的問(wèn)題都是準(zhǔn)確的,并且可以正確的作答。醫(yī)學(xué)知識(shí)比較匱乏的用戶(hù)在學(xué)習(xí)過(guò)程中受益更多。利用本發(fā)明的技術(shù)方案,可針對(duì)一頁(yè)面中顯示的文章,自動(dòng)生成與該文章內(nèi)容相關(guān)的問(wèn)題,幫助用戶(hù)高速有效的理解文章的內(nèi)容,提高閱讀效率。本發(fā)明的保護(hù)范圍不限于上述說(shuō)明,本領(lǐng)域的一般技術(shù)人員按本發(fā)明的構(gòu)思,可以對(duì)其做出修改或變動(dòng),它們應(yīng)屬于本發(fā)明的構(gòu)思范圍內(nèi)。權(quán)利要求1、一種問(wèn)題自動(dòng)生成的方法,應(yīng)用于服務(wù)器中,其特征在于,當(dāng)所述服務(wù)器輸出一頁(yè)面時(shí),對(duì)于所述頁(yè)面中的文字內(nèi)容進(jìn)行分析,并自動(dòng)生成與所述文字內(nèi)容相關(guān)的問(wèn)題,所述方法包括如下步驟步驟一,掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;步驟二,利用依存關(guān)系分析工具、該所屬領(lǐng)域的語(yǔ)義詞典、該所屬領(lǐng)域的語(yǔ)義分析工具分析各個(gè)句子,形成具有明確語(yǔ)義與語(yǔ)法關(guān)系的具體問(wèn)題源及問(wèn)題源表達(dá)式;步驟三,在一模板庫(kù)中,搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式,獲取與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題及答案。2、如權(quán)利要求l所述的方法,其特征在于,所述步驟一中進(jìn)一步包括設(shè)置一概念-領(lǐng)域索引表,其中包含有多個(gè)領(lǐng)域概念與其對(duì)應(yīng)的領(lǐng)域之間'的關(guān)聯(lián)度值;根據(jù)所述領(lǐng)域概念在所述概念-領(lǐng)域索弓I表中檢索對(duì)應(yīng)的關(guān)聯(lián)值;根據(jù)所述領(lǐng)域概念的關(guān)聯(lián)值獲得所述文字所屬的領(lǐng)域。3、如權(quán)利要求1所述的方法,其特征在于,所述步驟二進(jìn)一步包括利用依存關(guān)系分析工具分析句子的語(yǔ)法結(jié)構(gòu),對(duì)于符合名詞短語(yǔ)+動(dòng)詞短語(yǔ),名詞短語(yǔ)+介詞短語(yǔ)或者名詞短語(yǔ)+連接詞+名詞短語(yǔ)形式的句子,形成所述具體問(wèn)題源的步驟;利用語(yǔ)義詞典,獲取所述文字中每個(gè)語(yǔ)義概念在所述語(yǔ)義詞典中的概念類(lèi)型,作為語(yǔ)義標(biāo)簽,利用所述語(yǔ)義分析工具,分析句子的語(yǔ)義關(guān)系,獲得所述具體問(wèn)題源的問(wèn)題源表達(dá)式的步驟。4、如權(quán)利要求1所述的方法,其特征在于,所述模板庫(kù)中包括問(wèn)題源表達(dá)式、與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題、答案。5、如權(quán)利要求3所述的方法,其特征在于,所述搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式的步驟進(jìn)一步包括判斷動(dòng)詞是否相同、語(yǔ)義標(biāo)簽是否相同和語(yǔ)法結(jié)構(gòu)是否相同。6、一種問(wèn)題自動(dòng)生成的系統(tǒng),設(shè)置于服務(wù)器中,其特征在于,當(dāng)所述服務(wù)器輸出一頁(yè)面時(shí),所述系統(tǒng)用于對(duì)所述頁(yè)面中的文字內(nèi)容進(jìn)行分析,并自動(dòng)生成與所述文字內(nèi)容相關(guān)的問(wèn)題,所述系統(tǒng)包括領(lǐng)域概念識(shí)別模塊,用于掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;語(yǔ)法關(guān)系分析模塊,用于利用依存關(guān)系分析工具、該所屬領(lǐng)域的語(yǔ)義詞典、該所屬領(lǐng)域的語(yǔ)義分析工具,分析各個(gè)句子,形成具有明確語(yǔ)義與語(yǔ)法關(guān)系的具體問(wèn)題源及問(wèn)題源表達(dá)式;模板匹配模塊,用于在一模板庫(kù)中,搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式,以獲取與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題及答案。7、如權(quán)利要求6所述的系統(tǒng),其特征在于,所述領(lǐng)域概念識(shí)別模塊中進(jìn)一步包括一概念-領(lǐng)域索引表,其中包含有多個(gè)領(lǐng)域概念與其對(duì)應(yīng)的領(lǐng)域之間的關(guān)聯(lián)度值,所述領(lǐng)域概念識(shí)別模塊根據(jù)所述領(lǐng)域概念在所述概念-領(lǐng)域索弓I表中檢索對(duì)應(yīng)的關(guān)聯(lián)值,并根據(jù)所述領(lǐng)域概念的關(guān)聯(lián)值獲得所述文字所屬的領(lǐng)域。8、如權(quán)利要求6所述的系統(tǒng),其特征在于,所述依存關(guān)系分析工具,用于分析句子的語(yǔ)法結(jié)構(gòu),對(duì)于符合名詞短語(yǔ)+動(dòng)詞短語(yǔ),名詞短語(yǔ)+介詞短語(yǔ)或者名詞短語(yǔ)+連接詞+名詞短語(yǔ)形式的句子,形成所述具體問(wèn)題源;所述語(yǔ)義詞典,用于獲取所述文字中每個(gè)語(yǔ)義概念在所述語(yǔ)義詞典中的概念類(lèi)型,作為語(yǔ)義標(biāo)簽;所述語(yǔ)義分析工具,用于分析句子的語(yǔ)義關(guān)系,結(jié)合所述文字中每個(gè)語(yǔ)義概念的語(yǔ)義標(biāo)簽,獲得所述具體問(wèn)題源的問(wèn)題源表達(dá)式。9、如權(quán)利要求6所述的系統(tǒng),其特征在于,所述模板庫(kù)中包括問(wèn)題源表達(dá)式、與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題、答案。10、如權(quán)利要求8所述的系統(tǒng),其特征在于,所述模板匹配模塊根據(jù)動(dòng)詞是否相同、語(yǔ)義標(biāo)簽是否相同和語(yǔ)法結(jié)構(gòu)是否相同,判斷是否搜索到與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式。全文摘要本發(fā)明公開(kāi)了一種問(wèn)題自動(dòng)生成的系統(tǒng)及其方法,應(yīng)用于服務(wù)器中,當(dāng)服務(wù)器輸出一頁(yè)面時(shí),對(duì)于頁(yè)面中的文字內(nèi)容進(jìn)行分析,自動(dòng)生成與所述文字內(nèi)容相關(guān)的問(wèn)題,包括步驟一,掃描頁(yè)面中的文字,識(shí)別頁(yè)面中的屬于各領(lǐng)域的領(lǐng)域概念以識(shí)別文字所屬領(lǐng)域;步驟二,利用依存關(guān)系分析工具、該所屬領(lǐng)域的語(yǔ)義詞典、該所屬領(lǐng)域的語(yǔ)義分析工具分析各個(gè)句子,形成具有明確語(yǔ)義與語(yǔ)法關(guān)系的具體問(wèn)題源及問(wèn)題源表達(dá)式;步驟三,在一模板庫(kù)中,搜索與所述問(wèn)題源表達(dá)式匹配的問(wèn)題源表達(dá)式,獲取與所述問(wèn)題源表達(dá)式對(duì)應(yīng)的問(wèn)題及答案。利用本發(fā)明的技術(shù)方案,可針對(duì)一頁(yè)面中顯示的文章,自動(dòng)生成與該文章內(nèi)容相關(guān)的問(wèn)題,幫助用戶(hù)高速有效的理解文章的內(nèi)容,提高閱讀效率。文檔編號(hào)G06N5/00GK101261690SQ20081010443公開(kāi)日2008年9月10日申請(qǐng)日期2008年4月18日優(yōu)先權(quán)日2008年4月18日發(fā)明者劉文印申請(qǐng)人:北京百問(wèn)百答網(wǎng)絡(luò)技術(shù)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1