亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置的制作方法

文檔序號(hào):6656172閱讀:239來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置的制作方法
建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置。
背景技術(shù)
問(wèn)答社區(qū)(CQA,Community-basedQuestion Answering)是指諸如百度知道、搜搜問(wèn)問(wèn)等由網(wǎng)絡(luò)用戶之間相互提問(wèn)和回答的知識(shí)問(wèn)答平臺(tái)。由于其準(zhǔn)確性、及時(shí)性等優(yōu)勢(shì),近年來(lái)得到了迅速的發(fā)展。在問(wèn)答社區(qū)中涉及的問(wèn)答頁(yè)面通常以提問(wèn)作為標(biāo)題,以便與用戶 在搜索引擎中輸入的query進(jìn)行匹配,為用戶提供想要的信息。在目前的問(wèn)答社區(qū)中有兩個(gè)問(wèn)題亟待解決其一、提高基于問(wèn)答社區(qū)的信息搜索技術(shù)的準(zhǔn)確率。用戶在搜索時(shí)心里通常是存在一個(gè)清晰明確的問(wèn)句的,不過(guò)出于省時(shí)省力的考慮會(huì)僅輸入幾個(gè)關(guān)鍵詞作為query進(jìn)行搜索。例如用戶輸入“姚明身高”的query時(shí),想問(wèn)的問(wèn)句是“姚明的身高是多少? ”。對(duì)用戶輸入的query進(jìn)行搜索匹配時(shí),可能會(huì)匹配到雖然命中關(guān)鍵詞但與用戶實(shí)際想問(wèn)的問(wèn)句相關(guān)性較低的頁(yè)面。其二、如何根據(jù)熱點(diǎn)需求自動(dòng)導(dǎo)入提問(wèn),等待用戶回答。基于對(duì)上述兩個(gè)問(wèn)題的考量,如何利用搜索日志中的query生成需求明確且易于理解的問(wèn)句是關(guān)鍵。

發(fā)明內(nèi)容有鑒于此,本發(fā)明提供了一種建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置,以便于利用搜索日志中的query生成需求明確且易于理解的問(wèn)句。具體技術(shù)方案如下一種建立問(wèn)句生成模型的方法,所述問(wèn)句生成模型包括問(wèn)句模板與搜索請(qǐng)求query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率;該方法包括A、從搜索日志中,統(tǒng)計(jì)各query以及用戶從query對(duì)應(yīng)的搜索結(jié)果中點(diǎn)擊的問(wèn)句之間的對(duì)應(yīng)關(guān)系;B、從統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板,并將問(wèn)句模板以及問(wèn)句模板對(duì)應(yīng)的query記錄在數(shù)據(jù)庫(kù)中;C、計(jì)算各query到對(duì)應(yīng)問(wèn)句模板的概率,并將各query到問(wèn)句模板的概率記錄在所述數(shù)據(jù)庫(kù)中。其中,所述點(diǎn)擊的問(wèn)句為點(diǎn)擊的頁(yè)面標(biāo)題中所包含的問(wèn)句,且該問(wèn)句包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的各詞語(yǔ)。具體地,所述步驟B中從統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板可以包括將統(tǒng)計(jì)到的問(wèn)句中所包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的詞語(yǔ)抽象成變量槽的形式,并記錄變量槽與query進(jìn)行分詞處理后得到的各詞語(yǔ)的位置關(guān)系,從而得到問(wèn)句模板。
在所述步驟C中,按照公式尸(沙|以)=(c^^.)計(jì)算query Qri到問(wèn)句模板Tp的概率 P (Tp I Qri);其中,C(Qri)表示Qri在所述搜索日志中出現(xiàn)的次數(shù),c (Tp, Qri)表示Qri對(duì)應(yīng)到Tp的次數(shù)。一種問(wèn)句生成方法,該方法包括A、確定用戶輸入的搜索請(qǐng)求Qr在問(wèn)句生成模型中的相似query,所述問(wèn)句生成模型包括問(wèn)句模板與query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率;B、從所述相似query在問(wèn)句生成模型中對(duì)應(yīng)的各問(wèn)句模板中,為所述Qr選擇問(wèn)句模板;C、利用所述Qr對(duì)選擇的問(wèn)句模板進(jìn)行實(shí)例化,得到所述Qr對(duì)應(yīng)的問(wèn)句。
其中,所述步驟A中確定出的相似query與所述Qr具有相同個(gè)數(shù)的詞語(yǔ),且與所述Qr至少含有一個(gè)相同的詞語(yǔ)。 所述步驟B具體包括B11、將所述相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的候選問(wèn)句模板;B12、利用所述Qr與相似query的相似度以及問(wèn)句生成模型中相似query到相似query對(duì)應(yīng)各問(wèn)句模板的概率,確定所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率;B13、選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率滿足預(yù)設(shè)條件的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板。此時(shí),所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率采用如下公式計(jì)算f{Tp} ,Qr) = Iog^j ρ(Τρ} \Qrt )p(Qr1 \Qr);
i=\其中,f (Tpj, Qr)為所述Qr到問(wèn)句模板Tpj的概率,Qri為所述相似query中對(duì)應(yīng)Tpj的相似query, P (Qri I Qr)為Qr與Qri的相似度為步驟A確定出的相似query中對(duì)應(yīng)Tpj的相似query數(shù)目,p (Tpj | Qri)為問(wèn)句生成模型中Qri到問(wèn)句模板Tpj的概率。所述步驟B13具體包括選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值達(dá)到預(yù)設(shè)的模板概率閾值的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板;或者,選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值排在前NI個(gè)的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板,其中NI為預(yù)設(shè)的正整數(shù)。此時(shí)更進(jìn)一步地,在所述步驟C之后還包括利用所述問(wèn)句的通順度,或者,利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度,為所述步驟C得到的各問(wèn)句打分,選擇分值排在前N2個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N2為預(yù)設(shè)的正整數(shù)?;蛘?所述步驟B具體包括將問(wèn)句生成模型中所述相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的問(wèn)句模板。此時(shí)更進(jìn)一步地,在所述步驟C之后還包括利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度中的一種或組合,為所述步驟C得到的各問(wèn)句打分,選擇分值排在前N3個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N3為預(yù)設(shè)的正整數(shù)。其中
權(quán)利要求
1.一種建立問(wèn)句生成模型的方法,其特征在于,所述問(wèn)句生成模型包括問(wèn)句模板與搜索請(qǐng)求query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率;該方法包括 A、從搜索日志中,統(tǒng)計(jì)各query以及用戶從query對(duì)應(yīng)的搜索結(jié)果中點(diǎn)擊的問(wèn)句之間的對(duì)應(yīng)關(guān)系; B、從統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板,并將問(wèn)句模板以及問(wèn)句模板對(duì)應(yīng)的query記錄在數(shù)據(jù)庫(kù)中; C、計(jì)算各query到對(duì)應(yīng)問(wèn)句模板的概率,并將各query到問(wèn)句模板的概率記錄在所述數(shù)據(jù)庫(kù)中。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述點(diǎn)擊的問(wèn)句為點(diǎn)擊的頁(yè)面標(biāo)題中所包含的問(wèn)句,且該問(wèn)句包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的各詞語(yǔ)。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟B中從統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板具體包括 將統(tǒng)計(jì)到的問(wèn)句中所包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的詞語(yǔ)抽象成變量槽的形式,并記錄變量槽與query進(jìn)行分詞處理后得到的各詞語(yǔ)的位置關(guān)系,從而得到問(wèn)句模板。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,在所述步驟C中,按照公式
5.—種問(wèn)句生成方法,其特征在于,該方法包括 A、確定用戶輸入的搜索請(qǐng)求Qr在問(wèn)句生成模型中的相似query,所述問(wèn)句生成模型包括問(wèn)句模板與query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率; B、從所述相似query在問(wèn)句生成模型中對(duì)應(yīng)的各問(wèn)句模板中,為所述Qr選擇問(wèn)句模板; C、利用所述Qr對(duì)選擇的問(wèn)句模板進(jìn)行實(shí)例化,得到所述Qr對(duì)應(yīng)的問(wèn)句。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟A中確定出的相似query與所述Qr具有相同個(gè)數(shù)的詞語(yǔ),且與所述Qr至少含有一個(gè)相同的詞語(yǔ)。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟B具體包括 BI I、將所述相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的候選問(wèn)句模板; B12、利用所述Qr與相似query的相似度以及問(wèn)句生成模型中相似query到相似query對(duì)應(yīng)各問(wèn)句模板的概率,確定所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率; B13、選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率滿足預(yù)設(shè)條件的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率采用如下公式計(jì)算
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述步驟B13具體包括 選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值達(dá)到預(yù)設(shè)的模板概率閾值的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板;或者, 選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值排在前NI個(gè)的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板,其中NI為預(yù)設(shè)的正整數(shù)。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,在所述步驟C之后還包括 利用所述問(wèn)句的通順度,或者,利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度,為所述步驟C得到的各問(wèn)句打分,選擇分值排在前N2個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N2為預(yù)設(shè)的正整數(shù)。
11.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟B具體包括 將問(wèn)句生成模型中所述相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的問(wèn)句模板。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,在所述步驟C之后還包括 利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度中的一種或組合,為所述步驟C得到的各問(wèn)句打分,選擇分值排在前N3個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N3為預(yù)設(shè)的正整數(shù)。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率,為所述步驟C得到的各問(wèn)句打分具體為 按照V (qs) = f (Tpc, Qr),得到問(wèn)句qs的打分值V (qs); 其中,
14.根據(jù)權(quán)利要求10或12所述的方法,其特征在于,利用所述問(wèn)句的通順度,為所述步驟C得到的各問(wèn)句打分具體為按照
15.根據(jù)權(quán)利要求10或12所述的方法,其特征在于,利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度,為所述步驟C得到的各問(wèn)句打分具體為 按照 V(qs)=入 f(Tpc, Qr) + (1_X Kjj/qs),得到問(wèn)句 qs 的打分值 V(qs); 其中,λ為預(yù)設(shè)的權(quán)值參數(shù),Tpc為得到qs所使用的問(wèn)句模板,
16.根據(jù)權(quán)利要求8或13所述的方法,其特征在于,所述P(Qri I Qr)為 K PiQr1 \Qr) = Π sim^tQn tk J ;其中f 、為 Qri 中第 k 個(gè)詞語(yǔ) Qri k 和 Qr 中第 k=l——^imVQri _k->lQr _k)—k個(gè)詞語(yǔ)Qr k之間的相似度。
17.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟C具體包括 按照所述問(wèn)句模板記錄的變量槽與query進(jìn)行分詞處理后各詞語(yǔ)的位置關(guān)系,將所述Qr進(jìn)行分詞處理后得到的各詞語(yǔ)填充至所述問(wèn)句模板的變量槽,得到所述Qr對(duì)應(yīng)的問(wèn)句。
18.一種建立問(wèn)句生成模型的裝置,其特征在于,所述問(wèn)句生成模型包括問(wèn)句模板與搜索請(qǐng)求query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率;該裝置包括日志統(tǒng)計(jì)單元、模板抽取單元和概率計(jì)算單元; 所述日志統(tǒng)計(jì)單元,用于從搜索日志中,統(tǒng)計(jì)各query以及用戶從query對(duì)應(yīng)的搜索結(jié)果中點(diǎn)擊的問(wèn)句之間的對(duì)應(yīng)關(guān)系; 所述模板抽取單元,用于從所述日志統(tǒng)計(jì)單元統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板,并將問(wèn)句模板以及問(wèn)句模板對(duì)應(yīng)的query記錄在數(shù)據(jù)庫(kù)中; 所述概率計(jì)算單元,用于計(jì)算各query到對(duì)應(yīng)問(wèn)句模板的概率,并將各問(wèn)句到對(duì)應(yīng)模板的概率記錄在所述數(shù)據(jù)庫(kù)中。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述點(diǎn)擊的問(wèn)句為點(diǎn)擊的頁(yè)面標(biāo)題中所包含的問(wèn)句,且該問(wèn)句包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的各詞語(yǔ)。
20.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述模板抽取單元具體包括分詞處理子單元、變量槽形成子單元和位置記錄子單元; 所述分詞處理子單元,用于將所述日志統(tǒng)計(jì)單元統(tǒng)計(jì)到的query進(jìn)行分詞處理; 所述變量槽形成子單元,用于將所述日志統(tǒng)計(jì)單元統(tǒng)計(jì)到的問(wèn)句中所包含對(duì)應(yīng)query進(jìn)行分詞處理后得到的詞語(yǔ)抽象成變量槽的形式,以形成問(wèn)句模板,將問(wèn)句模板以及問(wèn)句模板對(duì)應(yīng)的query記錄在所述數(shù)據(jù)庫(kù)中; 所述位置記錄子單元,用于記錄變量槽與query進(jìn)行分詞處理后得到的各詞語(yǔ)的位置關(guān)系至所述數(shù)據(jù)庫(kù)中。
21.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述概率計(jì)算單元具體按照公式P(Tp\Qri) = ( 計(jì)算 query Qri 到問(wèn)句模板 Tp 的概率 P (Tp | Qri); cKQr1) 其中,c (Qri)表示Qri在所述搜索日志中出現(xiàn)的次數(shù),c (Tp, Qri)表示Qri對(duì)應(yīng)到Tp的次數(shù)。
22.一種問(wèn)句生成裝置,其特征在于,該裝置包括相似query確定單元、模板選擇單元和問(wèn)句生成單元; 所述相似query確定單元,用于確定用戶輸入的搜索請(qǐng)求Qr在問(wèn)句生成模型中的相似query ; 所述模板選擇單元,用于從所述相似query在問(wèn)句生成模型中對(duì)應(yīng)的各問(wèn)句模板中,為所述Qr選擇問(wèn)句模板; 所述問(wèn)句生成單元,用于利用所述Qr對(duì)所述模板選擇單元選擇的問(wèn)句模板進(jìn)行實(shí)例化,得到所述Qr對(duì)應(yīng)的問(wèn)句; 其中,所述問(wèn)句生成模型包括問(wèn)句模板與query之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率。
23.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述相似query確定單元確定出的相似query與所述Qr具有相同個(gè)數(shù)的詞語(yǔ),且與所述Qr至少含有一個(gè)相同的詞語(yǔ)。
24.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述模板選擇單元具體包括候選模板選擇子單元、概率計(jì)算子單元和模板確定子單元; 所述候選模板選擇子單元,用于將所述相似query確定單元確定出的相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的候選問(wèn)句模板; 所述概率計(jì)算子單元,用于利用所述Qr與相似query的相似度以及問(wèn)句生成模型中相似query到相似query對(duì)應(yīng)各問(wèn)句模板的概率,確定所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率; 所述模板確定子單元,用于選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率滿足預(yù)設(shè)條件的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板。
25.根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述概率計(jì)算子單元采用公式I(Tpj^Qr) = ^Y^piTp\Qr^p{Qr\Qr),計(jì)算所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率;1=\ 其中,f (Tpj, Qr)為所述Qr到問(wèn)句模板Tpj的概率,Qri為所述相似query中對(duì)應(yīng)Tpj的相似query, p (Qri | Qr)為Qr與Qri的相似度,m為所述相似query確定單元確定出的相似query中對(duì)應(yīng)Tpj的相似query數(shù)目,p (Tpj | Qri)為問(wèn)句生成模型中Qri到問(wèn)句模板Tpj的概率。
26.根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述模板確定子單元選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值達(dá)到預(yù)設(shè)的模板概率閾值的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板;或者, 選擇所述Qr到對(duì)應(yīng)各候選問(wèn)句模板的概率值排在前NI個(gè)的候選問(wèn)句模板作為所述Qr對(duì)應(yīng)的問(wèn)句模板,其中NI為預(yù)設(shè)的正整數(shù)。
27.根據(jù)權(quán)利要求24所述的裝置,其特征在于,該裝置還包括第一問(wèn)句選擇單元,用于利用所述問(wèn)句的通順度,或者,利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度,為所述問(wèn)句生成單元得到的各問(wèn)句打分,選擇分值排在前N2個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N2為預(yù)設(shè)的正整數(shù)。
28.根據(jù)權(quán)利要求27所述的裝置,其特征在于,所述第一問(wèn)句選擇單元具體按照V(qs)=fLM(qs)或者 V(qs)=入 f(Tpc, Qr) + (1_X Kjj/qs),得到問(wèn)句 qs 的打分值 V(qs);其中
29.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述模板選擇單元具體將問(wèn)句生成模型中所述相似query對(duì)應(yīng)的各問(wèn)句模板確定為所述Qr對(duì)應(yīng)的問(wèn)句模板。
30.根據(jù)權(quán)利要求29所述的裝置,其特征在于,該裝置還包括第二問(wèn)句選擇單元,用于利用所述Qr到所述問(wèn)句所使用問(wèn)句模板的概率和所述問(wèn)句的通順度中的一種或組合,為所述問(wèn)句生成單元得到的各問(wèn)句打分,選擇分值排在前N3個(gè)的問(wèn)句作為最終所述Qr對(duì)應(yīng)的問(wèn)句,其中N3為預(yù)設(shè)的正整數(shù)。
31.根據(jù)權(quán)利要求30所述的裝置,其特征在于,所述第二問(wèn)句選擇單元具體按照V(qs)=f (Tpc, Qr) >V(qs) = fLM(qs)或者 V (qs)=入 f (Tpc, Qr) + (I-λ ) fLM(qs),得到問(wèn)句 qs 的打分值V(qs); 其中,
32.根據(jù)權(quán)利要求28或31所述的裝置,其特征在于,所述
33.根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述問(wèn)句生成單元具體按照所述問(wèn)句模板記錄的變量槽與query進(jìn)行分詞處理后各詞語(yǔ)的位置關(guān)系,將所述Qr進(jìn)行分詞處理后得到的各詞語(yǔ)填充至所述問(wèn)句模板的變量槽,得到所述Qr對(duì)應(yīng)的問(wèn)句。
全文摘要
本發(fā)明提供了一種建立問(wèn)句生成模型的方法和裝置以及問(wèn)句生成方法和裝置,建立的問(wèn)句生成模型包括問(wèn)句模板與搜索請(qǐng)求(query)之間的對(duì)應(yīng)關(guān)系以及各query到對(duì)應(yīng)問(wèn)句模板的概率;其中建立問(wèn)句模型的方法包括從搜索日志中,統(tǒng)計(jì)各query以及用戶從query對(duì)應(yīng)的搜索結(jié)果中點(diǎn)擊的問(wèn)句之間的對(duì)應(yīng)關(guān)系;從統(tǒng)計(jì)到的問(wèn)句中抽取出問(wèn)句模板,并記錄問(wèn)句模板對(duì)應(yīng)的query;計(jì)算各query到對(duì)應(yīng)問(wèn)句模板的概率。問(wèn)句生成方法包括確定用戶輸入的搜索請(qǐng)求Qr在問(wèn)句生成模型中的相似query;從相似query在問(wèn)句生成模型中對(duì)應(yīng)的各問(wèn)句模板中,為Qr選擇問(wèn)句模板;利用Qr對(duì)問(wèn)句模板進(jìn)行實(shí)例化,得到Qr對(duì)應(yīng)的問(wèn)句。
文檔編號(hào)G06F17/30GK102737042SQ20111008791
公開(kāi)日2012年10月17日 申請(qǐng)日期2011年4月8日 優(yōu)先權(quán)日2011年4月8日
發(fā)明者方高林, 王海峰, 趙世奇 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1