亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

針對(duì)用戶查詢句的類型識(shí)別方法及裝置制造方法

文檔序號(hào):6637664閱讀:157來(lái)源:國(guó)知局
針對(duì)用戶查詢句的類型識(shí)別方法及裝置制造方法
【專利摘要】本發(fā)明實(shí)施例公開(kāi)了一種針對(duì)用戶查詢句的類型識(shí)別方法及裝置,其中所述方法包括:獲取用戶查詢句;對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句;在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。本發(fā)明實(shí)施例提供的技術(shù)方案能夠?qū)τ脩糨斎氲木哂腥我庑缘闹形牟樵兙溥M(jìn)行問(wèn)題判定及問(wèn)題類型的識(shí)別,以便后續(xù)搜索引擎據(jù)此進(jìn)行相關(guān)資源的搜索,從而提高搜索結(jié)果的準(zhǔn)確度,滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
【專利說(shuō)明】針對(duì)用戶查詢句的類型識(shí)別方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及一種針對(duì)用戶查詢句的類型識(shí)別方法及裝置。

【背景技術(shù)】
[0002]傳統(tǒng)的搜索引擎在獲取到用戶輸入的查詢句后,通常是基于詞袋的匹配方法在資源庫(kù)中查找與查詢句相關(guān)聯(lián)的資源信息,作為搜索結(jié)果。但是,搜索引擎中的問(wèn)答類查詢句需求往往與普通的搜索需求不同,用戶想要獲取的是問(wèn)題的答案,而非與問(wèn)題本身相關(guān)的信息,因此對(duì)于問(wèn)答類查詢句的搜索結(jié)果而言,其準(zhǔn)確率很低,無(wú)法滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
[0003]在現(xiàn)有技術(shù)中,watson(沃森)系統(tǒng)提供了一種專門針對(duì)問(wèn)題類型的查詢句的搜索系統(tǒng),該系統(tǒng)要求用戶輸入的查詢句的類型必須是問(wèn)題類型,之后從查詢句中直接提取出一個(gè)答案的定型詞,來(lái)表示答案的類型,進(jìn)而根據(jù)答案類型提取結(jié)果和查詢句進(jìn)行相關(guān)資源的搜索。并且,watson系統(tǒng)僅適用于英文問(wèn)答類搜索。
[0004]雖然watson系統(tǒng)的搜索結(jié)果在一定程度上滿足了用戶需求,但是該系統(tǒng)對(duì)用戶輸入的查詢句有著嚴(yán)格的要求,存在一定的局限性,無(wú)法適用于對(duì)用戶輸入的具有任意性的中文查詢句的搜索。


【發(fā)明內(nèi)容】

[0005]本發(fā)明實(shí)施例提供一種針對(duì)用戶查詢句的類型識(shí)別方法及裝置,以能夠?qū)τ脩糨斎氲木哂腥我庑缘闹形牟樵兙溥M(jìn)行問(wèn)題判定及問(wèn)題類型的識(shí)別,以便后續(xù)搜索引擎據(jù)此進(jìn)行相關(guān)資源的搜索,從而提高搜索結(jié)果的準(zhǔn)確度,滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
[0006]第一方面,本發(fā)明實(shí)施例提供了一種針對(duì)用戶查詢句的類型識(shí)別方法,該方法包括:
[0007]獲取用戶查詢句;
[0008]對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句;
[0009]在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
[0010]第二方面,本發(fā)明實(shí)施例還提供了一種針對(duì)用戶查詢句的類型識(shí)別裝置,該裝置包括:
[0011]用戶查詢句獲取單元,用于獲取用戶查詢句;
[0012]用戶查詢句類型判定單元,用于對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句;
[0013]問(wèn)題類型識(shí)別單元,用于在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
[0014]本發(fā)明實(shí)施例提供的技術(shù)方案,在獲取到用戶查詢句之后,首先判斷該用戶查詢句是否為問(wèn)題類查詢句,并在是的情況下識(shí)別用戶查詢句所屬的問(wèn)題類型。因此,本發(fā)明實(shí)施例能夠?qū)τ脩糨斎氲木哂腥我庑缘闹形牟樵兙溥M(jìn)行問(wèn)題判定及問(wèn)題類型的識(shí)別,以便后續(xù)搜索引擎據(jù)此進(jìn)行相關(guān)資源的搜索,從而可以提高搜索結(jié)果的準(zhǔn)確度,滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。

【專利附圖】

【附圖說(shuō)明】
[0015]圖1是本發(fā)明實(shí)施例一提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖;
[0016]圖2是本發(fā)明實(shí)施例二提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖;
[0017]圖3是本發(fā)明實(shí)施例三提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖;
[0018]圖4是本發(fā)明實(shí)施例四提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖;
[0019]圖5是本發(fā)明實(shí)施例五提供的一種針對(duì)用戶查詢句的類型識(shí)別裝置的結(jié)構(gòu)示意圖;
[0020]圖6是本發(fā)明實(shí)施例六提供的一種針對(duì)用戶查詢句的類型識(shí)別裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0021]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0022]實(shí)施例一
[0023]圖1是本發(fā)明實(shí)施例一提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖,該方法可以由針對(duì)用戶查詢句的類型識(shí)別裝置來(lái)執(zhí)行,所述裝置可由軟件和/或硬件實(shí)現(xiàn)。參見(jiàn)圖1,本實(shí)施例提供的針對(duì)用戶查詢句的類型識(shí)別方法具體包括如下操作:
[0024]操作110、獲取用戶查詢句。
[0025]操作120、對(duì)用戶查詢句進(jìn)行類型判定,以確定用戶查詢句是否為問(wèn)題類查詢句。
[0026]操作130、在確定用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別用戶查詢句所屬的問(wèn)題類型。
[0027]在本實(shí)施例中,用戶查詢句可為對(duì)用戶在搜索引擎提供的搜索欄中輸入的文本信息進(jìn)行處理得到的句子。其中,所述處理可包括:字符糾錯(cuò)、去除預(yù)設(shè)的無(wú)用字符(例如去除標(biāo)點(diǎn)符號(hào))、大小寫(xiě)轉(zhuǎn)換等。
[0028]現(xiàn)有技術(shù)提供的方案,在獲取到用戶查詢句后,通常是對(duì)該查詢句進(jìn)行諸如分詞省略、分詞同義詞擴(kuò)展等之類的處理,得到搜索語(yǔ)句;然后在資源庫(kù)中查找與搜索語(yǔ)句中的各分詞相似度較高的資源信息,作為搜索結(jié)果。但是,用戶對(duì)問(wèn)答類的用戶查詢句的搜索需求往往與其他類別的用戶查詢句的搜索需求不同。對(duì)于問(wèn)答類的用戶查詢句而言,用戶想要獲取的是用戶查詢句中所包含的問(wèn)題的答案,而非與問(wèn)題本身相關(guān)的信息。
[0029]為此,本實(shí)施例在獲取到用戶查詢句后,對(duì)該用戶查詢句進(jìn)行一個(gè)類型識(shí)別的過(guò)程,通過(guò)該類型識(shí)別過(guò)程,來(lái)確定用戶查詢句是否為問(wèn)題類查詢句以及用戶查詢句所屬的問(wèn)題類型,進(jìn)而使得搜索引擎可同時(shí)結(jié)合類型識(shí)別結(jié)果與傳統(tǒng)的匹配算法(例如基于詞袋的匹配算法),在資源庫(kù)中查找相應(yīng)的資源信息作為搜索結(jié)果。特別是,在用戶查詢句為問(wèn)題類查詢句的情況下,搜索引擎可根據(jù)類型識(shí)別結(jié)果與傳統(tǒng)的匹配算法,在資源庫(kù)中查找與用戶查詢句關(guān)聯(lián)度較高的且與問(wèn)題類型對(duì)應(yīng)的答案信息,作為搜索結(jié)果,從而大大提升了用戶的搜索體驗(yàn),提高了搜索結(jié)果的準(zhǔn)確度。
[0030]在本發(fā)明實(shí)施例中,在獲取到用戶查詢句之后,在對(duì)用戶查詢句進(jìn)行類型判定之前,可對(duì)該查詢句進(jìn)行基礎(chǔ)詞法分析,該分析包括:切詞、詞性標(biāo)注、專名識(shí)別以及句法分析等。其中句法分析指的是對(duì)該查詢句中各分詞之間的依存關(guān)系的解析。對(duì)用戶查詢句進(jìn)行類型的判定,以及對(duì)用戶查詢句所屬的問(wèn)題類型的識(shí)別,可通過(guò)采用機(jī)器學(xué)習(xí)算法學(xué)習(xí)得到的分類器來(lái)實(shí)現(xiàn)。
[0031]本實(shí)施例提供的技術(shù)方案,在獲取到用戶查詢句之后,首先判斷該用戶查詢句是否為問(wèn)題類查詢句,并在是的情況下識(shí)別用戶查詢句所屬的問(wèn)題類型。因此,本實(shí)施例能夠?qū)τ脩糨斎氲木哂腥我庑缘闹形牟樵兙溥M(jìn)行問(wèn)題判定及問(wèn)題類型的識(shí)別,以便后續(xù)搜索引擎據(jù)此進(jìn)行相關(guān)資源的搜索,從而可以提高搜索結(jié)果的準(zhǔn)確度,滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
[0032]實(shí)施例二
[0033]圖2是本發(fā)明實(shí)施例二提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖。本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上,進(jìn)一步優(yōu)化對(duì)用戶查詢句進(jìn)行類型判定的操作。參見(jiàn)圖2,本實(shí)施例提供的方法具體包括如下操作:
[0034]操作210、獲取用戶查詢句。
[0035]操作220、確定用戶查詢句在預(yù)設(shè)的多個(gè)第一特征下的特征值。
[0036]操作230、將確定的特征值作為預(yù)先生成的問(wèn)題判定分類器的輸入,基于問(wèn)題判定分類器來(lái)判斷用戶查詢句是否為問(wèn)題類查詢句。
[0037]在本實(shí)施例中,各式各樣的用戶查詢句的類型可被劃分為多種類型,例如問(wèn)題類型、知識(shí)查找類型、視頻下載類型、圖片下載類型等。在獲取到用戶查詢句之后,需對(duì)該用戶查詢句的類型加以判定,以確定該用戶查詢句是不是問(wèn)題,也即確定該用戶查詢句是否為問(wèn)題類查詢句。為此,可預(yù)先根據(jù)機(jī)器學(xué)習(xí)算法,對(duì)大量的附有人工標(biāo)注信息的用戶查詢句樣本在預(yù)設(shè)的多個(gè)第一特征下的特征值進(jìn)行訓(xùn)練,得到一個(gè)問(wèn)題判定分類器。對(duì)于任意用戶查詢句樣本,其對(duì)應(yīng)的人工標(biāo)注信息為由人工標(biāo)注的用于標(biāo)識(shí)該樣本是否屬于問(wèn)題的信息。該問(wèn)題判定分類器的輸入是用戶查詢句在預(yù)設(shè)的多個(gè)第一特征下的特征值,輸出是該用戶查詢句的是否為問(wèn)題,若是問(wèn)題,則可判定該用戶查詢句是問(wèn)題類查詢句。
[0038]其中,預(yù)設(shè)的多個(gè)第一特征包括正例特征和/或反例特征,所述正例特征為用于表征任意查詢句屬于問(wèn)題類查詢句的特征,所述反例特征為用于表征任意查詢句不屬于問(wèn)題類查詢句的特征。如果用戶查詢句越接近于是問(wèn)題類查詢句,則其在正例特征下的特征值就會(huì)越大,在反例特征下的特征值就會(huì)越小。
[0039]在本實(shí)施例的一種優(yōu)選的實(shí)施方式中,所述正例特征包括:用于表征任意查詢句屬于問(wèn)題類查詢句的疑問(wèn)詞特征;
[0040]所述反例特征包括:用于表征任意查詢句不屬于問(wèn)題類查詢句的百科需求詞特征、圖片需求詞特征、視頻需求詞特征和工具需求詞特征中的至少一種。
[0041]示例性的,用戶查詢句在疑問(wèn)詞特征下的特征值可定義為:如果所述用戶查詢句包含該疑問(wèn)詞,則在疑問(wèn)詞特征下的特征值為1,否則為O ;用戶查詢句在百科需求詞特征、圖片需求詞特征、視頻需求詞特征或工具需求詞特征下的特征值可定義為:如果所述用戶查詢句包含該百科需求詞、圖片需求詞、視頻需求詞或工具需求詞,則在該需求詞特征下的特征值為-1,否則為O。
[0042]操作240、在判斷用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別用戶查詢句所屬的問(wèn)題類型。
[0043]本實(shí)施例提供的技術(shù)方案,預(yù)先根據(jù)機(jī)器學(xué)習(xí)算法,對(duì)大量的附有人工標(biāo)注信息的用戶查詢句樣本在預(yù)設(shè)的多個(gè)第一特征下的特征值進(jìn)行訓(xùn)練,得到一個(gè)問(wèn)題判定分類器,從而使得在獲取到用戶查詢句之后,能夠基于該分類器準(zhǔn)確的判斷出該用戶查詢句是否為問(wèn)題類查詢句。
[0044]實(shí)施例三
[0045]圖3是本發(fā)明實(shí)施例三提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖。本實(shí)施例在上述實(shí)施例一和實(shí)施例二的基礎(chǔ)上,進(jìn)一步優(yōu)化識(shí)別用戶查詢句所屬的問(wèn)題類型的操作。參見(jiàn)圖3,本實(shí)施例提供的方法具體包括如下操作:
[0046]操作310、獲取用戶查詢句。
[0047]操作320、對(duì)用戶查詢句進(jìn)行類型判定,以確定用戶查詢句是否為問(wèn)題類查詢句。
[0048]操作330、在用戶查詢句為問(wèn)題類查詢句時(shí),確定用戶查詢句在預(yù)設(shè)的多個(gè)第二特征下的特征值。
[0049]操作340、將確定的特征值作為預(yù)先生成的問(wèn)題類型分類器的輸入,基于問(wèn)題類型分類器來(lái)識(shí)別用戶查詢句在預(yù)設(shè)的多個(gè)問(wèn)題類型中所屬的問(wèn)題類型。
[0050]在本實(shí)施例中,在確定用戶查詢句為問(wèn)題類查詢句時(shí),需進(jìn)一步判定該用戶查詢句所屬的問(wèn)題類型,即該用戶查詢語(yǔ)句具體是屬于各式各樣的問(wèn)題中的哪種類型的問(wèn)題,以便搜索引擎能夠更好的根據(jù)所判定的問(wèn)題類型準(zhǔn)確定位搜索結(jié)果。為此,依然可采用與實(shí)施例二中構(gòu)建問(wèn)題判定分類器的思想,預(yù)先根據(jù)機(jī)器學(xué)習(xí)算法,對(duì)大量的附有人工標(biāo)注信息的用戶查詢句樣本在預(yù)設(shè)的多個(gè)第二特征下的特征值進(jìn)行訓(xùn)練,得到一個(gè)問(wèn)題類型分類器。對(duì)于任意用戶查詢句樣本,其對(duì)應(yīng)的人工標(biāo)注信息為由人工標(biāo)注的用于標(biāo)識(shí)該樣本具體屬于預(yù)設(shè)的多個(gè)問(wèn)題類型中的哪種問(wèn)題類型的信息。該問(wèn)題判定分類器的輸入是用戶查詢句在預(yù)設(shè)的多個(gè)第二特征下的特征值,輸出是該用戶查詢句所屬的問(wèn)題類型。實(shí)際上,實(shí)施例二中所得到的問(wèn)題判定分類器為一個(gè)二元分類器,而本實(shí)施例中得到的問(wèn)題類型分類器則為多元分類器。
[0051]在本實(shí)施例中,預(yù)設(shè)的多個(gè)第二特征為:能夠?qū)︻A(yù)設(shè)的多個(gè)問(wèn)題類型的分類起到作用的多個(gè)特征。在本實(shí)施例的一種優(yōu)選的實(shí)施方式中,所述能夠?qū)?wèn)題類型的分類起到作用的多個(gè)特征包括:語(yǔ)法結(jié)構(gòu)特征、語(yǔ)義結(jié)構(gòu)特征、疑問(wèn)詞的類型特征、意圖詞特征和需求詞特征中的至少一種。
[0052]示例性的,用戶查詢句在疑問(wèn)詞的類型特征下的特征值可定義為:如果所述用戶查詢句包含的疑問(wèn)詞對(duì)應(yīng)于預(yù)設(shè)的多個(gè)問(wèn)題類型中的第η個(gè)類型,則在疑問(wèn)詞的類型特征下的特征值為fn(fn>0),如果用戶查詢句不包含疑問(wèn)詞,則在疑問(wèn)詞的類型特征下的特征值為O ;用戶查詢句在意圖詞特征或需求詞特征下的特征值可定義為:如果用戶查詢句包含該意圖詞或需求詞,則在意圖詞特征或需求詞特征下的特征值為1,否則為O。用戶查詢句在語(yǔ)法結(jié)構(gòu)特征或語(yǔ)義結(jié)構(gòu)特征下的特征值可采用現(xiàn)有技術(shù)中任意種用于計(jì)算句子的語(yǔ)法結(jié)構(gòu)特征或語(yǔ)義結(jié)構(gòu)的特征算法得到。
[0053]示例性的,預(yù)設(shè)的多個(gè)問(wèn)題類型包括:對(duì)象類型、原因類型、方法類型、是非類型和選擇類型。
[0054]其中,對(duì)象類型包含實(shí)體屬性類、解釋類、列表類,如“姚明身高”、“貴陽(yáng)什么體檢公司比較好”、“gdp是什么意思”、“年終會(huì)計(jì)賬務(wù)應(yīng)有哪些處理”這些用戶查詢語(yǔ)句均屬于對(duì)象類型。如“外眼角癢是怎么回事”,“為什么進(jìn)行人力資源管理”這些用戶查詢語(yǔ)句均屬于原因類型。如“眉毛稀少怎么辦”、“gps如何設(shè)置端口”、“暗影薩滿出裝”這些用戶查詢語(yǔ)句均屬于方法類型。如“iphone5有送轉(zhuǎn)接頭”、“電力機(jī)車司機(jī)好嗎”這些用戶查詢語(yǔ)句均屬于是非類型?!癷phone5S和三星note2哪個(gè)好”的用戶查詢語(yǔ)句屬于選擇類型。
[0055]對(duì)于包含有疑問(wèn)詞特征的用戶查詢語(yǔ)句,其疑問(wèn)詞的類型會(huì)對(duì)問(wèn)題的分類起到?jīng)Q定性的作用。例如,對(duì)于包含有“如何”或者“怎么辦”等之類的疑問(wèn)詞的用戶查詢語(yǔ)句而言,其屬于方法類型的問(wèn)題的概率很大;對(duì)于包含有“為什么”、“怎么回事”等之類的疑問(wèn)詞的用戶查詢語(yǔ)句而言,其屬于原因類型的問(wèn)題的概率很大,等等。
[0056]對(duì)于不包含有疑問(wèn)詞特征的用戶查詢語(yǔ)句,如果其包含有需求詞特征或意圖詞特征,則需求詞特征、意圖詞特征、詞性也會(huì)對(duì)問(wèn)題的分類起到一定的作用。例如,用戶查詢語(yǔ)句“突擊地平線存檔”的需求詞特征是“存檔”,“存檔”是一個(gè)動(dòng)詞,因此“突擊地平線存檔”所表達(dá)的問(wèn)題是如何存檔,對(duì)應(yīng)的問(wèn)題類型是方法類型;再例如,“中央財(cái)政部部長(zhǎng)”的意圖詞特征是“部長(zhǎng)”,“部長(zhǎng)”是一個(gè)名詞,“中央財(cái)政部部長(zhǎng)”所表達(dá)的問(wèn)題是部長(zhǎng)是誰(shuí),對(duì)應(yīng)的問(wèn)題類型是對(duì)象類型。
[0057]本實(shí)施例提供的技術(shù)方案,預(yù)先根據(jù)機(jī)器學(xué)習(xí)算法,對(duì)大量的附有人工標(biāo)注結(jié)果的用戶查詢句樣本在預(yù)設(shè)的多個(gè)第二特征下的特征值進(jìn)行訓(xùn)練,得到一個(gè)問(wèn)題類型分類器,從而使得在用戶查詢句為問(wèn)題類查詢句時(shí),能夠基于該分類器準(zhǔn)確的判斷出該用戶查詢句為屬于哪種問(wèn)題類型的問(wèn)題類查詢句。
[0058]在上述技術(shù)方案的基礎(chǔ)上,在識(shí)別用戶查詢句所屬的問(wèn)題類型為是非類型或選擇類型之后,還包括:基于用戶查詢句及用戶查詢句所屬的問(wèn)題類型,估測(cè)用戶查詢句對(duì)應(yīng)的答案。是非類型和選擇類型的用戶查詢句的答案是和用戶查詢句相關(guān)的,都可以從用戶查詢句中直接抽取,例如是非類型的用戶查詢語(yǔ)句“iphone5有送轉(zhuǎn)接頭嗎”,可估測(cè)出答案是“有”或“沒(méi)有”;選擇類型的用戶查詢語(yǔ)句“iphone5s和三星note2哪個(gè)好”,答案是“ iphone5s,,或“三星 note2 ” ;
[0059]在識(shí)別用戶查詢句所屬的問(wèn)題類型為所述對(duì)象類型之后,還包括:基于設(shè)定的多種候選答案類型抽取算法,從用戶查詢句中抽取多種候選答案類型;根據(jù)預(yù)先生成的決策樹(shù)模型和抽取的多種候選答案類型,得到用戶查詢句對(duì)應(yīng)的最終答案類型。搜索引擎利用該答案類型,可將候選搜索結(jié)果中的一些無(wú)關(guān)條目過(guò)濾掉(例如去除候選搜索結(jié)果中與該答案類型的適配程度較小的條目),以便能夠更好的滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
[0060]示例性的,基于設(shè)定的多種候選抽取算法,從用戶查詢句中抽取多種候選答案類型,包括:
[0061]抽取用戶查詢句中的疑問(wèn)詞作為第一候選答案類型;
[0062]抽取用戶查詢句中與疑問(wèn)詞距離最近的名詞,作為第二候選答案類型;
[0063]獲取用戶查詢句的語(yǔ)法依存樹(shù),抽取獲取的語(yǔ)法依存樹(shù)中與疑問(wèn)詞有依存關(guān)系的名詞,作為第三候選答案類型;
[0064]抽取用戶查詢句中的意圖詞作為第四候選答案類型。
[0065]在本實(shí)施例中,依然可以根據(jù)機(jī)器學(xué)習(xí)的算法,對(duì)大量的附有人工標(biāo)注信息的用戶查詢句樣本的第一候選答案類型、第二候選答案類型第三候選答案類型以及第四候選答案類型進(jìn)行訓(xùn)練,得到一個(gè)決策樹(shù)模型。決策樹(shù)模型的輸入是用戶查詢句對(duì)應(yīng)的第一候選答案類型、第二候選答案類型、第三候選答案類型以及第四候選答案類型,輸出是用戶查詢句對(duì)應(yīng)的最終答案類型。所述人工標(biāo)注信息為由人工標(biāo)注的用于標(biāo)識(shí)該樣本對(duì)應(yīng)的最終答案類型的信息。
[0066]相較于根據(jù)單個(gè)的候選答案類型抽取算法從用戶查詢句中抽取答案類型的方案,上述技術(shù)方案通過(guò)對(duì)多個(gè)候選答案類型進(jìn)行融合能夠得到準(zhǔn)確度較高的答案類型。
[0067]實(shí)施例四
[0068]圖4是本發(fā)明實(shí)施例四提供的一種針對(duì)用戶查詢句的類型識(shí)別方法的流程示意圖。本實(shí)施例在上述實(shí)施例一、實(shí)施例二和實(shí)施例三的基礎(chǔ)上,增加了問(wèn)題語(yǔ)義表示的操作。參見(jiàn)圖4,本實(shí)施例提供的方法具體包括如下操作:
[0069]操作410、獲取用戶查詢句。
[0070]操作420、對(duì)用戶查詢句進(jìn)行類型判定,以確定用戶查詢句是否為問(wèn)題類查詢句。
[0071]操作430、在確定用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別用戶查詢句所屬的問(wèn)題類型。
[0072]操作440、生成用戶查詢句的問(wèn)題語(yǔ)義表示信息。
[0073]本實(shí)施例在確定用戶查詢句是問(wèn)題類查詢句時(shí),除了進(jìn)一步識(shí)別用戶查詢句所屬的問(wèn)題類型之外,還可根據(jù)用戶查詢語(yǔ)句的特點(diǎn)進(jìn)一步生成問(wèn)題語(yǔ)義表示信息。需要說(shuō)明的是,上述操作440和操作430中的“識(shí)別用戶查詢句所屬的問(wèn)題類型”的執(zhí)行順序還可互換。示例性的,問(wèn)題語(yǔ)義表示信息包括:語(yǔ)義角色標(biāo)注樹(shù)、主干表示信息、邏輯結(jié)構(gòu)表示信息中的至少一個(gè)。
[0074]具體的,可通過(guò)語(yǔ)義角色標(biāo)注系統(tǒng)對(duì)用戶查詢句進(jìn)行語(yǔ)義關(guān)系的分析,得到語(yǔ)義角色標(biāo)注樹(shù),以便于搜索引擎可以綜合考慮此語(yǔ)義角色標(biāo)注樹(shù)中的語(yǔ)義關(guān)系以及其他因素來(lái)對(duì)問(wèn)題類查詢句篩選相應(yīng)的答案。例如,針對(duì)屬于對(duì)象類型的“任盈盈為令狐沖療傷的歌曲是什么”的問(wèn)題類查詢句,要分析出“任盈盈”、“令狐沖”和“歌曲”三者之間的語(yǔ)義關(guān)系。語(yǔ)義關(guān)系著重從語(yǔ)義角度刻畫(huà)句子的結(jié)構(gòu)信息。所謂語(yǔ)義關(guān)系的分析,主要指的是以句子中的核心動(dòng)詞為中心,來(lái)識(shí)別核心動(dòng)詞,判別核心動(dòng)詞的主語(yǔ)賓語(yǔ)等關(guān)鍵語(yǔ)義角色成分,以及時(shí)間,地點(diǎn)等狀語(yǔ)成分。
[0075]針對(duì)一些復(fù)雜的且不能簡(jiǎn)單轉(zhuǎn)化為概念和意圖表述的用戶查詢語(yǔ)句,可提取該用戶查詢語(yǔ)句中的主干部分,生成主干表示信息。為此,在本實(shí)施例的一種【具體實(shí)施方式】中,生成用戶查詢句的問(wèn)題語(yǔ)義表示信息,還可進(jìn)一步包括:如果用戶查詢句的長(zhǎng)度超過(guò)預(yù)設(shè)的目標(biāo)長(zhǎng)度,且提取用戶查詢句的概念詞和意圖詞失敗,則根據(jù)用戶查詢句的語(yǔ)義結(jié)構(gòu)特征以及預(yù)設(shè)的分詞之間的關(guān)聯(lián)關(guān)系,對(duì)用戶查詢句進(jìn)行解析,以確定用戶查詢句的主干表示信息。
[0076]在上述【具體實(shí)施方式】下,用戶查詢句的語(yǔ)義結(jié)構(gòu)特征即為用戶查詢語(yǔ)句的語(yǔ)義角色標(biāo)注樹(shù);預(yù)設(shè)的分詞之間的關(guān)聯(lián)關(guān)系可以是根據(jù)預(yù)先存儲(chǔ)的知識(shí)庫(kù)學(xué)習(xí)得到的大量的分詞之間的關(guān)聯(lián)關(guān)系,其中兩個(gè)分詞的關(guān)聯(lián)關(guān)系可以是上下位的關(guān)系(如“世界”和“我國(guó)”)、也可以是同義詞關(guān)系(如“高峰”和“山峰”)、同種類下的并列關(guān)系(例如“香蕉”和“蘋(píng)果”)等。對(duì)用戶查詢句進(jìn)行解析的目的在于提取用戶查詢句中對(duì)答案召回有幫助的至少一個(gè)關(guān)鍵詞,進(jìn)而將這些關(guān)鍵詞組合得到主干表示信息。
[0077]例如,用戶查詢句“世界第一高峰是我國(guó)的什么山峰”,獲得的語(yǔ)義結(jié)構(gòu)特征為:“是”為核心動(dòng)詞,主語(yǔ)是“高峰”,賓語(yǔ)是“山峰”,“世界”和“第一”均為主語(yǔ)“高峰”的修飾詞,“我國(guó)”、“的”、“什么”均為賓語(yǔ)“山峰”的修飾詞。根據(jù)該語(yǔ)義結(jié)構(gòu)特征,“世界”和“我國(guó)”為上下位關(guān)系,以及“高峰”和“山峰”為同義詞關(guān)系,對(duì)該用戶查詢句進(jìn)行解析,可知該用戶查詢句所包含的關(guān)鍵詞是“我國(guó)”、“第一”和“山峰”(或者“高峰”),其余的詞都是對(duì)這些詞的修飾和限定,對(duì)答案的召回沒(méi)有幫助。
[0078]在本實(shí)施例中,生成用戶查詢句的問(wèn)題語(yǔ)義表示信息,還可進(jìn)一步包括:
[0079]對(duì)用戶查詢句的結(jié)構(gòu)進(jìn)行識(shí)別,以判定用戶查詢句的結(jié)構(gòu)是否為預(yù)設(shè)的邏輯結(jié)構(gòu);
[0080]在用戶查詢句的結(jié)構(gòu)是預(yù)設(shè)的邏輯結(jié)構(gòu)時(shí),生成用戶查詢句的邏輯結(jié)構(gòu)表示信息。
[0081]示例性的,判斷用戶查詢句中是否包含有預(yù)設(shè)的用于表征邏輯的分詞,來(lái)對(duì)用戶查詢句的結(jié)構(gòu)進(jìn)行識(shí)別。其中,所述邏輯可以是因果邏輯或者包含邏輯等,用于表征包含邏輯的分詞可以是“合稱為”、“包括”等,用于表征因果邏輯的分詞可以是“理由在于”、“理由是”、“為什么”、“原因”等。根據(jù)識(shí)別結(jié)果、用戶查詢句的語(yǔ)義結(jié)構(gòu)特征,來(lái)生成用戶查詢句的邏輯結(jié)構(gòu)表示信息。當(dāng)然,如果用戶查詢句的結(jié)構(gòu)是預(yù)設(shè)的包含邏輯結(jié)構(gòu)時(shí),還可進(jìn)一步結(jié)合用戶查詢句中包含的專名以及專名間的關(guān)聯(lián)關(guān)系,來(lái)生成用戶查詢句的邏輯結(jié)構(gòu)表示信息。
[0082]例如,針對(duì)用戶查詢句“與劉德華,張學(xué)友,郭富城合稱為香港四大天王的人是誰(shuí)”,由于該句中包括“合稱為”,則判定該用戶查詢句的結(jié)構(gòu)為預(yù)設(shè)的包含邏輯結(jié)構(gòu),該句中所包含的所有專名包括具有并列關(guān)系的各個(gè)人名“劉德華”、“張學(xué)友”以及“郭富城”,該句的語(yǔ)義結(jié)構(gòu)特征為:“合稱為”是核心動(dòng)詞,“誰(shuí)”是動(dòng)詞的主語(yǔ),“四大天王”是動(dòng)詞的賓語(yǔ),“與劉德華,張學(xué)友,郭富城”是動(dòng)詞的狀語(yǔ),邏輯結(jié)構(gòu)表示信息可為“劉德華+張學(xué)友+郭富城+【X】=四大天王”這種表述形式,以表示答案和“四大天王”是包含關(guān)系,和“劉德華”、“張學(xué)友”、“郭富城”是并列關(guān)系。
[0083]再例如,針對(duì)用戶查詢句“為什么會(huì)出現(xiàn)月全食”,由于該句中包括“為什么”,則判定該用戶查詢句的結(jié)構(gòu)為預(yù)設(shè)的因果邏輯結(jié)構(gòu)。邏輯結(jié)構(gòu)表示信息可為“因?yàn)椤綳】,所以出現(xiàn)月全食”這種表述形式,以表示答案和“出現(xiàn)月全食”是因果關(guān)系。
[0084]本實(shí)施例提供的技術(shù)方案,在確定用戶查詢句為問(wèn)題類查詢句時(shí),能夠進(jìn)一步生成該用戶查詢句的問(wèn)題語(yǔ)義表示信息,這樣可使得后續(xù)搜索引擎據(jù)此得到更為準(zhǔn)確的搜索答案,更好的滿足用戶對(duì)問(wèn)答類查詢句的搜索需求。
[0085]實(shí)施例五
[0086]圖5是本發(fā)明實(shí)施例五提供的一種針對(duì)用戶查詢句的類型識(shí)別裝置的結(jié)構(gòu)示意圖。參見(jiàn)圖5,該裝置的具體結(jié)構(gòu)如下:
[0087]用戶查詢句獲取單元510,用于獲取用戶查詢句;
[0088]用戶查詢句類型判定單元520,用于對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句;
[0089]問(wèn)題類型識(shí)別單元530,用于在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
[0090]其中,所述用戶查詢句類型判定單元520,具體用于:
[0091]確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第一特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第一特征包括正例特征和/或反例特征,所述正例特征為用于表征任意查詢句屬于所述問(wèn)題類查詢句的特征,所述反例特征為用于表征任意查詢句不屬于所述問(wèn)題類查詢句的特征;
[0092]將確定的特征值作為預(yù)先生成的問(wèn)題判定分類器的輸入,基于所述問(wèn)題判定分類器來(lái)判斷所述用戶查詢句是否為所述問(wèn)題類查詢句。
[0093]優(yōu)選的,所述正例特征包括:用于表征任意查詢句屬于所述問(wèn)題類查詢句的疑問(wèn)詞特征;
[0094]所述反例特征包括:用于表征任意查詢句不屬于所述問(wèn)題類查詢句的百科需求詞特征、圖片需求詞特征、視頻需求詞特征和工具需求詞特征中的中的至少一種。
[0095]其中,所述問(wèn)題類型識(shí)別單元530,具體用于:
[0096]確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第二特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第二特征為:能夠?qū)︻A(yù)設(shè)的多個(gè)問(wèn)題類型的分類起到作用的多個(gè)特征;
[0097]將確定的特征值作為預(yù)先生成的問(wèn)題類型分類器的輸入,基于所述問(wèn)題類型分類器來(lái)識(shí)別所述用戶查詢句在預(yù)設(shè)的多個(gè)問(wèn)題類型中所屬的問(wèn)題類型。
[0098]優(yōu)選的,所述能夠?qū)?wèn)題類型的分類起到作用的多個(gè)特征包括:語(yǔ)法結(jié)構(gòu)特征、語(yǔ)義結(jié)構(gòu)特征、疑問(wèn)詞的類型特征、意圖詞特征和需求詞特征中的至少一種。
[0099]優(yōu)選的,所述預(yù)設(shè)的多個(gè)問(wèn)題類型包括:對(duì)象類型、原因類型、裝置類型、是非類型和選擇類型。
[0100]進(jìn)一步的,本實(shí)施例提供的裝置還包括:
[0101]答案估測(cè)單元540,用于在所述問(wèn)題類型識(shí)別單元530識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述是非類型或所述選擇類型之后,基于所述用戶查詢句及所述用戶查詢句所屬的問(wèn)題類型,估測(cè)所述用戶查詢句對(duì)應(yīng)的答案。
[0102]進(jìn)一步的,本實(shí)施例提供的裝置還包括答案類型確定單元550,用于:
[0103]在所述問(wèn)題類型識(shí)別單元530識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述對(duì)象類型之后,基于設(shè)定的多種候選答案類型抽取算法,從所述用戶查詢句中抽取多種候選答案類型;
[0104]根據(jù)預(yù)先生成的決策樹(shù)模型和抽取的多種候選答案類型,得到所述用戶查詢句對(duì)應(yīng)的最終答案類型。
[0105]上述產(chǎn)品可執(zhí)行本發(fā)明實(shí)施例一、實(shí)施例二和實(shí)施例三所提供的方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
[0106]實(shí)施例六
[0107]圖6是本發(fā)明實(shí)施例六提供的一種針對(duì)用戶查詢句的類型識(shí)別裝置的結(jié)構(gòu)示意圖。參見(jiàn)圖6,該裝置的具體結(jié)構(gòu)如下:
[0108]用戶查詢句獲取單元610,用于獲取用戶查詢句;
[0109]用戶查詢句類型判定單元620,用于對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句;
[0110]問(wèn)題類型識(shí)別單元630,用于在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
[0111]進(jìn)一步的,本實(shí)施例提供的裝置還包括:
[0112]主干表示信息確定單元640,用于在所述用戶查詢句類型判定單元620確定所述用戶查詢句是問(wèn)題類查詢句之后,如果所述用戶查詢句的長(zhǎng)度超過(guò)預(yù)設(shè)的目標(biāo)長(zhǎng)度,且提取所述用戶查詢句的概念詞和意圖詞失敗,則根據(jù)所述用戶查詢句的語(yǔ)義結(jié)構(gòu)特征以及預(yù)設(shè)的分詞之間的關(guān)聯(lián)關(guān)系,對(duì)所述用戶查詢句進(jìn)行解析,以確定所述用戶查詢句的主干表不?目息;
[0113]進(jìn)一步的,本實(shí)施例提供的裝置還包括:
[0114]問(wèn)題語(yǔ)義表示信息生成單元650,用于在所述用戶查詢句類型判定單元620確定所述用戶查詢句是問(wèn)題類查詢句之后,生成所述用戶查詢句的問(wèn)題語(yǔ)義表示信息,所述問(wèn)題語(yǔ)義表示信息包括:語(yǔ)義角色標(biāo)注樹(shù)、主干表示信息、邏輯結(jié)構(gòu)表示信息中的至少一個(gè)。
[0115]上述產(chǎn)品可執(zhí)行本發(fā)明實(shí)施例一和實(shí)施例四所提供的方法所提供的方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
[0116]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過(guò)以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說(shuō)明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【權(quán)利要求】
1.一種針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,包括: 獲取用戶查詢句; 對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句; 在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
2.根據(jù)權(quán)利要求1所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,對(duì)所述用戶查詢句進(jìn)行類型判定,包括: 確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第一特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第一特征包括正例特征和/或反例特征,所述正例特征為用于表征任意查詢句屬于所述問(wèn)題類查詢句的特征,所述反例特征為用于表征任意查詢句不屬于所述問(wèn)題類查詢句的特征; 將確定的特征值作為預(yù)先生成的問(wèn)題判定分類器的輸入,基于所述問(wèn)題判定分類器來(lái)判斷所述用戶查詢句是否為所述問(wèn)題類查詢句。
3.根據(jù)權(quán)利要求2所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,所述正例特征包括:用于表征任意查詢句屬于所述問(wèn)題類查詢句的疑問(wèn)詞特征; 所述反例特征包括:用于表征任意查詢句不屬于所述問(wèn)題類查詢句的百科需求詞特征、圖片需求詞特征、視頻需求詞特征和工具需求詞特征中的中的至少一種。
4.根據(jù)權(quán)利要求1所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,識(shí)別所述用戶查詢句所屬的問(wèn)題類型,包括: 確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第二特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第二特征為:能夠?qū)︻A(yù)設(shè)的多個(gè)問(wèn)題類型的分類起到作用的多個(gè)特征; 將確定的特征值作為預(yù)先生成的問(wèn)題類型分類器的輸入,基于所述問(wèn)題類型分類器來(lái)識(shí)別所述用戶查詢句在預(yù)設(shè)的多個(gè)問(wèn)題類型中所屬的問(wèn)題類型。
5.根據(jù)權(quán)利要求4所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,所述能夠?qū)?wèn)題類型的分類起到作用的多個(gè)特征包括:語(yǔ)法結(jié)構(gòu)特征、語(yǔ)義結(jié)構(gòu)特征、疑問(wèn)詞的類型特征、意圖詞特征和需求詞特征中的至少一種。
6.根據(jù)權(quán)利要求4所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,所述預(yù)設(shè)的多個(gè)問(wèn)題類型包括:對(duì)象類型、原因類型、方法類型、是非類型和選擇類型。
7.根據(jù)權(quán)利要求6所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,在識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述是非類型或所述選擇類型之后,還包括: 基于所述用戶查詢句及所述用戶查詢句所屬的問(wèn)題類型,估測(cè)所述用戶查詢句對(duì)應(yīng)的答案。
8.根據(jù)權(quán)利要求6所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,在識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述對(duì)象類型之后,還包括: 基于設(shè)定的多種候選答案類型抽取算法,從所述用戶查詢句中抽取多種候選答案類型; 根據(jù)預(yù)先生成的決策樹(shù)模型和抽取的多種候選答案類型,得到所述用戶查詢句對(duì)應(yīng)的最終答案類型。
9.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的針對(duì)用戶查詢句的類型識(shí)別方法,其特征在于,在確定所述用戶查詢句是問(wèn)題類查詢句之后,還包括: 生成所述用戶查詢句的問(wèn)題語(yǔ)義表示信息,所述問(wèn)題語(yǔ)義表示信息包括:語(yǔ)義角色標(biāo)注樹(shù)、主干表示信息、邏輯結(jié)構(gòu)表示信息中的至少一個(gè)。
10.一種針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,包括: 用戶查詢句獲取單元,用于獲取用戶查詢句; 用戶查詢句類型判定單元,用于對(duì)所述用戶查詢句進(jìn)行類型判定,以確定所述用戶查詢句是否為問(wèn)題類查詢句; 問(wèn)題類型識(shí)別單元,用于在確定所述用戶查詢句是問(wèn)題類查詢句時(shí),識(shí)別所述用戶查詢句所屬的問(wèn)題類型。
11.根據(jù)權(quán)利要求10所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,所述用戶查詢句類型判定單元,具體用于: 確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第一特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第一特征包括正例特征和/或反例特征,所述正例特征為用于表征任意查詢句屬于所述問(wèn)題類查詢句的特征,所述反例特征為用于表征任意查詢句不屬于所述問(wèn)題類查詢句的特征; 將確定的特征值作為預(yù)先生成的問(wèn)題判定分類器的輸入,基于所述問(wèn)題判定分類器來(lái)判斷所述用戶查詢句是否為所述問(wèn)題類查詢句。
12.根據(jù)權(quán)利要求11所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,所述正例特征包括:用于表征任意查詢句屬于所述問(wèn)題類查詢句的疑問(wèn)詞特征; 所述反例特征包括:用于表征任意查詢句不屬于所述問(wèn)題類查詢句的百科需求詞特征、圖片需求詞特征、視頻需求詞特征和工具需求詞特征中的中的至少一種。
13.根據(jù)權(quán)利要求10所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,所述問(wèn)題類型識(shí)別單元,具體用于: 確定所述用戶查詢句在預(yù)設(shè)的多個(gè)第二特征下的特征值;其中,所述預(yù)設(shè)的多個(gè)第二特征為:能夠?qū)︻A(yù)設(shè)的多個(gè)問(wèn)題類型的分類起到作用的多個(gè)特征; 將確定的特征值作為預(yù)先生成的問(wèn)題類型分類器的輸入,基于所述問(wèn)題類型分類器來(lái)識(shí)別所述用戶查詢句在預(yù)設(shè)的多個(gè)問(wèn)題類型中所屬的問(wèn)題類型。
14.根據(jù)權(quán)利要求13所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,所述能夠?qū)?wèn)題類型的分類起到作用的多個(gè)特征包括:語(yǔ)法結(jié)構(gòu)特征、語(yǔ)義結(jié)構(gòu)特征、疑問(wèn)詞的類型特征、意圖詞特征和需求詞特征中的至少一種。
15.根據(jù)權(quán)利要求13所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,所述預(yù)設(shè)的多個(gè)問(wèn)題類型包括:對(duì)象類型、原因類型、裝置類型、是非類型和選擇類型。
16.根據(jù)權(quán)利要求15所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,還包括: 答案估測(cè)單元,用于在所述問(wèn)題類型識(shí)別單元識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述是非類型或所述選擇類型之后,基于所述用戶查詢句及所述用戶查詢句所屬的問(wèn)題類型,估測(cè)所述用戶查詢句對(duì)應(yīng)的答案。
17.根據(jù)權(quán)利要求15所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,還包括答案類型確定單元,用于: 在所述問(wèn)題類型識(shí)別單元識(shí)別所述用戶查詢句所屬的問(wèn)題類型為所述對(duì)象類型之后,基于設(shè)定的多種候選答案類型抽取算法,從所述用戶查詢句中抽取多種候選答案類型; 根據(jù)預(yù)先生成的決策樹(shù)模型和抽取的多種候選答案類型,得到所述用戶查詢句對(duì)應(yīng)的最終答案類型。
18.根據(jù)權(quán)利要求10-17中任一項(xiàng)所述的針對(duì)用戶查詢句的類型識(shí)別裝置,其特征在于,還包括: 問(wèn)題語(yǔ)義表示信息生成單元,用于在所述用戶查詢句類型判定單元確定所述用戶查詢句是問(wèn)題類查詢句之后,生成所述用戶查詢句的問(wèn)題語(yǔ)義表示信息,所述問(wèn)題語(yǔ)義表示信息包括:語(yǔ)義角色標(biāo)注樹(shù)、主干表示信息、邏輯結(jié)構(gòu)表示信息中的至少一個(gè)。
【文檔編號(hào)】G06F17/30GK104503998SQ201410742367
【公開(kāi)日】2015年4月8日 申請(qǐng)日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】張偉萌, 李超, 馬艷軍 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1