亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

事件提取方法及裝置的制造方法_3

文檔序號(hào):9631533閱讀:來源:國知局
集合中每個(gè)動(dòng)詞的特征,計(jì)算出每個(gè)動(dòng)詞是主題的概率,然后根據(jù)每個(gè)動(dòng)詞是主題的概率確定屬于主題的動(dòng)詞。
[0140]其中,動(dòng)詞的特征可以包括動(dòng)詞的長度、結(jié)構(gòu)、出現(xiàn)的位置、所屬的類別和配價(jià)的類型中的至少一種。其中,動(dòng)詞的結(jié)構(gòu)可以是“吃飯”、“碰面”等動(dòng)賓結(jié)構(gòu),動(dòng)詞出現(xiàn)的位置是指動(dòng)詞在對話場景中出現(xiàn)的先后位置,動(dòng)詞的類別是指動(dòng)詞屬于使動(dòng)詞、行為動(dòng)詞、聯(lián)系動(dòng)詞等。動(dòng)詞配價(jià)的類型是指施事、受事、與事的類型。
[0141]在步驟S403中,根據(jù)命名實(shí)體識(shí)別從會(huì)話場景中識(shí)別出主題對應(yīng)事件的時(shí)間和地點(diǎn)。
[0142]在該實(shí)施例中,可以采用命名實(shí)體識(shí)別(NER)的方式從上述會(huì)話場景中識(shí)別出時(shí)間為周末晚上6點(diǎn)半左右,地點(diǎn)為中關(guān)村的眉州東坡。
[0143]假設(shè)從會(huì)話場景中可以識(shí)別出多個(gè)不同的時(shí)間,則可以選擇與主題之間距離最小的時(shí)間作為主題對應(yīng)事件的時(shí)間。同樣地,如果從會(huì)話場景中可以識(shí)別出多個(gè)不同的地點(diǎn),則可以選擇與主題之間距離最小的地點(diǎn)作為主題對應(yīng)事件的地點(diǎn)。
[0144]在步驟S404中,根據(jù)動(dòng)詞的配價(jià)資源庫獲得主題的配價(jià)資源,根據(jù)主題的配價(jià)資源從會(huì)話場景中提取出主題對應(yīng)事件的參與物,參與物包括主題對應(yīng)事件的執(zhí)行主體、客體和執(zhí)行對象。
[0145]在該實(shí)施例中,可以從動(dòng)詞的配價(jià)資源庫獲得主題的配價(jià)資源,然后采用NER技術(shù)從對話場景中提取結(jié)果,填充到事件的參與物中。
[0146]上述實(shí)施例,根據(jù)動(dòng)詞的配價(jià)資源庫從會(huì)話場景中識(shí)別出事件的參與物,使得提取的參與物更全面,從而使得提取的事件要素更全面。
[0147]與前述事件提取方法實(shí)施例相對應(yīng),本公開還提供了事件提取裝置實(shí)施例。
[0148]圖5是根據(jù)一示例性實(shí)施例示出的一種事件提取裝置的框圖,如圖5所示,事件提取裝置包括:獲取模塊51、分割模塊52和識(shí)別提取模塊53。
[0149]獲取模塊51被配置為獲取用戶的交互信息。
[0150]該實(shí)施例中的交互信息可以為短信息,但不局限于短信息,例如可以為米聊信息等。
[0151]分割模塊52被配置為分割出獲取模塊獲取的交互信息的會(huì)話場景。
[0152]在該實(shí)施例中,分割模塊52可以使用CRF標(biāo)注出交互信息中的會(huì)話類型,會(huì)話類型包括開始會(huì)話、中間會(huì)話和結(jié)束會(huì)話;根據(jù)每條交互信息的會(huì)話類型從交互信息中分割出會(huì)話場景。識(shí)別提取模塊53被配置為根據(jù)預(yù)存的動(dòng)詞的配價(jià)資源庫從分割模塊分割出的會(huì)話場景中識(shí)別出事件的要素,并根據(jù)要素提取出事件。
[0153]在該實(shí)施例中,可以根據(jù)與動(dòng)詞發(fā)生聯(lián)系的名詞性成分的數(shù)量來確定動(dòng)詞的“價(jià)”,動(dòng)詞的配件資源庫中可以包含不同價(jià)的動(dòng)詞。
[0154]例如,“我把筆記本借給張三了”中的“借”支配了“我”、“筆記本”和“張三”,因此,
“借”是三價(jià)動(dòng)詞。其中“我”是施事、“筆記本”是與事、“張三”是受事。施事在語法上指動(dòng)作的主體,也就是發(fā)出動(dòng)作或發(fā)生變化的人或事物。受事在語法上指動(dòng)作的對象,也就是受動(dòng)作支配的人或事物。與事在語法上指接受某事物或從一行動(dòng)中獲益的人或事物。
[0155]動(dòng)詞的配價(jià)資源庫可以是開發(fā)人員根據(jù)需要自己構(gòu)建的,也可以由其他組織或機(jī)構(gòu)免費(fèi)向公眾提供的,移動(dòng)終端在接收并保存用戶輸入的動(dòng)詞的配價(jià)資源庫后,可以從會(huì)話場景中識(shí)別出事件的要素。
[0156]其中,事件的要素可以包括:事件的主題、時(shí)間、地點(diǎn)和參與物。在該實(shí)施例中,參與物是指參與的人和物,即事件的執(zhí)行主體、客體和執(zhí)行對象。
[0157]識(shí)別提取模塊53在識(shí)別出事件的要素之后,可以根據(jù)事件的要素提取出事件。
[0158]由于從交互信息中提取的會(huì)話場景為一組相關(guān)性很強(qiáng)的會(huì)話序列,因此,從會(huì)話場景中提取的事件要素比從所有交互信息中提取的事件要素關(guān)聯(lián)性更強(qiáng),同時(shí),根據(jù)動(dòng)詞的配價(jià)資源庫可以從會(huì)話場景中識(shí)別出更全面的事件要素,從而使得本實(shí)施例中,根據(jù)這些要素提取的事件更全面、更準(zhǔn)確。如圖5所示的裝置用于實(shí)現(xiàn)上述如圖1所示的方法流程,涉及到的相關(guān)內(nèi)容描述相同,此處不贅述。
[0159]上述事件提取裝置實(shí)施例,通過分割模塊分割出交互信息的會(huì)話場景,并通過識(shí)別提取模塊根據(jù)預(yù)存的動(dòng)詞的配價(jià)資源庫從會(huì)話場景中識(shí)別出事件的要素,使得提取的事件要素關(guān)聯(lián)性更強(qiáng)、更全面,進(jìn)而使得根據(jù)事件的要素提取出的事件更準(zhǔn)確、更全面。
[0160]圖6是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖,如圖9所示,在上述圖5所示實(shí)施例的基礎(chǔ)上,該裝置還可包括:生成模塊54。
[0161]生成模塊54被配置為在識(shí)別提取模塊53根據(jù)要素提取出事件之后,生成事件的提醒記錄。
[0162]在該實(shí)施例中,識(shí)別提取模塊53在從交互信息中提取出事件之后,生成模塊54可以根據(jù)用戶的操作指令生成對應(yīng)事件的提醒記錄,例如,用戶可點(diǎn)擊短信,一鍵在日歷中添加對應(yīng)事件的提醒記錄;也可以是根據(jù)事件的級(jí)別自動(dòng)生成對應(yīng)事件的提醒記錄,例如,該事件為重要級(jí)別,則自動(dòng)生成對應(yīng)事件的提醒記錄。
[0163]如圖6所示的裝置用于實(shí)現(xiàn)上述如圖2所示的方法流程,涉及到的相關(guān)內(nèi)容描述相同,此處不贅述。
[0164]上述事件提取裝置實(shí)施例,通過生成事件的提醒記錄,為用戶提供提醒服務(wù),較好地提升用戶的使用體驗(yàn)。
[0165]圖7是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖,如圖7所示,在上述圖5所不實(shí)施例的基礎(chǔ)上,分割模塊52可包括:標(biāo)注子模塊521和分割子模塊522。
[0166]標(biāo)注子模塊521,被配置為使用CRF標(biāo)注出交互信息中的會(huì)話類型,會(huì)話類型包括開始會(huì)話、中間會(huì)話和結(jié)束會(huì)話。
[0167]分割子模塊522,被配置為根據(jù)標(biāo)注子模塊521標(biāo)注出的每條交互信息的會(huì)話類型從交互信息中分割出會(huì)話場景。
[0168]例如,當(dāng)前獲取的交互信息為:
[0169]A:周末一塊吃飯?
[0170]B:好啊去哪?
[0171]A:中關(guān)村的眉州東坡,怎么樣?
[0172]B:不錯(cuò)晚上6點(diǎn)半左右在那碰面?
[0173]A:好的。那到時(shí)候見。
[0174]B:你家寶寶咳嗽好了嗎?
[0175]A:好了,多謝關(guān)心。
[0176]假設(shè),使用CRF標(biāo)注出該交互信息中第一條信息為開始會(huì)話,第二條信息至第四條信息為中間會(huì)話,第五條信息為結(jié)束會(huì)話,則可以從這段交互信息中分割出一個(gè)會(huì)話場景,即該會(huì)話場景由第一條信息至第五條信息組成。如圖7所示的裝置用于實(shí)現(xiàn)上述如圖1所示的方法流程,涉及到的相關(guān)內(nèi)容描述相同,此處不贅述。
[0177]上述事件提取裝置實(shí)施例,基于CRF從交互信息中分割出會(huì)話場景,實(shí)現(xiàn)方式簡單、準(zhǔn)確率高。
[0178]圖8是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖,如圖8所示,在上述圖7所示實(shí)施例的基礎(chǔ)上,標(biāo)注子模塊521包括:標(biāo)注單元5211、提取計(jì)算單元5212和確定單元5213。
[0179]標(biāo)注單元5211,被配置為使用CRF標(biāo)注出交互信息中每條交互信息所有可能存在的會(huì)話類型。
[0180]對于每條交互信息例如短信而言,它具有三種會(huì)話類型,即開始(B)會(huì)話、中間
(I)會(huì)話和結(jié)束(E)會(huì)話。
[0181]在該實(shí)施例中,假設(shè)會(huì)話序列為:01,02,03…0n,Si表示0i的會(huì)話類型(i = 1...η),由于每個(gè)Si可能標(biāo)注的會(huì)話類型有{B,I,E} 3種,因此,Sl,S2,S3...Sn就有3的η次方種標(biāo)注方式。
[0182]提取計(jì)算單元5212,被配置為從每條交互信息中提取出至少一個(gè)特征,計(jì)算每個(gè)特征相對于標(biāo)注單元5211標(biāo)注的任一會(huì)話類型的權(quán)重。
[0183]在該實(shí)施例中,提取計(jì)算單元5212可以從交互信息例如短信中提取出特征,其中,這些特征可以包括:短信的開頭詞(你好、好啊、在么……)、短信的結(jié)尾詞(拜拜、晚安、
睡了......)、短信的發(fā)送或接收時(shí)間、相鄰短信的間隔時(shí)間、短信中的動(dòng)詞、短信中的命名實(shí)體(例如,時(shí)間、地點(diǎn)、人物)、相鄰短信中的動(dòng)詞組合、短信的長度、上一條短信與本條短信是否都為接收短ig等。
[0184]然后,可以計(jì)算每個(gè)特征相對于任一會(huì)話類型的權(quán)重。
[0185]確定單元5213,被配置為根據(jù)提取計(jì)算單元5212計(jì)算的所有特征相對于不同會(huì)話類型的權(quán)重,確定出每條交互信息的最終會(huì)話類型。
[0186]在該實(shí)施例中,計(jì)算條件概率:P(S1,S2,S3…Sn/01,02,03…On),其中,SI, S2,
S3…Sn有3的n次方種標(biāo)注方式。
[0187]確定單元5213根據(jù)所有特征相對于不同會(huì)話類型的權(quán)重,計(jì)算出一個(gè)最好的標(biāo)注方式,使得條件概率P(S1,S2,S3…Sn/01,02,03…On)最大。
[0188]根據(jù)該最好的標(biāo)注方式就可以確定出每條交互信息的最終會(huì)話類型。
[0189]如圖8所示的裝置用于實(shí)現(xiàn)上述如圖3所示的方法流程,涉及到的相關(guān)內(nèi)容描述相同,此處不贅述。
[0190]上述事件提取裝置實(shí)施例,根據(jù)提取計(jì)算單元計(jì)算的所有特征相對于不同會(huì)話類型的權(quán)重,確定出每條交互信息的最終會(huì)話類型,準(zhǔn)確率高。<
當(dāng)前第3頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1