亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

事件提取方法及裝置的制造方法_2

文檔序號(hào):9631533閱讀:來源:國知局
]圖3是根據(jù)一示例性實(shí)施例示出的一種分割出會(huì)話場(chǎng)景的方法流程圖。
[0076]圖4是根據(jù)一示例性實(shí)施例示出的一種從會(huì)話場(chǎng)景中識(shí)別出事件的要素的方法流程圖。
[0077]圖5是根據(jù)一示例性實(shí)施例示出的一種事件提取裝置的框圖。
[0078]圖6是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0079]圖7是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0080]圖8是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0081]圖9是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0082]圖10是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0083]圖11是根據(jù)一示例性實(shí)施例示出的另一種事件提取裝置的框圖。
[0084]圖12是根據(jù)一示例性實(shí)施例示出的一種適用于事件提取裝置的框圖。
【具體實(shí)施方式】
[0085]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0086]圖1是根據(jù)一示例性實(shí)施例示出的一種事件提取方法的流程圖,如圖1所示,該事件提取方法可應(yīng)用于移動(dòng)終端上,該移動(dòng)終端可以包括但不限于手機(jī)、平板電腦(PAD)等終端,該事件提取方法包括以下步驟S101-S103:
[0087]在步驟S101中,獲取用戶的交互信息。
[0088]在該實(shí)施例中,移動(dòng)終端例如手機(jī)可以獲取用戶輸入的短信息。需要說明的是,該實(shí)施例中的交互信息可以為短信息,但不局限于短信息,例如可以為米聊信息等。
[0089]在步驟S102中,分割出交互信息的會(huì)話場(chǎng)景。
[0090]在該實(shí)施例中,可以基于條件隨機(jī)場(chǎng)(CRF)來分割交互信息的會(huì)話場(chǎng)景。
[0091]基于CRF分割交互信息的會(huì)話場(chǎng)景可以包括:使用CRF標(biāo)注出交互信息中的會(huì)話類型,會(huì)話類型包括開始會(huì)話、中間會(huì)話和結(jié)束會(huì)話;根據(jù)每條交互信息的會(huì)話類型從交互信息中分割出會(huì)話場(chǎng)景。
[0092]例如,當(dāng)前獲取的交互信息為:
[0093]A:周末一塊吃飯?
[0094]B:好啊去哪?
[0095]A:中關(guān)村的眉州東坡,怎么樣?
[0096]B:不錯(cuò)晚上6點(diǎn)半左右在那碰面?
[0097]A:好的。那到時(shí)候見。
[0098]B:你家寶寶咳嗽好了嗎?
[0099]A:好了,多謝關(guān)心。
[0100]假設(shè),使用CRF標(biāo)注出該交互信息中第一條信息為開始會(huì)話,第二條信息至第四條信息為中間會(huì)話,第五條信息為結(jié)束會(huì)話,則可以從這段交互信息中分割出一個(gè)會(huì)話場(chǎng)景,即該會(huì)話場(chǎng)景由第一條信息至第五條信息組成。
[0101]在步驟S103中,根據(jù)預(yù)存的動(dòng)詞的配價(jià)資源庫從會(huì)話場(chǎng)景中識(shí)別出事件的要素,并根據(jù)要素提取出事件。
[0102]在該實(shí)施例中,可以根據(jù)與動(dòng)詞發(fā)生聯(lián)系的名詞性成分的數(shù)量來確定動(dòng)詞的“價(jià)”,動(dòng)詞的配件資源庫中可以包含不同價(jià)的動(dòng)詞。
[0103]例如,“我把筆記本借給張三了”中的“借”支配了“我”、“筆記本”和“張三”,因此,
“借”是三價(jià)動(dòng)詞。其中“我”是施事、“筆記本”是與事、“張三”是受事。施事在語法上指動(dòng)作的主體,也就是發(fā)出動(dòng)作或發(fā)生變化的人或事物。受事在語法上指動(dòng)作的對(duì)象,也就是受動(dòng)作支配的人或事物。與事在語法上指接受某事物或從一行動(dòng)中獲益的人或事物。
[0104]動(dòng)詞的配價(jià)資源庫可以是開發(fā)人員根據(jù)需要自己構(gòu)建的,也可以由其他組織或機(jī)構(gòu)免費(fèi)向公眾提供的,移動(dòng)終端在接收并保存用戶輸入的動(dòng)詞的配價(jià)資源庫后,可以從會(huì)話場(chǎng)景中識(shí)別出事件的要素。
[0105]其中,事件的要素可以包括:事件的主題、時(shí)間、地點(diǎn)和參與物。在該實(shí)施例中,參與物是指參與的人和物,即事件的執(zhí)行主體、客體和執(zhí)行對(duì)象。
[0106]在識(shí)別出事件的要素之后,可以根據(jù)事件的要素提取出事件。
[0107]由于從交互信息中提取的會(huì)話場(chǎng)景為一組相關(guān)性很強(qiáng)的會(huì)話序列,因此,從會(huì)話場(chǎng)景中提取的事件要素比從所有交互信息中提取的事件要素關(guān)聯(lián)性更強(qiáng),同時(shí),根據(jù)動(dòng)詞的配價(jià)資源庫可以從會(huì)話場(chǎng)景中識(shí)別出更全面的事件要素,從而使得本實(shí)施例中,根據(jù)這些要素提取的事件更全面、更準(zhǔn)確。
[0108]上述事件提取方法實(shí)施例,通過分割出交互信息的會(huì)話場(chǎng)景,并根據(jù)預(yù)存的動(dòng)詞的配價(jià)資源庫從會(huì)話場(chǎng)景中識(shí)別出事件的要素,使得提取的事件要素關(guān)聯(lián)性更強(qiáng)、更全面,進(jìn)而使得根據(jù)事件的要素提取出的事件更準(zhǔn)確、更全面。
[0109]圖2是根據(jù)一示例性實(shí)施例示出的另一種事件提取方法的流程圖,如圖2所示,在上述步驟S103之后,該方法還可以包括:
[0110]在步驟S104中,生成事件的提醒記錄。
[0111]在該實(shí)施例中,在從交互信息中提取出事件之后,可以根據(jù)用戶的操作指令生成對(duì)應(yīng)事件的提醒記錄,例如,用戶可點(diǎn)擊短信,一鍵在日歷中添加對(duì)應(yīng)事件的提醒記錄;也可以是根據(jù)事件的級(jí)別自動(dòng)生成對(duì)應(yīng)事件的提醒記錄,例如,該事件為重要級(jí)別,則自動(dòng)生成對(duì)應(yīng)事件的提醒記錄。
[0112]上述事件提取方法實(shí)施例,通過生成事件的提醒記錄,為用戶提供提醒服務(wù),較好地提升用戶的使用體驗(yàn)。
[0113]圖3是根據(jù)一示例性實(shí)施例示出的一種分割出會(huì)話場(chǎng)景的方法流程圖,如圖3所示,分割出會(huì)話場(chǎng)景的方法可以包括:
[0114]在步驟S301中,使用CRF標(biāo)注出交互信息中每條交互信息所有可能存在的會(huì)話類型。
[0115]對(duì)于每條交互信息例如短信而言,它具有三種會(huì)話類型,即開始(B)會(huì)話、中間(I)會(huì)話和結(jié)束(E)會(huì)話。
[0116]在該實(shí)施例中,假設(shè)會(huì)話序列為:01,02,03…0n,Si表示0i的會(huì)話類型(i = 1...η),由于每個(gè)Si可能標(biāo)注的會(huì)話類型有{B,I,E} 3種,因此,Sl,S2,S3...Sn就有3的η次方種標(biāo)注方式。
[0117]在步驟S302中,從每條交互信息中提取出至少一個(gè)特征,計(jì)算每個(gè)特征相對(duì)于任一會(huì)話類型的權(quán)重。
[0118]在該實(shí)施例中,CRF可以從交互信息例如短信中提取出特征,其中,這些特征可以包括:短信的開頭詞(你好、好啊、在么……)、短信的結(jié)尾詞(拜拜、晚安、睡了……)、短信的發(fā)送或接收時(shí)間、相鄰短信的間隔時(shí)間、短信中的動(dòng)詞、短信中的命名實(shí)體(例如,時(shí)間、地點(diǎn)、人物)、相鄰短信中的動(dòng)詞組合、短信的長度、上一條短信與本條短信是否都為接收短
?目等。
[0119]然后,可以計(jì)算每個(gè)特征相對(duì)于任一會(huì)話類型的權(quán)重。
[0120]在步驟S303中,根據(jù)所有特征相對(duì)于不同會(huì)話類型的權(quán)重,確定出每條交互信息的會(huì)話類型。
[0121]在該實(shí)施例中,計(jì)算條件概率:P(S1,S2,S3…Sn/01,02,03…On),其中,SI, S2,
S3…Sn有3的n次方種標(biāo)注方式。
[0122]CRF根據(jù)所有特征相對(duì)于不同會(huì)話類型的權(quán)重,計(jì)算出一個(gè)最好的標(biāo)注方式,使得條件概率 P(S1,S2,S3…Sn/01,02,03…On)最大。
[0123]根據(jù)該最好的標(biāo)注方式就可以確定出每條交互信息的最終會(huì)話類型。
[0124]在步驟S304中,根據(jù)每條交互信息的會(huì)話類型從交互信息中分割出會(huì)話場(chǎng)景。
[0125]在該實(shí)施例中,假設(shè)01是開始會(huì)話,02和03是中間會(huì)話,04是結(jié)束會(huì)話,則可以從交互信息01,02,03…0n(n>5)中分割出會(huì)話場(chǎng)景01,02,03,04。
[0126]上述實(shí)施例,基于CRF從交互信息中分割出會(huì)話場(chǎng)景,實(shí)現(xiàn)方式簡單、準(zhǔn)確率高。
[0127]圖4是根據(jù)一示例性實(shí)施例示出的一種從會(huì)話場(chǎng)景中識(shí)別出事件的要素的方法流程圖,如圖4所示,包括如下步驟:
[0128]在步驟S401中,從會(huì)話場(chǎng)景中識(shí)別出動(dòng)詞集合。
[0129]假設(shè),從交互短信中分割出的會(huì)話場(chǎng)景為:
[0130]A:周末一塊吃飯?
[0131]B:好啊去哪?
[0132]A:中關(guān)村的眉州東坡,怎么樣?
[0133]B:不錯(cuò)晚上6點(diǎn)半左右在那碰面?
[0134]A:好的。那到時(shí)候見。
[0135]在該實(shí)施例中,從該會(huì)話場(chǎng)景中識(shí)別出的動(dòng)詞集合為:吃飯、去、碰面和見。
[0136]在步驟S402中,從上述動(dòng)詞集合中識(shí)別出事件的主題。
[0137]在該實(shí)施例中,可以采用分類模型識(shí)別出事件的主題。其中,分類模型可以包括但不限于決策樹、支持向量機(jī)(SVM)等分類器以及貝葉斯、邏輯回歸和最大熵模型。
[0138]其中,采用決策樹、支持向量機(jī)(SVM)等分類器時(shí),先對(duì)分類器進(jìn)行訓(xùn)練,以調(diào)整好分類器的參數(shù),然后采用訓(xùn)練好的分類器對(duì)動(dòng)詞集合中的動(dòng)詞進(jìn)行分類處理,以輸出屬于主題的動(dòng)詞。
[0139]而在采用貝葉斯、邏輯回歸和最大熵模型時(shí),根據(jù)動(dòng)詞
當(dāng)前第2頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1