語句處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本公開設(shè)及自然語言處理領(lǐng)域,特別設(shè)及一種語句處理方法及裝置。
【背景技術(shù)】
[0002] 隨著社交網(wǎng)絡(luò)的不斷發(fā)展,基于社交網(wǎng)絡(luò)的短文本語句(比如微博等)爆發(fā)出了巨 大的社會沖擊力,因此,對社交網(wǎng)絡(luò)中的短文本語句進(jìn)行語句處理,在網(wǎng)絡(luò)話題發(fā)現(xiàn)、節(jié)點(diǎn) 推薦W及廣告投放等方面都具有重要意義。
[0003] 目前的對社交網(wǎng)絡(luò)中的短文本語句進(jìn)行語句處理時,主要是根據(jù)節(jié)點(diǎn)之間的社會 關(guān)系的緊密程度進(jìn)行語句處理,比如,通過分析各個節(jié)點(diǎn)(比如一個用戶賬號)的網(wǎng)絡(luò)社交 行為(比如發(fā)帖、轉(zhuǎn)發(fā)、跟帖W及評論等)分析各個節(jié)點(diǎn)之間的關(guān)系緊密程度,并根據(jù)各個節(jié) 點(diǎn)之間的關(guān)系緊密程度對各個節(jié)點(diǎn)發(fā)布的短文本語句進(jìn)行歸類等處理。
[0004] 在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下問題:
[0005] 由于基于社交網(wǎng)絡(luò)的短文本語句具有語義內(nèi)容多元離散的特點(diǎn),同一節(jié)點(diǎn)即便是 在短時間內(nèi)發(fā)送的不同短文本語句,其語義之間也可能存在很大的差異,因此,現(xiàn)有的處理 方法會導(dǎo)致語句處理的準(zhǔn)確度較低。
【發(fā)明內(nèi)容】
[0006] 為了解決現(xiàn)有技術(shù)中根據(jù)各個節(jié)點(diǎn)之間的關(guān)系緊密程度對各個節(jié)點(diǎn)發(fā)布的短文 本語句進(jìn)行處理的方法會導(dǎo)致語句處理的準(zhǔn)確度較低的問題,本公開實(shí)施例提供了一種語 句處理方法及裝置,技術(shù)方案如下:
[0007] 根據(jù)本公開實(shí)施例的第一方面,提供了一種語句處理方法,包括:
[000引提取待處理語句的至少一個關(guān)鍵詞;
[0009] 從預(yù)先設(shè)置的語義向量集合中獲取所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量;所 述語義向量是由表示語義的實(shí)數(shù)組成的向量;
[0010] 根據(jù)所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量計算所述待處理語句的語義向量;
[0011] 對所述待處理語句的語義向量進(jìn)行縮放,獲得所述待處理語句的語義縮放結(jié)果;
[0012] 根據(jù)待處理語句的所述語義縮放結(jié)果對所述待處理語句進(jìn)行語句處理。
[0013] 可選的,所述根據(jù)所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量計算所述待處理語句 的語義向量,包括:
[0014] 對于所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量中的每一個維度,計算所述至少一 個關(guān)鍵詞各自對應(yīng)的語義向量在所述維度上的平均值;
[0015] 將所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量在所述每一個維度上的平均值所組 成的向量確定為所述待處理語句的語義向量。
[0016] 可選的,所述對所述待處理語句的語義向量進(jìn)行縮放,包括:
[0017] 根據(jù)預(yù)先設(shè)置的η階縮放矩陣Κη,按照下述公式對所述待處理語句的語義向量進(jìn) 行縮放:
[001 引 Υ = Κη*Χ;
[0019] 其中,X為所述待處理語句的語義向量,Υ為所述語義縮放結(jié)果,Κη用于指示沿X的 各個方向上的縮放比例。
[0020] 可選的,所述對所述待處理語句的語義向量進(jìn)行縮放,包括:
[0021] 確定到達(dá)所述待處理語句的語義向量的Ρ-范數(shù)小于預(yù)設(shè)縮放距離R的各個向量,R 為實(shí)數(shù);
[0022] 將確定的所述各個向量組成的向量空間獲取為所述語義縮放結(jié)果。
[0023] 可選的,所述根據(jù)所述待處理語句的縮放結(jié)果對所述待處理語句進(jìn)行語句處理, 包括:
[0024] 計算所述待處理語句的語義縮放結(jié)果與其它各個語句的語義縮放結(jié)果之間的交 集;
[0025] 根據(jù)所述待處理語句的語義縮放結(jié)果與其它各個語句的語義縮放結(jié)果之間的交 集對所述待處理語句進(jìn)行歸類。
[0026] 根據(jù)本公開實(shí)施例的第二方面,提供了一種語句處理裝置,所述裝置包括:
[0027] 關(guān)鍵詞提取模塊,用于提取待處理語句的至少一個關(guān)鍵詞;
[0028] 向量獲取模塊,用于從預(yù)先設(shè)置的語義向量集合中獲取所述至少一個關(guān)鍵詞各自 對應(yīng)的語義向量;所述語義向量是由表示語義的實(shí)數(shù)組成的向量;
[0029] 向量計算模塊,用于根據(jù)所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量計算所述待處 理語句的語義向量;
[0030] 向量縮放模塊,用于對所述待處理語句的語義向量進(jìn)行縮放,獲得所述待處理語 句的語義縮放結(jié)果;
[0031] 語句處理模塊,用于根據(jù)待處理語句的所述語義縮放結(jié)果對所述待處理語句進(jìn)行 語句處理。
[0032] 可選的,所述向量計算模塊,包括:
[0033] 平均值計算單元,用于對于所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量中的每一個 維度,計算所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量在所述維度上的平均值;
[0034] 第一確定單元,用于將所述至少一個關(guān)鍵詞各自對應(yīng)的語義向量在所述每一個維 度上的平均值所組成的向量確定為所述待處理語句的語義向量。
[0035] 可選的,所述向量縮放模塊,包括:
[0036] 縮放單元,用于根據(jù)預(yù)先設(shè)置的η階縮放矩陣Κη,按照下述公式對所述待處理語句 的語義向量進(jìn)行縮放:
[0037] Υ=Κη*Χ;
[0038] 其中,X為所述待處理語句的語義向量,Υ為所述語義縮放結(jié)果,Κη用于指示沿X的 各個方向上的縮放比例。
[0039] 可選的,所述向量縮放模塊,包括:
[0040] 第二確定單元,用于確定到達(dá)所述待處理語句的語義向量的Ρ-范數(shù)小于預(yù)設(shè)縮放 距離R的各個向量,R為實(shí)數(shù);
[0041] 結(jié)果獲取單元,用于將確定的所述各個向量組成的向量空間獲取為所述語義縮放 結(jié)果。
[0042] 可選的,所述語句處理模塊,包括:
[0043] 交集計算單元,用于計算所述待處理語句的語義縮放結(jié)果與其它各個語句的語義 縮放結(jié)果之間的交集;
[0044] 歸類單元,用于根據(jù)所述待處理語句的語義縮放結(jié)果與其它各個語句的語義縮放 結(jié)果之間的交集對所述待處理語句進(jìn)行歸類。
[0045] 本公開實(shí)施例提供的技術(shù)方案可W包括W下有益效果:
[0046] 通過提取待處理語句的至少一個關(guān)鍵詞,獲取該至少一個關(guān)鍵詞各自對應(yīng)的語義 向量;根據(jù)該至少一個關(guān)鍵詞各自對應(yīng)的語義向量計算該待處理語句的語義向量,對待處 理語句的語義向量進(jìn)行縮放,獲得該待處理語句的語義縮放結(jié)果,并根據(jù)待處理語句的該 語義縮放結(jié)果對待處理語句進(jìn)行語句處理,提供了一種根據(jù)語義對短文本語句進(jìn)行語句處 理的方法,達(dá)到提高語句處理的準(zhǔn)確度的效果。
[0047] 應(yīng)當(dāng)理解的是,W上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不 能限制本公開。
【附圖說明】
[0048] 此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施 例,并與說明書一起用于解釋本公開的原理。
[0049] 圖1是根據(jù)一示例性實(shí)施例示出的一種語句處理方法的流程圖;
[0050] 圖2是根據(jù)另一示例性實(shí)施例示出的一種語句處理方法的流程圖;
[0051 ]圖3是根據(jù)一示例性實(shí)施例示出的一種語句處理裝置的框圖;
[0052] 圖4是根據(jù)另一示例性實(shí)施例示出的一種語句處理裝置的框圖。
【具體實(shí)施方式】
[0053] 運(yùn)里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述設(shè)及 附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。W下示例性實(shí)施例 中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附 權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
[0054] 圖1是根據(jù)一示例性實(shí)施例示出的一種語句處理方法的流程圖,該方法可W應(yīng)用 于根據(jù)待處理語句的語義對待處理語句進(jìn)行語句處理,如圖1所示,該語句處理方法可W包 括如下幾個步驟:
[0化5] 步驟101,提取待處理語句的至少一個關(guān)鍵詞。
[0056] 步驟102,從預(yù)先設(shè)置的語義向量集合中獲取該至少一個關(guān)鍵詞各自對應(yīng)的語義 向量;該語義向量是由表示語義的實(shí)數(shù)組成的向量。
[0057] 步驟103,根據(jù)該至少一個關(guān)鍵詞各自對應(yīng)的語義向量計算該待處理語句的語義 向量。
[0058] 步驟104,對待處理語句的語義向量進(jìn)行縮放,獲得該待處理語句的語義縮放結(jié) 果。
[0059] 步驟105,根據(jù)待處理語句的該語義縮放結(jié)果對待處理語句進(jìn)行語句處理。
[0060] 綜上所述,本公開實(shí)施例所示的方法,通過提取待處理語句的至少一個關(guān)鍵詞,獲 取該至少一個關(guān)鍵詞各自對應(yīng)的語義向量;根據(jù)該至少一個關(guān)鍵詞各自對應(yīng)的語義向量計 算該待處理語句的語義向量,對待處理語句的語義向量進(jìn)行縮放,獲得該待處理語句的語 義縮放結(jié)果,并根據(jù)待處理語句的該語義縮放結(jié)果對待處理語句進(jìn)行語句處理,提供了一 種根據(jù)語義對短文本語句進(jìn)行語句處理的方法,達(dá)到提高語句處理的準(zhǔn)確度的效果。
[0061] 圖2是根據(jù)另一示例性實(shí)施例示出的一種語句處理方法的流程圖,該方法可W應(yīng) 用于根據(jù)待處理語句的語義對待處理語