優(yōu)選的,處理器980可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其 中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶(hù)界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線 通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器980中。
[0132] 手機(jī)還包括給各個(gè)部件供電的電源990 (比如電池),優(yōu)選的,電源可以通過(guò)電源管 理系統(tǒng)與處理器980邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理 等功能。
[0133] 盡管未示出,手機(jī)還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。
[0134] 在本發(fā)明實(shí)施例中,該終端所包括的處理器980還具控制執(zhí)行方法實(shí)施例中各步 驟的功能。
[0135] 圖10是本發(fā)明實(shí)施例提供的服務(wù)器結(jié)構(gòu)示意圖,該服務(wù)器1000可配置或性能 不同而產(chǎn)生比較大的差異,可以包括一個(gè)或一個(gè)以上中央處理器(centralprocessing units,CPU) 1022 (例如,一個(gè)或一個(gè)以上處理器)和存儲(chǔ)器1032, 一個(gè)或一個(gè)以上存儲(chǔ)應(yīng) 用程序1042或數(shù)據(jù)1044的存儲(chǔ)介質(zhì)1030 (例如一個(gè)或一個(gè)以上海量存儲(chǔ)設(shè)備)。其中,存 儲(chǔ)器1032和存儲(chǔ)介質(zhì)1030可以是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)1030的程序可 以包括一個(gè)或一個(gè)以上模塊(圖示沒(méi)標(biāo)出),每個(gè)模塊可以包括對(duì)服務(wù)器中的一系列指令操 作。更進(jìn)一步地,中央處理器1022可以設(shè)置為與存儲(chǔ)介質(zhì)1030通信,在服務(wù)器1000上執(zhí) 行存儲(chǔ)介質(zhì)1030中的一系列指令操作。
[0136] 服務(wù)器1000還可以包括一個(gè)或一個(gè)以上電源1026, 一個(gè)或一個(gè)以上有線或無(wú) 線網(wǎng)絡(luò)接口 1050, 一個(gè)或一個(gè)以上輸入輸出接口 1058,和/或,一個(gè)或一個(gè)以上操作系統(tǒng) 1041,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM等等。
[0137] 上述實(shí)施例中由摘要生成裝置所執(zhí)行的步驟可以基于該圖10所示的服務(wù)器結(jié) 構(gòu)。
[0138] 值得注意的是,上述裝置實(shí)施例中,所包括的各個(gè)單元只是按照功能邏輯進(jìn)行劃 分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體 名稱(chēng)也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
[0139] 另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各方法實(shí)施例中的全部或部分步驟 是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,相應(yīng)的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
[0140] 以上僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明實(shí)施例揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替 換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范 圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種摘要生成方法,其特征在于,包括: 獲取正文內(nèi)容并獲取所述正文內(nèi)容的句子; 對(duì)正文內(nèi)容的各句子使用多元語(yǔ)言模型算法進(jìn)行分詞得到分詞結(jié)果,確定所述分詞結(jié) 果的特征向量;所述特征向量包含典型特征,典型特征對(duì)應(yīng)有特征權(quán)重;依據(jù)典型特征的 特征權(quán)重計(jì)算正文內(nèi)容的各句子的重要度; 依據(jù)計(jì)算得到的重要度由高往低從所述正文內(nèi)容中提取句子作為摘要。2. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述特征權(quán)重的獲得方法包括: 獲取訓(xùn)練正文,所述訓(xùn)練正文包含已知重要度的句子; 循環(huán)執(zhí)行如下步驟:對(duì)訓(xùn)練正文的句子使用多元語(yǔ)言模型算法進(jìn)行分詞得到分詞結(jié) 果,并確定分詞結(jié)果的特征向量,然后使用典型特征的初始特征權(quán)重計(jì)算訓(xùn)練正文的句子 的重要度,并調(diào)整初始特征權(quán)重; 直到計(jì)算得到的重要度與已知重要度的接近程度高于預(yù)定閾值時(shí),停止循環(huán)執(zhí)行過(guò) 程,并將最后一次調(diào)整后的初始特征權(quán)重作為所述典型特征的特征權(quán)重。3. 根據(jù)權(quán)利要求1或2所述方法,其特征在于,在所述依據(jù)計(jì)算得到的重要度由高往低 從所述正文內(nèi)容中提取句子之后,所述方法還包括: 刪除提取得到的句子,刪除的句子滿(mǎn)足如下條件:刪除的句子與保留的句子的相似度 高于預(yù)定門(mén)限,并且刪除的句子的重要度低于保留的句子的重要度。4. 根據(jù)權(quán)利要求1或2所述方法,其特征在于,在所述依據(jù)計(jì)算得到的重要度由高往低 從所述正文內(nèi)容中提取句子之后,所述方法還包括: 將提取得到的句子中的代詞替換為名詞,所述名詞為所述代詞指代的名詞。5. 根據(jù)權(quán)利要求1或2所述方法,其特征在于,在所述依據(jù)計(jì)算得到的重要度由高往低 從所述正文內(nèi)容中提取句子之后,所述方法還包括: 按照提取得到的句子在所述正文內(nèi)容中的順序進(jìn)行排序。6. 根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述方法還包括: 獲取約束條件; 所述依據(jù)計(jì)算得到的重要度從所述正文內(nèi)容中提取句子作為摘要包括:依據(jù)計(jì)算得到 的重要度和所述約束條件從所述正文內(nèi)容中提取句子作為摘要。7. 根據(jù)權(quán)利要求6所述方法,其特征在于,所述約束條件包括:摘要的字?jǐn)?shù)上限值,或 者,摘要的句子數(shù)量。8. 根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述典型特征的值包含:句子包含標(biāo)題 詞串的數(shù)量、句子包含重要詞串的數(shù)量、句子的長(zhǎng)度、句子在正文中的位置以及句子是否包 含總結(jié)性詞匯中的至少一項(xiàng)。9. 一種摘要生成裝置,其特征在于,包括: 句子提取單元,用于獲取正文內(nèi)容并獲取所述正文內(nèi)容的句子; 計(jì)算單元,用于對(duì)所述句子提取單元提取的正文內(nèi)容的各句子使用多元語(yǔ)言模型算法 進(jìn)行分詞得到分詞結(jié)果,確定所述分詞結(jié)果的特征向量;所述特征向量包含典型特征,典型 特征對(duì)應(yīng)有特征權(quán)重;依據(jù)典型特征的特征權(quán)重計(jì)算正文內(nèi)容的各句子的重要度; 摘要提取單元,用于依據(jù)所述計(jì)算單元計(jì)算得到的重要度由高往低從所述正文內(nèi)容中 提取句子作為摘要。10. 根據(jù)權(quán)利要求9所述裝置,其特征在于, 所述句子提取單元,還用于獲取訓(xùn)練正文,所述訓(xùn)練正文包含已知重要度的句子; 所述計(jì)算單元,還用于循環(huán)執(zhí)行:對(duì)訓(xùn)練正文的句子使用多元語(yǔ)言模型算法進(jìn)行分詞 得到分詞結(jié)果,并確定分詞結(jié)果的特征向量,然后使用典型特征的初始特征權(quán)重計(jì)算訓(xùn)練 正文的句子的重要度;所述裝置還包括: 權(quán)重調(diào)整單元,用于調(diào)整初始特征權(quán)重,直到所述計(jì)算單元計(jì)算得到的重要度與已知 重要度的接近程度高于預(yù)定閾值時(shí),停止循環(huán)執(zhí)行過(guò)程,并將最后一次調(diào)整后的初始特征 權(quán)重作為所述典型特征的特征權(quán)重。11. 根據(jù)權(quán)利要求9或10所述裝置,其特征在于,所述裝置還包括: 刪除控制單元,用于在所述摘要提取單元依據(jù)計(jì)算得到的重要度由高往低從所述正文 內(nèi)容中提取句子之后,刪除提取得到的句子,刪除的句子滿(mǎn)足如下條件:刪除的句子與保留 的句子的相似度高于預(yù)定門(mén)限,并且刪除的句子的重要度低于保留的句子的重要度。12. 根據(jù)權(quán)利要求9或10所述裝置,其特征在于,所述裝置還包括: 替換控制單元,用于在所述摘要提取單元依據(jù)計(jì)算得到的重要度由高往低從所述正文 內(nèi)容中提取句子之后,將提取得到的句子中的代詞替換為名詞,所述名詞為所述代詞指代 的名詞。13. 根據(jù)權(quán)利要求9或10所述裝置,其特征在于,所述裝置還包括: 排序單元,用于在所述摘要提取單元依據(jù)計(jì)算得到的重要度由高往低從所述正文內(nèi)容 中提取句子之后,按照提取得到的句子在所述正文內(nèi)容中的順序進(jìn)行排序。14. 根據(jù)權(quán)利要求9或10所述裝置,其特征在于,所述裝置還包括: 條件獲取單元,用于獲取約束條件; 所述摘要提取單元,用于依據(jù)所述計(jì)算單元計(jì)算得到的重要度和所述條件獲取單元獲 取到的約束條件從所述正文內(nèi)容中提取句子作為摘要。15. 根據(jù)權(quán)利要求14所述裝置,其特征在于, 所述條件獲取單元,用于獲取約束條件包括:摘要的字?jǐn)?shù)上限值,或者,摘要的句子數(shù) 量。16. 根據(jù)權(quán)利要求9或10所述裝置,其特征在于, 所述計(jì)算單元,用于確定所述分詞結(jié)果的特征向量所使用的所述典型特征的值包含: 句子包含標(biāo)題詞串的數(shù)量、句子包含重要詞串的數(shù)量、句子的長(zhǎng)度、句子在正文中的位置以 及句子是否包含總結(jié)性詞匯中的至少一項(xiàng)。
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了一種摘要生成方法及裝置,其中方法的實(shí)現(xiàn)包括:獲取正文內(nèi)容并獲取所述正文內(nèi)容的句子;對(duì)正文內(nèi)容的各句子使用多元語(yǔ)言模型算法進(jìn)行分詞得到分詞結(jié)果,確定所述分詞結(jié)果的特征向量;所述特征向量包含典型特征,典型特征對(duì)應(yīng)有特征權(quán)重;依據(jù)典型特征的特征權(quán)重計(jì)算正文內(nèi)容的各句子的重要度;依據(jù)計(jì)算得到的重要度由高往低從所述正文內(nèi)容中提取句子作為摘要。以上方法使用多元語(yǔ)言模型算法進(jìn)行分詞,使分詞不再依賴(lài)于詞典,而且能夠最大程度地保留信息量;可以從正文內(nèi)容中獲取到重要度高的句子并作為摘要使用。以上方案不再依賴(lài)于詞典也不必維護(hù)詞典,可以準(zhǔn)確并且高效的生成摘要。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN105005563
【申請(qǐng)?zhí)枴緾N201410151888
【發(fā)明人】蔡兵
【申請(qǐng)人】騰訊科技(深圳)有限公司
【公開(kāi)日】2015年10月28日
【申請(qǐng)日】2014年4月15日