本發(fā)明涉及互聯(lián)網(wǎng)閱讀領(lǐng)域,具體而言,涉及一種文章縮略文意生成方法、裝置及服務(wù)器。
背景技術(shù):
互聯(lián)網(wǎng)閱讀是當(dāng)下主流的閱讀方式。但隨著互聯(lián)網(wǎng)獲取信息的速度越來越快,用戶接收到的信息也越來越多。如何快速的了解信息的本質(zhì),節(jié)省閱讀時間是用戶最迫切的需要。特別是當(dāng)被閱讀的文章篇幅很長字?jǐn)?shù)較多時,通過閱讀文章縮略文意可以有效的節(jié)省用戶的閱讀時間,解決用戶最迫切的需求。但在信息爆炸時代,網(wǎng)絡(luò)文章泛濫,采用人工撰寫文章概略大意的方式會耗費巨大的人力物力,造成人力成本以及時間成本的浪費。
技術(shù)實現(xiàn)要素:
為了解決上述問題,本發(fā)明實施例采用的技術(shù)方案如下:
本發(fā)明實施例提供一種文章縮略文意生成方法,所述方法包括獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值;根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值;依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句;根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。
本發(fā)明實施例還提供一種文章縮略文意生成裝置,所述裝置包括:獲取模塊,用于獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值;計算模塊,用于根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值;篩選模塊,用于依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句;生成模塊,用于根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。
本發(fā)明實施例還提供一種服務(wù)器,所述服務(wù)器包括:第一存儲器;第一處理器;以及文章縮略文意生成裝置,所述文章縮略文意生成裝置安裝于所述第一存儲器中并包括一個或多個由所述第一處理器執(zhí)行的軟件功能模組,所述文章縮略文意生成裝置包括:獲取模塊,用于獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值;計算模塊,用于根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值;篩選模塊,用于依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句;生成模塊,用于根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。
與現(xiàn)有技術(shù)相比,本發(fā)明提供的一種文章縮略文意生成方法、裝置及服務(wù)器。通過獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值。依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句。根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。生成所述文章的縮略文意可以幫助用戶快速了解文章的主題大意,節(jié)約閱讀時間。同時,也省去人工撰寫文章縮略文意耗費的人力成本以及時間成本。
為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。
附圖說明
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1為本發(fā)明較佳實施例提供的應(yīng)用了文章縮略文意生成方法的服務(wù)器的方框示意圖。
圖2示出了本發(fā)明實施例提供的文章縮略文意生成方法流程圖。
圖3為圖2示出的獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值的子步驟流程圖。
圖4為圖2示出的計算得到文章的正文中每個語句的權(quán)重值的子步驟流程圖。
圖5為圖2示出的篩選出重要語句的子步驟流程圖。
圖6為圖2示出的生成所述文章的縮略文意的子步驟流程圖。
圖7示出了本發(fā)明實施例提供的文章縮略文意生成裝置的功能模塊示意圖。
圖8為圖7示出的獲得模塊的功能子模塊示意圖。
圖9為圖7示出的計算模塊的功能子模塊示意圖。
圖10為圖7示出的篩選模塊的功能子模塊示意圖。
圖11為圖7示出的生成模塊的功能子模塊示意圖。
圖標(biāo):100-服務(wù)器;111-存儲器;112-處理器;113-通信單元;200-文章縮略文意生成裝置;201-獲取模塊;2011-分詞子模塊;2012-獲得子模塊;202-計算模塊;2021-提取子模塊;2022-計算子模塊;203-篩選模塊;2031-排序子模塊;2032-篩選子模塊;204-生成模塊;2041-整合子模塊;2042-生成子模塊;205-預(yù)設(shè)置模塊;206-檢測模塊。
具體實施方式
下面將結(jié)合本發(fā)明實施例中附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。通常在此處附圖中描述和示出的本發(fā)明實施例的組件可以以各種不同的配置來布置和設(shè)計。因此,以下對在附圖中提供的本發(fā)明的實施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實施例?;诒景l(fā)明的實施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步定義和解釋。同時,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于區(qū)分描述,而不能理解為指示或暗示相對重要性。
請參照圖1,是服務(wù)器100的方框示意圖。所述服務(wù)器100包括文章縮略文意生成裝置200、存儲器111、處理器112及通信單元113。
所述存儲器111、處理器112以及通信單元113各元件相互之間直接或間接地電性連接,以實現(xiàn)數(shù)據(jù)的傳輸或交互。例如,這些元件相互之間可通過一條或多條通訊總線或信號線實現(xiàn)電性連接。所述文章縮略文意生成裝置200包括至少一個可以軟件或固件(Firmware)的形式存儲于所述存儲器111中或固化在所述服務(wù)器100的操作系統(tǒng)(Operating System,OS)中的軟件功能模塊。所述處理器112用于執(zhí)行所述存儲器111中存儲的可執(zhí)行模塊,例如所述文章縮略文意生成裝置200所包括的軟件功能模塊及計算機(jī)程序等。
其中,所述存儲器111可以是,但不限于,隨機(jī)存取存儲器(Random Access Memory,RAM),只讀存儲器(Read Only Memory,ROM),可編程只讀存儲器(Programmable Read-Only Memory,PROM),可擦除只讀存儲器(Erasable Programmable Read-Only Memory,EPROM),電可擦除只讀存儲器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存儲器111用于存儲程序或者數(shù)據(jù)。所述通信單元113用于通過所述網(wǎng)絡(luò)建立所述服務(wù)器100與其它通信終端之間的通信連接,并用于通過所述網(wǎng)絡(luò)收發(fā)數(shù)據(jù)。
應(yīng)當(dāng)理解的是,圖1所示的結(jié)構(gòu)僅為服務(wù)器100的結(jié)構(gòu)示意圖,所述服務(wù)器100還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。圖1中所示的各組件可以采用硬件、軟件或其組合實現(xiàn)。
第一實施例
請參考圖2,圖2為本發(fā)明較佳實施例提供的一種文章縮略文意生成方法的流程圖。文章縮略文意生成方法包括以下步驟:
步驟S101,獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。
在本實施例中,關(guān)鍵詞可以是,但不限于是,與表達(dá)文章主題大意有關(guān)的詞匯。在本實施例中,關(guān)鍵詞可以通過從文章中獲取的詞匯及響應(yīng)用戶操作生成的詞匯。所述操作可以是服務(wù)器100接收到的,也可以通過與服務(wù)器100通信連接的其它通信終端接收到并傳送至服務(wù)器100的操作。
所述關(guān)鍵詞對應(yīng)的權(quán)重值代表關(guān)鍵詞對文章主題內(nèi)容的相關(guān)程度,每一個關(guān)鍵詞均有一個對應(yīng)的權(quán)重值。
請參照圖3,在本實施例中,步驟S101可以包括以下子步驟。
子步驟S1011,對所述文章進(jìn)行分詞處理得到所述關(guān)鍵詞。
分詞處理是將連續(xù)的字序列按照一定規(guī)范重新組合成詞序列的過程。所述重新組合成詞序列可以采用基于字典的分詞規(guī)則進(jìn)行。在本實施例中,可以選用雙向匹配分詞法進(jìn)行分詞。
在本實施例中,通過對所述文章的正文及標(biāo)題進(jìn)行分詞處理得到各個分詞。再對得到的各個分詞進(jìn)行處理從而得到關(guān)鍵詞。
具體地,對各個分詞進(jìn)行處理從而得到關(guān)鍵詞的方式可以是,將各個分詞與預(yù)設(shè)的非表意詞進(jìn)行比對,并將分詞處理得到的各個分詞中的非表意詞進(jìn)行剔除,將剔除后的剩余的分詞作為關(guān)鍵詞。其中,所述非表意詞是指沒有實際意義的詞語,所述非表意詞可以包括副詞及感嘆詞等。例如,“的”“了”“地”等均屬于非表意詞。
子步驟S1012,根據(jù)預(yù)設(shè)規(guī)則得到每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。
在本實施例中,權(quán)重值的設(shè)置滿足以下關(guān)系,權(quán)重值越高的關(guān)鍵詞與文章表達(dá)的主題大意越相關(guān)。
在本實施例中,預(yù)設(shè)規(guī)則可以為在步驟S101之前根據(jù)文章的不同屬性對應(yīng)設(shè)置不同的預(yù)設(shè)規(guī)則。需要說明的是,文章的屬性包括文章的類型或文章的字?jǐn)?shù)。預(yù)設(shè)規(guī)則可以預(yù)先存儲于服務(wù)器100。同時在執(zhí)行步驟S101之前,服務(wù)器100會先檢測待縮略文意文章的文章屬性,并匹配出與所述文章屬性對應(yīng)的預(yù)設(shè)規(guī)則。具體地,所述預(yù)設(shè)規(guī)則可以是按照預(yù)設(shè)排序規(guī)則對所述關(guān)鍵詞進(jìn)行排序,對排序后的所述關(guān)鍵詞按權(quán)重值由大到小依次賦值,得到每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。
需要說明的是,預(yù)設(shè)排序規(guī)則可以是,但不限于是,通過判斷關(guān)鍵詞的獲得方式進(jìn)行排序。具體為,判斷所述關(guān)鍵詞是否為響應(yīng)用戶操作生成的,若所述關(guān)鍵詞為響應(yīng)用戶操作生成的,將響應(yīng)用戶操作生成的關(guān)鍵詞排在其它所有所述關(guān)鍵詞之前;判斷所述關(guān)鍵詞是否為對所述文章的標(biāo)題進(jìn)行分詞處理得到的關(guān)鍵詞,如果是對所述標(biāo)題進(jìn)行分詞處理得到的所述關(guān)鍵詞,將對所述標(biāo)題進(jìn)行分詞處理得到的所述關(guān)鍵詞排在響應(yīng)用戶操作生成的關(guān)鍵詞之后;判斷所述關(guān)鍵詞是否為對所述文章的正文進(jìn)行分詞處理得到的所述關(guān)鍵詞,如果是對所述正文進(jìn)行分詞處理得到的所述關(guān)鍵詞,統(tǒng)計所述關(guān)鍵詞在正文中出現(xiàn)的次數(shù),并根據(jù)出現(xiàn)次數(shù)以降序的方式排在對所述文章的標(biāo)題進(jìn)行分詞處理得到的關(guān)鍵詞之后。
步驟S102,根據(jù)所述關(guān)鍵詞及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值。
如圖4所示,本實施例中,步驟S102包括以下子步驟:
子步驟S1021,獲取所述文章的正文中每個語句包含的所述關(guān)鍵詞。
在本實施例中,每個語句的含義由構(gòu)成語句的詞語表達(dá)。因此語句中出現(xiàn)的關(guān)鍵詞所對應(yīng)的權(quán)重值可以反映語句與文章的主題大意之間關(guān)聯(lián)程度。
子步驟S1022,根據(jù)每個語句包含的所述關(guān)鍵詞所對應(yīng)的權(quán)重值計算得到每個所述語句的權(quán)重值從而獲得每個語句的權(quán)重值。
具體地,可以通過疊加語句中出現(xiàn)的關(guān)鍵詞的權(quán)重值獲得語句的權(quán)重值。例如,語句中出現(xiàn)了兩個關(guān)鍵詞,且兩個關(guān)鍵詞對應(yīng)的權(quán)重值分別為4和6,則該語句的權(quán)重值為10。
步驟S103,依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句。
在本實施例中,重要語句是文章縮略文意的主要組成部分。文章縮略文意的特點是簡短同時又能準(zhǔn)確、完整的表達(dá)文章主題大意的段落。為了使獲得的文章縮略文意在簡短的情況下又能準(zhǔn)確、完整的表達(dá)出來文章的主題大意,可以通過預(yù)設(shè)條件來限制控制重要語句的條數(shù)。其中,所述預(yù)設(shè)條件可以是通過不同的文章屬性進(jìn)行相應(yīng)的設(shè)置,并根據(jù)待縮略文意文章的屬性匹配出的與所述文章屬性相對應(yīng)的預(yù)設(shè)條件。
以自然科學(xué)類文章為例,由于自然科學(xué)類文章多為論證某一觀點的文章,因此這類文章的主題大意相對其它類型的文章更加明確,一般而言可以采用較少數(shù)量(比如,數(shù)量為6或7)的句子就能完整、準(zhǔn)確的展現(xiàn)文章的主題大意。再如人文類文章,由于人文類文章重在敘事,文章主題大意相比其他文章來說比較分散,一般而言采用較多數(shù)量(比如,數(shù)量為20條左右)的句子才能完整、準(zhǔn)確的展現(xiàn)文章主題大意。
在本實施例中,如圖5所示,步驟S103包括以下子步驟:
子步驟S1031,根據(jù)所述每個所述語句的權(quán)重值以降序的方式對所述每個語句進(jìn)行排序。
子步驟S1032,將排序在預(yù)設(shè)名次之前的語句作為重要語句。例如,預(yù)設(shè)名次可以為7,則取排序后的語句的前6條為重要語句。
步驟S104,根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。文章標(biāo)題可以點明文章中心,因此,依據(jù)文章的標(biāo)題以及所述重要語句生成的所述文章的縮略文意可以使文章的主體大意更加直觀。
在本實施例中,如圖6所示,步驟S104包括以下子步驟:
子步驟S1041,按照所述重要語句在所述文章中出現(xiàn)的先后順序,對所述重要語句進(jìn)行整合以形成文章的縮略文意的正文。將在文章中較先出現(xiàn)的所述重要語句排在比該重要語句后出現(xiàn)的重要語句之前。以保證文意的通順。
子步驟S1042,將所述文章的標(biāo)題放置于所述縮略文意的正文之前,形成文章的縮略文意。一般而言,文章標(biāo)題可以點明文章中心。將文章標(biāo)題放置于縮略文意的正文之前,可以使閱讀過程中快速地初步獲取文章主題大意。
第二實施例
請參照圖7,圖7為本發(fā)明實施例提供的文章縮略文意生成裝置200的功能模塊示意圖。所述文章縮略文意生成裝置200包括:獲取模塊201、計算模塊202、篩選模塊203及生成模塊204。
獲取模塊201,用于獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。
在本實施例中,關(guān)鍵詞可以是,但不限于是,與文章主題大意相關(guān)的詞匯。在本實施例中,關(guān)鍵詞可以是通過從文章中獲取的詞匯及響應(yīng)用戶操作生成的詞匯。所述操作可以是服務(wù)器100接收到的,也可以通過與服務(wù)器100通信連接的其它通信終端接收到并傳送至服務(wù)器100的操作。所述關(guān)鍵詞對應(yīng)的權(quán)重值代表關(guān)鍵詞對文章主題內(nèi)容的表達(dá)的重要程度,每一個關(guān)鍵詞均有一個對應(yīng)的權(quán)重值。
在本發(fā)明實施例中,所述步驟S101可以由獲取模塊201執(zhí)行。
需要說明的是,文章縮略文意生成裝置200還包括預(yù)設(shè)置模塊205及檢測模塊206。預(yù)設(shè)置模塊205用于在獲取模塊201執(zhí)行步驟S101之前,執(zhí)行根據(jù)不同屬性的文章對應(yīng)設(shè)置不同的預(yù)設(shè)規(guī)則。其中,所述文章的屬性包括文章的類型或文章的字?jǐn)?shù)。檢測模塊206,用于在獲取模塊201執(zhí)行步驟S101之前,執(zhí)行檢測待縮略文意文章的文章屬性,并匹配出與所述文章屬性對應(yīng)預(yù)設(shè)規(guī)則。
請參考圖8,獲取模塊201包括分詞子模塊2011及獲得子模塊2012。
分詞子模塊2011,用于對所述文章進(jìn)行分詞處理得到所述關(guān)鍵詞。
在本發(fā)明實施例中,所述步驟S1011可以由分詞子模塊2011執(zhí)行。
分詞處理是將連續(xù)的字序列按照一定規(guī)范重新組合成詞序列的過程。所述重新組合成詞序列的規(guī)范可以是,但不僅限于是可以采用基于字典的分詞規(guī)則進(jìn)行。優(yōu)選在本實施例中,分詞處理方法可以選用雙向匹配分詞法進(jìn)行分詞。
在本實施例中,通過對所述文章的正文及標(biāo)題進(jìn)行分詞處理得到各個分詞。再對得到的各個分詞進(jìn)行處理從而得到關(guān)鍵詞。
具體地,對各個分詞進(jìn)行處理從而得到關(guān)鍵詞的方式可以是,將各個分詞。例如,與預(yù)設(shè)的非表意詞進(jìn)行比對,并剔除將分詞處理得到的各個分詞中的非表意詞進(jìn)行剔除,將剔除后的剩余的分詞作為關(guān)鍵詞。需要說明的是,其中,所述非表意詞為是指沒有實際意義的詞語。,具體地,所述非表意詞可以包括副詞及以及感嘆詞等。例如,“的”“了”“地”等均屬于非表意詞。
獲得子模塊2012,用于根據(jù)預(yù)設(shè)規(guī)則得到每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。在本實施例中,權(quán)重值的設(shè)置滿足以下關(guān)系,權(quán)重值越高的關(guān)鍵詞與表達(dá)文章的主題大意越相關(guān)。
在本發(fā)明實施例中,所述步驟S1012可以由獲得子模塊2012執(zhí)行。優(yōu)選實施例中,預(yù)設(shè)規(guī)則可以是按照預(yù)設(shè)排序規(guī)則對所述關(guān)鍵詞進(jìn)行排序,對排序后的所述關(guān)鍵詞按權(quán)重值由大到小依次賦值,得到每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。
需要說明的是,預(yù)設(shè)排序規(guī)則可以是,但不限于是,通過判斷關(guān)鍵詞的獲得方式進(jìn)行排序。具體為,判斷所述關(guān)鍵詞是否為響應(yīng)用戶操作生成的,若所述關(guān)鍵詞為響應(yīng)用戶操作生成的,將響應(yīng)用戶操作生成的關(guān)鍵詞排在其它所有所述關(guān)鍵詞之前;判斷所述關(guān)鍵詞是否為對所述文章的標(biāo)題進(jìn)行分詞處理得到的關(guān)鍵詞,如果是對所述標(biāo)題進(jìn)行分詞處理得到的所述關(guān)鍵詞,將對所述標(biāo)題進(jìn)行分詞處理得到的所述關(guān)鍵詞排在響應(yīng)用戶操作生成的關(guān)鍵詞之后;判斷所述關(guān)鍵詞是否為對所述文章的正文進(jìn)行分詞處理得到的所述關(guān)鍵詞,如果是對所述正文進(jìn)行分詞處理得到的所述關(guān)鍵詞,統(tǒng)計所述關(guān)鍵詞在正文中出現(xiàn)的次數(shù),并根據(jù)出現(xiàn)次數(shù)以降序的方式排在對所述文章的標(biāo)題進(jìn)行分詞處理得到的關(guān)鍵詞之后。
計算模塊202,根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值。
在本發(fā)明實施例中,所述步驟S102可以由計算模塊202執(zhí)行。如圖9所示,計算模塊202包括提取子模塊2021及計算子模塊2022。
提取子模塊2021,用于獲取所述文章的正文中每個語句包含的所述關(guān)鍵詞。
在本發(fā)明實施例中,所述步驟S1021可以由提取子模塊2021執(zhí)行。每個語句的含義由構(gòu)成語句的詞語表達(dá)。因此語句中出現(xiàn)的關(guān)鍵詞所對應(yīng)的權(quán)重值也就可以反應(yīng)了反映該語句與文章的主題大意的之間關(guān)聯(lián)程度。
計算子模塊2022,用于根據(jù)每個語句包含的所述關(guān)鍵詞所對應(yīng)的權(quán)重值計算得到每個所述語句的權(quán)重值。具體地,可以通過疊加語句中出現(xiàn)的關(guān)鍵詞的權(quán)重值獲得語句的權(quán)重值。例如,語句中出現(xiàn)了兩個關(guān)鍵詞,且兩個關(guān)鍵詞對應(yīng)的權(quán)重值分別為4和6,則該語句的權(quán)重值為10。
在本發(fā)明實施例中,所述步驟S1022可以由計算子模塊2022執(zhí)行。
篩選模塊203,用于依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句。
在本發(fā)明實施例中,所述步驟S103可以由篩選模塊203執(zhí)行。需要說明的是,預(yù)設(shè)條件可以是預(yù)設(shè)置模塊205在獲取模塊201執(zhí)行步驟S101之前,執(zhí)行根據(jù)所述文章的不同屬性對應(yīng)設(shè)置的不同的預(yù)設(shè)條件。并由檢測模塊206在獲取模塊201執(zhí)行步驟S101之前,執(zhí)行檢測待縮略文意文章的文章屬性,并匹配出來的與所述文章屬性對應(yīng)的預(yù)設(shè)條件。例如,當(dāng)待縮略文意文章的總字?jǐn)?shù)較多(比如,文章總字?jǐn)?shù)超過1萬字),一般而言,總字?jǐn)?shù)較多的文章內(nèi)容比較豐富,需要用較多數(shù)量(例如,數(shù)量為30條)的重要語句才能完整、準(zhǔn)確的展現(xiàn)文章的主題大意。因此對應(yīng)的預(yù)設(shè)條件可以篩選出的重要語句條數(shù)要多。當(dāng)檢測模塊206,檢測出待縮略文意文章的總字?jǐn)?shù)較多時,將對應(yīng)匹配出可以篩選出的重要語句條數(shù)要多的預(yù)設(shè)條件。如圖10所示,篩選模塊203包括排序子模塊2031及篩選子模塊2032。
排序子模塊2031,用于根據(jù)所述每個所述語句的權(quán)重值以降序的方式對所述每個語句進(jìn)行排序。
在本發(fā)明實施例中,所述步驟S1031可以由排序子模塊2031執(zhí)行。
篩選子模塊2032,用于將排序在預(yù)設(shè)名次之前的語句作為重要語句。
在本發(fā)明實施例中,所述步驟S1032可以由篩選子模塊2032執(zhí)行。
生成模塊204,用于根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。文章標(biāo)題可以點明文章中心,因此,依據(jù)文章的標(biāo)題以及所述重要語句生成的所述文章的縮略文意可以使文章的主體大意更加直觀。
在本發(fā)明實施例中,所述步驟S104可以由排序子模塊2031執(zhí)行。如圖11所示,生成模塊204包括整合子模塊2041及生成子模塊2042。
整合子模塊2041,用于按照所述重要語句在所述文章中出現(xiàn)的先后順序,對所述重要語句進(jìn)行整合以形成文章的縮略文意的正文。將在文章中較先出現(xiàn)的所述重要語句排在比該重要語句后出現(xiàn)的重要語句之前。以保證文意的通順。
在本發(fā)明實施例中,所述步驟S1041可以由整合子模塊2041執(zhí)行。
生成子模塊2042,用于將所述文章的標(biāo)題放置于所述縮略文意的正文之前,形成文章的縮略文意。一般而言,文章標(biāo)題可以點明文章中心。將文章標(biāo)題放置于縮略文意的正文之前,可以使閱讀過程中快速地初步獲取文章主題大意。
在本發(fā)明實施例中,所述步驟S1042可以由生成子模塊2042執(zhí)行。
綜上所述,本發(fā)明提供的一種文章縮略文意生成方法及裝置。通過獲取關(guān)鍵詞以及與每個所述關(guān)鍵詞對應(yīng)的權(quán)重值。根據(jù)所述關(guān)鍵詞以及所述關(guān)鍵詞對應(yīng)的權(quán)重值計算得到所述文章的正文中每個語句的權(quán)重值。依據(jù)每個所述語句的權(quán)重值按照預(yù)設(shè)條件篩選出重要語句。根據(jù)文章的標(biāo)題及所述重要語句生成所述文章的縮略文意。生成的文章縮略文意可以幫助用戶快速了解文章的主題大意,節(jié)約閱讀時間。同時,也省去人工撰寫文章縮略文意耗費的人力成本以及時間成本。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置和方法,也可以通過其它的方式實現(xiàn)。以上所描述的裝置實施例僅僅是示意性的,例如,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的裝置、方法和計算機(jī)程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)方式中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機(jī)指令的組合來實現(xiàn)。
另外,在本發(fā)明各個實施例中的各功能模塊可以集成在一起形成一個獨立的部分,也可以是各個模塊單獨存在,也可以兩個或兩個以上模塊集成形成一個獨立的部分。
所述功能如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步定義和解釋。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。