本申請涉及人工智能,特別是涉及一種文本處理方法、裝置、計算機設備、存儲介質(zhì)和計算機程序產(chǎn)品。
背景技術:
1、在一些電力場景中,例如,檢索和問答等,需要利用自然語言模型,根據(jù)查詢信息,獲取對應的答案信息,為了提高自然語言處理能力,可以引入大語言模型,根據(jù)查詢信息,獲取對應的答案信息,完成檢索任務和/或問答任務,然而,由于大語言模型對于巨大規(guī)模參數(shù)的依賴,導致其在硬件計算資源上的高消耗,并由此引發(fā)了對于其處理的上下文長度限制問題。
2、在目前的技術中,一般會利用一個小模型作為外部模型,對大語言模型的輸入信息,進行數(shù)據(jù)預處理,減小大語言模型在硬件計算資源上的高消耗,不過,這種方法會導致整體復雜度較高和模型學習能力不強的問題,存在準確率低的問題。
技術實現(xiàn)思路
1、基于此,有必要針對上述技術問題,提供一種文本處理方法、裝置、計算機設備、存儲介質(zhì)和計算機程序產(chǎn)品。
2、第一方面,本申請?zhí)峁┝艘环N文本處理方法。所述方法包括:
3、獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;
4、對所述電力對象關聯(lián)信息進行文本識別處理,得到所述電力對象關聯(lián)信息的至少一個文本切片;
5、根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征;
6、根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息。
7、在其中一個實施例中,所述根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征,包括:對至少一個所述文本切片中每一所述文本切片進行文本識別處理,得到各所述文本切片對應的至少一個文本分詞;根據(jù)至少一個所述文本分詞,獲取各所述文本切片的所述關鍵電力特征。
8、在其中一個實施例中,所述根據(jù)至少一個所述文本分詞,獲取各所述文本切片的所述關鍵電力特征,包括:確定各所述文本分詞的權重值;根據(jù)至少一個所述文本分詞和各所述文本分詞對應的所述權重值,獲取各所述文本切片的所述關鍵電力特征。
9、在其中一個實施例中,所述根據(jù)至少一個所述文本分詞和各所述文本分詞對應的所述權重值,獲取各所述文本切片的所述關鍵電力特征,包括:根據(jù)各所述文本分詞對應的所述權重值,對至少一個所述文本分詞進行加權求和,得到對應的所述文本切片的所述關鍵電力特征。
10、在其中一個實施例中,所述根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息,包括:對所述電力查詢文本信息進行文本識別處理,得到所述電力查詢文本信息對應的至少一個查詢文本分詞;獲取各所述查詢文本分詞對應的查詢分詞實體,以及各所述查詢分詞實體之間的關系信息;根據(jù)所述關鍵電力特征、所述查詢分詞實體和所述關系信息,獲取所述待查詢電力對象對應的所述電力對象信息。
11、在其中一個實施例中,所述獲取所述待查詢電力對象對應的所述電力對象信息之前,還包括:確定所述關鍵電力特征的特征向量維度;將所述特征向量維度轉(zhuǎn)換為適配向量維度。
12、第二方面,本申請?zhí)峁┝艘环N文本處理裝置。所述裝置包括:
13、獲取模塊,用于獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;
14、文本識別模塊,用于對所述電力對象關聯(lián)信息進行文本識別處理,得到所述電力對象關聯(lián)信息的至少一個文本切片;
15、特征提取模塊,用于根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征;
16、答案生成模塊,用于根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息。
17、第三方面,本申請還提供了一種計算機設備。所述計算機設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)以下步驟:
18、獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;
19、對所述電力對象關聯(lián)信息進行文本識別處理,得到所述電力對象關聯(lián)信息的至少一個文本切片;
20、根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征;
21、根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息。
22、第四方面,本申請還提供了一種計算機可讀存儲介質(zhì)。所述計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
23、獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;
24、對所述電力對象關聯(lián)信息進行文本識別處理,得到所述電力對象關聯(lián)信息的至少一個文本切片;
25、根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征;
26、根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息。
27、第五方面,本申請還提供了一種計算機程序產(chǎn)品。所述計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
28、獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;
29、對所述電力對象關聯(lián)信息進行文本識別處理,得到所述電力對象關聯(lián)信息的至少一個文本切片;
30、根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征;
31、根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息。
32、上述文本處理方法、裝置、計算機設備、存儲介質(zhì)和計算機程序產(chǎn)品中,獲取針對待查詢電力對象的電力信息查詢請求的電力對象關聯(lián)信息;對電力對象關聯(lián)信息進行文本識別處理,得到電力對象關聯(lián)信息的至少一個文本切片;根據(jù)至少一個文本切片,獲取各文本切片的關鍵電力特征;根據(jù)關鍵電力特征和電力信息查詢請求包含的與待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取待查詢電力對象對應的電力對象信息。本申請實施例提供的該方法中,可以將大語言模型和文本壓縮進行結合,在得到針對電力信息查詢請求的電力對象關聯(lián)信息之后,可以對該電力對象關聯(lián)信息進行壓縮處理,即文本識別和關鍵特征提取,進而,可以獲取待查詢電力對象對應的電力對象信息,基于此,可以在降低模型計算復雜度的同時,也提高了電力對象信息獲取的準確度。
1.一種文本處理方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)至少一個所述文本切片,獲取各所述文本切片的關鍵電力特征,包括:
3.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)至少一個所述文本分詞,獲取各所述文本切片的所述關鍵電力特征,包括:
4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)至少一個所述文本分詞和各所述文本分詞對應的所述權重值,獲取各所述文本切片的所述關鍵電力特征,包括:
5.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述關鍵電力特征和所述電力信息查詢請求包含的與所述待查詢電力對象相關聯(lián)的電力查詢文本信息,獲取所述待查詢電力對象對應的電力對象信息,包括:
6.根據(jù)權利要求1-5中任一項所述的方法,其特征在于,所述獲取所述待查詢電力對象對應的所述電力對象信息之前,還包括:
7.一種文本處理裝置,其特征在于,所述裝置包括:
8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權利要求1-6任一項所述的方法的步驟。
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-6任一項所述的方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-6中任一項所述的方法的步驟。