1.基于ai的檔案信息資源智能共享方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于ai的檔案信息資源智能共享方法,其特征在于,步驟3中,結(jié)合tf-idf算法和textrank算法對關(guān)鍵詞進行提取,首先利用tf-idf算法計算每個詞語的重要性權(quán)重,然后利用textrank算法基于依存句法樹構(gòu)建的圖結(jié)構(gòu)進行迭代計算,最終選取權(quán)重較高的詞語作為關(guān)鍵詞,形成結(jié)構(gòu)化的關(guān)鍵詞列表;對于詞語wi,其tf-idf值為:
3.根據(jù)權(quán)利要求2所述的基于ai的檔案信息資源智能共享方法,其特征在于,采用transformer架構(gòu)作為預(yù)訓(xùn)練檔案信息資源理解大模型的基礎(chǔ),該架構(gòu)包含多個編碼器和解碼器層,每層由多頭自注意力機制和全連接神經(jīng)網(wǎng)絡(luò)組成,用于捕捉輸入文本的上下文信息和語義特征,模型構(gòu)建的步驟包括:
4.根據(jù)權(quán)利要求3所述的基于ai的檔案信息資源智能共享方法,其特征在于:所述步驟4中,將關(guān)鍵詞列表輸入到預(yù)訓(xùn)練的檔案信息資源理解大模型中,模型通過其內(nèi)部的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對關(guān)鍵詞列表進行語義解析,包括對關(guān)鍵詞之間關(guān)系的識別、語義角色的標注以及上下文信息的整合;基于模型對關(guān)鍵詞列表的語義解析結(jié)果,生成一個增強查詢文本,所述增強查詢文本不僅包含用戶原始查詢請求中的關(guān)鍵信息,還通過模型的語義理解能力進行了擴展和細化。
5.根據(jù)權(quán)利要求4所述的基于ai的檔案信息資源智能共享方法,其特征在于:所述步驟5中,根據(jù)步驟4生成的增強查詢文本,從預(yù)先構(gòu)建的多個維度的數(shù)據(jù)模塊中進行檢索,數(shù)據(jù)模塊包括檔案系統(tǒng)數(shù)據(jù)庫模塊、高維文檔向量數(shù)據(jù)庫模塊和檔案業(yè)務(wù)知識圖譜模塊,多個維度的數(shù)據(jù)模塊分別存儲了不同類型的檔案信息資源;將各個數(shù)據(jù)模塊中召回的候選答案進行融合,形成一個包含多個候選答案的集合。
6.根據(jù)權(quán)利要求5所述的基于ai的檔案信息資源智能共享方法,其特征在于,在每個數(shù)據(jù)模塊中,利用相應(yīng)的檢索算法和匹配機制,召回與查詢文本相關(guān)的候選答案:
7.根據(jù)權(quán)利要求3所述的基于ai的檔案信息資源智能共享方法,其特征在于,在s3中,梯度下降算法更新參數(shù)的公式為:
8.根據(jù)權(quán)利要求1所述的基于ai的檔案信息資源智能共享方法,其特征在于:在步驟6中,將構(gòu)建好的問答上下文文本傳入通用大語言模型,利用通用大語言模型的自然語言理解能力,對多個候選答案進行融合;融合過程中,通用大語言模型分析候選答案之間的邏輯關(guān)系、內(nèi)容相似度和信息互補性,生成一個綜合各個候選答案優(yōu)點的融合答案。
9.一種基于ai的檔案信息資源智能共享系統(tǒng),其特征在于,所述系統(tǒng)包括: