技術(shù)編號(hào):40378746
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本申請(qǐng)涉及計(jì)算機(jī),尤其涉及一種長(zhǎng)文本解析方法、裝置、存儲(chǔ)介質(zhì)以及終端。背景技術(shù)、面對(duì)包括各種文檔的知識(shí)庫(kù),為了提升信息檢索的效率與準(zhǔn)確性,構(gòu)建高效、精準(zhǔn)的索引系統(tǒng)成為了不可或缺的一環(huán)。這一過程中,文檔解析的準(zhǔn)確性影響著文檔索引的準(zhǔn)確性。通常來說,文檔解析都是遵循著一套精心設(shè)計(jì)的規(guī)則與模式,將連續(xù)的文本流切割成一塊塊易于處理與理解的片段。然而,這種直接的解析方式,在應(yīng)對(duì)長(zhǎng)文本時(shí)卻逐漸顯露出其局限性。長(zhǎng)文本的內(nèi)部結(jié)構(gòu)復(fù)雜多變,上下文之間的關(guān)聯(lián)往往跨越了多個(gè)段落乃至章節(jié)。因此傳統(tǒng)的固定模式的解析方法...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。