技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種文件中圖片標注信息識別方法、裝置、服務(wù)器及計算機存儲介質(zhì)。本發(fā)明先對文件中的文本對象進行文字樣式聚類分析,得到具有不同文字樣式的多個第一文本對象集合,從多個第一文本對象集合中過濾掉正文文本對象集合,針對每個圖片頁面,篩選得到至少一個第二文本對象集合,不僅可以節(jié)省驗證資源,而且還提升了文件中圖片標注信息的識別速率,針對每一個第二文本對象集合,對屬于該文字樣式的文本對象進行有效性驗證,可以進一步提升圖片與圖片標注信息關(guān)聯(lián)的準確性。利用本發(fā)明提供的技術(shù)方案,能夠準確地將圖片標注信息與圖片關(guān)聯(lián)在一起,保證關(guān)聯(lián)后的文本對象能夠正確地對圖片進行解釋和說明。
技術(shù)研發(fā)人員:孫上斌;張恒
受保護的技術(shù)使用者:掌閱科技股份有限公司
技術(shù)研發(fā)日:2017.03.23
技術(shù)公布日:2017.07.07