1.一種人工智能模式下的網(wǎng)站編輯器文章錄入方法,其特征在于,包括:
S1、使用攝像頭對紙質(zhì)文稿進(jìn)行掃描,生成所述紙質(zhì)文稿的掃描文件;
S2、對所述掃描文件進(jìn)行OCR文字圖片識別,獲取與所述掃描文件內(nèi)容對應(yīng)的文字和圖片;
S3、將獲取的文字和圖片錄入網(wǎng)站編輯器;
S4、當(dāng)所述網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,利用自動分詞技術(shù)計算出所述文檔的主題;
S5、以所述文檔的主題為關(guān)鍵詞,在網(wǎng)絡(luò)圖片庫中進(jìn)行關(guān)鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡(luò)圖片庫,利用爬蟲技術(shù)采集所述限縮的網(wǎng)絡(luò)圖片庫中的圖片;
S6、根據(jù)需要,選擇采集的部分圖片,錄入到所述網(wǎng)站編輯器。
2.如權(quán)利要求1所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法,其特征在于,步驟S1包括:
網(wǎng)站編輯器調(diào)用PC端或移動端的攝像頭對紙質(zhì)文稿進(jìn)行掃描,所述攝像頭與網(wǎng)站編輯器進(jìn)行數(shù)據(jù)傳輸。
3.如權(quán)利要求1所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法,其特征在于,步驟S4包括:
所述文檔的主題為一個或多個。
4.如權(quán)利要求1所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法,其特征在于,步驟S5包括:
爬蟲程序首先獲取目標(biāo)網(wǎng)頁的源代碼,過濾出源代碼中的圖片地址,根據(jù)過濾出來的圖片地址下載所述限縮的網(wǎng)絡(luò)圖片庫中的圖片。
5.一種人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),其特征在于,包括:
掃描模塊:用于使用攝像頭對紙質(zhì)文稿進(jìn)行掃描,生成所述紙質(zhì)文稿的掃描文件;
OCR識別模塊:用于對所述掃描文件進(jìn)行OCR文字圖片識別,獲取與所述掃描文件內(nèi)容對應(yīng)的文字和圖片;
第一錄入模塊:用于將獲取的文字和圖片錄入網(wǎng)站編輯器;
主題計算模塊:用于當(dāng)所述網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,然后利用自動分詞技術(shù)計算出所述文檔的主題;
采集圖片模塊:用于以所述文檔的主題為關(guān)鍵詞,在網(wǎng)絡(luò)圖片庫中進(jìn)行關(guān)鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡(luò)圖片庫,利用爬蟲技術(shù)采集所述限縮的網(wǎng)絡(luò)圖片庫中的圖片;
第二錄入模塊:用于根據(jù)需要,選擇采集的部分圖片,錄入到所述網(wǎng)站編輯器。
6.如權(quán)利要求5所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),其特征在于,掃描模塊:
網(wǎng)站編輯器調(diào)用PC端或移動端的攝像頭對紙質(zhì)文稿進(jìn)行掃描,所述攝像頭與網(wǎng)站編輯器進(jìn)行數(shù)據(jù)傳輸。
7.如權(quán)利要求5所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),其特征在于,主題計算模塊:
所述文檔的主題為一個或多個。
8.如權(quán)利要求5所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),其特征在于,采集圖片模塊:
爬蟲程序首先獲取目標(biāo)網(wǎng)頁的源代碼,過濾出源代碼中的圖片地址,根據(jù)過濾出來的圖片地址下載所述限縮的網(wǎng)絡(luò)圖片庫中的圖片。