本發(fā)明涉及網(wǎng)站編輯器技術領域,尤其是涉及一種人工智能模式下的網(wǎng)站編輯器文章錄入方法及系統(tǒng)。
背景技術:
如今,通過互聯(lián)網(wǎng)獲取信息已經(jīng)成為人們獲取信息的重要方式,很多企業(yè)、單位、個人都擁有自己的網(wǎng)站,各種類別、用途的網(wǎng)站多種多樣,在網(wǎng)站維護人員維護、更新網(wǎng)站的時候,往往需要用到網(wǎng)站編輯器,用以編輯發(fā)布到網(wǎng)站上的文章。
使用網(wǎng)站編輯器編輯內容時,往往需要輸入文字和插入圖片,形成圖文并茂的文章發(fā)布到網(wǎng)站上,當需要把紙質文稿的內容發(fā)布到網(wǎng)站上時,一般采取手動打字錄入文字到網(wǎng)站編輯器里,然后在網(wǎng)上人工查找符合主題的圖片插入文字中,但是,手動打字輸入文字和網(wǎng)上人工查找符合主題的圖片都比較耗時耗力、速度較慢,這樣一來,網(wǎng)站維護人員的工作量往往比較大。
技術實現(xiàn)要素:
本發(fā)明的目的在于克服上述技術不足,提出一種人工智能模式下的網(wǎng)站編輯器文章錄入方法及系統(tǒng),解決現(xiàn)有技術中錄入紙質文稿的內容和錄入配圖耗時耗力、速度較慢的技術問題。
一種人工智能模式下的網(wǎng)站編輯器文章錄入方法,其中,包括:
S1、使用攝像頭對紙質文稿進行掃描,生成所述紙質文稿的掃描文件;
S2、對所述掃描文件進行OCR文字圖片識別,獲取與所述掃描文件內容對應的文字和圖片;
S3、將獲取的文字和圖片錄入網(wǎng)站編輯器;
S4、當所述網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,利用自動分詞技術計算出所述文檔的主題;
S5、以所述文檔的主題為關鍵詞,在網(wǎng)絡圖片庫中進行關鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡圖片庫,利用爬蟲技術采集所述限縮的網(wǎng)絡圖片庫中的圖片;
S6、根據(jù)需要,選擇采集的部分圖片,錄入到所述網(wǎng)站編輯器。
一種人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),其中,包括:
掃描模塊:用于使用攝像頭對紙質文稿進行掃描,生成所述紙質文稿的掃描文件;
OCR識別模塊:用于對所述掃描文件進行OCR文字圖片識別,獲取與所述掃描文件內容對應的文字和圖片;
第一錄入模塊:用于將獲取的文字和圖片錄入網(wǎng)站編輯器;
主題計算模塊:用于當所述網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,然后利用自動分詞技術計算出所述文檔的主題;
采集圖片模塊:用于以所述文檔的主題為關鍵詞,在網(wǎng)絡圖片庫中進行關鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡圖片庫,利用爬蟲技術采集所述限縮的網(wǎng)絡圖片庫中的圖片;
第二錄入模塊:用于根據(jù)需要,選擇采集的部分圖片,錄入到所述網(wǎng)站編輯器。
與現(xiàn)有技術相比,本發(fā)明的有益效果包括:通過攝像頭掃描紙質文稿,形成掃描文件,然后對掃描文件進行OCR文字圖片識別,識別后獲取的文字和圖片錄入網(wǎng)站編輯器,與手動打字輸入文字相比,實現(xiàn)了紙質文稿的快速錄入;計算錄入的文字內容的主題,自動在網(wǎng)上搜索主題有關的圖片,并采用爬蟲技術采集搜索到的圖片,再從采集到的圖片中挑選部分圖片錄入網(wǎng)站編輯器,與人工搜索符合主題的圖片相比,實現(xiàn)了配圖的快速錄入。
附圖說明
圖1是本發(fā)明提供的一種人工智能模式下的網(wǎng)站編輯器文章錄入方法流程圖;
圖2是本發(fā)明提供的一種人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng)結構框圖。
附圖中:1、人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng),11、掃描模塊,12、OCR識別模塊,13、第一錄入模塊,14、主題計算模塊,15、采集圖片模塊,16、第二錄入模塊
具體實施方式
為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1,一種人工智能模式下的網(wǎng)站編輯器文章錄入方法,其中,包括:
S1、使用攝像頭對紙質文稿進行掃描,生成紙質文稿的掃描文件;
S2、對掃描文件進行OCR文字圖片識別,獲取與掃描文件內容對應的文字和圖片;
S3、將獲取的文字和圖片錄入網(wǎng)站編輯器;
S4、當網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,利用自動分詞技術計算出文檔的主題;
S5、以文檔的主題為關鍵詞,在網(wǎng)絡圖片庫中進行關鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡圖片庫,利用爬蟲技術采集限縮的網(wǎng)絡圖片庫中的圖片;
S6、根據(jù)需要,選擇采集的部分圖片,錄入到網(wǎng)站編輯器。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法中,步驟S1包括:
網(wǎng)站編輯器調用PC端或移動端的攝像頭對紙質文稿進行掃描,攝像頭與網(wǎng)站編輯器進行數(shù)據(jù)傳輸;
網(wǎng)站編輯器安裝于PC端,可以調用PC端的攝像頭,移動端通過掃描網(wǎng)站編輯器提供的二維碼與PC端的網(wǎng)站編輯器連接,網(wǎng)站編輯器此時也可以調用移動端攝像頭。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法中,步驟S4包括:
文檔的主題為一個或多個。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法中,步驟S5包括:
爬蟲程序首先獲取經(jīng)搜索操作后的網(wǎng)絡頁面的源代碼,然后過濾出源代碼中的圖片地址,根據(jù)過濾出來的圖片地址下載符合主題的網(wǎng)絡圖片庫中的圖片。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法中,步驟S6包括:
S5中采集到的都是符合主題的圖片,在S5采集到的圖片中人工選擇最為合適的圖片,點擊選擇的圖片,圖片就被錄入到網(wǎng)站編輯器中。
如圖2,一種人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng)1,其中,包括:
掃描模塊11:用于使用攝像頭對紙質文稿進行掃描,生成紙質文稿的掃描文件;
OCR識別模塊12:用于對掃描文件進行OCR文字圖片識別,獲取與掃描文件內容對應的文字和圖片;
第一錄入模塊13:用于將獲取的文字和圖片錄入網(wǎng)站編輯器;
主題計算模塊14:用于當網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,然后利用自動分詞技術計算出文檔的主題;
采集圖片模塊15:用于以文檔的主題為關鍵詞,在網(wǎng)絡圖片庫中進行關鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡圖片庫,利用爬蟲技術采集限縮的網(wǎng)絡圖片庫中的圖片;
第二錄入模塊16:用于根據(jù)需要,選擇采集的部分圖片,錄入到網(wǎng)站編輯器。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng)1中,掃描模塊11:
網(wǎng)站編輯器調用PC端或移動端的攝像頭對紙質文稿進行掃描,攝像頭與網(wǎng)站編輯器進行數(shù)據(jù)傳輸。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng)1中,主題計算模塊14:
文檔的主題為一個或多個。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入系統(tǒng)1中,采集圖片模塊15:
爬蟲程序首先獲取目標網(wǎng)頁的源代碼,過濾出源代碼中的圖片地址,根據(jù)過濾出來的圖片地址下載限縮的網(wǎng)絡圖片庫中的圖片。
本發(fā)明所述的人工智能模式下的網(wǎng)站編輯器文章錄入方法及系統(tǒng)在使用時,利用攝像頭對紙質文稿進行掃描,生成紙質文稿的掃描文件;對掃描文件進行OCR文字圖片識別,獲取與掃描文件內容對應的文字和圖片;將獲取的文字和圖片錄入網(wǎng)站編輯器;當網(wǎng)站編輯器錄入文字后,錄入的文字形成文檔,利用自動分詞技術計算出文檔的主題;以文檔的主題為關鍵詞,在網(wǎng)絡圖片庫中進行關鍵詞搜索,得到符合搜索條件的限縮的網(wǎng)絡圖片庫,利用爬蟲技術采集限縮的網(wǎng)絡圖片庫中的圖片;根據(jù)需要,選擇采集的部分圖片,錄入到網(wǎng)站編輯器,由此,紙質文稿內容和符合主題的圖片快速錄入到網(wǎng)站編輯器里。
與現(xiàn)有技術相比,本發(fā)明的有益效果包括:通過攝像頭掃描紙質文稿,形成掃描文件,然后對掃描文件進行OCR文字圖片識別,識別后獲取的文字和圖片錄入網(wǎng)站編輯器,與手動打字輸入文字相比,實現(xiàn)了紙質文稿的快速錄入;計算錄入的文字內容的主題,自動在網(wǎng)上搜索主題有關的圖片,并采用爬蟲技術采集搜索到的圖片,再從采集到的圖片中挑選部分圖片錄入網(wǎng)站編輯器,與人工搜索符合主題的圖片相比,實現(xiàn)了配圖的快速錄入。
以上所述本發(fā)明的具體實施方式,并不構成對本發(fā)明保護范圍的限定。任何根據(jù)本發(fā)明的技術構思所做出的各種其他相應的改變與變形,均應包含在本發(fā)明權利要求的保護范圍內。