本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于云計(jì)算的信息檢索分類系統(tǒng)及方法。
背景技術(shù):
“云計(jì)算”概念是由google提出的,狹義云計(jì)算是指it基礎(chǔ)設(shè)施的交付和使用模式,指通過網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需的資源。廣義的云計(jì)算是指服務(wù)的交付和使用模式,指通過網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需的服務(wù)。云計(jì)算將應(yīng)用“計(jì)算”從終端轉(zhuǎn)移到服務(wù)終端,從而弱化了對移動終端設(shè)備的處理需求。這樣移動終端主要承擔(dān)與用戶交互功能,復(fù)雜的運(yùn)算交由云端服務(wù)器處理,終端不需要強(qiáng)大的運(yùn)算能力既可響應(yīng)用戶操作,并將結(jié)果展現(xiàn)給用戶,從而實(shí)現(xiàn)豐富的應(yīng)用。
但是,在實(shí)際應(yīng)用過程中,多是檢索預(yù)存儲的科技文獻(xiàn)資料,并不能夠檢索比對紙質(zhì)文獻(xiàn),多需要專業(yè)人員將科技檔案轉(zhuǎn)換為電子文檔格式,再進(jìn)行檢索出來。同時,在文獻(xiàn)檢索過程中,并未確定待檢索的類型,而檢索數(shù)據(jù)量大。用戶在獲取檢索結(jié)果之后,并不能夠根據(jù)用戶需求,進(jìn)行顯示。
如何加快信息入錄速率,提高科技文獻(xiàn)的檢索效率,是本領(lǐng)域技術(shù)人員亟需解決的問題。
技術(shù)實(shí)現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供了一種基于云計(jì)算的信息檢索分類系統(tǒng)及方法,能夠加快信息入錄速率,提高科技文獻(xiàn)的檢索效率。
第一方面,本發(fā)明提供一種基于云計(jì)算的信息檢索分類系統(tǒng),該系統(tǒng)包括:依次通信連接的終端、檢索分析服務(wù)器和云端服務(wù)器,終端用于發(fā)送檢索請求至檢索分析服務(wù)器,檢索分析服務(wù)器用于對檢索請求進(jìn)行分析,并發(fā)送至相應(yīng)的云端服務(wù)器,云端服務(wù)器用于根據(jù)檢索請求,基于云計(jì)算執(zhí)行信息檢索。
本發(fā)明提供另一種基于云計(jì)算的信息檢索分類系統(tǒng),該系統(tǒng)包括攝像頭、掃描儀、服務(wù)終端、檢索分析服務(wù)器和云端服務(wù)器,服務(wù)終端包括圖像處理子系統(tǒng)、光學(xué)文字識別子系統(tǒng)、信息處理子系統(tǒng)、數(shù)據(jù)存儲子系統(tǒng)、傳輸子系統(tǒng)和觸摸顯示屏,圖像處理子系統(tǒng)、光學(xué)文字識別子系統(tǒng)、信息處理子系統(tǒng)和數(shù)據(jù)存儲子系統(tǒng)依次連接,信息處理子系統(tǒng)還分別與傳輸子系統(tǒng)和觸摸顯示屏連接,攝像頭和掃描儀均與圖像處理子系統(tǒng)連接,傳輸子系統(tǒng)、檢索分析服務(wù)器和云端服務(wù)器依次連接,攝像頭用于采集科技檔案的圖像信息或視頻信息,并傳輸至圖像處理子系統(tǒng),掃描儀用于掃描科技檔案,獲取掃描信息,并傳輸至圖像處理子系統(tǒng),圖像處理子系統(tǒng)用于預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件,光學(xué)文字識別子系統(tǒng)用于識別圖像文件中的字符,獲取科技檔案的字符信息,并傳輸至信息處理子系統(tǒng),信息處理子系統(tǒng)用于根據(jù)字符信息,生成檢索請求,并將檢索請求和字符信息通過傳輸子系統(tǒng)傳輸至檢索分析服務(wù)器,還用于將傳輸子系統(tǒng)反饋的檢索結(jié)果暫存至數(shù)據(jù)存儲子系統(tǒng),并根據(jù)觸摸顯示屏傳輸?shù)娘@示指令,從數(shù)據(jù)存儲子系統(tǒng)中調(diào)取檢索結(jié)果,傳輸至觸摸顯示屏,檢索分析服務(wù)器用于分析檢索請求,獲取檢索請求的檢索類型,確定與檢索類型相應(yīng)的目標(biāo)云端服務(wù)器,并將檢索請求和字符信息發(fā)送至目標(biāo)云端服務(wù)器,目標(biāo)云端服務(wù)器用于根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并將檢索結(jié)果依次通過檢索分析服務(wù)器、傳輸子系統(tǒng)傳輸至信息處理子系統(tǒng),數(shù)據(jù)存儲子系統(tǒng)用于暫存檢索結(jié)果,觸摸顯示屏用于接收用戶輸入的顯示指令,并傳輸至信息處理子系統(tǒng),還用于顯示信息處理子系統(tǒng)傳輸?shù)臋z索結(jié)果。
進(jìn)一步地,圖像處理子系統(tǒng)包括依次連接的數(shù)模轉(zhuǎn)換器和dsp處理器,攝像頭和掃描儀均與數(shù)模轉(zhuǎn)換器連接,dsp處理器與光學(xué)文字識別子系統(tǒng)連接,數(shù)模轉(zhuǎn)換器用于將攝像頭采集的視頻信息轉(zhuǎn)換為數(shù)字信息,dsp處理器用于實(shí)時預(yù)處理數(shù)字信息、圖像信息和掃描信息,獲取目標(biāo)格式的圖像文件。
進(jìn)一步地,光學(xué)文字識別子系統(tǒng)包括arm處理器,dsp處理器通過hpi接口與arm處理器連接,hpi接口用于dsp和arm處理器之間的信息交換,arm處理器用于識別目標(biāo)格式的圖像文件,獲取文字信息。
基于上述任意基于云計(jì)算的信息檢索分類系統(tǒng)實(shí)施例,進(jìn)一步地,傳輸子系統(tǒng)包括依次連接的接入路由器和硬件防火墻,信息處理子系統(tǒng)通過無線網(wǎng)絡(luò)連接到接入路由器,硬件防火墻的安全接入網(wǎng)關(guān)連接到檢索分析服務(wù)器。
第二方面,本發(fā)明提供一種基于云計(jì)算的信息檢索分類方法,該方法包括:
信息輸入步驟:采集科技檔案的圖像信息或視頻信息,或掃描科技檔案,獲取掃描信息;
圖像處理步驟:預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件;
光學(xué)文字識別步驟:識別圖像文件中的字符,獲取科技檔案的字符信息;
檢索請求生成步驟:根據(jù)字符信息,生成檢索請求;
檢索請求分析步驟:分析檢索請求,獲取檢索請求的檢索類型,確定與檢索類型相應(yīng)的目標(biāo)云端服務(wù)器的地址;
記錄檢索請求的源地址;
按照目標(biāo)云端服務(wù)器的地址,發(fā)送檢索請求、字符信息和檢索請求的源地址;
信息檢索步驟:根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并按照檢索請求的源地址,反饋檢索結(jié)果;
信息顯示步驟:接收用戶輸入的顯示指令,根據(jù)顯示指令,顯示反饋的檢索結(jié)果。
進(jìn)一步地,預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件,具體包括:
根據(jù)每幀圖像的采集時間,將視頻信息分解為每幀圖像;
對圖像信息、視頻信息分解的每幀圖像或掃描信息進(jìn)行平滑、降噪處理;
按照指定的存儲格式,將平滑、降噪處理后的圖像信息、視頻信息分解的每幀圖像或掃描信息進(jìn)行格式轉(zhuǎn)換,獲取目標(biāo)格式的圖像文件。
進(jìn)一步地,識別圖像文件中的字符,獲取科技檔案的字符信息,具體包括:
按照圖像文件的灰度值,識別圖像文件中的字符,獲取科技檔案的字符信息,圖像文件為二值圖像。
基于上述任意基于云計(jì)算的信息檢索分類方法實(shí)施例,進(jìn)一步地,根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并按照檢索請求的源地址,反饋檢索結(jié)果,具體包括:
根據(jù)檢索請求,調(diào)取預(yù)存儲的科技檔案;
將字符信息與每篇科技檔案的關(guān)鍵詞或摘要信息進(jìn)行比對,獲取對比度;
將對比度最高的科技檔案,作為檢索結(jié)果,并傳輸至檢索請求的源地址。
由上述技術(shù)方案可知,本實(shí)施例提供的基于云計(jì)算的信息檢索分類系統(tǒng)及方法,能夠通過攝像頭采集待入錄的科技檔案,形成圖像信息或視頻信息,或通過掃描儀采集待入錄科技檔案的掃描信息,完成信息采集。同時,圖像處理子系統(tǒng)對采集到的信息進(jìn)行預(yù)處理,以便于光學(xué)文字識別子系統(tǒng)能夠識別出文字信息,加快科技文獻(xiàn)資料的入錄進(jìn)程。
同時,該系統(tǒng)通過檢索分析服務(wù)器確定檢索請求的類型,再進(jìn)行檢索,以便于提高科技文獻(xiàn)的檢索效率。并且,該系統(tǒng)還能夠?qū)⒔邮沼脩酎c(diǎn)選的顯示指令,以將反饋的檢索結(jié)果進(jìn)行顯示,方便用戶進(jìn)行信息瀏覽。
因此,本實(shí)施例基于云計(jì)算的信息檢索分類系統(tǒng)及方法,能夠加快信息入錄速率,提高科技文獻(xiàn)的檢索效率。
附圖說明
為了更清楚地說明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識。附圖中,各元件或部分并不一定按照實(shí)際的比例繪制。
圖1示出了本發(fā)明所提供的一種基于云計(jì)算的信息檢索分類系統(tǒng)的結(jié)構(gòu)示意圖;
圖2示出了本發(fā)明所提供的另一種基于云計(jì)算的信息檢索分類系統(tǒng)的方法流程圖。
具體實(shí)施方式
下面將結(jié)合附圖對本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
第一方面,本發(fā)明實(shí)施例所提供的一種基于云計(jì)算的信息檢索分類系統(tǒng),該系統(tǒng)包括依次通信連接的終端、檢索分析服務(wù)器和云端服務(wù)器,終端用于發(fā)送檢索請求至檢索分析服務(wù)器,檢索分析服務(wù)器用于對檢索請求進(jìn)行分析,并發(fā)送至相應(yīng)的云端服務(wù)器,云端服務(wù)器用于根據(jù)檢索請求,基于云計(jì)算執(zhí)行信息檢索。
本發(fā)明實(shí)施例所提供的另一種基于云計(jì)算的信息檢索分類系統(tǒng),結(jié)合圖1,該系統(tǒng)包括攝像頭1、掃描儀2、服務(wù)終端3、檢索分析服務(wù)器4和云端服務(wù)器5,服務(wù)終端3包括圖像處理子系統(tǒng)31、光學(xué)文字識別子系統(tǒng)32、信息處理子系統(tǒng)、數(shù)據(jù)存儲子系統(tǒng)34、傳輸子系統(tǒng)35和觸摸顯示屏36,圖像處理子系統(tǒng)31、光學(xué)文字識別子系統(tǒng)32、信息處理子系統(tǒng)和數(shù)據(jù)存儲子系統(tǒng)34依次連接,信息處理子系統(tǒng)還分別與傳輸子系統(tǒng)35和觸摸顯示屏36連接,攝像頭1和掃描儀2均與圖像處理子系統(tǒng)31連接,傳輸子系統(tǒng)35、檢索分析服務(wù)器4和云端服務(wù)器5依次連接,攝像頭1用于采集科技檔案的圖像信息或視頻信息,并傳輸至圖像處理子系統(tǒng)31,掃描儀2用于掃描科技檔案,獲取掃描信息,并傳輸至圖像處理子系統(tǒng)31,圖像處理子系統(tǒng)31用于預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件,光學(xué)文字識別子系統(tǒng)32用于識別圖像文件中的字符,獲取科技檔案的字符信息,并傳輸至信息處理子系統(tǒng),信息處理子系統(tǒng)用于根據(jù)字符信息,生成檢索請求,并將檢索請求和字符信息通過傳輸子系統(tǒng)35傳輸至檢索分析服務(wù)器4,還用于將傳輸子系統(tǒng)35反饋的檢索結(jié)果暫存至數(shù)據(jù)存儲子系統(tǒng)34,并根據(jù)觸摸顯示屏36傳輸?shù)娘@示指令,從數(shù)據(jù)存儲子系統(tǒng)34中調(diào)取檢索結(jié)果,傳輸至觸摸顯示屏36,檢索分析服務(wù)器4用于分析檢索請求,獲取檢索請求的檢索類型,確定與檢索類型相應(yīng)的目標(biāo)云端服務(wù)器5,并將檢索請求和字符信息發(fā)送至目標(biāo)云端服務(wù)器5,目標(biāo)云端服務(wù)器5用于根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并將檢索結(jié)果依次通過檢索分析服務(wù)器4、傳輸子系統(tǒng)35傳輸至信息處理子系統(tǒng),數(shù)據(jù)存儲子系統(tǒng)34用于暫存檢索結(jié)果,觸摸顯示屏36用于接收用戶輸入的顯示指令,并傳輸至信息處理子系統(tǒng),還用于顯示信息處理子系統(tǒng)傳輸?shù)臋z索結(jié)果。其中,攝像頭優(yōu)選采用ccd攝像頭,靈敏度高,信號轉(zhuǎn)換不易失真。
由上述技術(shù)方案可知,本實(shí)施例提供的基于云計(jì)算的信息檢索分類系統(tǒng),能夠通過攝像頭1采集待入錄的科技檔案,形成圖像信息或視頻信息,或通過掃描儀2采集待入錄科技檔案的掃描信息,完成信息采集。同時,圖像處理子系統(tǒng)31對采集到的信息進(jìn)行預(yù)處理,以便于光學(xué)文字識別子系統(tǒng)32能夠識別出文字信息,加快科技文獻(xiàn)資料的入錄進(jìn)程。
同時,該系統(tǒng)通過檢索分析服務(wù)器4確定檢索請求的類型,再進(jìn)行檢索,以便于提高科技文獻(xiàn)的檢索效率。并且,該系統(tǒng)還能夠?qū)⒔邮沼脩酎c(diǎn)選的顯示指令,以將反饋的檢索結(jié)果進(jìn)行顯示,方便用戶進(jìn)行信息瀏覽。
因此,本實(shí)施例基于云計(jì)算的信息檢索分類系統(tǒng),能夠加快信息入錄速率,提高科技文獻(xiàn)的檢索效率。
為了進(jìn)一步提高本實(shí)施例基于云計(jì)算的信息檢索分類系統(tǒng)的可靠性,具體地,對于圖像處理子系統(tǒng),圖像處理子系統(tǒng)31包括依次連接的數(shù)模轉(zhuǎn)換器和dsp處理器,攝像頭1和掃描儀2均與數(shù)模轉(zhuǎn)換器連接,dsp處理器與光學(xué)文字識別子系統(tǒng)32連接,數(shù)模轉(zhuǎn)換器用于將攝像頭1采集的視頻信息轉(zhuǎn)換為數(shù)字信息,dsp處理器用于實(shí)時預(yù)處理數(shù)字信息、圖像信息和掃描信息,獲取目標(biāo)格式的圖像文件。在此,數(shù)模轉(zhuǎn)換器能夠?qū)⒁曨l信息進(jìn)行轉(zhuǎn)換,以加快dsp處理器的處理效率。同時,該系統(tǒng)采用dsp處理器能夠進(jìn)行大數(shù)據(jù)量的圖像信息的處理,運(yùn)算效率快,準(zhǔn)確度高。在實(shí)際應(yīng)用過程中,dsp處理器可以采用tms320dm642型芯片實(shí)現(xiàn)。
具體地,對于光學(xué)文字識別子系統(tǒng),光學(xué)文字識別子系統(tǒng)32包括arm處理器,dsp處理器通過hpi接口與arm處理器連接,hpi接口用于dsp和arm處理器之間的信息交換,arm處理器用于識別目標(biāo)格式的圖像文件,獲取文字信息。在此,該系統(tǒng)通過hpi接口傳輸dsp處理器處理后的圖像文件,并由arm處理器進(jìn)行處理,功耗低,兼容性強(qiáng),指令執(zhí)行效率高,有助于快速識別出科技檔案的字符信息。在實(shí)際應(yīng)用過程中,優(yōu)選的芯片信號為s3c6410。
具體地,對于傳輸子系統(tǒng),傳輸子系統(tǒng)35包括依次連接的接入路由器和硬件防火墻,信息處理子系統(tǒng)通過無線網(wǎng)絡(luò)連接到接入路由器,硬件防火墻的安全接入網(wǎng)關(guān)連接到檢索分析服務(wù)器4。在此,該系統(tǒng)通過接入路由器和硬件防火墻進(jìn)行數(shù)據(jù)傳輸,有助于提高數(shù)據(jù)傳輸?shù)陌踩院涂煽啃裕苊鈹?shù)據(jù)在傳輸過程中被泄露或竊取。
第二方面,本發(fā)明實(shí)施例所提供一種基于云計(jì)算的信息檢索分類方法,結(jié)合圖2,該方法包括:
信息輸入步驟s1:采集科技檔案的圖像信息或視頻信息,或掃描科技檔案,獲取掃描信息;
圖像處理步驟s2:預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件;
光學(xué)文字識別步驟s3:識別圖像文件中的字符,獲取科技檔案的字符信息;
檢索請求生成步驟s4:根據(jù)字符信息,生成檢索請求;
檢索請求分析步驟s5:分析檢索請求,獲取檢索請求的檢索類型,確定與檢索類型相應(yīng)的目標(biāo)云端服務(wù)器的地址;
記錄檢索請求的源地址;
按照目標(biāo)云端服務(wù)器的地址,發(fā)送檢索請求、字符信息和檢索請求的源地址;
信息檢索步驟s6:根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并按照檢索請求的源地址,反饋檢索結(jié)果;
信息顯示步驟s7:接收用戶輸入的顯示指令,根據(jù)顯示指令,顯示反饋的檢索結(jié)果。
由上述技術(shù)方案可知,本實(shí)施例提供的基于云計(jì)算的信息檢索分類方法,能夠通過攝像頭采集待入錄的科技檔案,形成圖像信息或視頻信息,或通過掃描儀采集待入錄科技檔案的掃描信息,完成信息采集。同時,圖像處理子方法對采集到的信息進(jìn)行預(yù)處理,以便于光學(xué)文字識別子方法能夠識別出文字信息,加快科技文獻(xiàn)資料的入錄進(jìn)程。
同時,該方法通過檢索分析服務(wù)器確定檢索請求的類型,再進(jìn)行檢索,以便于提高科技文獻(xiàn)的檢索效率。并且,該方法還能夠?qū)⒔邮沼脩酎c(diǎn)選的顯示指令,以將反饋的檢索結(jié)果進(jìn)行顯示,方便用戶進(jìn)行信息瀏覽。
因此,本實(shí)施例基于云計(jì)算的信息檢索分類方法,能夠加快信息入錄速率,提高科技文獻(xiàn)的檢索效率。
為了進(jìn)一步提高本實(shí)施例基于云計(jì)算的信息檢索分類方法的可靠性,具體地,預(yù)處理圖像信息、視頻信息或掃描信息,獲取目標(biāo)格式的圖像文件,具體包括:根據(jù)每幀圖像的采集時間,將視頻信息分解為每幀圖像,對圖像信息、視頻信息分解的每幀圖像或掃描信息進(jìn)行平滑、降噪處理,按照指定的存儲格式,將平滑、降噪處理后的圖像信息、視頻信息分解的每幀圖像或掃描信息進(jìn)行格式轉(zhuǎn)換,獲取目標(biāo)格式的圖像文件。在此,該方法采用平滑、降噪處理方式,對圖像中所存在的噪聲進(jìn)行處理,以便于提高圖像識別過程的準(zhǔn)確性和運(yùn)算效率,降低圖像中的噪聲所帶來的干擾。
在實(shí)際應(yīng)用過程中,本實(shí)施例基于云計(jì)算的信息檢索分類方法將視頻信息分解為每幀圖像之前,該方法還能夠?qū)⒁曨l信息進(jìn)行轉(zhuǎn)碼,具體過程如下:
在接收到視頻信息后,在資源池中選擇轉(zhuǎn)碼倍數(shù)大于預(yù)定門限的轉(zhuǎn)碼處理單元作為工作處理單元,其中,預(yù)定門限與播放最大延遲及視頻分段預(yù)定最小值相關(guān)聯(lián)。
判斷t個可選工作處理單元的轉(zhuǎn)碼倍數(shù)總和是否小于1:若t個可選工作處理單元的轉(zhuǎn)碼倍數(shù)總和不小于1,則將視頻信息進(jìn)行分割,為t個可選工作處理單元分配相應(yīng)長度的視頻段,以便進(jìn)行并行轉(zhuǎn)碼處理,其中,視頻段長度與播放最大延遲、工作處理單元自身的轉(zhuǎn)碼倍數(shù)和工作處理單元個數(shù)t相關(guān)聯(lián)。將t個可選工作處理單元輸出的轉(zhuǎn)碼信息進(jìn)行匯總,以便完成視頻轉(zhuǎn)碼,其中,預(yù)定門限=視頻分段預(yù)定最小值/(播放最大延遲+視頻分段預(yù)定最小值)。若t個可選工作處理單元的轉(zhuǎn)碼倍數(shù)總和小于1,則拒絕轉(zhuǎn)碼任務(wù)。
在此,該方法通過根據(jù)轉(zhuǎn)碼處理單元的運(yùn)算能力以及轉(zhuǎn)碼任務(wù)的實(shí)時性約束,對視頻信息進(jìn)行智能分割,以便將分割為不同大小的視頻段調(diào)度到對應(yīng)的轉(zhuǎn)碼處理單元進(jìn)行并行處理,從而能夠在保證轉(zhuǎn)碼任務(wù)實(shí)時的同時,提高轉(zhuǎn)碼效率,再將轉(zhuǎn)碼之后的視頻信息分解為每幀圖像。
具體地,識別圖像文件中的字符,獲取科技檔案的字符信息,具體包括:按照圖像文件的灰度值,識別圖像文件中的字符,獲取科技檔案的字符信息,圖像文件為二值圖像。在此,該方法通過圖像文件中的灰度值,識別圖像文件中的字符,以便于獲取文字信息,根據(jù)圖像文件中的灰度值,識別字符,準(zhǔn)確性高,貼合原科技檔案的文意,無需信息檢驗(yàn)過程,節(jié)省人力成本。
在實(shí)際應(yīng)用過程中,按照圖像文件的灰度值,識別圖像文件中的字符,獲取科技檔案的字符信息,具體實(shí)現(xiàn)過程如下:
采用最大值法將采集到的圖像文件中的彩色圖像轉(zhuǎn)換為8位256色灰度圖像,采用最大類間方差法選取i值,將灰度圖像轉(zhuǎn)換為二值圖像,再定位圖像內(nèi)的字符區(qū)域,對字符區(qū)域進(jìn)行濾波后,進(jìn)行先膨脹后復(fù)勢的閉運(yùn)算,再分割獲得單字符圖像。計(jì)算單字符圖像中包含的孔洞數(shù)。根據(jù)圖像中包含的孔洞數(shù)對字符圖像進(jìn)行分類,對孔洞數(shù)相同的字符圖像,通過添加輔助識別線或計(jì)算圖像寬高比例對字符圖像進(jìn)行數(shù)字識別。當(dāng)計(jì)算出的字符圖像的孔洞數(shù)為2時,則該字符為數(shù)字“8”,識別結(jié)束;當(dāng)計(jì)算出的字符圖像的孔洞數(shù)不為2時,則進(jìn)一步判斷,當(dāng)計(jì)算出的字符圖像的孔洞數(shù)為1時,則該字符為數(shù)字“0”、“6”或“9”,需添加輔助識別線或計(jì)算圖像寬高比例對字符圖像進(jìn)行數(shù)字識別,當(dāng)計(jì)算出的字符圖像的孔洞數(shù)不為1時,則進(jìn)一步判斷,當(dāng)計(jì)算出的字符圖像的孔洞數(shù)為0時,則該字符為數(shù)字“1、2、3、4、5”或“7",需添加輔助識別線或計(jì)算圖像寬高比例對字符圖像進(jìn)行數(shù)字識別,當(dāng)計(jì)算出的字符圖像的孔洞數(shù)不為0,則非數(shù)字字符,識別結(jié)束,輸出字符信息。
在此,該方法根據(jù)數(shù)字字符圖像孔洞數(shù)對數(shù)字字符圖像進(jìn)行分類,對分類后孔洞數(shù)量相同的字符圖像,采用增加輔助識別線后再計(jì)算孔洞數(shù)的方法,減少運(yùn)算量,避免了現(xiàn)有方法中對字符圖像尺寸歸一化處理,識別準(zhǔn)確率高,魯棒性強(qiáng)。
具體地,根據(jù)檢索請求,按照字符信息,基于云計(jì)算執(zhí)行信息檢索,獲取檢索結(jié)果,并按照檢索請求的源地址,反饋檢索結(jié)果,具體包括:根據(jù)檢索請求,調(diào)取預(yù)存儲的科技檔案,將字符信息與每篇科技檔案的關(guān)鍵詞或摘要信息進(jìn)行比對,獲取對比度,將對比度最高的科技檔案,作為檢索結(jié)果,并傳輸至檢索請求的源地址。在此,該方法通過字符信息進(jìn)行檢索,提高檢索的準(zhǔn)確度。并且,該方法根據(jù)檢索請求,調(diào)取與該檢索請求的類型相對應(yīng)的科技檔案,縮小待比對的科技檔案的數(shù)量,降低運(yùn)算數(shù)據(jù)量。
在實(shí)際應(yīng)用過程中,根據(jù)檢索請求,調(diào)取預(yù)存儲的科技檔案之前,該方法還包括建立科技文獻(xiàn)本體庫,具體實(shí)現(xiàn)過程為:對科技文獻(xiàn)進(jìn)行語義分析,以提取中文關(guān)鍵詞和英文關(guān)鍵詞。將相同的中文關(guān)鍵詞或英文關(guān)鍵詞進(jìn)行合并,同義或近義的中文關(guān)鍵詞和英文關(guān)鍵詞歸為一類。對每一類關(guān)鍵詞,建立一個科技文獻(xiàn)信息本體鏈接,同時,建立一個該科技文獻(xiàn)信息本體鏈接指向源科技文獻(xiàn)的索引。集合科技文獻(xiàn)信息本體鏈接及該科技文獻(xiàn)信息本體鏈接指向源科技文獻(xiàn)的索引,形成科技文獻(xiàn)本體庫。其中,科技文獻(xiàn)信息包括:科技文獻(xiàn)的題目、作者、摘要、關(guān)鍵詞、出版時間、科技文獻(xiàn)的背景部分、問題部分和解決方案部分。
將字符信息與每篇科技檔案的關(guān)鍵詞或摘要信息進(jìn)行比對,具體為:讀取的字符信息,在科技文獻(xiàn)本體庫中查找與該檢索詞相匹配的同類關(guān)鍵詞所對應(yīng)的科技文獻(xiàn)信息本體鏈接。通過同類關(guān)鍵詞所對應(yīng)的科技文獻(xiàn)信息本體鏈接及該科技文獻(xiàn)信息本體鏈接指向源科技文獻(xiàn)的索引,查找出相關(guān)文獻(xiàn),并按預(yù)設(shè)排序顯示給用戶。
在此,該方法通過建立有科技文獻(xiàn)本體庫,科技文獻(xiàn)本體庫中存儲有同類關(guān)鍵詞、同類關(guān)鍵詞所對應(yīng)的科技文獻(xiàn)信息本體鏈接及該科技文獻(xiàn)信息本體鏈接指向源科技文獻(xiàn)的索引,同類關(guān)鍵詞為同義或近義的中文關(guān)鍵詞和英文關(guān)鍵詞集合,使得用戶輸入檢索詞后,只需在科技文獻(xiàn)本體庫中查找該檢索詞相匹配的同類關(guān)鍵詞所對應(yīng)的科技文獻(xiàn)信息本體鏈接,通過同類關(guān)鍵詞所對應(yīng)的科技文獻(xiàn)信息本體鏈接及該科技文獻(xiàn)信息本體鏈接指向源科技文獻(xiàn)的索引,查找出相關(guān)文獻(xiàn),并按預(yù)設(shè)排序顯示給用戶,即可實(shí)現(xiàn)檢索,相比現(xiàn)有技術(shù),省去了檢索過程中的源語言到目標(biāo)語言的翻譯過程,能提高科技文獻(xiàn)檢索的精確度。
在本說明書的描述中,參考術(shù)語“一個實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個或多個實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
需要說明的是,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實(shí)施例的服務(wù)器、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的服務(wù)器來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
本發(fā)明實(shí)施例所提供的配置裝置可以是計(jì)算機(jī)程序產(chǎn)品,包括存儲了程序代碼的計(jì)算機(jī)可讀存儲介質(zhì),所述程序代碼包括的指令可用于執(zhí)行前面方法實(shí)施例中所述的方法,具體實(shí)現(xiàn)可參見方法實(shí)施例,在此不再贅述。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的服務(wù)器、裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。
在本申請所提供的幾個實(shí)施例中,應(yīng)該理解到,所揭露的服務(wù)器、裝置和方法,可以通過其它的方式實(shí)現(xiàn)。以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時可以有另外的劃分方式,又例如,多個單元或組件可以結(jié)合或者可以集成到另一個服務(wù)器,或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以發(fā)布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機(jī)存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。