一種信息搜索的方法和裝置的制造方法
【專利說明】
[0001]【技術(shù)領(lǐng)域】
[0002]本申請涉及計算機應(yīng)用技術(shù)領(lǐng)域,特別涉及一種信息搜索的方法和裝置。
[0003]【【背景技術(shù)】】
[0004]隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)搜索已經(jīng)逐漸成為人們最常使用的信息獲取方式之一。然而,傳統(tǒng)PC上的搜索操作借助鼠標(biāo)和鍵盤很容易實現(xiàn),但在諸如智能手機、PDA、平板電腦等智能設(shè)備上實現(xiàn)一個搜索過程相對困難很多,選擇搜索框并輸入文字變得很繁瑣且效率低下。因此語音輸入法成為目前的一個流行方式,但語音識別準(zhǔn)確率有限,在一些公共的場合用戶也可能不愿意在人群中自言自語。
[0005]【
【發(fā)明內(nèi)容】
】
[0006]有鑒于此,本申請?zhí)峁┝艘环N信息搜索的方法和裝置,以便于簡化用戶操作,提高搜索效率。
[0007]具體技術(shù)方案如下:
[0008]本申請?zhí)峁┝艘环N信息搜索的方法,該方法包括:
[0009]啟動包含定位標(biāo)志的拍攝預(yù)覽界面;
[0010]獲取用戶拍攝的圖像;
[0011]確定利用定位標(biāo)志從用戶拍攝的圖像中提取的目標(biāo)文字區(qū)域;
[0012]確定對目標(biāo)文字區(qū)域進行文字識別后的識別結(jié)果;
[0013]獲取利用所述識別結(jié)果進行搜索的搜索結(jié)果。
[0014]根據(jù)本申請一優(yōu)選實施方式,所述包含定位標(biāo)志的拍攝預(yù)覽界面采用在拍攝界面上疊加繪制有定位標(biāo)志的畫布界面的方式形成。
[0015]根據(jù)本申請一優(yōu)選實施方式,所述確定利用定位標(biāo)志從用戶拍攝的圖像中提取的目標(biāo)文字區(qū)域包括:
[0016]利用定位標(biāo)志從用戶拍攝的圖像中提取目標(biāo)文字區(qū)域;或者,
[0017]將所述用戶拍攝的圖像和定位標(biāo)志的位置發(fā)送給服務(wù)器端,接收服務(wù)器端利用定位標(biāo)志從用戶拍攝的圖像中提取目標(biāo)文字區(qū)域后返回的提取結(jié)果。
[0018]根據(jù)本申請一優(yōu)選實施方式,所述利用定位標(biāo)志從用戶拍攝的圖像中提取目標(biāo)文字區(qū)域包括:
[0019]利用定位標(biāo)志的位置獲取子圖像;
[0020]對所述子圖像進行二值化處理;
[0021]將二值化處理后的子圖像進行橫向投影確定子圖像內(nèi)的各文字行區(qū)域,并利用所述定位標(biāo)志的位置確定目標(biāo)文字行區(qū)域;
[0022]將目標(biāo)文字行區(qū)域進行縱向投影確定目標(biāo)文字行區(qū)域內(nèi)的各文字區(qū)域,并利用所述定位標(biāo)志的位置確定目標(biāo)文字區(qū)域。
[0023]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為橫線,則所述利用定位標(biāo)志的位置獲取子圖像包括:從橫線位置開始向上下分別擴展N像素作為子圖像的上下邊界;將整個圖像的寬度作為子圖像的寬度,或者將橫線的左端點向左擴展M個像素作為子圖像的左邊界,將橫線的右端點向右擴展M個像素作為子圖像的右邊界,所述N和M為預(yù)設(shè)的正整數(shù)。
[0024]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為方框,則所述利用定位標(biāo)志的位置獲取子圖像包括:將方框內(nèi)的圖像作為子圖像。
[0025]根據(jù)本申請一優(yōu)選實施方式,所述將二值化處理后的子圖像進行橫向投影確定子圖像內(nèi)的各文字行區(qū)域包括:將二值化處理后的子圖像進行橫向投影后,將橫向投影值的低谷值點作為各文字行區(qū)域的分割處;
[0026]所述將目標(biāo)文字行區(qū)域進行縱向投影確定目標(biāo)文字行區(qū)域內(nèi)的各文字區(qū)域包括:將目標(biāo)文字行區(qū)域進行縱向投影后,將縱向投影值的低谷值點作為各文字區(qū)域的分割處。
[0027]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為橫線,則利用所述定位標(biāo)志的位置確定目標(biāo)文字行區(qū)域包括:將橫線在橫向上的位置所落的文字行區(qū)域作為目標(biāo)文字行區(qū)域。
[0028]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為方框,則利用所述定位標(biāo)志的位置確定目標(biāo)文字行區(qū)域包括:
[0029]將完整落在方框上下邊界內(nèi)的文字行區(qū)域作為目標(biāo)文字行區(qū)域;或者,
[0030]將方框上下邊界在橫向上的位置所落的文字行區(qū)域以及完整落在方框上下邊界內(nèi)的文字行區(qū)域作為目標(biāo)文字行區(qū)域;或者,
[0031]將靠近方框內(nèi)部中間位置的文字行區(qū)域作為目標(biāo)文字行區(qū)域。
[0032]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為橫線,則利用所述定位標(biāo)志的位置確定目標(biāo)文字區(qū)域包括:將橫線在縱向上的位置所落的文字區(qū)域作為目標(biāo)文字區(qū)域。
[0033]根據(jù)本申請一優(yōu)選實施方式,如果所述定位標(biāo)志為方框,則利用所述定位標(biāo)志的位置確定目標(biāo)文字區(qū)域包括:將完整落在方框左右邊界內(nèi)的文字區(qū)域作為目標(biāo)文字區(qū)域;或者,
[0034]將方框左右邊界在縱向上的位置所落的文字區(qū)域以及完整落在方框左右邊界內(nèi)的文字區(qū)域作為目標(biāo)文字區(qū)域。
[0035]根據(jù)本申請一優(yōu)選實施方式,利用所述識別結(jié)果進行搜索包括:
[0036]將識別出的目標(biāo)文字作為搜索詞進行搜索;或者,
[0037]從識別出的目標(biāo)文字中提取關(guān)鍵詞,將提取的關(guān)鍵詞作為搜索詞進行搜索。
[0038]本發(fā)明本申請還提供了一種信息搜索的裝置,該裝置包括:
[0039]拍攝啟動單元,啟動包含定位標(biāo)志的拍攝預(yù)覽界面;
[0040]圖像獲取單元,通過所述拍攝預(yù)覽界面獲取用戶拍攝的圖像;
[0041]區(qū)域提取單元,確定利用所述定位標(biāo)志從所述用戶拍攝的圖像中提取的目標(biāo)文字區(qū)域;
[0042]文字識別單元,確定對所述目標(biāo)文字區(qū)域進行文字識別后的識別結(jié)果;
[0043]結(jié)果獲取單元,獲取利用所述識別結(jié)果進行搜索的搜索結(jié)果。
[0044]根據(jù)本申請一優(yōu)選實施方式,所述拍攝啟動單元,在拍攝預(yù)覽界面上疊加繪制有定位標(biāo)志的畫布界面。
[0045]根據(jù)本申請一優(yōu)選實施方式,所述區(qū)域提取單元具體包括:
[0046]子圖像獲取子單元,利用定位標(biāo)志的位置獲取子圖像;
[0047]二值化處理子單元,對所述子圖像進行二值化處理;
[0048]文字行區(qū)域確定子單元,將二值化處理后的子圖像進行橫向投影確定子圖像內(nèi)的各文字行區(qū)域,并利用所述定位標(biāo)志的位置確定目標(biāo)文字行區(qū)域;
[0049]文字區(qū)域確定子單元,將目標(biāo)文字行區(qū)域進行縱向投影確定目標(biāo)文字行區(qū)域內(nèi)的各文字區(qū)域,并利用所述定位標(biāo)志的位置確定目標(biāo)文字區(qū)域。
[0050]由以上技術(shù)方案可以看出,在本申請中采用定位標(biāo)識和文字識別技術(shù),能夠?qū)⒂脩襞臄z的感興趣的文本自動識別后進行搜索,無需用戶手工輸入文本,簡化了用戶操作也提高了搜索效率,帶來了更好的用戶體驗。
[0051]【【附圖說明】】
[0052]圖1為本申請實施例一提供的信息搜索方法的流程圖;
[0053]圖2為本申請實施例二提供的信息搜索方法的流程圖;
[0054]圖3a為實施例二提供的一個拍攝預(yù)覽界面示意圖;
[0055]圖3b為由圖3a所示拍攝預(yù)覽界面所獲取圖像的子圖像示意圖;
[0056]圖3c為由圖3a所不拍攝預(yù)覽界面所獲取圖像的另一個子圖像不意圖;
[0057]圖3d為由圖3c所示子圖像確定出的目標(biāo)文字行區(qū)域示意圖;
[0058]圖3e為由圖3c所示子圖像確定出的目標(biāo)文字區(qū)域示意圖;
[0059]圖4為本申請實施例三提供的信息搜索方法的流程圖;
[0060]圖5a為本申請實施例三提供的一個拍攝預(yù)覽界面示意圖;
[0061]圖5b為由圖5a所示拍攝預(yù)覽界面所獲取圖像的子圖像示意圖;
[0062]圖5c為由圖5b所示子圖像確定出的目標(biāo)文字行區(qū)域示意圖;
[0063]圖5d為由圖5b所不子圖像確定出的目標(biāo)文字區(qū)域不意圖;
[0064]圖6為本申請實施例四提供的裝置結(jié)構(gòu)圖。
[0065]【【具體實施方式】】
[0066]為了使本申請的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本申請進行詳細描述。
[0067]鑒于視覺識別技術(shù)的不斷發(fā)展,在此搜索技術(shù)也能夠基于視覺識別來實現(xiàn),本申請在搜索技術(shù)中引入視覺識別,通過文字識別技術(shù)從用戶所拍攝圖片中的文本中提取目標(biāo)文字,從而實現(xiàn)基于該目標(biāo)文字的搜索。本申請?zhí)峁┑姆椒ê脱b置在具有內(nèi)置攝像頭的智能設(shè)備中實現(xiàn)。下面通過幾個實施例對本申請?zhí)峁┑姆椒ㄟM行詳細描述。
[0068]實施例一、
[0069]圖1為本申請實施例一提供的信息搜索方法的流程圖,如圖1中所示,該方法可以包括以下步驟:
[0070]步驟101:啟動包含定位標(biāo)志的拍攝預(yù)覽界面。
[0071]當(dāng)本申請實施例提供的方法被觸發(fā)時,開始執(zhí)行本步驟。通常情況下,本申請實施例提供的方法以智能設(shè)備中的APP或者客戶端的運行來實現(xiàn),當(dāng)該APP或者客戶端被用戶打開時,觸發(fā)該方法的執(zhí)行,或者當(dāng)該APP或者客戶端被用戶打開并點擊該APP或客戶端上的某個功能按鈕時,觸發(fā)該方法的執(zhí)行。即啟動智能設(shè)備的攝像頭,在拍攝預(yù)覽界面中包含有定位標(biāo)志。
[0072]該定位標(biāo)志可以采用在拍攝預(yù)覽界面上疊加繪制有定位標(biāo)志的畫布界面來形成,其中定位標(biāo)志可以采用但不限于:直線段、波浪線、特殊標(biāo)志串、