本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域,具體涉及一種全景照片自動(dòng)拍攝系統(tǒng)及方法。
背景技術(shù):
目前市面上全景照片的拍攝技術(shù)大量應(yīng)用在手持設(shè)備。所謂的全景照片就是從左至右或是從右至左或是從上到下或是從下到上拍攝多張照片,然后像拼圖游戲一樣,把這些照片拼接成一張全景照片。這種全景照片拍攝的缺陷是:需要手動(dòng)水平移動(dòng)或者垂直移動(dòng)拍攝多張照片,在移動(dòng)過程中拍攝的多張照片可能不在一個(gè)重合線上,出現(xiàn)較大的位移現(xiàn)象,最終拼接出的全景圖片達(dá)不到預(yù)期的效果或者拼接失敗。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,提供一種全景照片自動(dòng)拍攝系統(tǒng),解決以上技術(shù)問題;
本發(fā)明的目的還在于,提供一種全景照片自動(dòng)拍攝方法,解決以上技術(shù)問題;
本發(fā)明所解決的技術(shù)問題可以采用以下技術(shù)方案來實(shí)現(xiàn):
全景照片自動(dòng)拍攝系統(tǒng),用于機(jī)器人系統(tǒng),包括,
語音識(shí)別單元,用于識(shí)別語音信息中的指令信息,所述指令信息至少包 括拍照指令及拍攝軌跡信息;
控制單元,與所述語音識(shí)別單元連接,用于接收所述指令信息并產(chǎn)生控制信號(hào)控制相應(yīng)裝置動(dòng)作;
移動(dòng)單元,與所述控制單元連接,于所述控制單元的作用下自所述起始位置沿所述拍攝軌跡運(yùn)動(dòng)至所述結(jié)束位置;
圖像捕獲單元,設(shè)置于所述移動(dòng)單元上隨所述移動(dòng)單元移動(dòng),所述圖像捕獲單元與所述控制單元連接,于所述控制單元的作用下捕獲圖像。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),所述語音識(shí)別單元包括,
語音捕獲單元,用于捕獲語音信息;
信號(hào)處理單元,與所述語音捕獲單元連接,用于提取所述語音信息中的指令信息和/或用于對(duì)聲源進(jìn)行定位。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括圖像識(shí)別單元,與所述圖像捕獲單元連接,用于對(duì)所述圖像中的物體分類,及提取所述圖像中物體的圖片特征信息。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括一匹配單元,與所述圖像識(shí)別單元連接,將標(biāo)記起始位置的物體標(biāo)記信息及標(biāo)記結(jié)束位置的物體標(biāo)記信息和所述圖片特征信息進(jìn)行匹配,以重新確定拍攝的起始位置、結(jié)束位置及拍攝軌跡。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括存儲(chǔ)單元,用于存儲(chǔ)所述指令信息。
本發(fā)明還提供一種全景照片自動(dòng)拍攝方法,用于上述的全景照片自動(dòng)拍攝系統(tǒng),包括,
步驟s11,通過一發(fā)聲源發(fā)出的語音信息獲取拍攝對(duì)象的起始位置、拍攝對(duì)象的結(jié)束位置及拍攝軌跡;
步驟s12,所述移動(dòng)單元帶動(dòng)圖像捕獲單元自所述起始位置沿所述拍攝軌跡移動(dòng)至所述結(jié)束位置,并于移動(dòng)過程中拍攝一組照片;
步驟s13,依據(jù)所述照片拼接生成全景照片。
本發(fā)明的全景照片自動(dòng)拍攝方法,其中,所述步驟s11具體如下:
步驟s111a,接收一拍攝全景照片的語音信息;
步驟s112a,提取所述語音信息中包含的指令信息,所述指令信息至少包括拍照指令、初始起始位置、初始結(jié)束位置及初始拍攝軌跡;
步驟s113a,于所述指令信息的作用下產(chǎn)生控制信號(hào)驅(qū)動(dòng)所述移動(dòng)單元自所述初始起始位置沿所述初始拍攝軌跡移動(dòng)至所述初始結(jié)束位置,圖像捕獲單元于所述移動(dòng)單元的帶動(dòng)下沿所述拍攝軌跡的360度空間拍攝第一組參考照片;
步驟s114a,提取所述第一組參考照片中各個(gè)物體的圖片特征信息,通過將物體標(biāo)記信息與所述第一組參考照片中的物體的特征信息進(jìn)行匹配,調(diào)整并重新確定起始位置和結(jié)束位置及拍攝軌跡。
本發(fā)明的全景照片自動(dòng)拍攝方法,所述步驟s11具體如下:
步驟s111b,接收一拍攝全景照片的語音信息;
步驟s112b,提取所述語音信息中包含的指令信息,所述指令信息至少包括拍照指令及拍攝軌跡;
步驟s113b,對(duì)語音信息的發(fā)聲源進(jìn)行定位,并控制所述圖像捕獲單元朝向并追蹤所述發(fā)聲源的移動(dòng);
步驟s114b,所述圖像捕獲單元于所述移動(dòng)單元的帶動(dòng)下追蹤發(fā)聲源移動(dòng)到的第一位置作為拍攝的起始位置,追蹤發(fā)聲源移動(dòng)到的第二位置作為拍攝的結(jié)束位置。
本發(fā)明的全景照片自動(dòng)拍攝方法,所述步驟s11具體如下:
步驟s111c,接收一拍攝全景照片的語音信息;
步驟s112c,提取所述語音信息中包含的指令信息,所述指令信息至少包括拍照指令及拍攝軌跡;
步驟s113c,對(duì)語音信息的發(fā)聲源進(jìn)行定位;
步驟s114c,于所述發(fā)聲源的語音命令控制下,所述圖像捕獲單元依照設(shè)定方向移動(dòng)至一第一位置作為拍攝的起始位置;所述圖像捕獲單元繼續(xù)移動(dòng)至一第二位置作為拍攝的結(jié)束位置。
本發(fā)明的全景照片自動(dòng)拍攝方法,所述步驟s11具體如下:
步驟s111d,接收一拍攝全景照片的語音信息;
步驟s112d,提取所述語音信息中包含的指令信息,所述指令信息至少包括拍照指令、起始位置物體特征組合、結(jié)束位置物體特征組合及拍攝軌跡;
步驟s113d,轉(zhuǎn)動(dòng)所述圖像捕獲單元獲取一組參考照片;
步驟s114d,提取所述第參考照片中各個(gè)物體的名稱和圖片特征信息,通過將所述起始位置物體特征組合與所述參考照片中的物體的名稱和特征信息進(jìn)行匹配,查找出起始位置;通過將所述結(jié)束位置物體特征組合與所述參考照片中的物體的名稱和特征信息進(jìn)行匹配,查找出結(jié)束位置。
有益效果:由于采用以上技術(shù)方案,本發(fā)明可以通過用戶發(fā)出拍攝全景照片指令進(jìn)行自動(dòng)拍攝全景照片,解決了自動(dòng)拍攝全景照片的技術(shù)難題,讓 拍攝全景照片更加簡單,拼接的全景照片效果更佳。
附圖說明
圖1為本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖;
圖2為本發(fā)明的一種具體實(shí)施例的方法流程示意圖;
圖3為本發(fā)明的方法步驟時(shí)序圖;
圖4為本發(fā)明的另一種具體實(shí)施例的方法流程示意圖;
圖5為本發(fā)明的另一種具體實(shí)施例的方法流程示意圖;
圖6為本發(fā)明的再一種具體實(shí)施例的方法流程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
需要說明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明,但不作為本發(fā)明的限定。
參照?qǐng)D1,全景照片自動(dòng)拍攝系統(tǒng),用于機(jī)器人系統(tǒng),包括,
語音識(shí)別單元11,用于識(shí)別語音信息中的指令信息,指令信息至少包括拍照指令及拍攝軌跡信息;
控制單元12,與語音識(shí)別單元11連接,用于接收指令信息并產(chǎn)生控制信號(hào)控制相應(yīng)裝置動(dòng)作;
移動(dòng)單元13,與控制單元12連接,于控制單元12的作用下自起始位置沿拍攝軌跡運(yùn)動(dòng)至結(jié)束位置;
圖像捕獲單元14,設(shè)置于移動(dòng)單元13上隨移動(dòng)單元13移動(dòng),圖像捕獲單元14與控制單元12連接,于控制單元12的作用下捕獲圖像。
本發(fā)明應(yīng)用于機(jī)器人領(lǐng)域,利用機(jī)器人的轉(zhuǎn)動(dòng)設(shè)備,即移動(dòng)單元13,和圖像捕獲單元或稱拍照相機(jī),拍攝全景照片,并結(jié)合物體識(shí)別和鎖定技術(shù)、拍照相機(jī)拍照片技術(shù)、自動(dòng)語音識(shí)別技術(shù)、轉(zhuǎn)動(dòng)設(shè)備的轉(zhuǎn)動(dòng)功能等技術(shù)可以通過用戶發(fā)出拍攝全景照片指令進(jìn)行自動(dòng)拍攝全景照片,解決了自動(dòng)拍攝全景照片的技術(shù)難題,讓拍攝全景照片更加簡單,拼接的全景照片效果更佳。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),語音識(shí)別單元11包括,
語音捕獲單元,用于捕獲語音信息;
信號(hào)處理單元,與語音捕獲單元連接,用于提取語音信息中的指令信息和/或用于對(duì)聲源進(jìn)行定位。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括圖像識(shí)別單元15,與圖像捕獲單元14連接,用于對(duì)圖像中的物體分類,及提取圖像中物體的圖片特征信息。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括一匹配單元16,與圖像識(shí)別單元15連接,將標(biāo)記起始位置的物體標(biāo)記信息及標(biāo)記結(jié)束位置的物體標(biāo)記信息和圖片特征信息進(jìn)行匹配,以重新確定拍攝的起始位置、結(jié)束位置及拍攝軌跡。
本發(fā)明的全景照片自動(dòng)拍攝系統(tǒng),還包括存儲(chǔ)單元17,用于存儲(chǔ)指令信 息。
參照?qǐng)D2、圖3、圖4、圖5、圖6,本發(fā)明還提供一種全景照片自動(dòng)拍攝方法,用于上述的全景照片自動(dòng)拍攝系統(tǒng),包括,
步驟s11,通過一發(fā)聲源發(fā)出的語音信息獲取拍攝對(duì)象的起始位置、拍攝對(duì)象的結(jié)束位置及拍攝軌跡;
步驟s12,移動(dòng)單元帶動(dòng)圖像捕獲單元自起始位置沿拍攝軌跡移動(dòng)至結(jié)束位置,并于移動(dòng)過程中拍攝一組照片;
步驟s13,依據(jù)照片拼接生成全景照片。
本發(fā)明的全景照片自動(dòng)拍攝方法,參照?qǐng)D2,其中,步驟s11可以具體如下:
步驟s111a,接收一拍攝全景照片的語音信息;
步驟s112a,提取語音信息中包含的指令信息,指令信息至少包括拍照指令、初始起始位置、初始結(jié)束位置及初始拍攝軌跡;
步驟s113a,于指令信息的作用下產(chǎn)生控制信號(hào)驅(qū)動(dòng)移動(dòng)單元自初始起始位置沿初始拍攝軌跡移動(dòng)至初始結(jié)束位置,圖像捕獲單元于移動(dòng)單元的帶動(dòng)下沿拍攝軌跡的360度空間拍攝第一組參考照片;
步驟s114a,提取第一組參考照片中各個(gè)物體的圖片特征信息,通過將物體標(biāo)記信息與第一組參考照片中的物體的特征信息進(jìn)行匹配,調(diào)整并重新確定起始位置和結(jié)束位置及拍攝軌跡。
以下結(jié)合圖3的時(shí)序圖進(jìn)行簡單說明:首先用戶發(fā)出一些拍攝全景照片的語音指令,然后通過自動(dòng)語音識(shí)別技術(shù)提取出語音指令中起始位置和結(jié)束位置的物體信息,以及拍攝軌跡(水平或垂直)信息。接著機(jī)器人轉(zhuǎn)動(dòng)Camera 在水平或垂直的360度空間拍攝一組參考照片,利用物體識(shí)別圖像技術(shù)對(duì)這組照片進(jìn)行物體分類,提取出參考照片中各個(gè)物體的圖片特征信息。將物體標(biāo)記信息和參考圖片中物體特征信息進(jìn)行匹配,最終確定拍攝全景照片的起始位置,結(jié)束位置,拍攝軌跡(水平或垂直)。最后機(jī)器人轉(zhuǎn)動(dòng)Camera到起始位置的物體標(biāo)記信息的位置,按照拍攝軌跡(水平或垂直),開始拍攝一組照片,一直到結(jié)束位置的物體標(biāo)記信息的位置。最后將這一組拍攝的照片拼接一張全景照片。
本發(fā)明的全景照片自動(dòng)拍攝方法,參照?qǐng)D4,步驟s11可以具體如下:
步驟s111b,接收一拍攝全景照片的語音信息;
步驟s112b,提取語音信息中包含的指令信息,指令信息至少包括拍照指令及拍攝軌跡;
步驟s113b,對(duì)語音信息的發(fā)聲源進(jìn)行定位,并控制圖像捕獲單元朝向并追蹤發(fā)聲源的移動(dòng);
步驟s114b,圖像捕獲單元于移動(dòng)單元的帶動(dòng)下追蹤發(fā)聲源移動(dòng)到的第一位置作為拍攝的起始位置,追蹤發(fā)聲源移動(dòng)到的第二位置作為拍攝的結(jié)束位置。一種具體的實(shí)施例如下:
用戶向機(jī)器人發(fā)出拍全景照片指令,如:“給我拍一張水平或垂直方向的全景照片”;
提取出拍攝軌跡,如水平或垂直方向信息;圖像捕獲單元如拍照相機(jī)通過轉(zhuǎn)動(dòng)裝置和聲紋識(shí)別技術(shù)定位到發(fā)指令的用戶;
用戶移動(dòng)到拍攝全景照片的起始位置,拍照相機(jī)跟蹤用戶到該起始位置;
用戶發(fā)出記錄拍攝全景照片的起始位置命令,如:“從這里開始拍攝全景 照片”,提取出起始拍照位置信息;
用戶移動(dòng)到拍攝全景照片的結(jié)束位置,拍照相機(jī)跟蹤用戶到該結(jié)束位置;
用戶發(fā)出記錄拍攝全景照片的結(jié)束位置命令:“到這里為止”,提取出終止拍照的結(jié)束位置信息;
機(jī)器人通過起始位置,結(jié)束位置,拍攝軌跡信息,移動(dòng)拍照相機(jī)在同一個(gè)重合線上自動(dòng)拍攝全景照片。
本發(fā)明的全景照片自動(dòng)拍攝方法,參照?qǐng)D5,步驟s11可以具體如下:
步驟s111c,接收一拍攝全景照片的語音信息;
步驟s112c,提取語音信息中包含的指令信息,指令信息至少包括拍照指令及拍攝軌跡;
步驟s113c,對(duì)語音信息的發(fā)聲源進(jìn)行定位;
步驟s114c,于發(fā)聲源的語音命令控制下,圖像捕獲單元依照設(shè)定方向移動(dòng)至一第一位置作為拍攝的起始位置;圖像捕獲單元繼續(xù)移動(dòng)至一第二位置作為拍攝的結(jié)束位置。一種具體實(shí)施例,具體如下:
用戶向機(jī)器人發(fā)出拍全景照片指令,如:“給我拍一張水平或垂直方向的全景照片”;
提取出拍攝軌跡信息,拍攝軌跡為水平或垂直信息,拍照相機(jī)通過轉(zhuǎn)動(dòng)裝置和聲紋識(shí)別技術(shù)定位到發(fā)指令的用戶的位置;
用戶觀察機(jī)器人顯示系統(tǒng)的預(yù)覽照片,發(fā)出移動(dòng)指令:“向左或右或上或下移動(dòng)”。默認(rèn)每次移動(dòng)一幀照片的長度,移動(dòng)的長度可以通過語音命令進(jìn)行定制,當(dāng)移動(dòng)到了拍攝全景照片的起始位置,發(fā)出語音指令:“這里作為起始位置”,提取出起始拍照位置信息;同樣,當(dāng)移動(dòng)到了拍攝全景照片的結(jié)束 位置,發(fā)出語音指令:“這里作為結(jié)束位置”,提取出終止拍照位置信息;機(jī)器人通過起始位置,結(jié)束位置,拍攝軌跡信息,移動(dòng)拍照相機(jī)在同一個(gè)重合線上自動(dòng)拍攝全景照片。
本發(fā)明的全景照片自動(dòng)拍攝方法,參照?qǐng)D6,步驟s11可以具體如下:
步驟s111d,接收一拍攝全景照片的語音信息;
步驟s112d,提取語音信息中包含的指令信息,指令信息至少包括拍照指令、起始位置物體特征組合、結(jié)束位置物體特征組合及拍攝軌跡;
步驟s113d,轉(zhuǎn)動(dòng)圖像捕獲單元獲取一組參考照片;
步驟s114d,提取參考照片中各個(gè)物體的名稱和圖片特征信息,通過將起始位置物體特征組合與參考照片中的物體的名稱和特征信息進(jìn)行匹配,查找出起始位置;通過將結(jié)束位置物體特征組合與參考照片中的物體的名稱和特征信息進(jìn)行匹配,查找出結(jié)束位置。
一種具體實(shí)施例,用戶向機(jī)器人發(fā)出拍全景照片指令,如:“從左/右/上/下邊放黃色衣服的白色椅子到右/左/下/上邊桌上褐色茶壺地方拍一張全景照片”;
自動(dòng)語音識(shí)別技術(shù)解析出起始位置物體特征組合:“左/右/上/下邊的黃色衣服”,“左/右/上/下邊的白色椅子”,“黃色衣服在白色椅子上”;
自動(dòng)語音識(shí)別技術(shù)解析出結(jié)束位置物體特征組合:“右/左/下/上邊的桌子”,“右/左/下/上邊的茶壺”,“茶壺在桌子上”;
自動(dòng)語音識(shí)別技術(shù)解析出拍攝軌跡信息:水平/垂直方向;
通過拍照相機(jī)轉(zhuǎn)動(dòng)拍攝照片,收集水平或垂直方向360度的參考照片;
利用物體識(shí)別圖像技術(shù)對(duì)這組參考照片進(jìn)行物體分類,提取出參考照片 中各個(gè)物體的名稱和圖片特征信息;
將起始位置物體特征組合和參考照片提取的各個(gè)物體的名稱和圖片特征信息進(jìn)行匹配,尋找出起始拍照位置信息;
將結(jié)束位置物體特征組合和參考照片提取的各個(gè)物體的名稱和圖片特征信息進(jìn)行匹配,尋找出終止拍照的結(jié)束位置信息;
機(jī)器人通過起始位置,結(jié)束位置,拍攝軌跡信息,移動(dòng)拍照相機(jī)在同一個(gè)重合線上自動(dòng)拍攝全景照片。
以上所述僅為本發(fā)明較佳的實(shí)施例,并非因此限制本發(fā)明的實(shí)施方式及保護(hù)范圍,對(duì)于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識(shí)到凡運(yùn)用本發(fā)明說明書及圖示內(nèi)容所作出的等同替換和顯而易見的變化所得到的方案,均應(yīng)當(dāng)包含在本發(fā)明的保護(hù)范圍內(nèi)。