專利名稱:一種卡拉ok系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種卡拉OK系統(tǒng),其用于一個(gè)如視頻剪輯(videoclip)或影片的序列中的演唱。
如例如歐洲專利申請(qǐng)EP0782338中所描述的卡拉OK系統(tǒng)中,音樂(lè)、歌詞或任何種類的音頻數(shù)據(jù)由傳輸站傳輸?shù)椒峙湔?。系統(tǒng)的主模塊的音樂(lè)控制裝置把音樂(lè)通過(guò)監(jiān)視器的內(nèi)設(shè)揚(yáng)聲器播出,且把聲音從一個(gè)未示出的麥克風(fēng)通過(guò)所述的揚(yáng)聲器播出。圖象控制裝置將背景圖象(如視頻圖像或從背景圖象存儲(chǔ)裝置中提取的靜態(tài)圖象)顯示在監(jiān)視器上,而歌詞控制裝置通過(guò)把歌詞疊加于背景圖象上來(lái)顯示歌詞。圖象拾取設(shè)備,如一個(gè)CCD攝像機(jī),拾取演唱者的圖像,并將其通過(guò)視頻圖象控制裝置疊加于監(jiān)視器屏幕上作為疊加的圖像。這樣的系統(tǒng),可定義為卡拉OK概念中所謂的“視頻混合”。
本發(fā)明的目的是提出另一類型的具備額外功能的卡拉OK系統(tǒng)。
為了這一目的,該系統(tǒng)涉及一種用于在如視頻剪輯或影片的序列過(guò)程中演唱的卡拉OK系統(tǒng),并包括一系列用于拾取使用者的圖象和聲音的拾取設(shè)備,一個(gè)用于把使用者的至少一部分與背景分離的分析與處理設(shè)備,一個(gè)用于把所述分析與處理設(shè)備的輸出信號(hào)與預(yù)先錄制的材料組合起來(lái)的混合與再現(xiàn)(rendering)設(shè)備,和一個(gè)用于顯示該組合信號(hào)的顯示設(shè)備。
時(shí)至今日,唱卡拉OK的概念只依賴于基于音頻的技術(shù),其只提供有限的功能且不可能把使用者真正插入到視頻虛擬世界中。所建議的引入了視頻混合(video mixing)的概念的解決方案,允許將這一卡拉OK概念擴(kuò)展到視頻中,并一般地,允許發(fā)展完全音頻-視頻插入概念根據(jù)所述概念,在歌曲的視頻剪輯中的聲音和面孔可由偶然(fortuitous)演唱者的聲音和面孔代替(此后也稱使用者,因?yàn)樗蛩聦?shí)上可以是演唱者、表演者、舞蹈者等…)。同樣建議的技術(shù)可在其它環(huán)境中發(fā)現(xiàn)相似的應(yīng)用,例如電子商務(wù)領(lǐng)域或用于預(yù)先錄制內(nèi)容的視頻編輯。
下面將參考附圖,通過(guò)實(shí)例來(lái)描述本發(fā)明,其中
圖1根據(jù)本發(fā)明的卡拉OK系統(tǒng)的方框圖。
圖2根據(jù)本發(fā)明的卡拉OK系統(tǒng)的另一實(shí)施方案。
如圖1所示,實(shí)現(xiàn)根據(jù)本發(fā)明的卡拉OK系統(tǒng)所必需的不同的子系統(tǒng)主要是一個(gè)分析與處理設(shè)備11和一個(gè)混合與再現(xiàn)設(shè)備12。
用于接收由拾取設(shè)備10拾取到的使用者(黑色示出的人)的圖象和聲音的分析與處理設(shè)備11包括一個(gè)分割電路,其用于把例如使用者的面孔與背景分離,從而限定一個(gè)阿爾法(alpha)平面(如果使用者被置于舞臺(tái)上,這樣的電路可基于例如藍(lán)色屏幕前的色度鍵技術(shù))?;旌吓c再現(xiàn)設(shè)備12是一個(gè)利用設(shè)備11中分析的形狀信息把使用者與預(yù)先錄制的由媒體13傳送的視頻或音頻-視頻背景合成起來(lái)的電路(所述的預(yù)先錄制的材料在媒體左側(cè)示出)。這一合成完成了用于把所述使用者的聲音與來(lái)自歌曲的預(yù)先錄制的音樂(lè)背景混合的音頻合成。然后,利用由設(shè)備11限定的阿爾法平面,根據(jù)下述類型的關(guān)系式,容易地把兩個(gè)來(lái)源組合起來(lái)[(視頻1×阿爾法)+(視頻2×(255-阿爾法))]/255=最終視頻。最后,一個(gè)如監(jiān)視器的顯示設(shè)備14,用于最后顯示最終結(jié)果(即預(yù)先錄制的材料和特別屬于使用者的之組合)。
顯然,為提高質(zhì)量,在設(shè)備11中完成的分析可產(chǎn)生8比特阿爾法平面,其能在被鑲飾的對(duì)象邊緣(fronteer)有較好的混合。另外,還指出的是系統(tǒng)可以只替換使用者的頭部或他或她的整個(gè)身體。
相對(duì)于音頻-視頻來(lái)源的類型,可考慮不同的情況(a)兩個(gè)音頻/視頻來(lái)源沒(méi)有被壓縮這一選擇可用于例如卡拉OK餐館,演唱者的全部身體被鑲飾在剪輯/影片中時(shí)(預(yù)先錄制的數(shù)據(jù)可存儲(chǔ)在磁帶上,且偶然演唱者視頻可被分析并直接傳輸?shù)揭曨l混合器中);(b)一個(gè)或兩個(gè)來(lái)源被壓縮對(duì)這一情況的一個(gè)適配的架構(gòu)(framework)是新近發(fā)展起來(lái)MPEG-4標(biāo)準(zhǔn),其能對(duì)對(duì)象的形狀和阿爾法平面—這里是偶然使用者的面孔進(jìn)行編碼-(MPEG-4標(biāo)準(zhǔn)已定義了一個(gè)能使音頻和視頻對(duì)象合成的整個(gè)系統(tǒng)架構(gòu))。
也可考慮本發(fā)明應(yīng)用的不同情況(a)使用者可能想記錄混合操作的結(jié)果,這在圖2中示出,圖2示出了與圖1實(shí)施方案相似的系統(tǒng),只是包括了一個(gè)額外的錄制設(shè)備25;
(b)在一些情況下,卡拉OK系統(tǒng)可在線工作則預(yù)先錄制的剪輯可存儲(chǔ)于數(shù)據(jù)庫(kù)(例如互聯(lián)網(wǎng))上,并且使用者在家中錄制他或她的表演并打算產(chǎn)生卡拉OK剪輯的組合并將其放到他或她的個(gè)人主頁(yè)上(在這一情況下,壓縮技術(shù)的使用尤其有用,而且更普遍地,在所有應(yīng)用中它都運(yùn)行于帶寬所限的環(huán)境中);(c)另外,在一些情況下,使用者可能打算只把他或她的頭部放在原唱的頭部的位置,其包括在混合與再現(xiàn)設(shè)備12中的進(jìn)一步處理,因?yàn)槭褂谜哳^部的位置需要與原唱身體的取向和姿勢(shì)匹配。
權(quán)利要求
1.一種卡拉OK系統(tǒng),其用于在一個(gè)如視頻剪輯或影片的序列過(guò)程中演唱,并包括一系列用于拾取使用者的圖象和聲音的拾取設(shè)備,一個(gè)用于把使用者的至少一部分與背景分離的分析與處理設(shè)備,一個(gè)用于把所述分析與處理設(shè)備的輸出信號(hào)與預(yù)先錄制的材料組合起來(lái)的混合與再現(xiàn)設(shè)備,以及一個(gè)用于顯示該組合信號(hào)的顯示設(shè)備。
全文摘要
演唱卡拉OK的概念只依賴于基于音頻的技術(shù)。本發(fā)明包括對(duì)視頻插入概念的發(fā)展:使用者將看到他的(她的)圖象被插入到視頻剪輯或影片中他最喜歡的舞蹈者、演唱者或表演者的位置,以及所以將能夠播放錄象帶上的剪輯/歌曲,且能替換任何明星。更確切地,本發(fā)明涉及一種卡拉OK系統(tǒng),其中提供有連續(xù)的裝置,用于拾取使用者的圖象和他/她的聲音,分析和處理所得的信號(hào),把因此分析和處理的音頻或視頻信號(hào)與預(yù)先錄制的材料混合,并顯示因而得到的組合信號(hào)。
文檔編號(hào)G10K15/04GK1383543SQ01801723
公開(kāi)日2002年12月4日 申請(qǐng)日期2001年6月15日 優(yōu)先權(quán)日2000年6月20日
發(fā)明者I·科爾塞特 申請(qǐng)人:皇家菲利浦電子有限公司