亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于對延遲抖動和對話動態(tài)的監(jiān)視的抖動緩沖器控制的制作方法_3

文檔序號:9372028閱讀:來源:國知局
Towsley ,Packet Audio Playout Delay Adjustment:Performance Bounds and Algorithms,Multimedia Systems (1998) 6:17-28 中所公開的基于直方圖的JBM算法。
[0053] 然而,本文中所公開的實現(xiàn)提供抖動緩沖器控制的替選方法。本文中所公開的一 些實現(xiàn)涉及分析音頻數(shù)據(jù)以確定用于上下文感知的抖動緩沖器控制的網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù) 和對話交互性數(shù)據(jù)。
[0054] 圖2是示出本文中所提供的一些抖動緩沖器控制方法的塊的流程圖。方法200例 如可以(至少部分地)由服務(wù)器或被配置用于與通信終端如上面參照圖IB描述的終端通信 的另一這中裝置執(zhí)行。然而,本文中所提供的一些方法可以(至少部分地)由通信終端執(zhí)行。 至于本文中所描述的其他方法,方法200的塊不一定以所指示的順序執(zhí)行。而且,方法200 的一些實現(xiàn)(以及本文中所公開的其他方法)可以包括比所指示的或所描述的塊更多或更 少的塊。
[0055] 在該示例中,方法200開始于塊205,塊205涉及在與對話分析片段相對應(yīng)的時間 間隔期間接收音頻數(shù)據(jù)。在該示例中,音頻數(shù)據(jù)括在實際分組到達時間接收的音頻分組。 時間間隔例如可以是包括多個談話突峰的長期或短期時間間隔。如本文中所使用的,術(shù)語 "談話突峰"對應(yīng)于對話的"相互靜默時間"之間的話音的連續(xù)的(或基本連續(xù)的)片段。盡 管對應(yīng)于相互靜默時間的音頻分組可以包括背景噪聲等,在本文中術(shù)語"相互靜默時間"用 于意指其間沒有對話參與者在講話的時間。在一些實現(xiàn)中,分組或幀長度可以大約幾十毫 秒(例如,20ms),并且對話分析片段可以大約幾十秒例如20秒。
[0056] 在此,塊210涉及分析對話分析片段的音頻數(shù)據(jù)以確定網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)和對話 交互性數(shù)據(jù)。網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)例如可以提供中繼音頻數(shù)據(jù)分組的網(wǎng)絡(luò)中的抖動的指示。 對話交互性數(shù)據(jù)可以提供由音頻數(shù)據(jù)表示的對話的參與者之間的交互性的指示。在該實現(xiàn) 中,塊215涉及根據(jù)網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)和對話交互性數(shù)據(jù)兩者控制抖動緩沖器大小。
[0057] 分析音頻數(shù)據(jù)以確定網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)可以涉及至少部分地基于實際分組到達 時間來確定分組延遲變化(PDV)或到達間隔時間(IAT)變化中的至少之一。網(wǎng)絡(luò)抖動動態(tài) 數(shù)據(jù)例如可以包括分組延遲的百分位間距范圍、延遲尖峰概率和/或延遲尖峰密度。例如, 在一些實現(xiàn)中,可以將設(shè)定數(shù)量的分組的PDV確定為實際分組到達時間與預(yù)期分組到達時 間之間的差。
[0058] 例如,考慮由M個談話突峰和N個音頻分組組成的對話分析片段。在該討論中,下 面的變量表示下面所闡述的相應(yīng)的量:
[0059] < :表示第k個談話突峰中的第i個分組的發(fā)送器時間戳;
[0060] r/ :表示第k個談話突峰中的第i個分組的接收器時間戳;
[0061] nk :第k個談話突峰中接收的分組的數(shù)量;
[0062] ^ :表示第k個談話突峰中的第i個分組的回放時間戳;以及
[0063] 片-《:表示回放延遲。
[0064] 在一些實現(xiàn)中,可以根據(jù)回放時間戳是否指示音頻分組的再現(xiàn)/回放時間比音頻 分組的到達時間早,來作出晚到達的指示。例如,可以以二進制形式來表示音頻分組的晚到 達的指示,使得晚到達的指示為1或〇,例如,如下:
[0066] 在等式1中,表示第k個談話突峰中的第i個分組的晚到達指示。然而,在替選 實現(xiàn)中,可以使用更細粒度的晚到達指示。例如,晚到達指示可以根據(jù)兩個或更多個時間閾 值來指示晚的程度。
[0067] 在一些這種實現(xiàn)中,可以根據(jù)包括已經(jīng)接收到的過去w個音頻分組的時間窗口確 定分組延遲變化,例如,如下:
[0069] 在等式2中,^4表示第i個音頻分組的分組延遲,表示在第i個音頻分 組(w+1)個分組之前接收到的音頻分組的分組延遲表示下一個接收到的音頻分組 的分組延遲,等等。例如可以根據(jù)PDV或IAT確定分組延遲。在本文中w的值還可以指代 "分析窗口長度"。w的選擇確定相應(yīng)的算法可以多快地適應(yīng)延遲變化。因此,w的值遭受準 確度與響應(yīng)性之間的權(quán)衡。在一些實現(xiàn)中,w可以在200至1000的范圍內(nèi)。
[0070] 根據(jù)一些實現(xiàn),所接收的音頻分組例如可以根據(jù)分組延遲變化的次序統(tǒng)計而被分 類到分組延遲時間的范圍內(nèi)。例如,上面提及的分組延遲變化的次序統(tǒng)計可以被表示為 AD1,AD2,... ADW,其中,AD1彡AD2彡...彡ADW。在該示例中,AD 1表示最小延遲,ADw 表示最大延遲。
[0071] 因此,這種范圍包括最短分組延遲時間、中間分組延遲時間和最長分組延遲時間。 確定網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)可以涉及確定延遲時間之間的差,例如最大分組延遲時間之一與中 間分組延遲時間之一之間的差。
[0072] -些這種實現(xiàn)涉及確定分組延遲時間的百分位范圍。在一些這種實現(xiàn)中,確定網(wǎng) 絡(luò)抖動動態(tài)數(shù)據(jù)可以涉及確定與第一百分位范圍的第一分組延遲時間(例如,對于最大分 組延遲時間之一)與第二百分位范圍的第二分組延遲時間(例如,對于中間分組延遲時間之 一)之間的差相對應(yīng)的分組延遲的百分位間距范圍。
[0073] 在一些實現(xiàn)中,可以如下確定百分位間距范圍:
[0074] AD1-ADk (等式 3)
[0075] 在一些實現(xiàn)中,可以選擇r,使得Λ K表示最大分組延遲時間之一,而可以選擇k, 使得ADk表示分組延遲時間的中間處或附近的延遲時間。在一個示例中,可以如下確定r 和k :
[0076] r = round(0. 995Xw), κ = round(0. 5Xw) (等式 4 和等式 5)
[0077] 在等式4和等式5中,"round"表示舍入成整數(shù)的處理。在一些實現(xiàn)中,可以根據(jù) 基于涉及在不同類型的實際網(wǎng)絡(luò)上傳輸?shù)囊纛l分組的實驗的經(jīng)驗數(shù)據(jù),確定r和κ的值。
[0078] 確定網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)可以涉及例如基于具有超過閾值的延遲的分組數(shù)量以及 這些分組的延遲量來確定延遲尖峰強度,和/或確定延遲尖峰出現(xiàn)概率。例如,在一些實現(xiàn) 中,可以如下確定延遲尖峰出現(xiàn)概率:
[0080] 在等式6中,P表示延遲尖峰出現(xiàn)概率,/Ji表示延遲尖峰指示符。在一些示例中, 可以如下確定等式6的延遲尖峰指示符:
[0082] 在等式7中,ξ th表示延遲尖峰閾值。在一些實現(xiàn)中,延遲尖峰閾值可以在5到20 個分組間隔的范圍內(nèi),例如10個分組間隔。例如,如果分組之間的預(yù)期時間間隔是20ms,則 10個分組的延遲尖峰閾值將對應(yīng)于200ms。
[0083] 一些實現(xiàn)可以涉及在時間間隔期間確定平均延遲尖峰強度。在一些示例中,可以 如下確定平均延遲尖峰強度:
[0085] 在等式8中,λ表示w個音頻分組的分析窗口長度的平均延遲尖峰強度。
[0086] 一些實現(xiàn)可以涉及組合多于一種類型的網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)。例如,一些尖峰模式 檢測(PMD)實現(xiàn)可以涉及組合多于一種類型的網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù),以便檢測網(wǎng)絡(luò)抖動的峰 值模式。在一些示例中,PMD將涉及在包括多個談話突峰的對話分析片段期間的"長期"峰 值模式檢測。
[0087] 在一些示例中,PMD可以至少部分地基于百分位間距范圍(IPR)計算(例如,如上 所述的)、延遲尖峰強度和/或延遲尖峰出現(xiàn)概率。在一個示例中,如下確定PMD :
[0090] 在等式9中,IPR_th表示次序統(tǒng)計的百分位間距范圍的閾值,p_th表示延遲尖峰 出現(xiàn)概率的閾值,λ _th表示平均延遲尖峰強度的閾值。在一些實現(xiàn)中,IPR_th可以在5至 9的范圍內(nèi),例如7。在一些示例中,p_th可以在0.03至0.07的范圍內(nèi),例如0.05, A_th 可以在10至20的范圍內(nèi),例如15。因此,在等式9示出的示例中,峰值模式檢測過程將產(chǎn) 生與"是"或"否"確定相對應(yīng)的二進制值。然而,在替選實現(xiàn)中,可以確定相對更細粒度的 峰值模式檢測值。例如,在一些實現(xiàn)中,兩個或更多個PMD值的范圍可以對應(yīng)于網(wǎng)路抖動的 變化程度。
[0091] 如上面所指出的,本文中描述的各種實現(xiàn)涉及根據(jù)網(wǎng)絡(luò)抖動動態(tài)數(shù)據(jù)和對話交互 性數(shù)據(jù)兩者控制抖動緩沖器大小。前述談?wù)撝饕性诹舜_定各種類型的網(wǎng)路抖動動態(tài)數(shù) 據(jù)。下面是確定對話交互性數(shù)據(jù)的各種示例。
[0092] 在一些實現(xiàn)中,確定對話交互性數(shù)據(jù)可以涉及確定對話狀態(tài)。圖3提供了兩方對 話模型的示例,該模式提供對話狀態(tài)的一些示例。
[0093] 在圖3中,水平時間軸t上方的陰影區(qū)域指示其間對話參與者"A"在談話的時間, 而時間軸下方的陰影區(qū)域指示其間對話參與者"B"在談話的時間。標記有狀態(tài)A和狀態(tài)B 的區(qū)域指示其間單個對話參與者在講話的"單向談話"時間。
[0094] 標記有狀態(tài)D的區(qū)域指示其間對話參與者A和對話參與者B均在講話的"雙向談 話"時間。在一些實例中,對話可以包括三個或更多個參與者。因此,如本文中所使用的, "雙向談話"時間是指其間至少兩個對話參與者在講話的時間。
[0095] 圖3的狀態(tài)M對應(yīng)于其間對話參與者A和對話參與者B均未在講話的相互靜默時 間。鑒于對話有時可能包括三個或更多個參與者這一事實,如本文中所使用的,"相互靜默 時間"指示其間沒有對話參與者在講話的時間。
[0096] 然而,確定對話交互性數(shù)據(jù)可以涉及確定其他類型的對話狀態(tài)。在一些實現(xiàn)中,確 定對話交互性數(shù)據(jù)可以涉及確定講話者交替率或講話者中斷率中的至少之一。例如可以由 狀態(tài)A/狀態(tài)D/狀態(tài)B的序列來推斷對話參與者"A"被對話參與者"B"成功中斷。例如可 以由狀態(tài)A/狀態(tài)D/狀態(tài)A的序列來確定對話參與者"A"的不成功的中斷。一些實現(xiàn)可以 涉及發(fā)送或接收講話者靜音指示或演講指示,例如,作為與音頻分組相關(guān)聯(lián)的元數(shù)據(jù)。例 如,講話者靜音指示或演講指示可以對應(yīng)于來自對話參與者的輸入的接收,如按壓"靜音" 按鈕、輸入與講話者靜音指示或演講指示相對應(yīng)的代碼(例如,經(jīng)由鍵盤或小鍵盤)等。確定 對話交互性數(shù)據(jù)可以至少部分地基于講話者靜音指示和/或演講指示。
[0097] 在一些實現(xiàn)中,分析音頻數(shù)據(jù)以確定對話交互性數(shù)據(jù)可以涉及確定與對話交互性 程度相對應(yīng)的對話交互性度量((ΠΜ)。在一些實現(xiàn)中,(ΠΜ可以基于啟發(fā)式規(guī)則和/或?qū)υ?相對熵。
[0098] 在一些示例中,(ΠΜ可以至少部分地基于啟發(fā)式規(guī)則,該啟發(fā)式規(guī)則涉及應(yīng)用講話 者交替率的閾值、其間單個對話參與者在講話的單向談話時間的閾值、其間兩個或更多個 對話參與者在講話的雙向談話時間的閾值、和/
當前第3頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1