• / 17
  • 下載費用:30 金幣  

處理基于對象的音頻信號.pdf

摘要
申請專利號:

CN201510294063.7

申請日:

2015.06.01

公開號:

CN106303897A

公開日:

2017.01.04

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回IPC(主分類):H04S 3/00申請公布日:20170104|||公開
IPC分類號: H04S3/00; G10L19/008(2013.01)I 主分類號: H04S3/00
申請人: 杜比實驗室特許公司
發明人: A·西菲爾特; 蘆烈; 張晨
地址: 美國加利福尼亞州
優先權:
專利代理機構: 北京市金杜律師事務所 11256 代理人: 王茂華;楊立
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510294063.7

授權公告號:

|||

法律狀態公告日:

2018.12.18|||2017.01.04

法律狀態類型:

發明專利申請公布后的視為撤回|||公開

摘要

本文公開的示例實施例涉及音頻信號處理。公開了一種處理具有多個音頻對象音頻信號的方法,包括基于音頻對象的空間元數據,計算針對每個音頻對象中相對于多個預定義聲道覆蓋區域中的每個的平移系數,該預定義聲道覆蓋區域由分布在聲場中的多個端點定義;基于音頻對象和計算出的平移系數,將音頻信號轉換為相對于預定義聲道覆蓋區域的子混集,每個子混集指示多個音頻對象相對于一個預定義聲道覆蓋區域中的分量之和;通過向子混集中的每一個應用音頻處理而生成子混集增益;以及控制被應用至每個音頻對象的對象增益,該對象增益為針對每個音頻對象的平移系數以及相對于每個預定義聲道覆蓋區域的子混集增益的函數。還公開相應的系統和計算機程序產品。

權利要求書

1.一種處理音頻信號的方法,所述音頻信號具有多個音頻對象,
所述方法包括:
基于所述音頻對象的空間元數據,計算針對所述音頻對象中的每
個音頻對象相對于多個預定義聲道覆蓋區域中的每個預定義聲道覆
蓋區域的平移系數,所述預定義聲道覆蓋區域由分布在聲場中的多個
端點定義;
基于所述音頻對象和計算出的平移系數,將所述音頻信號轉換為
相對于所述預定義聲道覆蓋區域的子混集,所述子混集中的每個子混
集指示所述多個音頻對象相對于所述預定義聲道覆蓋區域中的一個
預定義聲道覆蓋區域的分量之和;
通過向所述子混集中的每個子混集應用音頻處理而生成子混集
增益;以及
控制被應用至所述音頻對象中的每個音頻對象的對象增益,所述
對象增益為針對所述音頻對象中的每個音頻對象的所述平移系數以
及相對于所述預定義聲道覆蓋區域中的每個預定義聲道覆蓋區域的
子混集增益的函數。
2.根據權利要求1所述的方法,進一步包括:
基于所述音頻對象和所述對象增益呈現所述音頻信號。
3.根據權利要求1所述的方法,其中所述子混集中的每個子混
集被轉換為所述多個音頻對象的加權平均值,其中所述權重為針對所
述音頻對象中的每個音頻對象的平移系數。
4.根據權利要求1所述的方法,其中所述預定義聲道覆蓋區域
的數量與被轉換的子混集的數量相等。
5.根據權利要求1所述的方法,進一步包括:
確定所述音頻對象是否屬于對話對象;以及
響應于所述音頻對象被確定為對話對象,將所述音頻對象聚類為
對話子混集。
6.根據權利要求5所述的方法,其中以置信度分數來估計所述
音頻對象是否屬于對話對象,并且所述方法進一步包括基于所估計的
置信度分數而生成針對所述對話子混集的所述子混集增益。
7.根據權利要求1至6中任一項所述的方法,其中
所述預定義聲道覆蓋區域包括由前左聲道和前右聲道定義的前
區域,
由中央聲道定義的中央區域,
由環繞左聲道和環繞右聲道定義的環繞區域,以及
由高度聲道定義的高度區域。
8.根據權利要求7所述的方法,其中將所述音頻信號轉換為子
混集進一步包括:
基于針對所述音頻對象的所述平移系數,將所述音頻信號轉換為
相對于所述前區域的前子混集;
基于針對所述音頻對象的所述平移系數,將所述音頻信號轉換為
相對于所述中央區域的中央子混集;
基于針對所述音頻對象的所述平移系數,將所述音頻信號轉換為
相對于所述環繞區域的環繞子混集;以及
基于針對所述音頻對象的所述平移系數,將所述音頻信號轉換為
相對于所述高度區域的高度子混集。
9.根據權利要求8所述的方法,進一步包括:
將所述中央子混集與所述前子混集合并;以及
以所述對話子混集替換所述中央子混集。
10.根據權利要求8所述的方法,進一步包括:
在所述環繞子混集以及所述高度子混集應用相同的音頻處理算
法,以生成對應的子混集增益。
11.根據權利要求1至6中任一項所述的方法,進一步包括:
針對所述音頻對象中的每個音頻對象,識別所述音頻對象的類型;
以及
基于所述音頻對象的所識別的類型,通過向所述子混集中的每個
子混集應用音頻處理而生成所述子混集增益。
12.一種處理音頻信號的系統,所述音頻信號具有多個音頻對象,
所述系統包括:
平移系數計算單元,被配置為基于所述音頻對象的空間元數據,
計算針對所述音頻對象中的每個音頻對象相對于多個預定義聲道覆
蓋區域中的每個預定義聲道覆蓋區域的平移系數,所述預定義聲道覆
蓋區域由分布在聲場中的多個端點定義;
子混集轉換單元,被配置為基于所述音頻對象和計算出的平移系
數,將所述音頻信號轉換為相對于所述預定義聲道覆蓋區域的子混集,
所述子混集中的每個子混集指示所述多個音頻對象相對于所述預定
義聲道覆蓋區域中的一個預定義聲道覆蓋區域的分量之和;
子混集增益生成單元,被配置為通過向所述子混集中的每個子混
集應用音頻處理而生成子混集增益;以及
對象增益控制單元,被配置為控制被應用至所述音頻對象中的每
個音頻對象的對象增益,所述對象增益為針對所述音頻對象中的每個
音頻對象的所述平移系數以及相對于所述預定義聲道覆蓋區域中的
每個預定義聲道覆蓋區域的子混集增益的函數。
13.根據權利要求12所述的系統,進一步包括:
音頻信號呈現單元,被配置為基于所述音頻對象和所述對象增益
呈現所述音頻信號。
14.根據權利要求12所述的系統,其中所述子混集中的每個子
混集被轉換為所述多個音頻對象的加權平均值,其中所述權重為針對
所述音頻對象中的每個音頻對象的平移系數。
15.根據權利要求12所述的系統,其中所述預定義聲道覆蓋區
域的數量與被轉換的子混集的數量相等。
16.根據權利要求12所述的系統,進一步包括:
對話確定單元,被配置為確定所述音頻對象是否屬于對話對象;
對話對象聚類單元,被配置為響應于所述音頻丟向被確定為對話
對象,將所述音頻對象聚類為對話子混集。
17.根據權利要求16所述的系統,其中以置信度分數來估計所
述音頻對象是否屬于對話對象,并且所述系統進一步包括對話子混集
增益生成單元,其被配置為基于所估計的置信度分數而生成針對所述
對話子混集的所述子混集增益。
18.根據權利要求12至17中任一項所述的系統,其中
所述預定義聲道覆蓋區域包括由前左聲道和前右聲道定義的前
區域,
由中央聲道定義的中央區域,
由環繞左聲道和環繞右聲道定義的環繞區域,以及
由高度聲道定義的高度區域。
19.根據權利要求18所述的系統,進一步包括:
前子混集轉換單元,被配置為基于針對所述音頻對象的所述平移
系數,將所述音頻信號轉換為相對于所述前區域的前子混集;
中央子混集轉換單元,被配置為基于針對所述音頻對象的所述平
移系數,將所述音頻信號轉換為相對于所述中央區域的中央子混集;
環繞子混集轉換單元,被配置為基于針對所述音頻對象的所述平
移系數,將所述音頻信號轉換為相對于所述環繞區域的環繞子混集;
以及
高度子混集轉換單元,被配置為基于針對所述音頻對象的所述平
移系數,將所述音頻信號轉換為相對于所述高度區域的高度子混集。
20.根據權利要求19所述的系統,進一步包括:
合并單元,被配置為將所述中央子混集與所述前子混集合并;以

替換單元,被配置為以所述對話子混集替換所述中央子混集。
21.根據權利要求19所述的系統,其中所述環繞子混集和所述
高度子混集被應用相同的音頻處理算法,以便于生成對應的子混集增
益。
22.根據權利要求12至17中任一項所述的系統,進一步包括:
對象類型識別單元,被配置為針對所述音頻對象中的每個音頻對
象,識別所述音頻對象的類型,并且其中所述子混集增益生成單元被
配置為基于所述音頻對象的所識別的類型,通過向所述子混集中的每
個子混集應用音頻處理而生成所述子混集增益。
23.一種用于呈現音頻信號的計算機程序產品,所述計算機程序
產品被有形地存儲在非瞬態計算機可讀介質上并且包括計算機可執
行指令,所述計算機可執行指令在被執行時使得機器執行根據權利要
求1至11中任一項所述的方法的步驟。

關 鍵 詞:
處理 基于 對象 音頻 信號
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:處理基于對象的音頻信號.pdf
鏈接地址:http://www.rgyfuv.icu/p-6100596.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图