これは、ユーザーが2025-1-16 24:55にhttps://ieeexplore-ieee-org.utokyo.idm.oclc.org/document/9523774のために保存したバイリンガルスナップショットページで、イマーシブ翻訳によって提供されたバイリンガルサポートがあります。保存方法を学ぶ?
カーネル補間に基づく音場の空間的アクティブノイズ制御

Spatial Active Noise Control Based on Kernel Interpolation of Sound Field
カーネル補間に基づく音場の空間的アクティブノイズ制御

Shoichi Koyama; Jesper Brunnström; Hayato Ito; Natsuki Ueno; Hiroshi Saruwatari
小山翔一; イェスパー・ブルンストローム; 伊藤隼人; 上野夏樹; 猿渡宏
Open Access オープンアクセス
Under a Creative Commons License
クリエイティブ・コモンズ・ライセンスの下で

Abstract: 要約:

An active noise control (ANC) method to reduce noise over a region in space based on kernel interpolation of sound field is proposed. Current methods of spatial ANC are l...Show More
空間内の特定の領域における騒音を低減するためのアクティブノイズコントロール(ANC)手法が、音場のカーネル補間に基づいて提案されている。現在の空間 ANCの手法は...

Abstract: 要約:

An active noise control (ANC) method to reduce noise over a region in space based on kernel interpolation of sound field is proposed. Current methods of spatial ANC are largely based on spherical or circular harmonic expansion of the sound field, where the geometry of the error microphone array is restricted to a simple one such as a sphere or circle. We instead apply the kernel interpolation method, which allows for the estimation of a sound field in a continuous region with flexible array configurations. The interpolation scheme is used to derive adaptive filtering algorithms for minimizing the acoustic potential energy inside a target region. A practical time-domain algorithm is also developed together with its computationally efficient block-based equivalent. We conduct experiments to investigate the achievable level of noise reduction in a two-dimensional free space, as well as adaptive broadband noise control in a three-dimensional reverberant space. The experimental results indicated that the proposed method outperforms the multipoint-pressure-control-based method in terms of regional noise reduction.
音場のカーネル補間に基づく空間内のノイズを低減するためのアクティブノイズ制御(ANC)手法が提案されている。現在の空間 ANC 手法は、音場の球面または円形調和展開に大きく依存しており、誤差マイクロフォンアレイのジオメトリは球体や円のような単純な形状に制限されている。そこで、我々はカーネル補間法を適用し、柔軟なアレイ構成で連続した領域内の音場を推定することを可能にする。この補間スキームを用いて、ターゲット領域内の音響ポテンシャルエネルギーを最小化するための適応フィルタリングアルゴリズムを導出する。実用的な時間領域アルゴリズムも開発され、その計算効率の良いブロックベースの同等物も併せて提案されている。我々は、二次元の自由空間におけるノイズ低減の達成可能なレベルや、三次元の残響空間における適応型広帯域ノイズ制御を調査するための実験を行った。実験結果は、提案手法が地域的なノイズ低減においてマルチポイント圧力制御に基づく手法よりも優れていることを示した。
Published in: IEEE/ACM Transactions on Audio, Speech, and Language Processing ( Volume: 29)
発表先:IEEE/ACMトランザクションズ オン オーディオ、スピーチ、アンド ランゲージ プロセッシング(ボリューム:29)
Page(s): 3052 - 3063 ページ: 3052 - 3063
Date of Publication: 26 August 2021
出版日:2021 年 8 月 26 日

ISSN Information:  ISSN 情報:

Funding Agency:  資金提供機関:


CCBY - IEEE is not the copyright holder of this material. Please follow the instructions via https://creativecommons.org/licenses/by/4.0/ to obtain full-text articles and stipulations in the API documentation.
CCBY - IEEEはこの資料の著作権者ではありません。全文記事およびAPIドキュメントの規定を取得するには、https://creativecommons.org/licenses/by/4.0/ の指示に従ってください。
SECTION I. 第 I 節。

Introduction 序論

The aim of active noise control (ANC) or active noise cancellation is to suppress unwanted noise by generating antinoise with secondary sources, i.e., loudspeakers. ANC techniques have been extensively investigated [1]–​[4] along with their practical applicability, especially for canceling low-frequency noise [5]–​[8].
アクティブノイズコントロール(ANC)またはアクティブノイズキャンセリングの目的は、二次ソース、すなわちスピーカーを用いて反対の音を生成することによって不要なノイズを抑制することです。ANC 技術は、特に低周波ノイズのキャンセルに関して、その実用性とともに広範に研究されています。

Achieving effective ANC over a three-dimensional (3D) space generally requires multiple microphones and loudspeakers to capture and synthesize a 3D sound field. Adaptive filters are typically used to minimize the cost function, which in conventional multipoint pressure control is defined as the power of the residual noise signals captured by error microphones [3], [9]. Thus, these methods primarily reduce noise local to error microphone positions. Virtual sensing techniques attempt to estimate the noise at locations remote from the physical error microphones [10]–​[12]; however, the cost function is still constructed as the power of the residual noise at discrete positions including virtual ones. Therefore, the noise field between the (physical/virtual) error microphone positions is not taken into consideration. Furthermore, most of the virtual sensing techniques require an identification stage to estimate a filter for predicting error signals at the virtual microphones.
効果的なANC(アクティブノイズキャンセリング)を三次元(3D)空間で実現するには、一般的に複数のマイクロフォンとスピーカーが必要で、3D 音場をキャプチャし合成します。適応フィルターは通常、コスト関数を最小化するために使用され、従来のマルチポイント圧力制御では、エラーマイクロフォンによってキャプチャされた残留ノイズ信号のパワーとして定義されます[3]、[9]。したがって、これらの方法は主にエラーマイクロフォンの位置に局所的なノイズを減少させます。仮想センシング技術は、物理的なエラーマイクロフォンから遠く離れた位置でのノイズを推定しようとします[10]–[12]が、コスト関数は依然として仮想位置を含む離散位置での残留ノイズのパワーとして構築されます。したがって、(物理的/仮想的)エラーマイクロフォンの位置間のノイズフィールドは考慮されていません。さらに、ほとんどの仮想センシング技術は、仮想マイクロフォンでのエラー信号を予測するためのフィルターを推定するために識別段階を必要とします。

In recent years, spatial ANC, which aims to control noise over a continuous 3D target region, has attracted attention [13]–​[19] owing to advancements in sound field recording and reproduction methods [20]–​[23]. Most spatial ANC methods are based on the expansion of the captured sound field into wave-domain basis functions, such as spherical and circular harmonics [24]. Consequently, the methods can only be applied to a simple array geometry, such as sphere, circle, or its combination [15], [18], [19]. Since the secondary sources and error microphones have to be placed surrounding the target region to suppress the interior noise field, it is preferable that their placement is flexible. Moreover, adaptive filtering algorithms for spatial ANC are derived in the frequency domain with a few exceptions [25], [26]. Implementing time-domain algorithms, especially for broadband noise, from these frequency-domain algorithms is not straightforward. Therefore, it is necessary to develop practical time-domain adaptive filtering algorithms for spatial ANC.
近年、連続した3Dターゲット領域におけるノイズ制御を目的とした空間 ANCが、音場の記録および再生方法の進展により注目を集めています[13]–[19]。ほとんどの空間 ANC 手法は、捕捉された音場を球面調和関数や円形調和関数などの波動領域基底関数に展開することに基づいています[24]。その結果、これらの手法は球体、円、またはその組み合わせのような単純な配列ジオメトリにのみ適用可能です[15]、[18]、[19]。二次音源と誤差マイクロフォンは、内部ノイズ場を抑制するためにターゲット領域の周囲に配置する必要があるため、その配置が柔軟であることが望ましいです。さらに、空間 ANCのための適応フィルタリングアルゴリズムは、いくつかの例外を除いて周波数領域で導出されます[25]、[26]。これらの周波数領域アルゴリズムから、特に広帯域ノイズに対する時間領域アルゴリズムを実装することは簡単ではありません。したがって、空間 ANCのための実用的な時間領域適応フィルタリングアルゴリズムを開発する必要があります。

We propose a spatial ANC approach based on the kernel interpolation of a sound field. The cost function is defined as the acoustic potential energy inside the target region. To minimize this cost function with an adaptive filter, it is necessary to estimate the noise field from discrete microphone measurements. We apply kernel interpolation [27], which makes it possible to estimate a continuous sound field in the frequency domain under the constraint of the Helmholtz equation. This interpolation method is equivalent to spherical/circular harmonic analysis of infinite order [28], [29] when using pressure microphones. The sound field can also be estimated from arbitrarily placed microphones. Therefore, the proposed method can meet the demand for flexible microphone and loudspeaker arrangements. Two time-domain algorithms based on kernel interpolation are developed. An extension of the well-known filtered-x least mean squares (FxLMS) algorithm [2], [3] for minimizing the regional noise power is derived, which is called kernel-interpolation-based FxLMS (KI-FxLMS). We also develop the fast block KI-FxLMS, which is a more computationally efficient algorithm using blockwise operations and the fast Fourier transform (FFT). Although preliminary results of this study are presented in [17], [30], we here describe in detail the derivations of the algorithms with a newly obtained optimal frequency-domain filter. In addition, extensive experimental results including 3D spatial ANC comparing with the virtual sensing technique and that using real data obtained in a practical environment are also presented.
我々は、音場のカーネル補間に基づく空間 ANCアプローチを提案する。コスト関数は、ターゲット領域内の音響ポテンシャルエネルギーとして定義される。このコスト関数を適応フィルタで最小化するためには、離散マイクロフォン測定からノイズ場を推定する必要がある。我々は、ヘルムホルツ方程式の制約の下で周波数領域における連続音場を推定することを可能にするカーネル補間[27]を適用する。この補間法は、圧力マイクロフォンを使用する際に無限次の球面/円形調和解析[28][29]に相当する。音場は、任意に配置されたマイクロフォンからも推定可能である。したがって、提案された方法は、柔軟なマイクロフォンおよびスピーカー配置の要求に応えることができる。カーネル補間に基づく2つの時間領域アルゴリズムが開発される。地域ノイズパワーを最小化するためのよく知られたフィルタ付きx 最小二乗法(FxLMS)アルゴリズム[2][3]の拡張が導出され、カーネル補間に基づくFxLMS(KI-FxLMS)と呼ばれる。 私たちは、ブロック単位の操作と高速フーリエ変換(FFT)を使用した、より計算効率の良いアルゴリズムである高速ブロックKI-FxLMSを開発しました。この研究の予備結果は[17]、[30]に示されていますが、ここでは新たに得られた最適な周波数領域フィルターを用いたアルゴリズムの導出を詳細に説明します。さらに、仮想センシング技術と実際の環境で得られた実データを使用した3D 空間 ANCとの比較を含む広範な実験結果も示されています。

The rest of this paper is organized as follows. In Section II, the problem statement of spatial ANC is described. The kernel interpolation method is introduced in Section III. In Section IV, the proposed spatial ANC algorithms are developed. Experimental results compared with those of the multipoint-pressure-control-based ANC method and the virtual sensing technique are reported in Section V. Finally, Section VI concludes this paper.
本論文の残りの部分は以下のように構成されています。第 II 節では、空間 ANCの問題定義が説明されます。第 III 節では、カーネル補間法が紹介されます。第 IV 節では、提案された空間 ANCアルゴリズムが開発されます。第 V 節では、マルチポイント圧力制御に基づくANC 手法および仮想センシング技術との比較実験結果が報告されます。最後に、第 VI 節で本論文を結論づけます。

A. Notation A. 表記法

Italic letters denote scalars, lower case boldface italic letters denote vectors, and upper case boldface italic letters denote tensors of order two or more, including matrices. The sets of real and complex numbers are denoted by R and C, respectively. The unit sphere in R3 is denoted by S2. Subscripts of scalars, vectors, and tensors indicate their indexes. To illustrate, xi,j is the (i,j)th entry of the matrix X. The identity matrix of size N×N is denoted by IN.
イタリック体の文字はスカラーを示し、小文字の太字イタリック体の文字はベクトルを示し、大文字の太字イタリック体の文字は二次以上のテンソル、すなわち行列を示します。実数の集合は R 、複素数の集合は C で示されます。 R3 の単位球は S2 で示されます。スカラー、ベクトル、テンソルの下付き文字はそれらのインデックスを示します。例として、 xi,j は行列 X(i,j) 番目のエントリです。サイズ N×N の単位行列は IN で示されます。

The imaginary unit is denoted by j:=1. The complex conjugate, transpose, conjugate transpose, and inverse are denoted by superscripts (), ()T, ()H, and ()1, respectively. The absolute value of a scalar x is denoted by |x|. The p-norm of a vector x is denoted by xp.
虚数単位は j:=1 で表されます。複素共役、転置、共役転置、および逆行列は、それぞれ上付き文字 ()()T()H 、および ()1 で表されます。スカラー x の絶対値は |x| で表されます。ベクトル xp -ノルムは xp で表されます。

Indexes of discrete time and filter coefficients are denoted by n and i, respectively, and angular frequency is denoted by ω, in arguments of variables or functions. For example, x(n) is the vector-valued signal at the time index n. The sound velocity and wave number are denoted by c and =ω/c, respectively. Harmonic time dependence ejωt with the time t is assumed according to conventions in the signal processing literature.
離散時間のインデックスとフィルター係数はそれぞれ ni で示され、角周波数は変数または関数の引数において ω で示される。例えば、 x(n) は時間インデックス n におけるベクトル値信号である。音速と波数はそれぞれ c=ω/c で示される。信号処理文献の慣習に従い、時間 t に対する調和的時間依存性 ejωt が仮定される。

SECTION II. 第 II 節。

Problem Statement 問題の定義

Suppose that a target region Ω is set in the 3D space R3 and that undesired noise arrives from outside of Ω. The objective of spatial ANC is to reduce incoming noise over the region Ω by controlling the output of the placed loudspeakers. The incoming noise and the loudspeakers are called the primary noise and secondary sources, respectively. As shown in Fig. 1, error microphones are placed inside Ω to measure the error of the adaptation process. Although the error microphones can be arbitrarily placed inside Ω, it is usually desirable that the error microphones are placed near the boundary of Ω to save space for ANC users. It is also known that the microphones should be placed near the boundary to estimate an interior sound field, but arranging the pressure microphones to be completely on the boundary can lead to the forbidden frequency problem [31]. The secondary sources are placed around Ω and are used to generate an antinoise field of the primary noise from the signals captured by the reference microphones.
ターゲット領域 Ω が3D 空間 R3 に設定され、望ましくないノイズが Ω の外部から到着すると仮定します。空間 ANCの目的は、設置されたスピーカーの出力を制御することによって、領域 Ω 内の到着ノイズを減少させることです。到着ノイズとスピーカーはそれぞれ一次ノイズと二次ソースと呼ばれます。図 1に示すように、エラーマイクロフォンは適応プロセスの誤差を測定するために Ω 内に配置されます。エラーマイクロフォンは Ω 内に任意に配置できますが、通常、ANCユーザーのためにスペースを節約するために、エラーマイクロフォンは Ω の境界近くに配置されることが望ましいとされています。また、マイクロフォンは内部音場を推定するために境界近くに配置されるべきであることも知られていますが、圧力マイクロフォンを完全に境界上に配置すると禁止周波数問題を引き起こす可能性があります[31]。二次ソースは Ω の周囲に配置され、リファレンスマイクロフォンによってキャプチャされた信号から一次ノイズのアンチノイズフィールドを生成するために使用されます。

Fig. 1. - Conceptual diagram of feedforward spatial active noise control.
Fig. 1.  図 1。

Conceptual diagram of feedforward spatial active noise control.
フィードフォワード空間アクティブノイズコントロールの概念図。

The signals of the reference microphones and secondary sources in the discrete time domain are denoted by x(n)RR and y(n)RL with the time index n, where the numbers of reference microphones and secondary sources are R and L, respectively. The error microphone signals and primary noise at the error microphone positions are denoted by e(n) and d(n) (RM), respectively. The number of error microphones is M. The total pressure field at the position rΩ and time n is denoted by u(r,n). The pressure field at the position of the mth microphone rm is equal to the mth element of e(n), meaning that em(n)=u(rm,n). The signals in the frequency domain are distinguished by the angular frequency ω as an argument, for example, as x(ω) (CR).
参照マイクロフォンと二次ソースの信号は、離散時間領域において x(n)RR および y(n)RL で表され、時間インデックスは n です。参照マイクロフォンの数は R 、二次ソースの数は L です。エラーマイクロフォン信号とエラーマイクロフォン位置での主ノイズは、それぞれ e(n) および d(n)RM )で表されます。エラーマイクロフォンの数は M です。位置 rΩ および時間 n における総圧力場は u(r,n) で表されます。 m 番目のマイクロフォン rm の位置における圧力場は、 e(n)m 番目の要素に等しく、これは em(n)=u(rm,n) を意味します。周波数領域における信号は、角周波数 ω を引数として区別され、例えば x(ω)CR )のように表されます。

The impulse response between the secondary sources and the error microphones (secondary paths) is represented by a multiple-input multiple-output (MIMO) finite impulse response (FIR) filter G(i)RM×L of length J, where each i indicates a matrix of filter coefficients. The error microphone signal e(n) can be expressed as a superposition of the primary noise and the secondary source signals as
二次ソースと誤差マイクロフォン(セカンダリーパス)間のインパルス応答は、長さ J の多入力多出力(MIMO)有限インパルス応答(FIR)フィルター G(i)RM×L によって表され、各 i はフィルター係数の行列を示します。誤差マイクロフォン信号 e(n) は、一次ノイズと二次ソース信号の重ね合わせとして表現できます。

e(n)=d(n)+i=0J1G(i)y(ni).(1)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. We assume that the true secondary paths are known, for instance, by measuring them offline. The control filter is a MIMO FIR filter W(i)RL×R of length I. The driving signals of the secondary sources, y(n), are obtained by filtering the reference signal x(n) with the control filter W(i) as
真の二次経路がオフラインで測定されることによって知られていると仮定します。制御フィルターは長さ I のMIMO FIRフィルター W(i)RL×R です。二次ソースの駆動信号 y(n) は、参照信号 x(n) を制御フィルター W(i) でフィルタリングすることによって得られます。
y(n)=i=0I1W(i)x(ni).(2)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
It is assumed that the effect of the secondary source signals is negligible at the reference microphone positions.
参照マイクロフォンの位置において、二次ソース信号の効果は無視できると仮定されている。

The above-described ANC setup is a typical multichannel feedforward ANC system, whose block diagram is depicted in Fig. 2. Although we focus only on feedforward ANC in this study, feedback ANC is also useful to suppress periodic noises [3]. One of the benefits of feedback ANC is its lack of reference microphones, leading to simple system configurations. Feedback ANC algorithms can be developed from the following derivations by constructing virtual reference signals as
上記のANC 設定は、典型的なマルチチャネルフィードフォワードANCシステムであり、そのブロック図は図 2に示されています。本研究ではフィードフォワードANCのみに焦点を当てていますが、フィードバックANCも周期的なノイズを抑制するのに有用です[3]。フィードバックANCの利点の一つは、参照マイクロフォンが不要であるため、システム構成が簡単になることです。フィードバックANCアルゴリズムは、仮想参照信号を構築することによって以下の導出から開発できます。

x^(n)=e(n)j=0J1G(j)y(nj).(3)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.

Fig. 2. - Block diagram of a multichannel feedforward ANC system.
Fig. 2.

Block diagram of a multichannel feedforward ANC system.

Our objective is to reduce the power of u(r,n) over the region Ω by adapting the control filter W(i). Since the error microphones are placed inside Ω in discrete locations, the continuous sound field u(r,n) has to be predicted from e(n).

SECTION III.

Kernel Interpolation of Sound Field

We here introduce the kernel interpolation of a sound field [27], with the goal of estimating the sound field inside the source-free target region Ω from microphone observations. The kernel interpolation method is formulated in the frequency domain; hence, the signals are dependent on ω, which is omitted for notational simplicity in this section.

The sound pressure u(r) at angular frequency ω is observed by M pressure microphones, i.e., the error microphones. The observed value of the mth microphone in the frequency domain is emC. The interpolation problem is formulated as

minimizeuHm=1M|u(rm)em|2+λu2H.(4)
View SourceRight-click on figure for MathML and additional features. Here, H is a function space for which we seek a solution, which, therefore, should be designed for representing a sound field, H is a norm on H, and λ is a real non-negative parameter. The first term of (4) is a loss term between u and e1,,eM, and the second term is a regularization term. First, we introduce kernel ridge regression for solving (4) in Section III-A. Next, we define H for sound field interpolation in Section III-B.

A. Kernel Ridge Regression

When H is a function space called a reproducing kernel Hilbert space, the optimization problem (4) corresponds to kernel ridge regression, for which a closed-form solution can be obtained [32]. First, H is assumed to be a reproducing kernel Hilbert space with the inner product ,H and positive-definite reproducing kernel κ:H×HC. On the basis of the representer theorem [33], the solution of (4) can be expressed as
H が再生核ヒルベルト空間と呼ばれる関数空間であるとき、最適化問題(4)はカーネルリッジ回帰に対応し、閉形式の解を得ることができる[32]。まず、 H が内積 ,H と正定値再生核 κ:H×HC を持つ再生核ヒルベルト空間であると仮定する。表現定理[33]に基づいて、(4)の解は次のように表現できる。

u(r)=m=1Mαmκ(r,rm),(5)
View SourceRight-click on figure for MathML and additional features. where αmC for m=1,,M. By substituting (5) into the objective function of (4), we obtain
m=1,,M のための αmC 。式(4)の目的関数に式(5)を代入することにより、次のようになります。
αH(KHK+λK)ααHKHeeHKα+eHe,(6)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where  どこ
αK:=[α1,,αM]T,:=κ(r1,r1)κ(rM,r1)κ(r1,rM)κ(rM,rM).(7)(8)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
Since K is Hermitian and positive-definite, α is obtained by minimizing (6) as
K がエルミートかつ正定値であるため、 α は(6)を最小化することによって得られます
α=(K+λIM)1e.(9)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
Therefore, u(r) is estimated as
したがって、 u(r) は次のように推定されます
u(r)=κ(r)T(K+λIM)1e,(10)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where  どこ
κ(r)=[κ(r,r1),,κ(r,rM)]T.(11)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
Thus, the closed-form solution of (4) is (10). Next, it is necessary to define appropriate H and ,H, as well as κ.
したがって、(4) の閉形式解は (10) です。次に、適切な H,H 、および κ を定義する必要があります。

B. Reproducing Kernel for Sound Field Interpolation
B. 音場補間のための再生カーネル

The pressure field u inside the source-free simply connected region Ω can be modeled as a solution of the following (homogeneous) Helmholtz equation [24]:
ソースのない単純連結領域 Ω 内の圧力場 u は、以下の(均質な)ヘルムホルツ方程式 [24] の解としてモデル化することができます:

(2+2)u=0,(12)
View SourceRight-click on figure for MathML and additional features. where 2 is the Laplacian. Any solution of (12) can be well approximated by the superposition of plane waves, i.e., the Herglotz wave function [29], [34], as
ここで 2 はラプラシアンです。(12)の任意の解は、平面波の重ね合わせ、すなわちヘルグロッツ波動関数[29]、[34]によって良好に近似されることができます。
u(r)=14πS2u~(ξ)ejkTrdξ,(13)
View SourceRight-click on figure for MathML and additional features.
where u~ is the (square-integrable) complex amplitude of the plane wave of arrival direction ξS2, and k:=ξ is the wave vector. Using this representation, we define the inner product and norm over the Hilbert space H as
u~ は到達方向 ξS2 の平面波の(平方可積分)複素振幅であり、 k:=ξ は波ベクトルです。この表現を用いて、ヒルベルト空間 H における内積とノルムを定義します。
u1,u2HuH=14πS21γ(ξ)u~1(ξ)u~2(ξ)dξ,=u,uH,(14)(15)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
respectively. Here, γ(ξ) is a directional weighting function, which is introduced to incorporate prior knowledge on source directions.
それぞれ。ここで、 γ(ξ) は方向重み付け関数であり、これはソース方向に関する事前知識を組み込むために導入されます。

We set the kernel function κ(r1,r2) as
カーネル関数 κ(r1,r2) を次のように設定します

κ(r1,r2)=14πS2γ(ξ)ejkT(r1r2)dξ.(16)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. When we denote κ(r,r) by κr(r), κr,u is obtained as
κ(r,r)κr(r) で示すと、 κr,u が得られます
κr,uH=14πS2γ(ξ)1γ(ξ)ejkTru~(ξ)dξ=14πS2u~(ξ)ejkTrdξ=u(r).(17)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
Therefore, we can confirm that κ(r1,r2) is the reproducing kernel of H. In this study, we set the directional weighting function to be uniform, i.e., γ(ξ)=1. Thus, the specific kernel function κ(r1,r2) is obtained from (49) as
したがって、 κ(r1,r2)H の再生カーネルであることを確認できます。本研究では、方向重み付け関数を一様に設定し、すなわち γ(ξ)=1 とします。したがって、特定のカーネル関数 κ(r1,r2) は(49)から得られます。
κ(r1,r2)=14πS2ejkT(r1r2)dξ=j0(r1r22),(18)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where j0() is the 0th-order spherical Bessel function of the first kind. See Appendix for the kernel function when using a directional weighting. The Gram matrix K when using this kernel function (18) corresponds to the normalized spatial covariance matrix in a diffuse sound field [35]. When a two-dimensional (2D) sound field is assumed instead, the corresponding kernel function becomes
j0() は第一種のゼロ次球ベッセル関数です。方向重み付けを使用する際のカーネル関数については付録を参照してください。このカーネル関数(18)を使用したときのグラム行列 K は、拡散音場における正規化された空間共分散行列に対応します[35]。二次元(2D)音場が仮定される場合、対応するカーネル関数は次のようになります。
κ(r1,r2)=J0(r1r22),(19)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where J0() is the 0th-order Bessel function of the first kind.
J0() は第一種のゼロ次ベッセル関数です。

The kernel interpolation of a sound field from the microphone measurements e is achieved by using (10) with the kernel function (18) or (19). Depending on the setting of the number and placement of microphones, the inversion of the Gram matrix K sometimes becomes numerically unstable. One simple strategy to prevent this problem is to appropriately set the regularization parameter λ. Another well-known strategy is low-rank approximation of K [36], [37].
音場のカーネル補間は、マイクロフォン測定 e から、カーネル関数(18)または(19)を用いて(10)によって達成されます。マイクロフォンの数と配置の設定に応じて、グラム行列 K の逆行列が数値的に不安定になることがあります。この問題を防ぐための一つの簡単な戦略は、正則化パラメータ λ を適切に設定することです。もう一つのよく知られた戦略は、 K の低ランク近似です[36]、[37]。

SECTION IV. セクション IV.

Spatial ANC Based on Kernel Interpolation
カーネル補間に基づく空間 ANC

The objective of spatial ANC is to reduce the power of the sound field inside the target region Ω. Therefore, we define the cost function for adapting the control filter as the acoustic potential energy inside Ω,
空間 ANCの目的は、ターゲット領域内の音場のパワーを低減することです Ω 。したがって、制御フィルターを適応させるためのコスト関数を Ω 内の音響ポテンシャルエネルギーとして定義します。

L:=E[Ωu(r,n)2dr],(20)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where E[] represents the expectation with respect to the time n. By assuming a stationary sound field, we can describe the frequency-domain cost function at ω as
E[] は時間 n に関する期待値を表します。定常音場を仮定することにより、周波数領域のコスト関数を ω で次のように記述できます。
L¯(ω):=Ω|u(r,ω)|2dr.(21)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
In both cases, the pressure distribution must be obtained. We apply kernel interpolation of the sound field to estimate u(r,n) or u(r,ω) from the error microphone signals e(n) or e(ω). First, we formulate the optimal filter in the frequency domain. Then, two adaptive filtering algorithms in the time domain are derived. We also discuss the difference of these algorithms from non-spatial ANC algorithms, i.e., multipoint pressure control.
両方の場合において、圧力分布を取得する必要があります。エラーマイクロフォン信号 e(n) または e(ω) から u(r,n) または u(r,ω) を推定するために、音場のカーネル補間を適用します。まず、周波数領域で最適フィルターを定式化します。次に、時間領域で2つの適応フィルタリングアルゴリズムを導出します。また、これらのアルゴリズムと非空間 ANCアルゴリズム、すなわちマルチポイント圧力制御との違いについても議論します。

A. Optimal Filter in Frequency Domain
A. 周波数領域における最適フィルタ

The relationship between the principal signals, given in the time domain in (1) and (2), can be similarly obtained in the frequency domain as
主信号間の関係は、(1)および(2)で時間領域において与えられるように、周波数領域でも同様に得られる

e(ω)y(ω)=d(ω)+G(ω)y(ω),=W(ω)x(ω).(22)(23)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.

The pressure distribution u(r,ω) can be estimated from the error signals e(ω) as
圧力分布 u(r,ω) は、誤差信号 e(ω) から次のように推定できます

u(r,ω)z(r,ω)=zT(r,ω)e(ω)=[(K(ω)+λIM)1]Tκ(r,ω).(24)(25)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. Here, z(r,ω) is the interpolation filter in the frequency domain, which is directly obtained from the kernel ridge regression formulation in (10). The kernel function is given in (18) for the 3D case and (19) for the 2D case. By substituting (24) into (21), we can rewrite the frequency-domain cost function L¯(ω) as
ここで、 z(r,ω) は周波数領域における補間フィルタであり、式(10)のカーネルリッジ回帰の定式化から直接得られます。カーネル関数は3Dの場合に式(18)で、2Dの場合に式(19)で与えられます。式(24)を式(21)に代入することにより、周波数領域のコスト関数 L¯(ω) を次のように書き換えることができます。
L¯(ω)=eH(ω)A(ω)e(ω),(26)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where  どこ
A(ω):=Ωz(r,ω)zT(r,ω)dr=PH(ω)[Ωκ(r,ω)κT(r,ω)dr]P(ω).(27)
View SourceRight-click on figure for MathML and additional features.
Here, P(ω):=(K(ω)+λIM)1 is defined. Thus, the cost function L¯(ω) is the power of the error signals subject to the weighting matrix A(ω). The elements of A(ω) can be determined from the positions of the error microphones alone. Numerical integration must be performed to calculate the integral in (27) in most cases; however, it can be avoided for some simple shapes of Ω [17], [38].
ここで、 P(ω):=(K(ω)+λIM)1 が定義されます。したがって、コスト関数 L¯(ω) は、重み行列 A(ω) に従った誤差信号の二乗です。 A(ω) の要素は、誤差マイクロフォンの位置のみから決定できます。ほとんどの場合、(27)の積分を計算するために数値積分を行う必要がありますが、いくつかの単純な形状の Ω については回避できます[17]、[38]。

The gradient of L¯(ω) with respect to W(ω) is derived as

L¯W=WeHAe=GHA(GWx+d)xH,(28)
View SourceRight-click on figure for MathML and additional features. where ω is omitted. The optimal control filter W(ω) satisfies L¯(ω)/W(ω)=0 as
W(ω)=(GHAG)1GHARdxR1xx,(29)
View SourceRight-click on figure for MathML and additional features.
where Rdx=dxH and Rxx=xxH. This control filter W(ω) is noncausal and includes the unobservable value d, but can still be useful to investigate fundamental properties. Although steepest descent algorithms for minimizing L¯(ω) can be derived from the gradient L¯/W=GHAexH, the direct use of such frequency-domain adaptive filters suffers from a significant delay.

B. Kernel-Interpolation-Based FxLMS Algorithm
B. カーネル補間に基づくFxLMSアルゴリズム

In this section, we develop a practical time-domain algorithm based on the frequency domain formulation given in Section IV-A. The algorithm is referred to as kernel-interpolation-based FxLMS (KI-FxLMS). The time-domain kernel-interpolation filter is obtained by inverse discrete-time Fourier transform of z(r,ω) in (25) as
このセクションでは、セクションIV-Aで示された周波数領域の定式化に基づいて、実用的な時間領域アルゴリズムを開発します。このアルゴリズムは、カーネル補間に基づくFxLMS(KI-FxLMS)と呼ばれます。時間領域のカーネル補間フィルタは、式(25)の z(r,ω) の逆離散時間フーリエ変換によって得られます。

z(r,i)=F1[z(r,ω)].(30)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. Then, the pressure distribution in the time domain can be estimated as
次に、時間領域における圧力分布は次のように推定できます
u(r,n)=i=zT(r,i)e(ni).(31)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
The time-domain cost function (20) can thus be reformulated as
時間領域コスト関数(20)は、このように再定式化することができる
L=E[i,j=eT(ni)Γ(i,j)e(nj)],(32)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where Γ(i,j) is the coefficient matrix of the interpolation filter defined as
Γ(i,j) は、次のように定義される補間フィルタの係数行列です
Γ(i,j):=Ωz(r,i)zT(r,j)dr.(33)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
The gradient of L with respect to the filter coefficients W(i), denoted by Δ(i), is obtained as
フィルター係数 W(i) に関する L の勾配は、 Δ(i) で示され、次のように得られます
Δ(i):=LW(i)=2ν,η=j=0J1GT(j)ΓT(ν,η)            E[e(nν)xT(nijη)],(34)
View SourceRight-click on figure for MathML and additional features.
where the symmetric property of Γ(i,j) derived from its definition (33), specifically Γ(i,j)=ΓT(j,i), is used. Note that G and Γ are here considered deterministic.
Γ(i,j) の対称性の特性は、その定義(33)から導かれ、特に Γ(i,j)=ΓT(j,i) が使用されます。ここで、 GΓ は決定論的であると考えられています。

To obtain a practical algorithm, we further simplify the gradient. We apply a change in variables η=ν+k to (34). If the signals x(n) and e(n) are assumed to be wide-sense stationary in a local time window, the cross correlation E[e(n)xT(ni)] is dependent only on the time difference i. Then, the gradient Δ(i) can be represented as
実用的なアルゴリズムを得るために、勾配をさらに簡略化します。変数 η=ν+k を(34)に適用します。信号 x(n)e(n) が局所的な時間ウィンドウ内で広義定常であると仮定すると、相互相関 E[e(n)xT(ni)] は時間差 i のみに依存します。したがって、勾配 Δ(i) は次のように表すことができます。

Δ(i)=2k=j=0J1GT(j)AT(k)            E[e(n)xT(nijk)],(35)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where A(k) is the simplified weighting filter matrix, which can be obtained from A(ω) in (27) as
A(k) は簡略化された重み付けフィルタ行列であり、(27)の A(ω) から得られる
A(k)=ν=Γ(ν,ν+k)=Ων=z(r,ν)zT(r,ν+k)dr=F1[A(ω)](k).(36)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
The relationship between the correlation operation in the time and frequency domains is used in the last line.
時間領域と周波数領域における相関操作の関係が最後の行で使用されています。

In practice, the weighting filter matrix A(k) has to be implemented as a causal FIR filter. We approximate A(k) by truncating it to a FIR filter of length 2K+1 and adding a delay of K samples to make it causal. Then, the causal weighting filter matrix is defined as
実際には、重み付けフィルタ行列 A(k) は因果 FIRフィルタとして実装する必要があります。私たちは A(k) を長さ 2K+1 のFIRフィルタに切り捨て、因果性を持たせるためにKサンプルの遅延を追加することで近似します。次に、因果重み付けフィルタ行列は次のように定義されます。

A^(i):={A(iK),0,0i2Kotherwise(37)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. The same delay K must be added to the error signal to obtain the correct cross-correlation. Therefore, the gradient Δ(i) becomes
同じ遅延 K を誤差信号に加える必要があり、正しい相互相関を得ることができます。したがって、勾配 Δ(i) は次のようになります。
Δ(i)2k=02Kj=0J1GT(j)A^T(k)            E[e(nK)xT(nijk)].(38)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
When the secondary path is modeled offline, G and A^ can be combined into a single filter in advance, reducing computational cost. We define the combination of these two FIR filters as
二次経路がオフラインでモデル化されるとき、 GA^ は事前に単一のフィルターに統合でき、計算コストが削減されます。これら二つのFIRフィルターの組み合わせを定義します。
H(i):=j=02KA^(j)G(ij).(39)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
Note that A^, and by extension H, can be computed before the ANC process is started. Then, replacing the expected value of the gradient with the instantaneous value, the update rule of the KI-FxLMS is obtained as
A^ およびそれに伴う H は、ANCプロセスが開始される前に計算できることに注意してください。次に、勾配の期待値を瞬時値で置き換えることで、KI-FxLMSの更新ルールが得られます。
Wn+1(i)=Wn(i)μj=0J+2K1HT(j)e(nK)xT(nij),(40)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where the subscript of W(i) indicates the time index, μ is the step-size parameter, and the constant factor 2 in (40) is absorbed into μ. The step-size parameter is normalized at each time step by the power of the filtered reference signal, some variation of which is used in many descriptions of the multichannel FxLMS algorithm [39]–​[41], as
W(i) の下付き文字は時間インデックスを示し、 μ はステップサイズパラメータであり、式(40)の定数因子 2は μ に吸収されます。ステップサイズパラメータは、フィルタリングされた基準信号の累乗によって各時間ステップで正規化され、これは多チャネルFxLMSアルゴリズムの多くの説明で使用されるいくつかの変種です[39]–[41]。
μ(n)=μ0ijG(j)x(nij)2F+β,(41)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where μ0 is a constant parameter, denotes the Kronecker product, and β is a parameter to avoid division by zero.
ここで、 μ0 は定数パラメータ、 はクロネッカー積を示し、 β はゼロ除算を回避するためのパラメータです。

C. Fast Block Kernel-Interpolation-Based FxLMS Algorithm
C. 高速ブロックカーネル補間に基づくFxLMSアルゴリズム

The computational cost of KI-FxLMS can be high when a large number of channels and long filters are used. By keeping the control filter constant during a finite block, we can employ a blockwise operation, which allows us to implement the algorithm with the FFT to reduce computational cost. Such a technique has been used for the standard FxLMS, which is called fast block FxLMS [42]. We here describe a blockwise implementation of KI-FxLMS, i.e., fast block KI-FxLMS.
KI-FxLMSの計算コストは、多数のチャネルと長いフィルターを使用する場合に高くなる可能性があります。有限ブロックの間、制御フィルターを一定に保つことで、ブロック単位の操作を採用でき、これによりFFTを用いてアルゴリズムを実装し、計算コストを削減することができます。このような技術は、標準のFxLMSに使用されており、ファストブロックFxLMSと呼ばれています[42]。ここでは、KI-FxLMSのブロック単位の実装、すなわちファストブロックKI-FxLMSについて説明します。

The linear convolution and correlation operations in the filter update are performed with the overlap-save algorithm [43] using the FFT. To avoid causality problems that can be introduced by block-based processing, the control filter is still obtained in the time domain. The loudspeaker signals are then easily computed sample by sample by computing the convolution between x(n) and W(i) in the time domain.
フィルター更新における線形畳み込みおよび相関操作は、FFTを使用したオーバーラップセーブアルゴリズム[43]で実行されます。ブロックベースの処理によって導入される可能性のある因果性の問題を避けるために、制御フィルターは依然として時間領域で取得されます。その後、スピーカー信号は時間領域で x(n)W(i) の間の畳み込みを計算することによって、サンプルごとに簡単に計算されます。

The block diagram of the fast block KI-FxLMS is shown in Fig. 3. The block size is denoted by B, and the index of the block is denoted by b. Each block of signal is represented using square brackets; for example, x[b] indicates the bth reference signal block consisting of x(n) for n[bB,(b+1)B1]. The length of the control filter I is set to be equal to the block length B. The FFT operation for sequences of two block lengths 2B is denoted by F2B. After the inverse FFT F12B, one block of its output is discarded. The serial-to-parallel (SP) block indicates whether to zero-pad the signal or concatenate the two latest signal blocks. Each parallel-to-serial (PS) block indicates whether the first or second block should be kept. The reference signal x filtered by H is denoted by XFRM×L×R. The frequency-domain filter H(ω) is here obtained by the FFT of H(i) after applying zero padding up to the length of 2B at the end of the filter. It is also possible to separately filter with G and A^ in series, which is necessary when estimating the secondary path online [44]. To calculate the linear correlation, the filtered reference signal XF is multiplied by e in the frequency domain, and summed over the dimension of length M. Eventually, the gradient Δ(i)RL×R is obtained.
高速ブロックKI-FxLMSのブロック図は図 3に示されています。ブロックサイズは B で示され、ブロックのインデックスは b で示されます。信号の各ブロックは角括弧を用いて表されます。例えば、 x[b]n[bB,(b+1)B1] のための x(n) から成る b 番目の参照信号ブロックを示します。制御フィルタ I の長さはブロック長 B と等しく設定されています。二つのブロック長 2B のシーケンスに対するFFT 操作は F2B で示されます。逆 FFT F12B の後、その出力の一つのブロックが破棄されます。直列から並列( SP )ブロックは、信号をゼロパディングするか、最新の二つの信号ブロックを連結するかを示します。各並列から直列( PS )ブロックは、最初のブロックまたは二番目のブロックのどちらを保持するかを示します。 H でフィルタリングされた参照信号 xXFRM×L×R で示されます。周波数領域フィルタ H(ω) は、フィルタの末尾で長さ 2B までゼロパディングを適用した後の H(i) のFFTによって得られます。また、オンラインで二次経路を推定する際に必要な GA^ を直列で別々にフィルタリングすることも可能です[44]。 線形相関を計算するために、フィルタリングされた基準信号 XF は周波数領域で e と乗算され、長さ M の次元にわたって合計されます。最終的に、勾配 Δ(i)RL×R が得られます。

Fig. 3. - Block diagram of fast block KI-FxLMS. The serial-to-parallel ($\mathrm{S}\rightarrow \mathrm{P}$) block indicates whether to zero-pad the signal or concatenate the two last signal blocks. The parallel-to-serial ($\mathrm{P}\rightarrow \mathrm{S}$) block indicates whether the first or second block should be kept.
Fig. 3.  図 3。

Block diagram of fast block KI-FxLMS. The serial-to-parallel (SP) block indicates whether to zero-pad the signal or concatenate the two last signal blocks. The parallel-to-serial (PS) block indicates whether the first or second block should be kept.
高速ブロックKI-FxLMSのブロックダイアグラム。直列から並列( SP )ブロックは、信号をゼロパディングするか、最後の2つの信号ブロックを連結するかを示します。並列から直列( PS )ブロックは、最初のブロックまたは2 番目のブロックのどちらを保持するべきかを示します。

The fast block KI-FxLMS is computationally efficient in many cases owing to the FFT algorithm. The KI-FxLMS is often more computationally costly, but performs the filter update sample by sample. Their computational costs are evaluated in the next section.
高速ブロックKI-FxLMSは、FFTアルゴリズムのおかげで多くのケースで計算効率が高いです。KI-FxLMSはしばしば計算コストが高くなりますが、フィルターの更新をサンプルごとに行います。彼らの計算コストは次のセクションで評価されます。

D. Comparison With Multipoint Pressure Control
D. 多点圧力制御との比較

In ANC methods based on multipoint pressure control, adaptive filtering algorithms are derived with the aim of reducing the primary noise at the error microphone positions. Therefore, the cost function is typically formulated as the power of the error microphone signal as
多点圧力制御に基づくANC 手法では、エラーマイクロフォン位置での主ノイズを低減することを目的として、適応フィルタリングアルゴリズムが導出されます。したがって、コスト関数は通常、エラーマイクロフォン信号のパワーとして定式化されます。

J=E[e(n)22].(42)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. In the frequency domain, the cost function for multipoint pressure control at ω is given by
周波数領域において、 ω におけるマルチポイント圧力制御のコスト関数は次のように表されます
J¯(ω)=e(ω)22.(43)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.

By comparing (26) and (43), one can find that the difference between the cost functions in the frequency domain is only in the weighting matrix A(ω) applied to the error signals. Therefore, the optimal filter for multipoint pressure control in the frequency domain can be obtained by replacing A(ω) in (29) with the identity matrix IM, giving
(26)と(43)を比較することによって、周波数領域におけるコスト関数の違いは、エラー信号に適用される重み行列 A(ω) のみにあることがわかる。したがって、周波数領域におけるマルチポイント圧力制御の最適フィルタは、(29)の A(ω) を単位行列 IM に置き換えることによって得られる。

W(ω)=(GHG)1GHRdxR1xx.(44)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. In other words, the proposed method achieves spatial interpolation solely through the multiplication with the weighting matrix A in (29).
言い換えれば、提案された方法は、式(29)の重み行列 A との乗算のみを通じて空間補間を達成します。

Similar insights can also be applied to the time-domain algorithm. As in (32), the filter coefficient matrix Γ, which is later simplified to the weighting filter matrix A(i) in (36), is the difference between the proposed cost function and (42). Thus, by skipping the convolution of A^(i) in KI-FxLMS, the FxLMS algorithm for multipoint pressure control can be obtained as
類似の洞察は、時間領域アルゴリズムにも適用できます。(32)と同様に、フィルター係数行列 Γ は、後に(36)で重み付けフィルター行列 A(i) に簡略化され、提案されたコスト関数と(42)の違いです。したがって、KI-FxLMSにおける A^(i) の畳み込みを省略することにより、マルチポイント圧力制御のためのFxLMSアルゴリズムを得ることができます。

Wn+1(i)=Wn(i)μj=0J1GT(j)e(n)xT(nij).(45)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. The fast block version of the FxLMS algorithm can also be derived for multipoint pressure control.
FxLMSアルゴリズムの高速ブロックバージョンは、マルチポイント圧力制御のためにも導出することができます。

The difference in computational cost between KI-FxLMS and FxLMS stems from the weighting filter A. The number of real-valued multiplications required for every sample of the input signals, not counting the update of the step-size parameter, is compared among FxLMS, fast block FxLMS, KI-FxLMS, and fast block KI-FxLMS in Table I. Since the filter H(i) of length 2K+J is applied in KI-FxLMS instead of G(i) of length J, the number of real-valued multiplication increases by 2RLMK. The fast block implementation often has reduced computational cost both for FxLMS and KI-FxLMS owing to the FFT. We assume that an N-length FFT requires N/2log2N complex-valued multiplications, and each complex-valued multiplication corresponds to four real-valued multiplications. The difference in computational cost between the regular and fast block implementations primarily depends on the filter lengths. For instance, when the lengths of W(i) and H(i) are equal, M=48, R=1, and L=32, the fast block KI-FxLMS is faster than KI-FxLMS for I>32. On the other hand, a disadvantage of the fast block implementations is the processing delay caused by the accumulation of samples necessary before processing. Note that the numbers of real-valued multiplications of fast block FxLMS and KI-FxLMS algorithms are identical.
KI-FxLMSとFxLMSの計算コストの違いは、重み付けフィルタ A に起因します。入力信号の各サンプルに必要な実数値の乗算の数(ステップサイズパラメータの更新は除く)は、表 IにおいてFxLMS、ファストブロックFxLMS、KI-FxLMS、およびファストブロックKI-FxLMSの間で比較されています。KI-FxLMSでは長さ 2K+J のフィルタ H(i) が適用され、長さ JG(i) の代わりに使用されるため、実数値の乗算の数が 2RLMK 増加します。ファストブロック実装は、FFTのおかげでFxLMSとKI-FxLMSの両方で計算コストが削減されることがよくあります。私たちは、長さ N のFFTが N/2log2N の複素数乗算を必要とし、各複素数乗算が4つの実数値乗算に相当すると仮定します。通常の実装とファストブロック実装の計算コストの違いは主にフィルタの長さに依存します。例えば、 W(i)H(i) の長さが等しい場合、 M=48R=1 、および L=32 において、ファストブロックKI-FxLMSは I>32 のためKI-FxLMSよりも速くなります。 一方、ファストブロック実装の欠点は、処理に必要なサンプルの蓄積によって生じる処理遅延です。ファストブロックFxLMSおよびKI-FxLMSアルゴリズムの実数値乗算の数は同じであることに注意してください。

TABLE I Computational Complexities of Algorithms
表 I アルゴリズムの計算複雑性
Table I- Computational Complexities of Algorithms
SECTION V. セクション V.

Experiments 実験

Experiments were conducted to evaluate the proposed spatial ANC algorithms in comparison with the multipoint-pressure-control-based ANC. First, their fundamental performances were compared by numerical simulation in the frequency domain assuming a 2D sound field. Then, the time-domain algorithms were evaluated in a 3D reverberant field, including a comparison with a virtual sensing technique. Finally, experimental results using real data obtained by a practical array system are shown.
提案された空間 ANCアルゴリズムを、マルチポイント圧力制御に基づくANCと比較するための実験が行われました。まず、2D 音場を仮定した周波数領域で数値シミュレーションにより、それらの基本的な性能が比較されました。次に、時間領域のアルゴリズムが3D 残響場で評価され、仮想センシング技術との比較も行われました。最後に、実際のアレイシステムから得られた実データを用いた実験結果が示されます。

A. 2D Numerical Simulations in Frequency Domain
A. 周波数領域における2D 数値シミュレーション

In a 2D free field, the target region Ω was chosen as a square of dimensions 1.0m×1.0m with its center at the origin. The numbers of error microphones and secondary sources were M=24 and L=12, respectively. As shown in Fig. 4, the error microphones were regularly placed along the boundary of Ω, but half of them were shifted 0.03 m outward to alleviate the effect of the forbidden frequency problem [31]. The secondary sources were regularly arranged along the square of dimensions 2.0m×2.0m. The reference signal was directly obtained from the primary noise source. We here investigate two cases for the primary noise source positions.
2D 自由空間において、ターゲット領域 Ω は、原点を中心とする寸法 1.0m×1.0m の正方形として選ばれました。エラーマイクの数と二次ソースの数はそれぞれ M=24L=12 でした。図 4に示すように、エラーマイクは Ω の境界に沿って定期的に配置されましたが、その半分は禁止周波数問題の影響を軽減するために0.03m 外側に移動されました[31]。二次ソースは寸法 2.0m×2.0m の正方形に沿って定期的に配置されました。参照信号は一次ノイズソースから直接取得されました。ここでは、一次ノイズソースの位置について2つのケースを調査します。

Fig. 4. - Experimental setup for 2D numerical simulation.
Fig. 4.  図 4。

Experimental setup for 2D numerical simulation.
2D 数値シミュレーションの実験設定。

Assuming a stationary sound field, we compared the frequency-domain optimal filters of the proposed method (29) and multipoint pressure control (MPC) (44). The parameter λ in (25) was set to 104.
定常音場を仮定し、提案された方法(29)と多点圧力制御(MPC)(44)の周波数領域最適フィルタを比較しました。式(25)のパラメータ λ104 に設定されました。

As a performance measure for spatial ANC, we define the regional power reduction Pred as
空間 ANCの性能指標として、地域的な電力削減 Pred を次のように定義します

Pred(ω)=10log10j|u(rj,ω)|2j|up(rj,ω)|2,(46)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where up() denotes the pressure field of the primary noise source without ANC. The evaluation points rjΩ were obtained by discretizing the target region Ω every 0.02 m. The number of evaluation points was 50×50.
up() は、ANCなしの一次ノイズ源の圧力場を示します。評価点 rjΩ は、ターゲット領域 Ω を0.02 mごとに離散化することによって得られました。評価点の数は 50×50 です。

First, results for the case when the primary noise source was a single point source at (3.0,0.2)m are shown. The amplitude of the primary source signal was 10.0. Fig. 5 shows the relationship between the frequency and the regional power reduction Pred. The investigated frequencies were from 100 to 1000 Hz at intervals of 10 Hz. At low frequencies, the noise power was reduced considerably by both methods, and the performance difference was small. The effect of the spatial interpolation in the proposed method can be seen at higher frequencies. Above 350 Hz, the Pred of MPC became larger than that of Proposed. The regional power reduction of the two methods gradually increased as the frequency increased, because the accuracy of capturing and synthesizing a sound field with a limited number of loudspeakers and microphones deteriorates at higher frequencies.
まず、主なノイズ源が (3.0,0.2)m の単一の点源であった場合の結果を示します。主源信号の振幅は10.0でした。図 5は、周波数と地域的な電力低下 Pred の関係を示しています。調査した周波数は100 Hzから1000 Hzまで、10 Hz 間隔で行いました。低周波数では、両方の方法によってノイズパワーが大幅に低下し、性能差は小さかったです。提案された方法における空間補間の効果は、高周波数で見ることができます。350 Hzを超えると、MPCの Pred は提案された方法のそれよりも大きくなりました。二つの方法の地域的な電力低下は、周波数が増加するにつれて徐々に増加しました。これは、限られた数のスピーカーとマイクロフォンで音場を捕捉し合成する精度が高周波数で悪化するためです。

Fig. 5. - Regional power reduction $P_{\mathrm{red}}$ of the proposed method (Proposed) and multipoint pressure control (MPC) with respect to frequency. The primary noise source was a single point source.
Fig. 5.  図 5。

Regional power reduction Pred of the proposed method (Proposed) and multipoint pressure control (MPC) with respect to frequency. The primary noise source was a single point source.
提案された方法(提案)と周波数に関するマルチポイント圧力制御(MPC)の地域電力削減 Pred 。主なノイズ源は単一の点源でした。

Fig. 6 shows the pressure distribution at 700 Hz. The power distribution normalized by the average power of the primary noise field inside Ω, i.e., |u(r,ω)|2/Ω|up(r,ω)|2dr, is shown in Fig. 7. The acoustic power inside Ω was reduced by the proposed method, but remained for MPC. The regional power reduction Pred was −9.97 dB for Proposed and 0.55 dB for MPC.
図 6は700 Hzにおける圧力分布を示しています。図 7には、主ノイズ場内の平均電力で正規化された電力分布、すなわち |u(r,ω)|2/Ω|up(r,ω)|2dr が示されています。提案された方法により、 Ω 内の音響電力は減少しましたが、MPCのためには残りました。地域電力の減少 Pred は、提案された方法で−9.97 dB、MPCで0.55 dBでした。

Fig. 6. - Pressure distribution at 700 Hz. (a) Proposed; (b) MPC. The blue crosses and green dots indicate error microphones and secondary sources, respectively. The boundary of the target region $\Omega$ is indicated by the square.
Fig. 6.  図 6。

Pressure distribution at 700 Hz. (a) Proposed; (b) MPC. The blue crosses and green dots indicate error microphones and secondary sources, respectively. The boundary of the target region Ω is indicated by the square.
700 Hzにおける圧力分布。(a) 提案されたもの; (b) MPC。青い十字と緑の点は、それぞれ誤差マイクと二次ソースを示しています。ターゲット領域 Ω の境界は四角で示されています。

Fig. 7. - Normalized power distribution at 700 Hz. (a) Proposed; (b) MPC. $P_{\mathrm{red}}$ was −9.97 dB for Proposed and 0.55 dB for MPC.
Fig. 7.  図 7。

Normalized power distribution at 700 Hz. (a) Proposed; (b) MPC. Pred was −9.97 dB for Proposed and 0.55 dB for MPC.
700 Hzにおける正規化された電力分布。(a) 提案; (b) MPC。 Pred は提案で−9.97 dB、MPCで0.55 dBでした。

Next, the case where multiple primary noise sources exist is investigated. Sixteen point sources were equiangularly placed along the circle of radius 3.0 m with its center at the origin. The amplitudes of the primary source signals were determined by the complex Gaussian distribution of mean 10.0 and variance 4.0. These settings were intended to simulate a diffuse field, which is the assumption used for deriving the kernel function (18), for the primary noise field. The relationship between the frequency and Pred is shown in Fig. 8. Again, the Pred of Proposed was lower than that of MPC above 350 Hz. Compared with the result of the single primary source case, the overall regional noise reduction improved, especially below 800 Hz.
次に、複数の一次ノイズ源が存在する場合について調査します。16の点源は、半径 3.0 mの円に等角に配置され、その中心は原点にあります。一次源信号の振幅は、平均 10.0および分散 4.0の複素ガウス分布によって決定されました。これらの設定は、一次ノイズ場のカーネル関数(18)を導出するために使用される仮定である拡散場をシミュレートすることを目的としています。周波数と Pred の関係は図 8に示されています。再び、提案された Pred は350 Hz 以上でMPCのそれよりも低かったです。単一の一次源の場合の結果と比較すると、全体的な地域ノイズの低減が改善され、特に800 Hz 以下で顕著でした。

Fig. 8. - Regional power reduction $P_{\mathrm{red}}$ of Proposed and MPC with respect to frequency. The primary noise source was 16 point sources surrounding the target region.
Fig. 8.  図 8。

Regional power reduction Pred of Proposed and MPC with respect to frequency. The primary noise source was 16 point sources surrounding the target region.
提案されたMPCに関する周波数に対する地域的な電力削減 Pred 。主なノイズ源は、ターゲット領域を囲む16の点源でした。

B. Investigation of Interpolation Filter
B. 補間フィルタの調査

As described in Section IV-B, the interpolation filter A(i) must be truncated to be usable in real-time systems. Therefore, the truncation parameter K defined in (37) has to be chosen appropriately for the KI-FxLMS algorithm. A short filter is desirable because it can be cheaper to compute and the control filter update has to be delayed for K samples in the KI-FxLMS algorithm. Conversely, the cost of a low K is the truncation error incurred by setting the filter coefficients A(i) to zero for |i|>K. To investigate the parameter, we define the truncation error of the filter A(i) as
セクションIV-Bで説明されているように、補間フィルタ A(i) はリアルタイムシステムで使用できるように切り捨てる必要があります。したがって、(37)で定義された切り捨てパラメータ K は、KI-FxLMSアルゴリズムに適切に選択する必要があります。短いフィルタは計算コストが安く済むため望ましく、KI-FxLMSアルゴリズムでは制御フィルタの更新がKサンプル分遅延する必要があります。逆に、低い K のコストは、フィルタ係数 A(i)|i|>K のためにゼロに設定することによって生じる切り捨て誤差です。このパラメータを調査するために、フィルタ A(i) の切り捨て誤差を定義します。

EA(K)=10log10i=K+1A(i)2F+A(i)2Fi=A(i)2F.(47)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. The expression is equivalent to the normalized mean square error of the filtered signal, assuming that the signal before being filtered is white with independent channels. This allows the error to be expressed solely in terms of the filter coefficients.
この表現は、フィルタリングされる前の信号が独立したチャネルを持つホワイトノイズであると仮定した場合のフィルタリングされた信号の正規化平均二乗誤差に相当します。これにより、誤差はフィルタ係数のみに基づいて表現されることが可能になります。

We investigate the effect of truncating the interpolation filter A for one choice of error microphone array and target region. The target region is defined as a cuboid of dimensions CΩm×CΩm×0.1m with its center at the origin. The error microphones, 48 in total, are regularly placed along the squares of dimensions CΩm×CΩm on the two planes z=0.05m and 0.05m, but half of them shifted 0.03 m outward. The impulse response for a few channels of the interpolation filter, calculated for CΩ=0.6, is shown in Fig. 9. The impulse responses correspond to the weighting between three microphone pairs at the positions (ra,ra), (ra,rb), and (ra,rc). The positions of the chosen microphones are ra=(0.275,0.3,0.05)m, rb=(0.3,0.275,0.05)m, and rc=(0.275,0.3,0.05)m.
我々は、誤差マイクロフォンアレイとターゲット領域の一つの選択に対して、補間フィルタ A を切り詰める効果を調査します。ターゲット領域は、中心が原点にある寸法 CΩm×CΩm×0.1m の直方体として定義されます。誤差マイクロフォンは合計 48 個で、2つの平面 z=0.05m0.05m 上の寸法 CΩm×CΩm の正方形に沿って定期的に配置されていますが、そのうち半分は0.03 m 外側にシフトされています。補間フィルタのいくつかのチャネルに対するインパルス応答は、 CΩ=0.6 のために計算され、図 9に示されています。インパルス応答は、位置 (ra,ra)(ra,rb) 、および (ra,rc) における3つのマイクロフォンペア間の重み付けに対応しています。選択されたマイクロフォンの位置は ra=(0.275,0.3,0.05)mrb=(0.3,0.275,0.05)m 、および rc=(0.275,0.3,0.05)m です。

Fig. 9. - Impulse response of the kernel interpolation filter $\boldsymbol{A}(i)$ for channels corresponding to different microphone pairs. The microphone positions are $\boldsymbol{r}_{\mathrm{a}} = (-0.275, -0.3, 0.05)\,{\rm m}$, $\boldsymbol{r}_{\mathrm{b}} = (0.3, -0.275, 0.05)\,{\rm m}$, and $\boldsymbol{r}_{\mathrm{c}} = (0.275, 0.3, 0.05)\,{\rm m}$.
Fig. 9.  図 9。

Impulse response of the kernel interpolation filter A(i) for channels corresponding to different microphone pairs. The microphone positions are ra=(0.275,0.3,0.05)m, rb=(0.3,0.275,0.05)m, and rc=(0.275,0.3,0.05)m.
カーネル補間フィルタ A(i) のインパルス応答は、異なるマイクペアに対応するチャンネルに対して示されています。マイクの位置は ra=(0.275,0.3,0.05)mrb=(0.3,0.275,0.05)m 、および rc=(0.275,0.3,0.05)m です。

The interpolation filter was computed with a sampling rate of 4000 Hz, the regularization parameter in (25) was λ=103, and the integral in (27) was computed using a naive Monte Carlo integration procedure with 1000 samples [45]. The true filter in (47) is a noncausal IIR filter and cannot be computed exactly. As a substitute, a long FIR filter of length 16383 samples was generated.
補間フィルタは、サンプリングレート4000 Hzで計算され、式(25)の正則化パラメータは λ=103 であり、式(27)の積分は1000サンプルを用いた単純なモンテカルロ積分手法で計算されました[45]。式(47)の真のフィルタは非因果 IIRフィルタであり、正確に計算することはできません。その代わりに、長さ16383サンプルの長いFIRフィルタが生成されました。

The truncation error as a function of K for various values of CΩ is shown in Fig. 10. The error decreases more slowly for larger values of CΩ, suggesting a correlation between the size of the target region and the desired value of K. However, for all sizes of the target region, the truncation error decreases rapidly below a certain value of K, after which the decrease slows down dramatically. Attempting to select a value of K just past that point is recommended, as it provides most of the value for a small cost.
トランケーションエラーは、さまざまな値の CΩ に対する K の関数として図 10に示されています。エラーは、より大きな値の CΩ に対してより遅く減少し、ターゲット領域のサイズと希望する値の K との相関関係を示唆しています。しかし、ターゲット領域のすべてのサイズにおいて、トランケーションエラーは、ある値の K を下回ると急速に減少し、その後減少が劇的に遅くなります。そのポイントを過ぎた値の K を選択することが推奨されます。なぜなら、それは小さなコストで大部分の価値を提供するからです。

Fig. 10. - Truncation error of the interpolation filter $\boldsymbol{A}(i)$ for a cuboid target region of size $C_\Omega \,{\rm m} \times C_\Omega \,{\rm m} \times {0.1}\,{\rm m}$.
Fig. 10.  図 10。

Truncation error of the interpolation filter A(i) for a cuboid target region of size CΩm×CΩm×0.1m.
補間フィルタ A(i) の切り捨て誤差は、サイズ CΩm×CΩm×0.1m の立方体ターゲット領域に対してです。

C. Time-Domain Simulations Comparing With Remote Microphone Technique
C. リモートマイクロフォン技術との比較による時間領域シミュレーション

The proposed time-domain algorithm is evaluated in a 3D simulated reverberant environment. One current ANC method applicable to spatial ANC with arbitrarily placed microphones and loudspeakers is virtual sensing, by densely placing virtual microphones inside the target region. We here compare the proposed method with the remote microphone technique (RMT) [10], [46], which is a representative virtual sensing method, in addition to the MPC-based method. The RMT requires an identification stage to estimate a filter for predicting signals at the virtual microphone positions from the primary noise at a fixed position. At this stage, it is necessary to place microphones at both the physical and virtual positions, but they are removed from the virtual positions at the running stage. Note that the identification stage is not necessary for the proposed and MPC-based methods.
提案された時間領域アルゴリズムは、3Dシミュレーションされた残響環境で評価されます。任意の位置に配置されたマイクロフォンとスピーカーに適用可能な現在のANC 手法の一つは、ターゲット領域内に仮想マイクロフォンを密に配置することによる仮想センシングです。ここでは、提案された手法を、代表的な仮想センシング手法であるリモートマイクロフォン技術(RMT)[10]、[46]と比較します。RMTは、固定位置の一次ノイズから仮想マイクロフォン位置での信号を予測するフィルターを推定するための識別ステージを必要とします。このステージでは、物理的および仮想的な位置の両方にマイクロフォンを配置する必要がありますが、実行ステージでは仮想位置からは取り除かれます。提案された手法およびMPCベースの手法には、識別ステージは必要ないことに注意してください。

For the RMT with Mv virtual microphones, the virtual secondary paths Gv(i)RMv×L, the acoustic paths from the secondary sources to the virtual microphone positions, must be measured. We here assume that they are perfectly estimated in advance. At the identification stage, a FIR observation filter for predicting the primary noise at the virtual microphone positions from the primary noise at the physical microphone positions is estimated. During the running stage, the virtual error signal is obtained by estimating d(n) from (1), applying the observation filter, and adding the secondary signals at the virtual microphone positions estimated from Gv(i) and y(n). Then, the control filter is updated to reduce the physical and virtual error signals with the FxLMS algorithm.
RMTにおいて Mv の仮想マイクロフォンがある場合、仮想二次経路 Gv(i)RMv×L 、すなわち二次ソースから仮想マイクロフォン位置への音響経路を測定する必要があります。ここでは、これらが事前に完全に推定されていると仮定します。識別段階では、物理マイクロフォン位置での一次ノイズから仮想マイクロフォン位置での一次ノイズを予測するためのFIR 観測フィルターが推定されます。実行段階では、(1)から d(n) を推定し、観測フィルターを適用し、 Gv(i) および y(n) から推定された仮想マイクロフォン位置での二次信号を加えることによって、仮想誤差信号が得られます。その後、FxLMSアルゴリズムを用いて物理的および仮想的誤差信号を減少させるために制御フィルターが更新されます。

We focus on the performance comparison between the proposed kernel-interpolation-based method and RMT; therefore, the fast block algorithms were used for all three time-domain algorithms. The reverberant environment was simulated using the image source method [47], [48]. The room dimension was 7.0m×5.0m×2.5m, and the reflection coefficients were set so that the reverberation time T60 became 0.35 s. For the RMT, the observation filter was estimated using the physical and virtual error signals of 40000 samples, i.e., 10 s, with the LMS algorithm until the normalized mean square error for the virtual error signal estimation became less than −40 dB. The primary noise source was placed at (2.8,0.3,0.0)m. The primary noise source emitted white Gaussian noise filtered by a bandpass filter with a passband of 50 to 900 Hz, which is hereafter referred to as Noise.
提案されたカーネル補間ベースの手法とRMTとの性能比較に焦点を当てるため、すべての三つの時間領域アルゴリズムには高速ブロックアルゴリズムが使用されました。残響環境は画像源法を用いてシミュレーションされました[47][48]。部屋の寸法は 7.0m×5.0m×2.5m で、反射係数は残響時間 T60 が0.35 秒になるように設定されました。RMTの場合、観測フィルタは40000サンプル、すなわち10 秒の物理的および仮想的エラー信号を用いてLMSアルゴリズムで推定され、仮想エラー信号の推定に対する正規化平均二乗誤差が−40 dB 未満になるまで行われました。主要なノイズ源は (2.8,0.3,0.0)m に配置されました。主要なノイズ源は、50から900 Hzの通過帯域を持つバンドパスフィルタでフィルタリングされたホワイトガウスノイズを発生させ、以後「ノイズ」と呼ばれます。

As a performance measure, we define the regional power reduction in the time domain as
パフォーマンス指標として、時間領域における地域の電力削減を次のように定義します

Pred(n)=10log10jνu(rj,nν)2jνup(rj,nν)2,(48)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where the signal power is calculated over a window in time, ν[0,T1]. The positions rj are the evaluation points.
信号のパワーは時間のウィンドウ ν[0,T1] 内で計算されます。位置 rj は評価点です。

As shown in Fig. 11, the target region Ω and the error microphone array were defined as in Section V-B with CΩ=0.6. The numbers of error microphones and secondary sources were M=48 and L=32, respectively. The secondary sources were arranged along two squares of dimensions 2.0m×2.0m at the heights z=0.1m and 0.1m. The evaluation points were 972 equally spaced points 3.33×102m apart inside the target region. The reference signal was directly obtained from the primary noise source.
図 11に示すように、ターゲット領域 Ω とエラーマイクロフォンアレイは、セクションV-Bで CΩ=0.6 のように定義されました。エラーマイクロフォンの数と二次音源の数はそれぞれ M=48L=32 でした。二次音源は、寸法 2.0m×2.0m の2つの正方形に沿って、高さ z=0.1m0.1m に配置されました。評価点は、ターゲット領域内で 3.33×102m 間隔で等間隔に配置された972 点でした。参照信号は、一次ノイズ源から直接取得されました。

Fig. 11. - Positions of error microphones and secondary sources for experiments using real data. The target region $\Omega$ is illustrated by the blue cuboid.
Fig. 11.  図 11。

Positions of error microphones and secondary sources for experiments using real data. The target region Ω is illustrated by the blue cuboid.
誤差マイクロフォンと二次ソースの位置は、実データを使用した実験のためのものです。ターゲット領域 Ω は青い直方体で示されています。

The truncation length of the kernel interpolation filter was K=77, chosen with some margin according to the heuristic presented in Section V-B. The sample rate, integration procedure, and regularization parameter were also the same as in Section V-B. The length of the control filter was I=2048, and the block size B for the fast block algorithms was therefore also 2048. The observation filter length for the RMT was 256. The parameter β in the update of the step-size parameter (41) was 103. The constant parameter μ0 was chosen from [101,103], equally divided into 30 values in a logarithmic scale for the fast block KI-FxLMS. The same procedure was used for RMT and fast block FxLMS with the range of [102,101].
カーネル補間フィルタの切断長は K=77 であり、セクションV-Bで提示されたヒューリスティックに従って、ある余裕を持って選ばれました。サンプルレート、統合手順、および正則化パラメータもセクションV-Bと同じでした。制御フィルタの長さは I=2048 であり、したがって高速ブロックアルゴリズムのブロックサイズ B も2048でした。RMTの観測フィルタの長さは256でした。ステップサイズパラメータの更新におけるパラメータ β103 でした。定数パラメータ μ0[101,103] から選ばれ、30の値に対して対数スケールで均等に分割され、高速ブロックKI-FxLMSに使用されました。同じ手順がRMTおよび高速ブロックFxLMSに対しても使用され、範囲は [102,101] でした。

First, we investigate the effect of the number of virtual microphones. We compare Mv=9, 16, 25, and 50 virtual microphones. The first three are distributed on equally spaced grids inside the target region at the height z=0m, and the final set is placed on two equally spaced grids of 5×5 microphones, at the heights z=0.025m and 0.025m. The resulting noise reduction over time can be seen in Fig. 12, comparing against fast block KI-FxLMS and fast block FxLMS. The signal power interval was set to T = 2048 samples. It can be seen that for fast block FxLMS with the RMT to reach a performance comparable to the proposed method, a higher number of virtual microphones are necessary. A single Pred value is calculated at the end of the 120 s with the signal power interval set to 60 s, i.e., T = 240000 samples. The obtained values were Pred=4.55 and 10.14dB for fast block FxLMS and fast block KI-FxLMS respectively. For the RMT, the obtained values were Pred=7.91, 8.93, 9.76, and 10.86dB for increasing number of virtual microphones.
まず、仮想マイクの数の影響を調査します。 Mv=9 、16、25、および50の仮想マイクを比較します。最初の3つは、ターゲット領域内の高さ z=0m で均等に配置されたグリッド上に分布しており、最後のセットは高さ z=0.025m0.025m5×5 マイクの2つの均等に配置されたグリッドに置かれています。時間にわたるノイズ削減の結果は、図 12に示されており、ファストブロックKI-FxLMSおよびファストブロックFxLMSと比較されています。信号パワーの間隔はT = 2048サンプルに設定されました。ファストブロックFxLMSが提案された方法と同等の性能に達するためには、より多くの仮想マイクが必要であることがわかります。120 秒の終了時に、信号パワーの間隔を60 秒、すなわちT = 240000サンプルに設定して、単一の Pred 値が計算されます。得られた値は、ファストブロックFxLMSおよびファストブロックKI-FxLMSに対してそれぞれ Pred=4.55 および 10.14dB でした。RMTに対しては、仮想マイクの数が増加するにつれて得られた値は Pred=7.918.939.76 、および 10.86dB でした。

Fig. 12. - Regional power reduction as a function of time, comparing fast block KI-FxLMS and fast block FxLMS to the RMT when different numbers of virtual microphones are used. The $P_{\mathrm{red}}$ for the last 60 s were $P_{\mathrm{red}}=-4.55$, $-10.14\, \mathrm{dB}$ for fast block FxLMS and fast block KI-FxLMS, and $P_{\mathrm{red}}=-7.91$, $-8.93$, $-9.76$, and $-10.86\,\mathrm{dB}$ for RMT with an increasing number of virtual microphones.
Fig. 12.  図 12。

Regional power reduction as a function of time, comparing fast block KI-FxLMS and fast block FxLMS to the RMT when different numbers of virtual microphones are used. The Pred for the last 60 s were Pred=4.55, 10.14dB for fast block FxLMS and fast block KI-FxLMS, and Pred=7.91, 8.93, 9.76, and 10.86dB for RMT with an increasing number of virtual microphones.
時間の関数としての地域的なパワー削減を、異なる数の仮想マイクロフォンを使用した場合における高速ブロックKI-FxLMSと高速ブロックFxLMSをRMTと比較しています。最後の60 秒間の PredPred=4.55 、高速ブロックFxLMSと高速ブロックKI-FxLMSのための 10.14dB 、および仮想マイクロフォンの数が増加するにつれてRMTのための Pred=7.918.939.76 、および 10.86dB です。

Next, we evaluate the algorithms’ robustness against changes in the position of the primary noise source. The primary noise source position was changed in the positive y direction after the identification stage. For this simulation, Mv=50 virtual microphones were used. The resulting noise reduction Pred of the three compared algorithms can be seen in Fig. 13, as a function of the distance the primary source is moved after the identification stage. The signal power interval T was again set to 60 s, calculated after 120 s adaptation. The figure shows that the RMT can achieve a similar level of performance as the proposed method under ideal circumstances, when the conditions present during the identification stage remains. However, because the primary noise must be predicted using the pre-calculated observation filter, the method becomes sensitive to changes in the primary noise. In this scenario, only a 0.2 m movement of the primary source is enough for the RMT to degrade instead of improve FxLMS performance.
次に、主要なノイズ源の位置の変化に対するアルゴリズムの堅牢性を評価します。主要なノイズ源の位置は、識別段階の後に正の y 方向に変更されました。このシミュレーションでは、 Mv=50 の仮想マイクロフォンが使用されました。識別段階の後に主要な源が移動した距離の関数として、比較した三つのアルゴリズムの結果として得られたノイズ削減 Pred は図 13に示されています。信号パワーの間隔 T は再び60 秒に設定され、120 秒の適応後に計算されました。図は、RMTが識別段階中の条件が維持される理想的な状況下で提案された方法と同様の性能レベルを達成できることを示しています。しかし、主要なノイズは事前に計算された観測フィルターを使用して予測しなければならないため、この方法は主要なノイズの変化に敏感になります。このシナリオでは、主要な源の0.2mの移動だけで、RMTはFxLMSの性能を改善するのではなく、劣化させるのに十分です。

Fig. 13. - Regional power reduction for the RMT with $M_{\mathrm{v}}=50$ when the primary source position was changed in the positive $y$ direction after the identification stage. The $P_{\mathrm{red}}$ is calculated in the interval 60 to 120 s.
Fig. 13.  図 13。

Regional power reduction for the RMT with Mv=50 when the primary source position was changed in the positive y direction after the identification stage. The Pred is calculated in the interval 60 to 120 s.
RMTのための地域的な電力削減は、識別段階の後に主要なソースの位置が正の y 方向に変更されたときに Mv=50 で行われます。 Pred は60 秒から120 秒の間で計算されます。

D. Time-Domain Experiments Using Real Data
D. 実データを用いた時間領域実験

Another set of time-domain simulations were conducted using real impulse response data measured in a practical environment. The impulse responses between the primary and secondary sources and the error microphones and evaluation points were measured one by one at each point using swept-sine signals [49]. The room dimensions were approximately 7.0m×6.4m×2.7m, and the reverberation time T60 was about 0.38 s. The primary and secondary sources were ordinary closed loudspeakers, and the error microphone was omnidirectional.
別の一連の時間領域シミュレーションが、実際の環境で測定された実際のインパルス応答データを使用して行われました。主源と副源、エラーマイクロフォンおよび評価ポイント間のインパルス応答は、スイープサイン信号を使用して各ポイントで一つずつ測定されました[49]。部屋の寸法は約 7.0m×6.4m×2.7m で、残響時間 T60 は約 0.38 秒でした。主源と副源は通常の密閉型スピーカーであり、エラーマイクロフォンは全指向性でした。

The error microphones, target region and secondary sources were placed as described in Section V-C and shown in Fig. 11. We set 72 evaluation points inside Ω, where 36 points were regularly arranged at intervals of 0.1 m inside each of two squares of dimensions 0.6m×0.6m at the heights of z=0.025m and 0.025m. The primary source was placed at (2.8,0.3,0.0)m. All relevant algorithm and simulation parameters were selected as in Section V-C. The stepsize for KI-FxLMS and FxLMS was determined from the same range as its fast block counterpart but divided by B=2048.
誤差マイクロフォン、ターゲット領域および二次ソースは、セクションV-Cで説明され、図 11に示されているように配置されました。私たちは、 Ω の内部に72の評価ポイントを設定し、そのうち36ポイントは、 z=0.025m および 0.025m の高さで、2つの寸法 0.6m×0.6m の正方形の内部に0.1 mの間隔で定期的に配置されました。一次ソースは (2.8,0.3,0.0)m に配置されました。すべての関連アルゴリズムおよびシミュレーションパラメータは、セクションV-Cと同様に選択されました。KI-FxLMSおよびFxLMSのステップサイズは、その高速ブロック対応物と同じ範囲から決定されましたが、 B=2048 で割られました。

We investigated two types of noise source for evaluation. The first is Noise as introduced in Section V-C. The other is the music signal High Horse by Secret Mountains from the dataset [50] (Music).
評価のために二種類のノイズソースを調査しました。最初のものはセクションV-Cで紹介されたノイズです。もう一つは、データセット[50](音楽)からのSecret Mountainsによる音楽信号「High Horse」です。

The regional power reduction Pred with respect to time is shown in Fig. 14, for which the signal power interval was chosen as T = 2048 samples. The Pred of each algorithm is shown in Table II, where the time interval for calculating Pred was set to 60 s, calculated after 120 s adaptation. For Noise, the resulting noise reduction by KI-FxLMS and its fast block version was much larger than that by FxLMS and its fast block version, because the proposed kernel-interpolation-based methods take the regional noise into consideration. KI-FxLMS was slightly better than fast block KI-FxLMS. FxLMS and fast block FxLMS differ less with regards to Pred as both are optimizing for the reduction of noise power at the error microphone positions instead. Since Music is nonstationary, the regional reduction varies significantly with time. However, as shown in Table II, the kernel-interpolation-based methods still outperformed the MPC-based methods. Since quick adaptation is necessary for nonstationary noises, the difference in Pred between KI-FxLMS and fast-block KI-FxLMS for Music was larger than that for Noise.
地域的な電力削減 Pred の時間に関する変化は図 14に示されており、信号電力の間隔はT = 2048サンプルとして選ばれました。各アルゴリズムの Pred は表 IIに示されており、 Pred を計算するための時間間隔は60 秒に設定され、120 秒の適応後に計算されました。ノイズに関しては、KI-FxLMSおよびその高速ブロックバージョンによるノイズ削減は、FxLMSおよびその高速ブロックバージョンによるものよりもはるかに大きく、提案されたカーネル補間ベースの手法が地域的なノイズを考慮に入れているためです。KI-FxLMSは高速ブロックKI-FxLMSよりもわずかに優れていました。FxLMSと高速ブロックFxLMSは、両者がエラーマイクロフォン位置でのノイズ電力の削減を最適化しているため、 Pred に関してはあまり差がありません。音楽は非定常であるため、地域的な削減は時間とともに大きく変動します。しかし、表 IIに示されているように、カーネル補間ベースの手法は依然としてMPCベースの手法を上回っています。非定常ノイズには迅速な適応が必要なため、音楽に対するKI-FxLMSと高速ブロックKI-FxLMSの Pred の違いは、ノイズに対するそれよりも大きくなりました。

TABLE II Regional Power Reduction in dB for Different Noise Sources
表 II 異なるノイズ源における dB の地域的電力削減
Table II- Regional Power Reduction in $\mathrm{dB}$ for Different Noise Sources
Fig. 14. - Regional power reduction with respect to time. (a) Noise; (b) Music.
Fig. 14.  図 14。

Regional power reduction with respect to time. (a) Noise; (b) Music.
時間に関する地域的な電力低下。(a) ノイズ; (b) 音楽。

SECTION VI. 第六節。

Conclusion 結論

We proposed a spatial ANC method based on kernel interpolation for the suppression of noise inside a continuous region. The noise between the error microphones is taken into account by estimating the sound field within the region using kernel interpolation. Whereas current spatial ANC methods based on spherical/circular harmonic expansion require a simple error microphone array geometry, the proposed method allows for arbitrary placement. A practical time-domain algorithm was derived, called the kernel-interpolation-based FxLMS (KI-FxLMS), which features only a marginal increase in computational complexity over FxLMS. We also presented a computationally efficient block-based implementation using FFT, the fast block KI-FxLMS. In the presented experiments, the proposed kernel-interpolation-based methods consistently outperformed the conventional multipoint-pressure-control-based methods with regards to regional power reduction. Compared with the virtual sensing technique, robustness against changes in the primary noise position was also shown. Although the fast block KI-FxLMS is more computationally efficient, KI-FxLMS demonstrated better performance, especially for nonstationary noise sources.
私たちは、連続領域内のノイズ抑制のためにカーネル補間に基づく空間 ANC 手法を提案しました。エラーマイクロフォン間のノイズは、カーネル補間を用いて領域内の音場を推定することによって考慮されます。現在の球面/円形調和展開に基づく空間 ANC 手法は、単純なエラーマイクロフォンアレイのジオメトリを必要としますが、提案された手法は任意の配置を許可します。実用的な時間領域アルゴリズムが導出され、カーネル補間に基づくFxLMS(KI-FxLMS)と呼ばれ、FxLMSに対して計算の複雑さがわずかに増加するだけです。また、FFTを使用した計算効率の良いブロックベースの実装、すなわち高速ブロックKI-FxLMSも提示しました。提示された実験では、提案されたカーネル補間に基づく手法が、地域的な電力削減に関して従来の多点圧力制御に基づく手法を一貫して上回りました。仮想センシング技術と比較して、主なノイズ位置の変化に対する堅牢性も示されました。 高速ブロックKI-FxLMSは計算効率が高いものの、KI-FxLMSは特に非定常ノイズ源に対してより良い性能を示しました。

SECTION Appendix 付録 セクション

Kernel Function With Directional Weighting
方向加重を持つカーネル関数

We here derive the kernel function incorporating directional weighting. Such kernel functions are applicable when prior information on the approximate source direction is available [29], [51]. First, we introduce the following relation:
ここでは、方向重み付けを組み込んだカーネル関数を導出します。このようなカーネル関数は、近似的なソース方向に関する事前情報が利用可能な場合に適用されます[29]、[51]。まず、次の関係を導入します:

14πS2ejξTvdξ=j0((v21+v22+v23)12),(49)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where v=[v1,v2,v3]TC3. The proof is given in [29].
v=[v1,v2,v3]TC3 の場所。証明は [29] に示されています。

We here consider the following directional weighting function:
ここでは、次の方向性重み付け関数を考慮します:

γ(ξ):=eρξTr^,(50)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where ρ0 is a constant parameter and r^S2 represents the prior arrival direction of the source. This function is derived from the von Mises–Fisher distribution in directional statistics [52]. By using (50) for ρ>0, one can find that the smaller ρξTr^ is, the larger the norm uH in (15) becomes, and vice versa. That is, the regularization term in (4) becomes larger when the difference between the prior arrival direction r^ and the direction of ξ becomes larger. The shape of γ(ξ) becomes sharper with increasing ρ.
ρ0 は定数パラメータで、 r^S2 はソースの事前到着方向を表します。この関数は方向統計におけるフォン・ミーゼス–フィッシャー分布から導出されています[52]。 ρ>0 に対して(50)を使用することで、 ρξTr^ が小さいほど(15)におけるノルム uH が大きくなり、その逆もまた然りであることがわかります。つまり、(4)における正則化項は、事前到着方向 r^ξ の方向との違いが大きくなると大きくなります。 ρ が増加するにつれて、 γ(ξ) の形状は鋭くなります。

By substituting (50) into (16) and using (49), one can derive the kernel function with directional weighting as
(50)を(16)に代入し、(49)を使用することによって、方向重み付けを持つカーネル関数を導出することができる

κ(r1,r2)=14πS2eρξTr^ejkT(r1r2)dξ=j0([(jρsinθcosϕx12)2+(jρsinθsinϕy12)2+(jρcosθz12)2]12),(51)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features. where ϕ and θ are the azimuth and zenith angles of r^, and r1r2:=[x12,y12,z12]T. By setting ρ=0, one can find that (51) corresponds to (18). In the 2D case, the kernel function with directional weighting is similarly derived as
ϕθr^r1r2:=[x12,y12,z12]T の方位角と天頂角である。 ρ=0 を設定することにより、(51) が (18) に対応することがわかる。2Dの場合、方向重み付けを持つカーネル関数は同様に導出される。
κ(r1,r2)=J0([(jρcosϕx12)2+(jρsinϕy12)2]12),(52)
View SourceRight-click on figure for MathML and additional features. ソースを表示 Right-click on figure for MathML and additional features.
where ϕ is the azimuth angle of r^. Again, for ρ=0, (52) corresponds to (19). Although we focused on the kernel function of the uniform weighting function (18) and (19) in this paper, (51) and (52) are also applicable by replacing the kernel functions [51].
ϕr^ の方位角です。再度、 ρ=0 について、(52)は(19)に対応します。本論文では一様重み付け関数(18)および(19)のカーネル関数に焦点を当てましたが、(51)および(52)もカーネル関数を置き換えることで適用可能です[51]。

References 参考文献

References is not available for this document.