デジタルオーディオあれこれ

半田ごての人。紙と鉛筆だけではちょっと。

マルチシステムはデジタル化の華。美味しいのはXover。

ハードディスクの整理をしていて、もう死語と化してしまったブブゼラが、南アのWカップで鳴り渡っていた頃の写真が出てきた。十年前。道楽の一つでもないと寂しいなと始めたオーディオ部屋の初期の頃。外壁と屋根だけを張って、床はまだコンクリのまま。手前の植木はハスカップでなかろか。ちゃんと根付いた。勿論外に。

f:id:xx3stksm:20200608212327j:plain

f:id:xx3stksm:20200608212335j:plain

スターリングとエジンバラが写ってる。もう今は使ってないが、クラシックのオーケストラ聴くならば、部屋が一番決定力として大きいな、と実感した。その後、何かと変遷あって今は自作スピーカーというのか、部屋込みのスピーカーになってる。十年経てば、床も壁も貼れるし、色々と変わる。部屋で決まるとの実感はより強くなった。

f:id:xx3stksm:20200608212842j:plain

f:id:xx3stksm:20200608213205j:plain

 部屋が35%で、ほぼ1/3かな。次は音源で25%程、1/4。もうこれで60%いっちゃう。今のクラシック音源は、住宅事情に合わせてそれなりに加工してあるので、広めの部屋には合わない。結局、アナログ時代の70年代ぐらいまでのレコードから自録りするのが一番良いと落ち着く。1932年、昭和七年の満州事変の一年後のSPでも、部屋が広くて自録りするならば、十分に楽しめる。音楽的という意味で。

 次は、スピーカーユニットで20%。ウッドホーンも含めて。数を増やすのは見た目では全然なくて、均一な特性にするため。低音側では、構造的イコライザになるので、無理なくオーケストラにふさわしい低音に上げられる。45cmが8本は必要。ここでもう80%いっちゃう。

 

 電子機器の出番はあまりない。意外に効くのがXover(チャンネルディバイダー)で、残りの20%のうち、13%。後はDACが3%、つなぎ方が3%、最後にアンプが1%で100%かな。マルチのシステムはスピーカー直結なので、アンプの出番はほとんどない。LCのネットワークならば違ってくるだろうけど、ハイエンドにそれはない。

 

 Xoverまでは、特定の音が聞こえるか聞こえないのレベルなので、ABXテストでも、ボケッとしてない限りは分かる。DACになると好みの問題なので、八割方は分かるだろうけれど、印象の域は出ない。勿論、八割方好きならば、そっちを選ぶのは当然。つなぎ方とは、所謂電線。電線自体ではないけれど、普通は電線での違いと認識されている。理由抜きの一言で片付けるならば、基板の外に電線を出さない事。光が良い。電源とスピーカーのみが電線でつながる。

 

 Xoverは基本的にはDACと込み。今時の音源はデジタルしかないので、デジタルの領域で分割する。結果として、DAC若しくはトランスポートにくっつく。単独でXoverの基板を作る事はない。元々その積りだったが、やってみると意外な程にここで有意な差がついて、電子機器はXoverと光出力とSDマイクロのためにのみ存在する、ような状態になってしまった。

 

 周波数の分割は、今時なのでデジタルフィルター。肩特性は、かなり自由に選べる。問題あるとすれば、やっぱり今時にマルチシステムやる人なんかいないので、市販品は限られる。デジタルのまま思いのまま、というのはないかも知れない。ベリンガーのようなのは一度アナログに戻すし、光で出すという基本方針に合うものはないと思う。自作する意味がテンコモリ。DACとかアンプでは市販品も色々だから、自作の有難味は薄い。

 

 一つ誤解があるとすれば、NFBは深ければ深い方が良いとか、アンプの出力はデカければデカいほど良い、とは誰も思わないように、フィルターのタップは長ければ長い方が良い、とはならない事。過ぎたるは及ばざるが如し、で却って有害。適切な長さがある。音声信号は常に変化しているので。振幅の変化がない信号であれば、長さはそんなに気にする必要はないのだが。

 

f:id:xx3stksm:20200608222602j:plain

f:id:xx3stksm:20200608222619j:plain

 少し極端な例として、1kHzを0.1秒毎にオンオフするような信号を考える。この間隔だと、人の耳には1kHzと無音とが交互に切り替わって聞こえる。0.01秒毎にオンオフすると、上の右側の16kのFFTのように無音の区別は無くなる。ブーという音になる。問題なのは、長いFFTでは人の耳と同じような結果にはならない事。オンオフしていなければ、問題はない。 左のように2KのFFTにしてやれば、1kHzと無音は区別できる。上の図は1kHzの所だから、1kHzの所に山が来る。右側の16kのFFTは間違い、ではなくて、そんな設定にする方が間違っている。

 

こっちは無音の所。2KのFFTならば無音の所ではちゃんと無音になる。

f:id:xx3stksm:20200608223540j:plain

f:id:xx3stksm:20200608223557j:plain

  右側の16kのFFTは、96kHzのサンプリングでは0.17秒ぐらいのデータを取ってしまうから、0.1秒毎のオンオフでは両者の区別がつかなくなるのは当然。少しだけ、山の高さは小さくなるみたいだけど。96kHzのサンプリングで16kのFFTは、16384*(1/96000)≒0.17秒のデータが入らないと計算が出来ない。その間にオンオフされると、うまくない。そこまで行かなくても、音楽は常に変化しているので、長さには必ず対価(副作用)が発生してしまう。

 

 デジタルフィルターも同じ理屈。96kHzのサンプリングで16kタップのフィルターは、16384*(1/96000)≒0.17秒のデータが入らないと計算が出来ない。結果として、不 可解な反応になってしまう。上の1kHzのオンオフ信号に、2kタップと64kタップで1.5kHzのLPFを通すとこうなる。64kタップは、何か変。長いタップは、こういう変化の速い信号には対応できない。

 

f:id:xx3stksm:20200608224536j:plain

 

2kタップは悪くないけれど、これも2048*(1/96000)≒0.021秒のデータが必要なので、境界ではおかしくなる。

f:id:xx3stksm:20200608225139j:plain

無音になってから0.01秒ぐらいの所では、64kタップと似たような反応。正しく反応していても、2KのFFTではこうなってしまう訳だが。

f:id:xx3stksm:20200608225533j:plain

無音になってから0.02秒ぐらいの所では、もう無音に戻る。64kタップでは無理。長いタップの副作用で、余計なスペクトルが出てしまう。

f:id:xx3stksm:20200608225751j:plain


  64kタップでは、0.05秒ぐらいの所でもダメ。16kタップにしても、0.1秒毎にオンオフされるとダメ。8kまで落とすと、辛うじて変なスペクトルが出ない所も出て来る。いずれにしても、タップの長さは反応速度に逆比例するので、0.1秒毎のオンオフぐらいには追いつけないと困る。完全なオンオフではないにしろ、プロのピアニストは一秒に十回は鍵盤を叩けるのだから。

 

 長いタップの問題は、ちょっと信号を大きくすると見えてくる。-60dBFSぐらいまで拡大すると、こうなっている。上が2Kのタップで下が64K。64Kでは、無音だった所に信号がはみ出すので変なスペクトルが出る。

f:id:xx3stksm:20200608230332j:plain

 

 それではと64kをかなり緩めの肩特性にしたら、こんなになった。上のは相当な急峻な特性。2kの方も少し緩めにしたけれど、こっちはほとんど変化なし。64kのタップでは、どう頑張ってもダメなよう。

f:id:xx3stksm:20200608231255j:plain

 オーバーサンプルの場合は、帯域外でのLPFなので長くしても実害はないかもだけど、現実の問題として長くしても実利はほとんどない。サンプリング周波数を上げない限り、長さに意味はない。なので、八倍ぐらいにはするのだけど、本来はDSMで使うような64とかそれ以上が好ましいので、その状態ならば1Kもあれば十分。タップは長ければ長い方が良い、なんて事はない。部屋は広ければ広い方が良い、けどね。

 

 それがデジタルフィルターの常識なので、タップの長さは反応速度で決めるもの。0.01秒ならば、まずはいう事なし。96kサンプリングならば、1kのタップ。48kサンプリングならば、512のタップ。要は、データを取り込む時間。問題は、短いタップでは急峻な特性を作れない事。現実的には、96kサンプリングの2kタップ(反応時間は0.02秒)で、十分過ぎる特性になる。

 

 最近のホーンドライバーは、デジタルフィルターを意識して、2インチで4インチボイスコイルでも、12db/octだと900Hzまでとしている。24db/octだと500Hz。

https://www.usspeaker.com/radian%20950pb-1.htm

でも聞いた感じでは、もっと低音は早めに切った方が良い。Xoverでの歴然とした音質差は、ここから来ていると思う。うちでは800Hzクロスぐらいなので、ここが一番きつくなる。なので、2kのタップにしている。こんな特性。HPFは600Hzで-85dBぐらい。このぐらいは落としたい。

f:id:xx3stksm:20200608233016j:plain

 因みに、HPFは構造的にLPFよりも効きが悪くなる。普通、LPFだけという事はないので、HPFは元信号を必要なだけ遅延してからLPFを引き算して作ると、最も急峻に出来て掛け算器を減らせる。上のHPFはそんな引き算型。そのままの2Kタップだと、ここまでは落ちない。

1.5kのHPFだと、ずっと落ちは良くなる。こんな具合。やっぱり引き算型。クロスでは-6db落ちる事になるが、他の帯域と部屋の特性の合わせ技なので、気にする必要はない。1300Hzで83dBぐらい落ちる。

f:id:xx3stksm:20200608233730j:plain

 最初はここまで落として良いのかと悩んだけれど、聞いてみると圧倒的に急峻なのが良い。オーケストラの中に埋もれていて聴こえない楽器の音が、急峻にするとしっかり聞こえるようになる。聞こえる聞こえないの次元だから、ABXは100%通る。アナログ時代にはこんなのなかったし、ここまで落としているのは自作しないとまず無理だから、実例がないだけ。

 

 聞けばこっちが圧倒的に良い。低音側は、積極的に急峻に落とすのが良い。音の明瞭度が、スピーカーユニットを変えたように良くなる。デジタル化した最大の利点は、こんなXoverが作れること。ピアノソナタでは、あまり差は出ないと思う。とにかくオーケストラの分離度がまるで違ってくる。

 

ツイーター(T925A)も同じ。割と低め(7200Hz)のクロスなので特に。6500Hzで114dB落としてる。周波数高くなるので、これは1kのタップで普通のHPF。これも聞いてみると、一気に落とした方が良い。とにかく低音側は積極的に切る。

f:id:xx3stksm:20200608234546j:plain

 とどのつまり、Xoverをデジタル化しないと、美味しい所を捨ててしまっている。フィルターの係数だけで、スピーカー変えたほどの違いが出るのだから、使わないと損。2kタップ程度の演算は、spartan6でも楽勝。DSMを実装して、余ったリソースで十分に対応できる。専用のDSPは些か重たくて融通が効かない。