デジタルオーディオあれこれ

半田ごての人。紙と鉛筆だけではちょっと。

SPDIF経由でbluetoothを聴けるようにする。

 最近のDACでは、bluetoothの入力も入るようになっている。音質的にはまだまだ落ちるだろうになんで? と思ってたけどこれは意外と便利。だいたい音源の種類は決まっていて、うちの場合はSDカードに書いたwaveファイルが標準。スマホに入っている音源ならば、一度ダウンロードする必要がある。ちょこっと聞いてみたい時には結構不便。ブルートゥースならば、簡単らくちん。

 

 色々調べてみたら、SPDIFを出してくれる受信機が¥6000ぐらいである。うちのトランスポートはSDカードの他に、SPDIFの入力も過去には入れていた。そこでこれを復活させれば、ブルートゥースも聴けるようになる。SPDIFは原理的に受信機(B06 proとかの型番)がマスターになる。光で受けた場合、クロックの精度はあんまり良くない。更に、44.1kHzで出して来るので、うちの場合は96kHzにも変換する必要がある。

 

 うちのような、FPGAでSDカードの読み出しやデジタルフィルターの実装をしている場合、これらの問題はそんなに難しくない。コードの書き換えで対応可能。XC7A100Tというかなり大容量のFPGAを使っているので、数日で完成した。こんな感じ。普通の感覚では宜しくない数字ではあるけれど、用途がお試しという事なので、使い物にはなる。これからどんどん性能は上がるだろうし。

詳しくはこちらに。

https://youtu.be/XRevt7hOAFs

 

 

比較試聴も悪くない。

 聞き比べというものは、録音であれDACのような装置であれ、あんまり参考にはならない。所詮は主観なのであって他の人がそれを聞いた時にどう感じるかなんて全くの別物。自分でそれを聞いた時にどう感じるかが全てであるし、同じ環境設定が出来ない事が多いから、所謂「印象」に過ぎない。今では印象派と呼ばれている人達が開いた展覧会が、単なる印象に過ぎないと批判されたように。

 

 でも珍しく凄く意味のある比較試聴を見つけた。ベートーベンの交響曲七番の比較。

https://www.youtube.com/watch?v=eP27i5HX4ls

演奏自体もさることながら、演奏の判断には録音状態がとても密接につながっている。たまたま、1943年のマグネットフォン録音から最近のデジタル録音までの五つだったので。最初と三番目は最近のデジタル録音なので、三番目は無視する。

 

 最初のは2016の録音でデュダメル。これはもう時代も時代なので典型的なデジタル録音。アナログからデジタルに変わって、80年代の前半ぐらいはあんまり良くなかったと思う。装置自体の問題もまだあっただろうし(主にADC)、録音方法もまだこなれてなかった。90年代以降ぐらいからが完成期。これは四番目のバーンスタインウィーンフィル(録音年が出ていないので調べたら多分1978のライブ)と較べれば違いは歴然。

 

 90年代以降のデジタル録音と、完成期にあった1978の楽友協会でのアナログ録音を分けるのは、記録媒体がCDかレコードかと言うのもさりながら(両者には決定的なダイナミックレンジの違いがある)、録音媒体の差が大きいと思う。デジタル録音ではアナログのテープはもう使わない。どの時点でADCが入るのかは分からないけれど、アナログ録音よりも圧倒的に多いチャンネル数で取れる。

 

 アナログでは、第九のように合唱が後半に入ってくるような曲の場合、マイクの割り当てを変えている。アナログ後期の70年代末でもそうしてたみたい。チャンネル数は16ぐらいだったんだと思う。オーケストラでは立てられるマイクの数が限られる。デジタルになると、もうそんな制限は消えた筈。結果として、全ての楽器がオンマイクで取れる様になる。

 

 個々の楽器の音を鮮明に拾えるようになるし、間違いがあった時も該当の楽器の部分だけを差し替えれば良しで、クレーム対策が楽。世の中には暇人がいて、スコアと比べて間違いを指摘するマニアがいるらしい。そんな面倒くさい人の相手するぐらいなら、編集時に差替えた方が楽よね。さはさりながら、オンマイクには欠点もある。横一線になってしまう。全てがオンマイクなんで、奥行きは消える。横はステレオなんで確保できるとしても。

 

 ホール全体の響きを拾うマイクも勿論あるだろうけれど、生のホールでは有り得ない無機質的な横一線録音が出来あがる。デジタル嫌いの一因はこの不自然さに由来すると思う。アナログ時代はマイクの数の制限が却って自然な音の響きになっていた。テレビのスピーカーぐらいだとあんまり分からないし、ホールの響きはある程度広い部屋でこその話だから、今の環境では横一線だけれども個々の楽器は聞き取れるデジタル録音が好まれるのは仕方ないのかも。ちゃんとした環境であれば、アナログ時代の録音でも横一線ではない個々の楽器の音が明瞭に取れているし、ホールの響きも素晴らしい。

 

 デジタル録音では、生のコンサートとの乖離が大き過ぎる。マイクの立て方の問題だと思う。ピアノソナタやバイオリンソナタであれば、問題なく最近のデジタル録音が優れている。当たり前の話として。オーケストラだけは、アナログ時代の録音が素晴らしい。少なくとも、二階席で聞く音に近いのはアナログ録音。バーンスタインの方が圧倒的に良い。かぶりつきで聞くのが好きならば、デジタルだろうけど。

 

 海外のオペラハウスなんかだと、王様が座るのは二階と三階をぶち抜いたあたりの席。良く見えるし音響的にも良いから。今でも二階席の前当りはS席。ホールの響きを聴くのであればやっぱりその辺。バイオリンソナタであれば、前の方もありとして。未だにレコードに人気があるのは、アナログ時代の豊かな響きが聞けるから。デジタル録音では無理。アナログ録音を復刻したCDでも、現実としては無理。SACDでは少しだけほぼアナログと同じものはあるけどね。

 

 どうしてCDで無理なのかは、二番目のフルトヴェングラーの1943が明白な答。デジタル録音の後に出て来るから比較は容易。かなり高域を上げた編集になっている。これはアナログ録音を復刻したCDでは100%確実な事実でありながら、あんまり知られていない。発売元は親切でそうしてる。録音の質自体は今のものに比べて劣るので、鮮明度にやや欠ける。なので高域を持ち上げて「聞き易く」している。

 

 結果として、少し高音に歪があるのかな、と言う音になる。それに比べて低音側は基本的に落とす。この動画ではあんまり落としていないけれど、普通はもっと落とす。今の環境では落とした方が鮮明に聞こえる。高域を上げて鮮明になったように見せかけて、低音側は下げて濁りが少ないようにする。化粧は濃くして照明は暗くして、加齢による劣化を抑えるキャバ嬢のような手法がCDの典型例。SACDは少しだけ薄化粧。ユーザー層に合わせてそうしている。

 

 こうした方が受けが良い。至高のマスタリングとか、究極のマスタリングとかでフルトヴェングラーの録音は手を変え品を変えで粗製乱造されてる。でもキャバ嬢志向は変わらないので、濃さは同じ。口紅の色がちょい違うとかマツゲの長さがとかで誤差の範囲。期待していると、ただ貢がされてるだけだったと後で後悔する。そんな輪廻から解脱する方法は唯一つ。1943のオリジナルに限りなく近いレコードを手に入れて、自分でマスタリングというヤツをする。解脱して仏になるにはそれしかない。さもなくば、永遠に賽の河原に石を積む羽目。

 

 1943録音ははマグネットフォンで、実使用としては世界初のテープレコーダー。その後、アンペックスが1948に発売する事になるアメリカ製の元になった装置。そこら辺りには色々な逸話があったんだろうけど、もう時効になった過去の事。市販の音源を買う限りは、キャバ嬢に貢ぐ無限ループからの解脱は無理なのよね、と悟ったので今はなるべく元に近い未編集の音源を探している。まずは音源からがDIYの鉄則。

 

 五番目のカラヤンは、ああ成る程ねえと、腑に落ちた。カラヤンとかけて名物と解く。その心は、名物に美味いものなし、でした。アンチカラヤンと言う人は少なからずいる。どうしてそうなのかがとても良く分かったのがこの録音。正確には、録音ではなくて映像。1978のバーンスタインの七年前の1971でありながら、映像の作りがまるで違う。カラヤンは、10の予算があれば5は映像に使っているよね。バーンスタインなら、1以下。

 

 良し悪しはともかくとして、見た目をとても大事にしている。ブランドとしてはそれもありでしょう。映像情報が豊富に出回り始めた時期でもあるから、そっちから攻めていけば名物にはなれる。有名にはなれる。でもまあしかし、人は全能ではないのだから、演奏の方に力がまわりかねたとしても不思議はない。それがカラヤンの本質だから、無意識的にその臭いに気付く人はカラヤンを評価しない。トヨタの車に近いんでないのかな。可もなし不可もなし。でも持ってて損はない。

 

 という按配で、それぞれがとっても個性的な録音だった。手元に置くとするならば、勿論レコードから自録りする訳なんだが、バースタインとフルトヴェングラーまあ、好みとしての一番は、1936のトスカニーニ&ニューヨークのSP盤。ちゃんと復刻するならば音質的に問題ない所に持って行ける。1943のフルトヴェングラーよりも音質として上になる。理由は簡単。SP盤はダイレクトカッティングだから。SP盤の時代、テープレコーダーはない。

 

 

蜂蜜組とは貢物なのよね、或いは喜び組。

 来年のWカップの組み合わせが決まった。日本にとっては、あんまり良い籤ではなかった。まあ、前回のスペイン、ドイツと同じ布団に押し込められた3Pのような死の組と比べるならば、天国には程遠いとしても、煉獄ぐらいかなとは思う。

 

 更に今回は、グループリーグの三位になったとしても、「蜘蛛の糸」のカンダタに降ろされた慈悲の糸にすがるようにして、一糸まとわぬ姿であろうと一糸にすがって決勝トーナメントの天上世界に登っていく事も出来るのだから。ちょっと前だけは隠して。前回は、お釈迦様の慈悲の糸なんかなくて、スペインかドイツのどちらかを布団から蹴り出さないといけなかった。サッカーだからして、まさに蹴り出す。今回は煉獄。

 

 Wカップのような世界の国が参加するイベントには、国民性がモロ出しになって来て、とても面白い。南米になると、かわいさ余って憎さ百倍の自虐ヤジが凄い。あんまり覚えてないけれど、クソDFどもは監督のケツに突っ込め、とか言ってる。スイスには、スローの再生装置なんてない。その心は、「標準再生でスロー並に遅い」。日本のサポーターはとっても優しい。仏の慈悲を感じる。負けて帰って来ても、空港では良く頑張ったと迎えてくれる。

 

 ブラジルだと、泳いで帰って来いと言われるし、空港だと卵が飛んでくる。コロンビアだと弾が飛んでくるし、カメルーンだと帰ってきたら家は燃やされてぺんぺん草になってたりする。アフリカでは、まじない師がベンチに呪いの人形を埋めるなんて都市伝説もある。

 

 アジアの協会に来る前のオーストラリアは、南米とのプレーオフに回る事が多くて、いつも散々な目にあってた。アゥェーの試合の時は、泊まったホテルを相手のサポーターに囲まれて、一晩中大音響のどんちゃん騒ぎをかまされて、一睡もできず。四面楚歌とでもいうのか、四面タンゴで敗退に追い込まれてた。それに懲りて、彼等はアジアの協会に移ってきた。

 

 それでも最後に一度だけ、アゥェーの四面タンゴにもめげずに勝ったのかな。後はホームでボロ負けさえしなければ、涙涙の出場切符にまで辿り着く所まで来た。私の記憶が確かなら、その時に彼等はオーストラリア的まじないを繰り出してきた。カンタスは(あのカンガルー航空)、超低空飛行で南米からオーストラリアまで代表選手を運んだ。超低空飛行は、疲労回復には百万馬力との科学的裏付けがあるとの話で。ほんとかねぇ。それまでの低空飛行を考えると縁起悪そうなんだが、この時だけは満願成就した。余談ながら、この時に日本はオーストラリアに大逆転を食らい、グループリーグ(ドイツ大会)で敗退している。低空飛行でドイツまで彼等がやって来たとは思わない。

 

 今回の組み合わせは、開催国がメキシコ、アメリカ、カナダと三か国。開催国はシードされて、楽な組み合わせのご褒美がもらえる。業界用語では、「蜂蜜組」と呼ばれる。たっぷりと蜂蜜をかけた砂糖菓子の様にあま~い組み合わせ。開催国が早期に消えると大会が盛り上がらないので、こっそりと優遇するのが言わずもがなの常識になっている。今回もそう。

 

 手口は比較的に簡単。まず開催国は無条件にランキングの上位国(ポッド1)として扱う。ポッド1同士は同じ組にはならない。なので強敵は、その次の上位国(ポッド2)となるが、公平に見せかけている抽選会ではこそっと開催国にはポッド2の最弱が当たるような手品が仕掛けられている。これは公然の秘密。英語では、部屋の中の象(an elephant in the room)と言うらしいが、抽選会場には必ず象がいる。

 

 今回、その栄えあるポッド2の最弱(いわゆる雑魚)に認定されたのは、韓国、オーストラリア、スイス。スイスは、ちょっとかわいそうかもだけど、少しは象にも色を付けなきゃなんないから、こんなもんでしょう。これもお国柄という訳で、未だかつてない蜂蜜組に我々(韓国)は入った、と報道してる。ちょっと詳しい人ならば、部屋の中には象がいると知っている。韓国はザコ認定されて、開催国の特権であるポッド2からの「貢物」にされたんだと。蜂蜜を嘗める方ではなくて、搾り取られた蜂なんだねと。実は、喜び組にされちゃった。今年の流行語だと「献上」された。

 

 今回の場合は、三位にも慈悲の糸の救いがあるので、門前払いと言うのか、書類選考落ちと言うのか、お前は既に死んでいる的なチームがいるならば、グループリーグの突破は容易い。単純に四チームのランキングで比べても意味はない。ベルギーが正真正銘の蜂蜜組。残りの三チームはゾンビ同然だから。噛まれさえしなければ問題ない。ゾンビがいないのは、韓国、オーストラリア、日本の組。この三つの組だけはゾンビがいないので、四位になって即刻帰国の憂き目を見る可能性は高い。

 

 ゾンビがいないと確実に勝ち点の三を取れる保証がないので、三位チームの中での蜘蛛の糸争いに負ける可能性も高くなる。まぁ、決勝トーナメントの組み合わせを見ると、日本は三位通過の方が良さそうなので、ロシア大会の時の様に、勝負よりも勝ち点勝負に徹するのが賢いのかも。そうなってくると巡り合わせというものはあるので、欧州のプレーオフからはポーランドが来るのかなあ。欧州のプレーオフは、ウクライナポーランドで、ポーランドが最後の切符を手にすると予想。

 

 ウクライナポーランドはお隣さんで、どちらもスラブ系で中々区別がつかない。でもウクライナ人からすると、アホか全然違うわい、と言ってる。日本と韓国なみに違うと。今は戦争もあって、ポーランドウクライナに協力的ではあるけれど、ウクライナからみると、ポーランドはとにかく面倒くさいらしい。いつも日和見で、自分たちに都合の良い時だけ良い顔をするんだと。隣同士の国とはそういうもんだろうけど。

 

 欧州のプレーオフの決勝で当たる事になると、どちらにとっても天地開闢以来の一大事となる。勝った方は、少なくとも百年はそれで酒が飲める。欧州予選は厳しい。親ガチャならぬ欧州ガチャ。オーストラリアみたいに、転籍という裏技もなくはないだろうけど、象のいるサッカー界隈でもウクライナポーランドが「アジアに入れて♥♥♥」という話はさすがに無理がある。ハンガリーならば、ワシ等は苗字が先に来るからアジアだ、とか言える。飛行機の低空飛行ぐらいならば、効果はともかくとして裁量の範囲。結果が出るのは来年の三月。

 

 

 

 

 

CDとレコードの違いとか、必要な帯域とか。

 CDとレコードの音の違いについて、当たり前なんだけどほとんど誰も言ってない事。知る限りでは、初めて見た。11分ぐらいから出て来る。

https://www.youtube.com/watch?v=Tu3yiuSh8aA&t=1037s

レコードのSNは60dBぐらいなのに、一般的には98dBと言われるCDと同等か状況次第ではそれ以上の音になるのは何故か、という疑問。良くある答えは、デジタルとアナログは林檎とオレンジなんで比べられない、というやつ。どっちも時間軸上の電気信号なんで、林檎と林檎なのは明白なんだが。

 

 アナログの場合、-60dBFSにまで信号が小さくなったとしても、歪はあまり変わらない。むしろ良くなるのが普通。信号が-60dBFS、ノイズが-60dBFS、歪が-90dBFSぐらいになる。でもSNは確かに0dBになる。CDでは、信号が-60dBFS、ノイズが-100dBFS、歪が-100dBFSぐらい。大雑把には。SNはまだ40dBぐらいは残る。

 

 この状態だと人の耳では両者にあまり差が出ない。信号自体の質には大差がないので、十分に識別可能。都会の雑踏の中でも会話が成り立つのと同じ。SNがマイナスになったとしても、それ程の問題にはならない。むしろ、レコードのノイズは暖かみとして判断されることが多いので、聴感としてはほぼ無視できる。弱音部での音の良さは好感につながる。音が大きくなると相対的にノイズも歪も感知しないので、やっぱり両者に差はあまりない。

 

 更にはCDだと多くの場合は大量のISOが出て来るし、編集も雑。所謂、海苔波形。レコードでクリップする事は無いし、編集もマシな場合が多い。そんな事情があるので、良く管理された環境でのレコード再生がCDを上回るのは当然の結果ではある。ただし、CDに書かれているデータと、レコードの中身は同じ曲であっても全くの別物なので、そういう意味では林檎とオレンジの比較でしかない。そこを無視するならば、レコードの方が良いという場合は多くなる。

 

 論より証拠なんで、テストレコードをかけて調べてみれば一目瞭然。大きめの時と小さめの時の歪。レベルが下がると、ほぼ全ての場合で歪は小さくなる。DACでもだいたい似た傾向。カートリッジはMCL-1000。 こういう事実があるので両者の聴感上の違いは小さい。 

 

 しかし、CDに高域補正がないかといえば、それは不正確。今ではほとんど使われなくなったけれど、プリエンファシスというのはあった。CDプレーヤーはこれの有無を検知して、かかっていればディエンファシスで元に戻す。なので聞いている人は関知しない。但し、リッピングをした時はその限りではないので、多くの場合はそのままになる。プリエンファシスはかかりっぱなし。

 

 知らずに聞いていると、これは分からない。そこそこ高域が上がっているのだけど、知らずに聞いているのが普通。うちでもピアノソナタなんかずっとそれで聞いていて特に不満はなかった。バイオリンだとあるかもだけど。高音が金ぴかの時は、怪しいかもねという話。

 

 レコードの周波数帯域となると、これは主観の問題であって、あるとないの基準が何かで決まる話。20kHz以上があると言えばあるし、ないと言えばない。そもそも楽器の高音だって同じ事。20kHz以上があると言えばあるし、ないと言えばない。楽器の場合は倍音というけれど、倍音と歪の区別は不可能。倍音なのかもしれないし歪なのかもしれない。どんな名前で呼ぶかの違いしかないと思うけど。数字的には。

 

 レコードの場合も、楽器の倍音(歪み)、録音の時のマイクの歪、再生の時のカートリッジの歪を区別するのは不可能。CDであれば、有無を言わせず22kHz以上はないと言えるけど、レコードでは解釈の問題にしかならない。具体例をテストレコードで見ればこうなる。Lチャンに、5kHzから12kHzぐらいまでのホワイトノイズを入れた時。Rチャンはクロストーク

 倍音の10kHzから24kHzぐらいと、三倍の15kHzから36kHzぐらいとが出てる。少なくとも、FFTでは確認できる。一般的にアナログの世界では、こんなレベルは測れないので「ない」、という事になってる。でもあると言えばある訳で、完璧に消えるCDと比べるならば、あるとしか言えない。なので定義とか解釈の問題としか言えない。

 

 これをカートリッジの歪と言うのか倍音というのかも解釈次第。楽器が倍音ならばカートリッジだってそうなのでは、という話はありでしょう。低い周波数だと特性は良くなる。これだと、三倍の所はナシと言っても差し支えなさそう。クロストークも悪くない。まぁ解釈次第ではあるけれど。あるかないかは自己責任でどうぞ、という話。

 おそらく、良い環境のレコード再生ならばCDよりは良いのでないかなとは思う。ノイズ成分が暖色的な音にしてくれる。CDは寒色的になる傾向がある。まぁ、林檎とオレンジではないとしても、両者の比較は簡単ではない。まずは実物で確かめてみましょう、そうすれば無用な誤解も減りますよ、というのが当たり前の結論。

 

 高い方が、そういう定義で決まる類であるとして、低い方はと言えばこちらは少しばかり数字の世界になる。CDは記録という話であればほとんど低域に制限はない。標準的なテストCDだと、再生できるかは別として4Hzが最低周波数。こんなの必要ないよね、というのが感覚的な常識ではあるけれど、数字的には低い方に制限はない。FFT的にと言うべきかも。実際の楽器でも、ほとんど制限はない。16Hzのオルガンが最低というのは、数字的に間違っている。

 

 どこまで下があるかといえば、答えられない。それは演奏者の決める事であって楽器で決まる事ではないから。オルガンのような場合は楽器で決まると言えるけれど、打楽器であるとかピアノでも弦楽器でも、決めるのは演奏者。1Hzだって出る。出てしまうという方が適切かも。楽器から出た音を完全に復元するには、そこまで必要になる。FFTの意味を考えれば当たり前の話。感覚的には理解しづらいとしても。

 

 太鼓であってもトライアングルであっても一秒間に一回叩くならば、周期は一秒。それをFFT解析すると、一秒の整数倍の周波数(1Hz)が嫌でも出て来る。それらを全部取らないと同じ信号の復元は無理。数字的には当たり前の話。勿論、太鼓とトライアングルでは、最も大きな成分の周波数は違うけれど、トライアングルでも一秒の整数倍の周波数が出る。なので、1Hzから必要。

 

 そんな低周波は耳では聞こえないけれど、体では感じている。本当にちゃんと低音が出るシステムで、低域を20Hzで切る場合と切らない場合とを比べると、切らない方が間違いなく良い。切ってしまうと、臨場感とか生き生きとした感じが消える。トライアングルならば同じかもだけど、太鼓ならば切ってはダメ。ちゃんとした低音は中々でないので、実地の確認は難しい。サブウーハーとかでは、全く話にならない。

 

 更にクリスタルボウルという楽器は、何にもしなくても平気で2.5Hzなんてのを出してくる。262Hzというのが勿論主成分であるけど。どんな構造なのかは謎としても、これの場合は、あるものはある。

  低い方を拡大すると、これ。2.34Hzの整数倍が延々と続く。

 これは2.34Hzの周期で叩いている訳ではないのだけれど、とにかくあるものはある。数字として否定はできない。録音するならば、再生は出来ないだろうとしてもDCまで必要でしょう。という訳で、解釈次第の高域は比較的に単純で、オーディオの闇と光明というのか解脱は低い方にこそある。この闇を通り抜けた先には、おそらくは光が。単純に、低音の事なのでスピーカーは部屋の一部と割り切って、部屋を建てて行けば答は待っているだろうという話。

失われた術。

 もう一つ面白い話で、10Hzの謎。

https://www.youtube.com/watch?v=OJkf_rWD-NE

これは知っている人は対策するけれど知らなければそのままというヤツ。レコードの再生をすると10Hz近辺にピークが出る。これはカートリッジとアームで変わる。相性という話にされてしまうかも。サエクの407-23とMCL-1000だと7Hzぐらいに来る。別のMCだと14Hzぐらいだった。

 

 レコードはデジタル化しないと意味がないので、ADC側での対応という話になる。レコードをそのまま聞くのは懐古趣味としてはありとしても、それ以上にはならない。デジタル化して適切にノイズ処理をして初めて意味がある。ノイズ処理とか或いはマスタリングというのをレコード会社にやらせると、金の逃げていく音を聞く羽目になる。入魂のマスタリング、渾身のマスタリング、究極のマスタリング、耳からウロコのマスタリング、などなどが出るたびについつい、「買っちゃった」、になるから。

 

 ADCはデジタルなのでこの低域カットもデジタルフィルターになる。通常HPFはLPFよりも同じタップ数では性能が落ちる。4096のタップでもこのぐらいの低い周波数ではちょっと厳しい。60dB/octぐらいは入れたいので。そこでLPFで作って、これを元の信号から引き算して実装するのがベター。たしか、7Hz用と14Hz用の二つを作ったと思う。7Hz用の10Hzぐらいから落とすのを使っている筈。

 

 これはRX7なんかでも低い周波数の対応はしてなかったと思う。デジタルのFIRが一番の解決策。アナログでは中々落とせないでしょう。デジタル型は自作品でしかないだろうけど。 

 

音の悪いホールって。

 技術的に豊富な経験があってその方面の会社もやっている人が、サントリーホールの音が悪いと書いたら凄い反響があったというビデオをアップしていて、とても面白い。

www.youtube.com

オーディオ関連で技術方向に詳しい人は、あんまり生の演奏は聴かない。スピーカーの位置を1mm単位で設定するとかの方向に行ってしまう。戦の無くなった江戸時代の武士みたいな感じになる。本職を試す現場がないので精神論に傾いてしまうような。武士道は死ぬ事と見つけたりとかの。本来の演奏を聞くのが目的ではなくなって、装置の設計とか調整が本職になってしまう。

 

 この人はビデオ見ても本来の目的を科学的な観点で追いかけてるし、今も現場にいるようでピンボケしてない。某有名DACメーカーの人なんかは、完全に圏外になっちゃってて有名。ほとんど同意はされていないらしいけど、サントリーホールの話は分からなくもない。但し、何処に座ったかが書いてないようで、そこは残念。

 

 サントリーホールは何度か言った事があるので、納得できる部分は多い。座る場所次第で大きく印象が変わっただろうとは思うけど。他の記事を読んでみると、割と一階の前の方に座る傾向があるみたいなんで、サントリーホールもその場所だったとするならば、ガッカリは納得。たぶん、音が全部頭の上を通り過ぎて行ってしまうような感じになる。当然、宜しくない。

 

 ホールってオーディオ的な言い方をするならば、間違いなく最大出力という概念がある。それを超えるとアンプと同じでサチる。アナログなんでデシタルほどに露骨ではないけれど、明らかに質は落ちる。何処が最大出力かは些か決めずらい。個人の感性に依存するので。いつも思うのは、ホールの一番良い音と言うのは、楽団員がそれぞれに自分のパートを小音量で練習している、本番前の時だと思う。今まで行った全てのホールでそう。サントリーホール、ミューザ川﨑、札幌のきたら、とか。

 

 一番極端だったのは、鼓童の太鼓を狭い市民会館みたいな所で聞いた時。もうクリップしまくり。あの太鼓は屋外で聞くのがベストでしょう。あの大音量に耐えられるホールなんてないと思う。PAも最悪だったし。好みの問題として、ましなPAにも遭遇したことはない。サントリーホールの場合、最大出力は比較的に大きめだけど、一階席はダメね。音は全て通り過ぎていく。二階席ならばそんなに悪くはない。バイオリンの音はレコードで聞くようなオンマイクにはならないけれど、バランスとしては悪くない。

 

 どこのホールであっても、響きを重視するならば二階席になるだろうし、そうなると録音で耳にするようなバイオリンのソロは聴けない。録音とは、なんとかその二つを両立させて不可能を可能にしようとする自己矛盾の行為であるんだろうけど。サントリーホールの一階席はナシでしょう。低音は頭の上をワルキューレの騎行のように飛び去るのでした。

 

 普段は二階席なんだけれど、一度一階も試そうと真中ぐらいに座った事がある。不運な事にこの時はべートーベンの五番だった。この時はチェコフィルで指揮者(ビィオフラーチェク)の意図として、「五番はコントラバスの曲だろが」、となっていた。五番の演奏になると、コントラバスが五人だったかずらずらと普段ならばティンパニが陣取る一番後ろに出張ってきた。最後列にコントラバス五人。

 

 ではありながら、低音は全て宙に響くばかりでおもわず後ろを振り返って飛び去る低音の尻尾でもつかめないかと思うばかりに、すかすか。二階席で聞くべきだった。そうすれば指揮者の意図の通り、コントラバスの洗礼を顔面で受け止められただろうに。残念。生の演奏とはそんな一期一会で、外れもあれば当たりも出る。チケット価格の割には当りの出る確率は低い。生なら何でも良いという事は無い。外れを以て反面教師にする覚悟が肝要かと。外れても料金の発生しないオーディオはその点では有利。

 

 クラシックの場合、何処に座るかが大事。指揮者の顔を見たいからと対面している所に座るのもアリだろうけど、音は良くないでしょう。ホールの評価をその場所でする事は無いだろうとしても、座る場所が大事。オーディオでもどこで聞くかは重要。それはスピーカーの位置を変えるのと同じ意味。聞いている音とは、音源からの距離と僅かばかりは温度、ならびに部屋での反射で決まる。温度が変わると波長が変わり、距離の変化と等価なので。現実として、温度差に合わせた特性の補正の必要はないみたいだけど、数字的には大きく変わる。

 

 

 

 

 

D90(AK4499eq版)のDSD入力の特性。

 USBstreamerというのは、192kHzまでの入力が出来るので使ってみた。PCと電気的につながるので条件次第では余計なノイズ成分が出るかもなんだけど。一つ前のADC基板はRpiとのインターフェース用に外部コネクターの端子が乗っているからこれを流用すればつながる。HDMI出力もあるのでD90DSDでつないでデジタルとアナログのデータを同時に取る積りだった。

 ところが挫折。アナログは上手く行かない。ADCはUSBstreamerのスレーブにならないといけないので、クロックはUSBstreamerからのを使う。これがダメ。デジタル的なサンプリングには問題ないレベルだが、アナログのサンプリングには使えないぐらいジッタがひどい。現実として、音声の領域でもクロックジッタの影響を受ける事はある。普通言われているのとは全く違う所でだけど。

 

 SPDIFだと、ESSのようにASRCを入れない限り115dBぐらいのSNRにしかならない。RpiのクロックはもっとひどくてCD並のSNRにしかならない。オシロスコープで見ても止まっていない程度なんで当然ではある。toppingのUSBも褒められたものではない。SNRの劣化と言う形では出てこないけれど、デジタルとしてはお粗末なレベル。USBstreamerのクロックだと110dB行かない。

 青がUSBstreamerのクロック。赤は基板に乗ってる$1ぐらいのクリスタル。クリスタルは電子部品の中では大谷のように飛び抜けているので、変な使い方をしない限り$1であろうが温度管理した$100越える様なのでも、音声の領域で差はない。$1に敵わない程度のクロックはとても多い。ちょっと変な時は、少し良さ目のFFTアナライザーで見ると一目瞭然。

 USBstreamerはこんな感じ。本来は22.5792MHzの所に一本だけ出る。$1のクリスタルだとこうなる。現実の基板でクロックのジッタがあると、大抵はSNRの劣化と言う形になる。基本波の横に余計なのが出るのは、意図的に余計な特定の周波数を混ぜたような場合で、現実世界でそういうのはまずない。机の上だけの話。

 デジタル的なサンプリングさえできれば良いので、二つのクリスタルを載せていないんだと思う。同じXMOSでも二つ載せているDDCは、完全な線一本であってI2SでD90につなげば何の問題もない。120dB越える様なSNRのADCやDACに使えないクロックは意外と多い。普通に$1のクリスタルで普通に発信させれば音声領域での問題はないのだが。二層基板とかは普通でないので、門前払い。

 

 仕方なくD90のアナログ出力を測る時は基板上のクリスタル。デジタルだけの場合はUSBstreamerからのクロック。せっかくなのでアナログとデシタルの比較の前にデジタル同士の比較。1bitDSMの次数の違いで、デジタル領域ではどのように特性が変わるのか。PCMtoDSDのチップ(AKMとか)にはデジタル領域の特性は出ていないし、まして次数での違いは分からない。

 

 SACDはおそらく七次ぐらいだと思うけれど、あれは古い規格なのであまり特性は良くない。入力がゼロになった時は別処理になって01001011を繰り返して出すようだし、極を作って特性の改善もしない。まだそんな知恵がなかった頃の規格だと思う。DSD128も周波数の違いだけだろうから、実質的には今の六次のDSD64(青)と同じ程度の特性と思う。

 原理的には六次のDSMだと三個の極を入れられるけど、そうすると低い方での特性が悪化するので最大でも二つ。上の図だと20kHzと15kHzの辺り。これがないと、五次と同じぐらいの特性になってしまう。これは完全にデジタルの領域の話。五次だと二つは厳しいので一つ。五次ではSNRが109.2dBとなるので、アナログ領域でもこれ以上にはならないからボツ。DSD64では少なくとも六次以上。

 

 但し、次数が上がると最大振幅は下がる(五次:-5.0dBFS、六次:-5.7dB)のでアナログ領域での最大振幅も減ってしまいSNRでは不利になる。最大振幅を上げるためには次数は低い方が良くて帯域外ノイズも減る。替りに20kHz帯域でのノイズは五次の様に増えるので、両方のトレードオフで決まる。つまりDSD64では、六次が最適

 

 DSD128だと話は変わる。

 これだと五次でもSNRは136dBなので、五次で問題ない。DSD128での最適は五次。但し、DSD128になると周波数が上がるので、DACの方式次第ではアナログ変換の段階での劣化が無視できなくなる。AK4499eqのようなモノリシックだとほとんど問題はない。ESSでどうなるかは実機がないので分からない。AK4499eqのDSDはかなり優秀だとは思う。

 

 なのでディスクリートでは2bitのDSD64というのがアリ。

 2bitと言っても実際は三値なので、二値の1bitとは感覚としての差はあまりない。数字の世界では随分と違う。SNRが7dBぐらい違うのはデジタル領域の話なので、アナログ領域での差にはならない。最大振幅の差が圧倒的。3.4dBぐらい違う。これは痺れる。ディスクリートではアナログFIRでタップを増やすのだが、これは32タップか64タップかというぐらいの差になる。ディスクリートで64タップは現実として無理。モノリシックでしか無理。対称性と言う点でも2bitは1bitよりも上で、違いは数字になって現れる。

 

 AK4499eqだとDSD256という選択もあり。その場合は五次の必要もないので四次で十分。DSD128の四次はちょっと無理。DSD256ならば楽勝。最大振幅も-4.21dBまで行ける。これ以上に入力を上げると、変調器は股裂きになるので発振するDSMの場合、一度発振すると信号レベルが下がっても正常動作にはならない。ハードの変調器だと、電源入れた時にはその状態になるので、普通は全く動作しない。 

 なのでハードウエアでの内部リセット回路が必ず入っている。ソフトでシミュレーションする時も、次数に応じて最大振幅を制限しないと上手く行かない。オフラインでのソフトウエア変換でもその問題は必ず出る。ISOで最大振幅越えたりしてもダメ。内部リセット次第で変換の質は違って来ると思う。ハードの場合、検出してからの復帰は早い。

 

 最後にD90HDMI経由のLVDSでDSD(デジタル領域)を入れて、アナログの出力との比較。使い物にならないのは分かっているけれど、五次のDSD64。デジタル領域で既に108.9dBなので、そのぐらいのSNRにしかならないのは自明。青が上がって来ると、当然ながら赤はそれと同じレベルになる。机の上の話なら、デジタル領域のノイズは限りなく減らせる。アナログ出力にとっては、全く意味がない。

 

 次は実用的な六次のDSD64。20kHzの少し上ぐらいまでデジタルのノイズはアナログの下なので、アナログ側の制約のみで特性が決まる。デジタル側は単純にロジック回路の問題で、FPGAならば掛算器、高速加算器、内蔵メモリーの問題。デジタル側は、アナログノイズの下になるような回路設計が必須であるという事。

 DSDでなくてI2SでPCMを入れてやれば、120dBぐらいのSNRになる。これはUSBの時よりも少し悪い。本来、差はないのだけれど、基板上でのノイズの影響かな。DSDで更に悪化するのは、DSDの最大値がPCMの0dBFSにならないので内部で上げているから。-2.03dBFSは4Vrms(D90の0dBFS)よりも少し大きいから、6dBぐらい上げていると思う。その結果の劣化。このぐらいなのはとても優秀。火事で燃えたのは残念。

 

 次は五次のDSD128。六次のDSD64よりもSNRが良くなるのは、最大振幅が上がって来て、信号レベルが大きくなるから。DSD64とDSD128で、AK4499eq自体の劣化はほとんどない模様。ディスクリートでは中々こうはならない。 

 

 六次のDSD128。THDの違いは誤差なのであんまり意味はない。ADC由来かも知れないし。AK4499eqはDSD128でもへいちゃらなんで、六次もなくはないけど最大振幅の問題があるので、やはり五次が正解。

 

 四次のDD256。四次なので最大振幅は上がるけれど、AK4499eqの劣化が少しあるようで、SNRは五次のDSD128よりも少し下。誤差の範囲だけれど。内蔵してるアナログのLPF次第としても、帯域外ノイズはこっちの方が小さくなる。この感じだと、DSD512では却って特性は悪くなると思う。D90DSDで使うのならば、五次のDSD128が数字としては一番良さそう。 

 火事の後のAK4499exでは、もうDSDが直接入る事は無いのかな。相方のチップは、5bit、6bit、7bitの出力しかしない様だったから。特性としてはそっちが上なので、敢えてDSDに拘る必要はないし。FPGAから1bitではなくてそういうbit数で出すのも、勿論可能。bit数の変更は、OSRと同じで比較的に簡単。次数の変更は些か面倒

 

 1bitでDSMを使うのは、あんまり賢くない。モノリシックならば5bit以上の7bit以下はとっても妥当。ディスクリートならば、2bit。工場持ってれば、モノリシックで2bit作る。楽に高性能になる。きっと5bitとかよりも。