DTM、コンピューター音楽、デジタル音楽、ミックスに関する記事です。
今回は「上下と前後の定位」の話です。
私はこの領域については「本当に真剣に興味があるならやってみれば良いんじゃないかな?」「もう無意味だという結論になりつつあるけど。」という程度のものとしてしか扱っていません。
(picture: http://people.eku.edu/ritchisong/birdbrain2.html)
(2023年8月13日更新)
- ■追記。三次元定位の未来
- ■「俺は上下定位作れるよ」派のみなさまへ
- ■上下と前後の定位は半分オカルト
- ■バイノーラルの限界
- ■将来像
- ■前後・上下定位の原理と誤解
- ■上下に操作可能な音の種類
- ■前後定位(奥行き)
- ■上下・前後定位がオカルトである理由は個人差
- ■フクロウの耳の話
- ■テレビ、ラジオにおける違和感
- ■経時変化による立体音響効果
- ■相対性
- ■個人的な感覚
- ■オーオタ某人の話
- ■独創性と先進性?
- ■リスニングポジションの違いで破綻する
- ■目的が逆になってないですか?
- ■読者の感想
- ■「DTMをやっていると突き当たるちょっと難しい単語の話」シリーズの過去記事
■追記。三次元定位の未来
この記事は2017年に書かれたものです。
その後、2020以降はヘッドトラッキング技術によって三次元表現の伝わり方は大きく変化しています。(主にVR、3Dゲームで)
ドルビーアトモス等の映画用の三次元音響も徐々に広まってきています(それほど有意ではないという批判もあるようですが、システムの刷新によって改善されていくでしょう。
以下、この記事で扱うのは、主にステレオ2chのお話です。
■「俺は上下定位作れるよ」派のみなさまへ
「ステレオ2chで」
「100Hzのサイン波を下から」
「5000Hzのサイン波を下から」聞かせてください。
これができないから私は上下定位はオカルトだと主張しているだけです。
やり方あるなら教えてまじで。煽りじゃなくて、ステレオ2chにおける上下定位がウソであると確定
--------------------
よくあるデモンストレーションでは
「高周波の限界をもっと上にすると、もっと上から聞こえるようになります」
「低周波の限界をもっと下にすると、もっと下から聞こえるようになります」
というものしかありません。
それは当たり前の錯覚です。
どういうわけか、そういうワークショップでは逆の上下定位を作ることはありません。片タイプだけやって「ほら、高音が上に移動したでしょ?」とアピールしているものしか見聞きしたことがありません。
さらに言えば、2wayスピーカーで上にツイーターがついているタイプで、高音を下から鳴らした音源を聞かせてください。
「単にツイーターが上にあるから高音は上から聞こえるんだよ」という説があるからです。(確かナルキさんが言ってた。違ったらごめん。)
なお、これは
「キックのアタックに高周波をつけたらキックが上になった」というレベルのものではありません。
--------------------
以下いろいろ書きますが、私の考えでは「すべての人間に共感させうる上下定位は2chでは実装不可能」です。
--------------------
■上下と前後の定位は半分オカルト
この記事は上下定位はこうやってミックスするよ、という話ではありません。「ステレオ2ch再生における前後定位と上下定位は半分オカルト」ですよ、という解説です。
「上下定位」は特にオカルト度が非常に高いです。
「前後定位」、奥行きのほとんどは単なる音量差です。
もしくはリバーブのある音を「奥行き」と言っているケースがほとんどです。
・語彙の問題
オーディオ、ミックス用語は抽象的な言葉に置き換えられることが多いのは誰もが知っている通りです。
「ストリングスに艶が出た」「ガッツのある音」「のっぺり」「シズル感」など、音声を文字で表現しようとするので、意味が大きく変質してしまいます。
で、そういう不確かな表現の代表格「音が前に出た」は単に音量が上がったことを意味していることがほとんどです。
この「前に出た=大きい」の対義語として、必然的に「後ろに下がった=小さい」という言葉が導き出されます。
音の話をしているのか、比喩表現を楽しんでいるのか、どっちなのかはっきりさせることが何より重要です。そうしなければ議論が成立しません。
なので、この記事ではより多くの人が納得できるように、言葉を変えて、しつこく、何度も同じことを少しだけ違った言葉で書きます。そのどれかがあなたに響けば幸いです。
なお、最も短く言えば「音には周波数と音量しか無い」だけで終わる話です。周波数の意味、音量の意味。この2つをシンプルに正しく理解している人に迷いはありません。
・そもそも人間の耳は上下認知が弱い
なぜかと言うと、狙い通りの効果を的確に認知できる人と、製作者の意図通りに認知できない人がいるからです。
なぜ上下と前後の定位が的確に作用しないのかというと、人間の頭周辺の形状に『個人差』があるからです。
この結論については昔から多くの研究報告が出ており、意図した効果を発揮できていないよね、ということが定説になっています。って言っちゃって問題無いよねもう。
個人差があるのは
- 両方の耳の距離
- 耳たぶの形状
- 耳の穴の深さ
- 上半身の体格
- (細かい要素だと髪型)
という要素です。
人はそれらの要素によって音が微妙に変化することを脳が処理して「上下」を認識しています。
また、そもそも人間の耳(脳)は上下の音の分析が苦手な生物だということを忘れてはいけません。
最も実験しやすいのは耳たぶです。
両手を耳たぶに添えて、耳たぶを大きくしてみてください。
その手の向きを動かして、犬が警戒している時のように耳たぶが後ろ向きになった形にしてみてください。後ろからの音が手に反射して耳の穴に入るように。
また、その手の形状や角度をいろいろ変えてみてください。
その時聞こえた周波数差が前後定位による効果です。
これは「耳たぶというローパスフィルター効果」なのですが、手の角度や頭との距離によって、様々な聞こえかたになることも実験してみてください。これは耳たぶだけではなく、耳道(耳の穴)が拡張されたことも意味しています。
そこで確実に分かることは、耳たぶ(手)の形状によって音は多種多様に変化して聞こえる(脳が処理する)ということです。
これには大きな個人差があります。
慣れない形状の耳たぶ(手の追加)では、脳が「その耳たぶ形状で入ってくる音に慣れてない」と錯覚を起こすことも体験できます。「再生装置の特性+耳たぶフィルター+脳」によって、はじめて音が感じられる、ということだけは絶対に忘れないでください。そこには大きな個人差があります。
・多スピーカーでは明確に定位して当然
明確な上下定位が再現できないのは「ステレオ2ch」の「疑似立体定位」の話です。
7.1chなど、多スピーカーを使用するサラウンドの場合には誰でも定位を感じ取ることができます。実際にその方向から鳴っている音を、自分の体で聞いているんだから当然です。酔っ払ってでもいない限り、聞き間違えることはありません。
頭の向きを変えたら、それに連動して自分が使い慣れている耳たぶなども動くので、当然その方向から聞こえていると認識できます。
問題となる、議論となるのは「ステレオ2chで上下と前後に定位ができるか?」ということです。
よく言われているような「ハイローパスとマイクロディレイ」程度では、上下前後定位を誰にでも感じさせるのは非常に困難です。
少なくとも我々レベルの音楽製作者が実装するのは限りなく不可能です。
・前後定位
たとえば「この処理で音が前に出る」と説明される時、
それは相対的に音量が大きく聞こえる処理をした時です。
EQによる被り除去処理の結果、相対的に大きくなったトラックは「前に出た」というアレです。「前に出る」は便宜的な表現でしかありません。
私はこれを「見立て」と呼ぶことにしています。
昔のミックスでは「リバーブは遠いという意味」に見立てをしますが、近くてもリリースの長い音はあります。
リリースの長い音=遠い音ではありません。
故に、「リバーブ=遠い」は見立てでしかありません。
eki-docomokirai.hatenablog.com
古典絵画の遠近法では「遠くのものは色がボケる」と表現することがありますが、近くのものでも色が薄いものがあります。
当たり前のことですが、特定の条件を満たしていればたしかに遠近感を出すことが可能です。でも万能ではありませんし、たった1つの方法で表現することはできません。
同様に、透視法では遠くのものは小さく見えますが、目の前にいる小さな人間と、遠くにあるピサの斜塔をうまく配置すれば錯覚が生じます。
2022年12月12日追記。
ピアニストの「見立て」の表現のお話。
https://youtu.be/QLktLs27CyA?t=344
5分40秒すぎからソフトペダルの解説です。
「打楽器がいろいろな場所を叩いて表現するように、ピアニストも弦の使う場所を変えて遠近感を表現する」
ソフトペダルは「ソフト」「ソフトな音」だけではなく「異質な音にして強く」という表現にも使える。
もちろんピアノの演奏する場所や向きが変わるわけではありません。それでも音質を微妙に変えて何かを表現するツールとして活用できます。
まさに「見立ての遠近感」であり、コンプで遠近感とかEQで高さとかを表現することに通じます。
ピアノのソフトペダルをここまでのレベルで使う人はかなり上手い人たちだけですが、ミックスにおけるコンプやEQで見立ての表現を的確に使いこなすのも結構な熟練が必要だと思うべきでしょう。
安易にプロの技術を見聞きした程度で使いこなせるものではなく、もっと基本的な運用をしっかり身につけることを重視し、ステップアップしていくべきでしょう。
近年はネットで上級テクニックの存在を知ることが容易ですが、それを知っていることと使いこなせることはまったく別です。さらに言えば、その表現が「聞き手に伝わる」ことと「聞いて理解できる」ことも全く別です。
あなたが表現しようとしていることが言葉の説明無しに音だけで伝わることは、お互いの音楽性が極めて近いものである必要があります。
遠近感や空間定位を伝えることを考えるよりも、まずは基本的な技能、すなわち曲の音符と演奏がちゃんとしていることの方が遥かに重要です。ほぼすべての人間はミックスを聞くために音楽に接していません。
--------------------
音が大きく知覚されれば「前に出た」となるわけですから、当然ラウドネスカーブに基づいた聞こえやすい周波数帯域(要するに4k Hz周辺)を強調理した場合に「前に出た」と認知されます。
大きくすれば手前にあるように聞こえるのは当然です。
エンジニアが「前だ」「後ろだ」と言っている場合、その多くは単に「大きい」「小さい」でしかありません。
もうちょっと繊細は前後定位はコンプ等による音量変化やハイパス・ローパスフィルターによる特性によって表現できる、と主張する人が居ます。
たとえばこういう記事。
が、的確に、慎重に処理されていないと、違和感のある音場になってしまいます。
この実装は使用する楽器編成が明確であれば比較的簡単です。が、ルームリバーブを含む異なる質感(異なる音場)のサンプル音を使ったりしていると非常に困難になります。全てがシンセサイザー音で構成されているなら比較的簡単に前後の差別化ができます。
音量が小さければ遠くに聞こえた気がするし、ハイを落とした曇った音なら遠くのような気がします。
でも、近くても小さい音はあるし、曇っている近い音もあります。それを無視して、前後だけで考えるのは間違いです。言葉は正しく使いましょう。「大きい・小さい」と言えば良いだけです。
それらを差別的に設計することで「異質な音がいろいろある」と認識させることはできますが、それを「遠近感ミックスだ!」と言い切るのは間違っています。
ミックスにおいて「奥行きがある」というのは、「音が差別化されている」のであって、奥行きはありません。だって2chスピーカーですから距離感は作れません。ミックスの技術を説明する際に便宜的に「奥行き」と表しているだけです。
・2人のトランペット奏者
機会があれば2人のトランペット奏者に目の前で演奏してもらえば良いです。トランペットは音の指向性が強いので実験向きです。バイオリンやクラリネットは指向性が不明瞭なので実験向きではありません。
1人は前向き。1人は後ろ向き。
同じ距離にいる奏者なのに、トランペットの向きによって聞こえ方が明確に変わることを経験できます。
それでも「前後定位」なんて言えますか?という単純この上無い実験です。
・表現の相対性
また、遠近感は相対的なものです。
他のトラックの処理とうまくすり合わせをしないといけません。
よくあるTIPSでは単一のトラックの音での実験で、「ね?近くに聞こえるでしょ?」的なものがあります。しかし、他のトラックとの相対性が丁寧に設計できていないと違和感のほうが強くなったり、サウンド全体がいびつなものになってしまいます。
繰り返しますが「奥行き」とは便宜的な言葉でしかありません。
最も簡単な実験は、完成したマスターを小さくし、そこにカラオケ歌を大きく乗せてみれば良いです。マスターで「最も前」に定位しているはずの音も、歌に対して小さくなっていれば、それは後ろに定位したことになります。これは逆にすることも可能です。小さすぎる歌はどんなにドライで、どんなにハイ上がりでも「後ろ」だと言われるでしょう。
要するに音量差でしかありません。前後なんていい方をするのはやめて「大きくして」と言えば良いだけです。
・昔の遠近法メソッド
移動しました。
eki-docomokirai.hatenablog.com
・映像、絵画の遠近法
絵画における「空気遠近法では色が浅くなる」というメソッドがあるからと言って、薄い色のすべてが遠くに感じるわけではないのと同じです。透視法によって小さく描かれたものは遠く感じますが、絵画に描かれるのは均一なタイルが敷き詰められた空間だけではありません。
「だまし絵」「錯覚」の存在を忘れてはいけません。
大きすぎる相撲取りやバスケットボール選手が一般人と一緒に写っていると「スケール感が狂う!」と感じることがあるはずです。
・錯視
見ているだけでも楽しい錯視。
ここから音楽家が学ぶ教訓は、細部の作り込みよりも全体像の自然さです。
加工されすぎたものはいびつな仕上がりになります。
あなたが目指す音楽はいびつさの表現ですか?
特殊効果が目的化した写真の代表例と言えばこれ。
ミックスで作りたいのは、こういうビックリ効果ではなく、普通の音のはずです。おかしな技法にこだわるのはやめましょう。
・強烈な錯覚
人の感覚などあてになりません。
人間の感覚器官の中で最も鋭敏な視覚でさえこのザマです。
あいまいすぎる聴覚なんて、もっとあてになりません。
--------------------
■バイノーラルの限界
バイノーラルの音響処理にはいろいろあり、「これはバイノーラル音源です!」「ダミーヘッド録音です!」と謳われていても、気持ち悪いだけの音に感じることがあったはずです。
理由は上でも述べている通り人の頭のサイズなどに大きな個人差があるからです。
eki-docomokirai.hatenablog.com
上の記事の中で書いた「位相ズレによるステレオ感の演出」でダミーヘッドの話を踏まえた上で話を進めます。
ダミーヘッドの形状に近い頭と上半身の形状をしていれば、ほぼ狙い通りのサウンドを体験できます。
しかし、ダミーヘッドの形状と大きく異なる人はその効果を快適なものとして受け止めることができません。
そうした経緯から、ダミーヘッドや胸像付きマイクで録音したとしても、録音環境と聴く人の体型差によって、バイノーラルは正確さを失い、違和感の方が強くなります。
「なんとなくステレオ感が強い」とか、「普通のステレオ音声とは違う」という印象は誰でも共通して知覚されます。しかし、それが的確な空間定位として認識されるか?となると、かなり怪しいというのが実情です。
その「違和感」の大小によって『遠くに聞こえる』『上下に聞こえる』と言う人はいるけれど、それは個人差の大きいバイアス表現です。どういう言葉で表現したら良いのか分からなくて便宜的に遠いとか上下と言っているだけです。
そりゃそう言いますよ。上下定位の話題の席ではね。
でも、もしそれが「狂った位相とはどういうサウンドか?」のワークショップの席だったら『クソ位相ですね。』とか『なんか伝説の「上下定位」っぽく聞こえねーか?(場内爆笑)』からの『それは興味深い発言なので補足しますと、上下定位は位相が狂った状態の一種ですからねぇ。』という流れになるはずです。
おかしな工夫でリスクを冒すより、普通に聞こえる音を「良い音」と定義するべきです。
・なんちゃってバイノーラル
バイノーラルという言葉が独り歩きし、単一指向性のステレオ録音ですらバイノーラルだと言う人までいます。これもうわかんねーな。ハイレゾとかハイファイとかのバズワードと同じになりつつある、と言っても過言じゃない。
わりとしっかりしたマイクメーカーが出しているバイノーラルマイクですら力の入れどころがどんどんズレてきていて、ダミーヘッドを放棄しつつあります。
で、近年はVR製品向けのバイノーラル的な試みが多く見られるようになってきましたが、どれも悲惨な状態です。違和感しか無い音をありがたがる風習があり、「完璧なバイノーラルだ!」という評価の声まであり、こりゃもうダメだという感じです。ハイレゾという言葉を流行らせて強引に不要なゴミクズを売る商法は、数十年後には笑いものにされているのは間違いないでしょう。
なお、90年代にもバイノーラルが流行していましたが、どのような惨状だったのかはおっさんなら知ってるはず。あの地獄を忘れたのか?
・ダミーヘッドに対する誤解
誤解が多い点なので書いておきますが、ダミーヘッドやステレオ録音というのは、
- ステレオマイクの位置(位相差)
- 距離
- マイク付近の障害物の「形状、質量、質感」
によって得られるサウンドです。
これらを通過することによって「掛け録り」録音されたものが「臨場感」として歓迎されるか「違和感」として拒絶されるかは大きな個人差があります。
■将来像
身体を計測して補正して再生するようになれば、その人にマッチした音になるから、様々な定位が適切に表現できてくる可能性はあります。
とは言え、私は昨今の立体音響の試みに対して懐疑的です。また90年代のバイノーラルブームのようなクソ音に終わるんじゃないかと危惧しています。
頑張るのは良いんだけど、個人差を上回る説得力を持つレベルには到達できるわけがないと思っています。もしできるとしたら脳に電極突っ込む時代を待つしかないと予想しています。
・以上を踏まえて、これを読んでほしい
そりゃ無理ですよ。
安易な考えで「バイノーラルマイクを使えば立体音響になる!やったぜ!」と思っている人は、本当に何も分かってない。
なお、現時点では(比較的)ちゃんとした市販ゲームの立体音響は、バイノーラル収録ではなく、ソフトウェア(ゲームエンジン)の上でリアルタイム加工で疑似三次元音響にしています。
>音空間レンダリングとその実装
https://www.jstage.jst.go.jp/article/jasj/75/6/75_358/_pdf
こういう加工については私達のような音楽屋よりも、ゲームで実装をやっている人の方が圧倒的に上を行ってる。今から個人が興味本位で対抗しようとしても、とても追いつけるものじゃないです。
言うまでもなく先にバイノーラル録音されてしまったもの(掛け録り)は加工には不向きです。
そこんとこ分かってない似非ゲームデザイナーが多すぎる。自分の専門領域なら勉強しよう。専門外なら、専門家と仲良くしよう。というか、そこらで買えるバイノーラルマイク1本で何でもできると本気で思ってるなら、詐欺に気をつけろ。メーカースペックや過大広告に騙されやすいですと名乗っているようなものだ。
--------------------
■前後・上下定位の原理と誤解
同様に、あなたが設計した前後・上下の定位が、聞き手にとって拒絶される恐れがあるということを忘れてはいけません。
前後・上下定位の原理は「頭蓋骨や耳たぶ、上半身のの形状や質感」によって生じるフィルター効果の再現です。(あと細かく言えば耳の中での反射によって生じる特性も。)
例えば、後ろから聞こえる音は耳たぶを回り込んで来るので、ある種のパスフィルター効果によってこもった音になります。耳たぶが複雑な形状なのは定位を獲得するためです。
同様に上や下の音もそれぞれ異なる性質のフィルターを経たような音になります。
スピーカーを鳴らしながら首をぐねぐね動かしてみることで上下の定位を明確に感じることができるはずです。もっと分かりやすいのは、寝転がって体の向きを変えてみる方法です。
なので上下定位は実在します。しかし、それをミックスに込めて、全ての人に同じように空間定位を感じさせることは原理的に無理があります。
(まぁメーカーは売るための文句として過剰な表現をしますが。)
とにかく個人の身体と、その身体を使い続けることによって初めて脳が認識できるのが定位判別という能力なんです。
以上のことから、人間の耳は左右にしか無いのに、上下定位は確かに存在します。
が、それをステレオ2ch再生という汎用環境で再現できるかというと、否ですよ、というお話です。
その理由は耳の周辺にある耳たぶを筆頭とする、頭や胸などの形状によるフィルタリングです。つまり巨乳の人は下から来る音が強くフィルターされるので、貧乳の人より明確に「これは下からの音」と認識できているはずです。巨乳はオーディオに適していない証拠ですので、貧乳派の人はこの点を覚えておいてください。
とは言え、耳や頭や乳の形状は個人差が大きいので、どんなに再現しようとしても万人が賛同するサウンドにはなりません。絶対に。
もしできるとしたら、耳仕込み式のバイノーラルマイクを装着し、各方向からの音響特性を記録し、それに基づいてカスタマイズされた音を鳴らすしか無いでしょう。逆に言えばこの方法を完璧に実装できれば、夢が広がる。でもコストもとんでもないことになるでしょう。
・『攻殻機動隊』の世界でサイボーグはどういう音を感じているのか?
『攻殻機動隊』というSF漫画(アニメ)があり、登場人物が「機械のボディ」を取り替える場面があります。とすると、慣れたボディで聞いた音の定位を脳が覚えているので、サイズが極端に異なるボディに乗り換えると、音の聞こえ方も変化してるはずなんです。それはボディサイズが変われば、階段を昇り降りする時の感覚も違うということと同じです。ハイヒールを履き慣れていないと強い違和感があるのと同じです。
『攻殻機動隊』の世界でボディを乗り換えることが上手な人は、そういう違和感を調節する能力が高い人だということになります。もしくは違和感を無くすプログラムがあって、どのようなボディでも脳が適切な認識をできる世界なのかもしれません。
・こういう声もある
serさんはこう言ってる。
敢えて触れなかったんだけども、左右はともかく、奥行き方向は個人差どころじゃないものがあると思ってる。音量、帯域、リバーブetcのどれが主要因になるかが人によって大きく異なるというか、同じ関係性を持つ人は二人といない。例えばFAKiE/To the Limitの録音に奥行きを感じるか、とか。
— serieril(せりえりる) (@serieril) 2019年12月23日
奥行きに影響を与える要素はいくつかあり、その要素について差別化することによって「差別化されたサウンド」は作れるが、それを聞いたすべての人が奥行きだと感じるとは限らないんです。
また、一連の発言トピックにあるとおり、
自分の話をすると、帯域のDIP or Decayみたいなものが奥行きの要因として比較的大きい節があって、DSP等で帯域をフラットにすると全く持って奥行きが分からなくなる。あと、オールドスタイルなスピーカーでハマると異様に奥行きを感じたりもする。録音で言うと低域の暗騒音に敏感。
— serieril(せりえりる) (@serieril) 2019年12月23日
特定の再生環境でのみ「ハマる」ことがある、とserさん「個人」は言ってる。が、それが他のすべての人に「ハマる」とは限らない。
ミックスにおける最悪の手法は「俺の環境では最高の音になる」「俺のミックスが良く聞こえないならお前の環境が安い」なのは言うまでもない。
・上下定位は強い左右定位で「マスキング」される?
ここまで散々述べてきたとおり、人間の身体は上下定位に鈍感です。
なので、左右定位を強くアピールする音があると、上下に対する集中力が削がれてしまう恐れがあります。
音楽制作、ミックス用語における「マスキング」は、ベースとキックの被りや、低音から生じる自然倍音による中高音域の不明瞭さとかの話になることが多いです。が、広い意味におけるマスキングはそれだけではない様々な要素に対して生じるものです。
なお、ここでは簡潔な説明だけに止めますが、アレンジ領域における音符的なマスキングも存在します。メロディが動いている時にバックが動くと、アレンジ的にボヤけるというアレもマスキングの一種です。(マスキングと呼ぶ人は皆無ですが、現象としては酷似していますよね。)
■上下に操作可能な音の種類
こんな記事に興味を持つ人なら既に御存知の通り、低音は定位がはっきりしません。逆に高音はその波の直進性が強いので定位が明確に現れます。
言い方を変えるなら、高音ほど耳たぶ等の影響を受けやすい、フィルターされやすいということです。
・回折と床の関係
人間は残念ながら飛ぶことができません。ほぼ全ての音を「床が近い状態」で経験し続けます。その経験の積み重ねから「これは下からの音」と認識している、とされています。
低音は「回折」によってはっきりしない定位となり、回折は床で常に起きます。
回折した低音が常に含まれている音響で育ったため、人間は低音を「床の音」だと認識します。
「フロアノイズ」という言葉は言い得て妙です。ルームノイズではなくフロアなのです。
・上下定位ワークショップはオカルトと同じ手法だった
上下定位ミックスのプレゼンを行っていた人がいたのですが、その場では「ではハイハットを上から聞こえるようにしてみましょう」「ベースを下から聞こえるようにしてみましょう」という操作を行っていました。なんでそのワークショップでは「ベースを上から聞こえるように、ハイハットを下から聞こえるように」しなかったのでしょうか?
もし上下定位が自由自在なものだとアピールするなら、低音を上から降ってくるように聞かせたり、高音が下から聞こえるのを明確に示すべきです。
このプレゼン自体がオカルト証明的であり、都合の良いパフォーマンスの連続であり、その方法論の耐久性を示すものではありませんでした。お察しください。
・高い音は上に聞こえるし、低い音は下に感じるのが当然
たとえばこういう曲での使用例。
portrayal of guiltの"Bed of Ash"のミックスが面白いのですが上下定位はオカルトなのだろうか?
— 3LA (@3LA_Disc) 2022年2月4日
自分は上→下に音が流れてるけど、ライブハウスなどでどういう効果で聴こえるのか知りたいな。
DTMをやっていると突き当たるちょっと難しい単語の話(3)上下定位、前後定位https://t.co/0BNQdOJ9jg https://t.co/yTIOkzZNce
(時間指定URL、0分54秒からの箇所)
そりゃそうですよ。高い音は上、低い音は下に感じるもの。
テストノイズと適当なEQを立ち上げて、上からスイープしてみれば良い。誰だって上から下の音は作れる。でもそれじゃあまったく意味がない。
本当に上下定位が可能なら、この曲と逆の表現をしなきゃいけない。
上から低音が降ってきて、高音になるに従って下に移動していることを万人が感じ取れるようにできないなら、上下定位をテクニックとして論じる意味が無いんです。
上の曲、曲の表現としてはダウナー感を出すために大胆なノイズスイープを適切に使っている素晴らしいコンセプトだと思います。でもこの曲の良し悪し、好き嫌いとは別の問題です。
--------------------
また、単にステレオを広げただけのミックスと、それをバイパスしたミックスを並べて「VRミックスでございます」というデモを行っている人さえいます。そういう安っぽい詐欺行為によってVRオーディオの未来は閉ざされていくのだと思います。なんでキャリブレーションすら行わずに画一的なサウンドを押し付けるのかねぇ。
・上下定位は周波数の高低の言い換えでしかない
この記事では下のような模式図で示しています。
箱型の模式図なので上下定位のように思い込むかもしれません。でもよく見てください。上下はFreq(周波数)だと書かれています。
この記事では「上下」とは言っていません。左右のWidth、奥行きのDepth、そして「Freq」としか書いていません。どこにもFreq=上下定位とは書いていません。わかりやすく説明するために便宜的に「三次元」と定義しているだけであって、要素を差別化する概念として「左右」「奥行き」「周波数」の3つのステージがあるよ、としているわけです。
■前後定位(奥行き)
・距離とEQ
遠くから聞こえる野球や祭りの音はこもって聞こえます。
耳の近くでささやくヒソヒソ声は高周波の成分に偏っていて、遠くの人には聞こえません。
近くの音は高周波成分が多く、遠い音はそれが失われるということが分かります。
また、近くの音の方が豊かなダイナミクスレンジを持っています。
距離が離れると遠くの小さな音は聞こえなくなり、大きな音だけが飛んできます。
以上のことから、距離定位は明確に存在します。
でも、それを再現できるかどうかは別問題なんです。
・距離とコンプ
「コンプで距離感が表現できる」というメソッドは限定的な状況でのみ可能です。
コンプをかけて音を潰せば距離感が失われるわけでもないし、アタックが明確なら近くになるわけでもありません。
いずれも単にダイナミクスが狭くなっただけで、距離が変わるわけではありません。
コンプは音量差を変えるエフェクタであって、距離感を変える魔法のエフェクタではありません。
・距離とリバーブ
「リバーブをかければ遠くなる」というメソッドも同じです。
残響音が不可されるだけであって、遠くなるわけではありません。
リバーブは残響音を作るエフェクタであって、距離を変える魔法のエフェクタではありません。
コンプやリバーブが強い音はあくまでも「コンプやリバーブが強い音」でしかありません。
ただ、それを「遠くなった」と抽象的な言語で示したがる人がいるだけのことです。
サウンドを差別化したくてダイナミクスや残響を変えているだけです。
リバーブの無いドライな野外空間で遠くの音がどう聞こえるか考えてみれば分かることです。遠いと残響がつくんですか?ということです。
■上下・前後定位がオカルトである理由は個人差
個人の身体形状と、その身体で長年行きてきたことを後天的に脳が学習してきた結果としての2つの耳が立体音響を認知できている。
身体形状に個人差があるのと同じで、その脳が後天的に学習した結果にも個人差がある。
故に、他の人や機器が作った立体音響は正しく認知できないんです。
■フクロウの耳の話
フクロウの耳は左右の高さが違います。
これによってフクロウは上下定位を明確に認識できています。
birdbrain (http://people.eku.edu/ritchisong/birdbrain2.html)
また、リンク先でも書かれているとおり、フクロウの頭部の形状と頭部付近羽毛が生えている場所にって異なるフィルター特性があるそうです。
故に人間の左右定位と同様に「到達時間差」から上下の定位をより正確に認識できていることは当然として、方向によるフィルター特性の違いによって、優れた立体定位聴力を持っているとされています。
フクロウは目が大きいですが、それだけではないんですね。
また、上の画像のとおり、左右の耳の穴の形状が大きく異なります。これによってさらに明確に全方位の音を聞き分けられている、と考えられています。
なお、他の鳥はこういう耳の構造ではありません。
「鳥目」と言われるとおり、ほぼ全ての鳥類は暗い時には活動しません。(渡り鳥が夜間に飛ぶのは全く別の能力によるものです。鳥の話ではないので割愛。)
夜間の狩りに特化したフクロウの個性的な進化だということでご理解ください。
・仮説「フクロウ耳人間」
フクロウのように上下に耳の高さが違うことと、脳が後天的に学習するということをかけ合わせてみると、人間の耳たぶの形状を大きく変更し、上下定位が分かりやすい身体にすることでテスト可能です。音感がおかしくなっても責任は取れませんが、有意義な論文を書けるかもしれません。脳科学+オーディオに興味がある人はどーぞ。
漫画(アニメ)『攻殻機動隊』のように身体能力を拡張できる時代になれば、そういう頭部を装着した「フクロウマン」が登場するのかもしれませんね。暗闇での特殊任務に強そうです。
・『ゴールデンカムイ』に近い人物が出てくる!
彼は盲目で戦う手段として、舌打ちの反響音で周辺の様子を探る特殊技能を身につけています。耳たぶを拡張する装具をして、前後定位を強化しています。
もし仮に私がキャラクター設定のアドバイスを求められていたら「左右の装具をフクロウのように斜めに傾けるべきです」と提案したかもしれません。アイヌ文化を軸にした物語なので、フクロウの骨格を用いることでカムイの能力を獲得、という演出は極めてすぐれたものとなったことでしょう。劇場版で都丹庵士が登場するとしたら、ぜひ装具を斜めに傾けて欲しいものです。
■テレビ、ラジオにおける違和感
付随するので左右定位の危険性についても書いておきます。
映画、ドラマ、アニメなどで過剰な定位操作をしているものが頻繁にあります。
画面の右にいる人物の声がヘッドホンで聞くと右100%定位から聞こえてくるという不気味な状況になっているものを聞いたことがありませんか?
映画館の立体音響も、座席位置によっては違和感しかありません。
■経時変化による立体音響効果
停止している音源よりは移動している音源の方がより明確に定位を把握できる可能性はあります。
もし音楽制作の中で立体的な音響を使ってみたいのであれば、オートメーションで移動する方が良いかもしれません。
ただ、これについても立体音響関連の論文やエンタメ系企業の報告で「意味ねぇんじゃね」ということになりつつあります。
通常の音楽の中では一定に鳴らしている音よりも変化の起きた音に耳が引き寄せられるものです。ネコが動いているものに反応するのと同じですね。
上下・前後定位は個人によっては「あ、後ろに動いた」と感じることはあるかもしれませんが、個人差が適合しない人は「あ、何か音が変化した」とか感じません。
重ねて強調しますが、聞こえ方(脳の感じ方)には大きな個人差があります。
経時変化(オートメ)で処理したからと言って、誰しもが同様に上下定位を感じられる2chステレオミックスなるわけではありません。
■相対性
動きと同様、相対性によって「上だ」「下だ」を意識できる可能性はあるかもしれません。でもこれも個人差という大きな壁の前には誤差でしかないでしょう。
■個人的な感覚
私自信、立体音響を体験したり、知人が作った音源で立体定位を試みたものを聞いたのですが、どれもパッとしないどころか気持ち悪いものでした。
それらの音は「こもった音」「ハイが少ない音」「ダイナミクスの狭い音」として知覚されるだけで、遠くの音にも上から降ってくる音にも聞こえませんでした。
例外的に遠く・高くに聞こえた音楽作品もありましたが、それが音楽的に何か効果を発揮していたようには全く感じませんでした。
■オーオタ某人の話
新しいヘッドホンに買い替えたら上下定位が明確になった、だそうです。
聞いた曲の中には立体音響を意識せずに作った曲もあったはずですが、そういう曲では上下定位がおかしく聞こえたりはしなかったんでしょうか。不思議!
その直後から私が作っている曲に対して、やたらと「その音は上から来て欲しい」とか言い出すようになった。これが本物の上から目線。というギャグにしかならないホラー話。
聴覚ではなく、新しく高価なものを買ったことによって、あらゆる音が良くなったと感じる(思い込む)心理作用が大きく働いているのは明らかです。現在は(音楽的な)付き合いを断っています。
■独創性と先進性?
早い話が「変わったアプローチで作ってみたい。目新しさで客が呼べる。身障者へのフィードバックもある。『予算くれ!』 」というアレじゃないかなぁとしか思えない部分があります。
実際、立体音響系のエンタメはどれもキワモノ色が強く、コンテンツ内容が立体音響ありきで、全体としてつまんねーよという印象が強いです。それだったらクレーンでスピーカー吊るして振り回した方が笑えるんじゃねーの?と思う。
シュトックハウゼンの話題は禁止な。
■リスニングポジションの違いで破綻する
スピーカーを大量に使う立体音響系では当然のことながら正確に体験できるポイントは1点しか存在しません。他の位置だと違和感が生じます。
■目的が逆になってないですか?
「立体音響設備のある場所で鳴らした時に破綻しないミックス」という消極的な方向性になってるじゃないかなーと心配です。
■読者の感想
PAN振りについて調べてたら昔ながらのオタク長文を見つけてテンション上がってるhttps://t.co/R6qPvtNcrk
— きゅうり (@keukeukeuri) 2021年10月11日
「昔ながらのオタク長文」というパワーワードをいただきました!
あざーっす!
きゅうり氏には当ブログの「強烈なオタク長文」として以下の2つを紹介しておきました。
eki-docomokirai.hatenablog.com
eki-docomokirai.hatenablog.com
--------------------
■「DTMをやっていると突き当たるちょっと難しい単語の話」シリーズの過去記事
eki-docomokirai.hatenablog.comeki-docomokirai.hatenablog.com