東京藝術大学 大学院 音楽音響創造

要旨

近年、音の聴感印象をその音の物理的な特徴から予測する研究が盛んに行われている。音を聴いた時にどういう印象を抱くかというのは聴く人の経験や感性に依る部分もあるが、なにより音そのものにどういう特徴があるのかという点が重要になる。音の印象を表す用語にも様々なものが考えられるが、英語圏では“Clear”や”Punchy”、“Distorted”などが非常によく使われる事が過去の研究から明らかになっており、日本でもそれぞれ「明瞭な音」、「パンチのある音」、「歪んだ音」といった言い回しで用いられ、音響関連の製品の宣伝文などでも頻繁に見受けられる。しかし「明瞭さ」や「歪み」と言った言葉に比べて、“Punchy”という言葉に対応する「パンチのある音」というのは日本語として異質である感を否めず、「パンチのある音」と言われてどういう音を多くの人がイメージするのかは定かでない。そこで本研究では「パンチのある音」が英語圏で用いられる“Punchy”な音に相当するものなのか、同様な特徴を有する音源に対して用いられるものなのかを検証する実験を行った。市販の楽曲から5秒間を切り出した6種類の音源に対して、実験参加者の思う「パンチのある音」で判断してもらう一対比較実験の評価値、“Punchy”な音の英文の定義を和訳したもので判断してもらう一対比較実験の評価値、更に過去の研究で提案されている“Punchy”な印象を物理的な特徴から数値化するモデルから算出された評価値のそれぞれの対応関係をピアソンの無相関検定を用いて分析した。分析結果からはいずれの評価値同士においても有意な相関関係がみられ、日本語で言う「パンチのある音」と英語圏でいう”Puncy”な音は物理的な性質がある程度類似している事が示唆された。その物理的な特徴とはモデルが評価値の算出に用いる「エネルギーの急峻な変化具合」と「低域のエネルギー量」に関係する事が推測される。

また、ある音の特徴からどういった印象が想起されるかというのを予測する研究は過去にも行われているが、逆に現実的なツールを用いて狙い通りの印象を想起させる為にはどういう操作が必要になるかという観点で行われている研究は多くない。そこで本研究では2つ目の実験として、バスドラムをコンプレッサーで加工するというミキシングにおいて頻繁に行われる処理を念頭に、どういう設定のコンプレッサーをどういうバスドラムに施す事がより「パンチのある音」を生み出す事になるのか検証する実験を行った。今回の実験の結果からはコンプレッサーのアタックタイムを長くする事でよりパンチを感じられる群とアタックタイムを短くする事でよりパンチを感じられなくなる群に分かれる事がクラスター分析の結果から判明した。コンプレッサーの処理により振幅特性が時間変化すると結果として音源の周波数バランスが変化する事がRMS値の計算から明らかになり、具体的には、「エネルギーの急峻な変化」をコンプレッサーで引き起こした代わりに「低域のエネルギー量」が減少している場合が見られた。アタックタイムが短い方がよりパンチを感じられる群の実験参加者は「エネルギーの急峻な変化具合」に重きをおいて評価していた可能性があり、アタックタイムが長い方がよりパンチを感じられる群の実験参加者は「低域のエネルギー量」により重きをおいて評価していた可能性が考えられる。また、多くの実験参加者にとってはコンプレッサーのパラメーターの違いによる影響の方がバスドラムの違いの影響よりも大きい事が示唆された。


The research for clarifying the relation between the impression of a sound and the physical nature of the sound is getting more popular these days. The impression of a sound is dependent not only on the experience and the sensitivity of listeners, but on the nature of the sound as well. There’re plenty of possible words to express a sound in a subjective manner, and words like “clear”, “punchy”, “distorted” are found, in the past research, to be especially well used. Those are respectively translated into “Meiryou”, “Panchi”, “Hizumi” and frequently used as well. However, by the contrast of translation for “clear” and “distortion”, the translation for “punchy” is not so familiar to most people and there’s no denying that the translation for “punchy” is ambiguous to some extent. For that reason, I’ve conducted an experiment to inspect whether the translation for “punchy” can be considered to be equal to the English word “punchy” in terms of their impression. In this experiment, 6 variations of 5 seconds extraction for commercial music was evaluated firstly by the Scheffe’s paired comparison based on how participants perceive the translation for “punchy” and secondly by the Scheffe’s paired comparison based on the translated text for the definition of English word “punchy” set in the past research, and lastly by the output of a punch score model proposed in the past research. Three of each evaluations had significant correlation to each other, and the translation for “punchy” was implied to be relevant with the English word “punchy” in terms of their impression on listeners. Also, punch score model suggested that both of these are closely related to the “percussiveness of a sound” and “energy in low frequency”.

Additionally, in the contrast to the fact that the relation between the impression of a sound and it’s physical nature is well studied, few research where practical method for creating a sound of specific impression are performed. Here, I’ve conducted a second experiment where different bass drums or kicks are processed by different settings of compressors and how they affect the impression of perceived “punch” is observed, keeping in mind that kicks are often processed using compressors in mixing. The cluster analysis showed that half of the participants chose shorter attack time for compressor to enhance perceived “punch” while other half showed the opposite trend. Also, it was been shown that the frequency response is affected by the process of amplitude modification with temporal variation as the compressor diminished the energy in low frequency while introducing rapid change in the entire energy. It is implied that the evaluation done by those who chose shorter attack time for punchier sound put emphasis on rapid change in energy, while the evaluation done by the other half put emphasis on the energy in low frequency. Moreover, the influence of the difference in compressors are suggested to be bigger than that of the difference in kick types for most participants.