東京藝術大学 大学院 音楽音響創造

修士論文:関連記事

要旨

顧 昊倫
武満徹の映画音楽 -『怪談』を中心にミュージック・コンクレートの技法を分析する-

本研究は現代音楽家である武満徹(1930-1996)の映画音楽、特に実験的な一例だと考えられる『怪談』のために作られたミュージック・コンクレートを分析検討する。1955年、武満徹によるミュージック・コンクレートの処女作が生まれてから『怪談』(1965)までのおよそ10年間に、いかなる手法を用いて『怪談』の成果にたどり着いたか、また『怪談』で用いられたミュージック・コンクレートの技法を画面と合わせて分析することが本研究にて最も重要な部分である。いっぽう、今の時代なら、音を変調したいのであればデジタル技術で簡単にできると考えられるが、ミュージック・コンクレートをもとに発展してきた変調手法、もしくはミュージック・コンクレートのような変調手法がエレクトロ・アコースティックなどの実験的な電子音楽に多く存在すると思われる。それに着いて、ミュージック・コンクレートからの影響も考察し、本研究のもう一つの目的とする。

まず第1章では武満徹の生い立ちから始め、彼なりに映画音楽の道へ踏み出しながら続いていた音楽活動を概観した後、映画音楽および映画のための音響を作る際の一般的な原則と、作曲家たちが直面する問題を検討した。第2章ではミュージック・コンクレートの時代背景および定義を述べ、日本のミュージック・コンクレート黎明期から『怪談』に至る武満徹の試みに絞り、彼自らの発言と合わせてミュージック・コンクレートとサウンド・デザインとの関係について検討を試みた。第3章においてはオーディオ分析ソフトウェアを用いて『怪談』全体の音楽を分析し、後に制作されたテープ音楽バージョンと比較して主に用いられるミュージック・コンクレートの技法を明らかにした。最後に第4章ではミュージック・コンクレートと他の多くの音楽ジャンルとの繋がりについて検討した。

ミュージック・コンクレートの手法を用いて作られた映画音楽は、映画の歴史においても稀有な存在であろう。実験性がきわめて高いとまでは言えないが、武満徹の試みからは彼なりの創造力および価値観が明らかになってくる。それは、音楽自体および技法の分析と併せて、映画音楽、さらには電子音楽などの作曲者にも大いに役立つと考えられる。


GU Haolun
The Film Music of Toru Takemitsu: Analysis of Musique Concrète Composition, Kwaidan

This study attempts to analyze film music of Toru Takemitsu, especially the Musique Concrète for the film Kwaidan, which is considered as an experimental work. Reviewing practices that Takemitsu had put into the decade from his first Musique Concrète composition Relief Static (1955) to Kwaidan (1965), and matching the film to analyze techniques that he had used to produce Musique Concrète are the most important parts of this study. On the other hand, nowadays we can easily materialize almost every single effect that were used in Musique Concrète through digital ways, and further more complicated electronic sound can also be produced easily. But several standard modulations which came from the “classical” Musique Concrète are still being used widely in current electronic music. It could not be ignored that electronic music still gets deep influences just from Musique Concrète, and we could find lots of similarities and connections between these two.

Chapter 1 begins from the upbringing of Takemitsu, and examines rules and problems which composers encounter when producing film music or sound effects. In chapter 2, mainly the background of Musique Concrète will be discussed, including the definition and connections between Musique Concrète and sound design. Chapter 3 is the main part of this study, which analyzes the techniques which Takemitsu used, and the unique constitution which he created for the film Kwaidan by using a software called “Sonic Visualizer”. And in the last Chapter 4, some other academic music genres such as contemporary music and electronic music will be given as examples that due to explore the connections with Musique Concrète.

Film music that produced only with Musique Concrète could not be found quite often, even through the whole film history. Hence we could find out the creativity and values in the composition by Takemitsu. Also, the results confirm that Musique Concrète had influenced other music genres, and composers nowadays will still get tips from the techniques which were used in Musique Concrète several decades ago.

要旨

増田 安南
アナログレコードプレーヤの違いが音質評価へ与える影響

アナログレコードの売り上げ上昇の要因は、物質的な特徴に着目した文化社会学的な説明だけ でなく、アナログレコード独自の音響的な特性からも考察し検討をする必要性があると考える。 本論文ではアナログレコードプレーヤの違いが音質の主観評価にどのような影響を与えるかを検 討するため、同一のアナログレコードを異なる3つのアナログレコードプレーヤ(エントリーモデ ル・ミドルクラスモデル・ハイエンドモデル)から再生し録音した音源と、CD音源を合わせた4 つの音源をシェッフェの一対比較法(中屋の変法)を用いて比較し、8つの尺度(全体的な好ま しさ・音場感・高音の豊かさ・低音の豊かさ・自然さ心地よさ・躍動感迫力・温かみ・ノイズ感) で音質の主観評価を行う実験を実施した。さらに、異なる4つの音楽ジャンル(洋ROCK・クラ シック・J-pop・ジャズ)と実験参加者の属性(音響グループ・一般グループ)においても、異なる 結果が見られるかどうかを検討した。

その結果、アナログレコードプレーヤの違いによる音質の主観評価への影響は、いくつかの尺 度において一部の音源間に統計的に有意な平均評価値の差がみられた。また、その結果はほとん どの場合においてCDやハイエンドモデルのプレーヤのような、音質の優れるメディアやプレーヤ の音源がポジティブな方向に高く評価され、反対にエントリーモデルとミドルクラスのプレーヤの 音源はネガティブな方向に低く評価される傾向が見られた。この傾向は音質の違いに敏感な音響 グループにおいても、より主観的な判断をするかと思われた一般グループにおいても、どちらのグ ループでも基本的に同様の傾向が見られた。しかし、特定の音楽ジャンルのいくつかの評価尺度 では、性能の劣るアナログレコードプレーヤが他の音源よりも有意に高く評価される結果もみられた。


MASUDA Anan
Effect of differences in analog record players on sound quality evaluation

I think that it is necessary to consider and examine the factors behind the increase in sales of analog records not only from the sociological explanations focusing on material characteristics but also from the acoustic characteristics unique to analog records. In order to examine the effect of the difference of analog record players on the subjective sound quality, perceptual evaluation experiments were carried out. Eight attribute scales (general preference, reproducibility of the sound image, richness of treble, richness of bass, naturalness and comfort, dynamism and power, warmth, and feeling of noise and distortion) were employed in Sheffeʼs pairwise comparison of four sound sources that were reproduced and recorded from the same analog LP record by different analog record players (entry, middle-class, and high-end models) and a corresponding digital counterpart. Four program materials were used in the experiment. Two subject groups (audio and naïve) participated in the study.
It was found that the subjective differences between analog record player sounds showed statistically significant differences in mean scores among some sound sources in some scales. In most cases, the sound sources of media and players that are generally of higher sound quality (CDs and high-end players) are evaluated in the positive direction, while the sound sources of entry models and middle-class players tended to be evaluated in the negative direction. This tendency was basically the same in both groups, while the audio group was more sensitive to differences in sound quality and the naïve group tended to make more subjective judgments. However, a particular genre of music rated on some scales showed the reverse rating that a consumer-level analog record player was rated significantly higher than other sources.

要旨

竹内 朗
サクソフォーンの演奏強度による音色変化の評価

 サクソフォーンを始めとする同属楽器の聞き分けは難しく、これを意図して吹きわけるのもまた演奏者、学習者の課題である。本研究ではサクソフォーンの演奏の強弱による音色の変化に注目し、測定と収録を行なった。さらに、収録した単音の演奏音を用いて主観評価実験を行ない、その結果を測定した騒音レベルと合わせて比較し、分析した。その結果、サクソフォーンの演奏経験に関係なく意図された演奏強度は演奏者から聴取者に伝達されており、判別に関して運指や楽器による際はあまり見られなかった。しかし、どの声部のサクソフォーンも低音の運指の音ほどより「強い」、「大きい」、「迫力のある」に対する評価値が高くなった。「柔らかい」と言う評価語の評価値は演奏強度と逆の大小を示し、「明るい」に関する評価値は、特にテナーサクソフォーンで目立って相関した。


TAKEUCHI Akira
Evaluation of Saxophone timbre change of playing dynamics

It is often difficult to distinguish between musical instruments of the same family such as between alto and tenor saxophones. Also, it is one of the challenges performers face when learning to intentionally make the sounds distinguishable. In this study, the author focused on the changes in the saxophone timbre when their dynamics were controlled by a performer. A subjective evaluation experiment using the recorded single-note performance sounds was done, and the results were analyzed together with the measured sound level. As a result, the intended playing dynamics were transmitted from the performer to the listener regardless of the listener’s experience of playing saxophones, while different fingerings or registers of saxophones were not salient for discrimination of the sounds. However, all the members in the saxophone family were rated higher for the attributes “Tsuyoi” (strong), “Ookii” (large), and “Hakuryoku-no-aru” (powerful) at the low-pitched fingering sounds. The ratings of the attributes “Yawarakai” (soft) showed the magnitude opposite to the playing dynamics, and the ratings of “Akarui” (bright) was notably correlated in the tenor saxophone sounds.

要旨

佐藤 真帆
2つの正弦波からなる複合音のピッチ知覚に関する実験とその活用方法の検討

ゲームにおける効果音のサウンドデザインは、サウンドデザイナの感覚に基づいて行われているのが現状である。しかしサウンドデザイナの意図をより正確に伝えるためには、効果音を制作するための客観的な指標が必要であると言える。本研究では、ゲームのサウンドデザインを行う上で指標を制作する際の一助とするため、音高に着目した主観評価実験を行なった。具体的には、複合音を構成する 2 音の中心周波数比を制御することで、音高の知覚にどのような影響を与えるか検討した。その結果、複合音の音高を知覚する際に、2 つのグループに分けられることが明らかになった。2つのグループとは、複合音の構成音 f1、f2(f1 < f2) の f1 を音高の判断の基準とするグループと、f2 を判断の基準とするグループである。

また、音の高さには 2 つの側面があることが示唆されている。周波数の高さと示すトーンハイトと、循環性を表すトーンクロマである。中心周波数比を変更した刺激においても 2 つの側面が知覚されるか調べるため、実験で得られた結果を多次元尺度構成法を用いて 2 次元に布置した。その結果、1つ目の次元は構成音の周波数の高低が対応した。これはトーンハイトと関連を示すと言える。一方、2 つ目の次元に対応する具体的な音響特徴量や実験参加者の特徴は算出できず、音の循環性を示すトーンクロマとの対応も本研究においては見られなかった。よって本研究におけるつ目の次元は、個人差が表れたものだと解釈した。これは、複合音の音高知覚に関する様々な先行研究において、音高の知覚には個人差が大きいと論じられていることに基づいている。

本研究をもって複合音の音高の知覚について定量的な提唱をすることはできなかったが、今後、より複雑な複合音を用いて研究を進めることで音高の知覚を多面的に分析できると考えられる。その一例として、従来は倍音構成に着目した刺激を用いる研究が多かったが、それ以外の複合音の構成パターンを持つ複合音の研究が待たれる。

今後の研究により、サウンドデザイナを支え、刺激となるような結果が得られることを期待する。


SATO Maho
Room acoustic parameters of perceived clarity of reproduced sound in small spaces

The sound effects in computer games is currently designed based on the senses of the sound designer. However, to convey the intentions of the sound designer more accurately, it is necessary to have an objective index for the production of sound effects. In this study, a subjective evaluation experiment focusing on the pitch of sound to help create an index for game sound design was conducted. Specifically, the effect of controlling the center frequency ratio of the two puretones that make up a compound sound on the perception of pitch was examined. As a result, it was found that the perception of the pitch of a compound sound can be divided into two groups: those who judge the pitch based on f1 and those who judge the pitch based on f2 (where f1 < f2).

It has also been suggested that there are two aspects of pitch. These are tone height which indicates frequency height and tone chroma which indicates pitch cyclicality. To investigate whether the two aspects are perceived in stimuli with different frequency ratios, the results of the experiment were analyzed using the MultiDimensional Scaling method. As a result, the first dimension corresponded to the high and low frequencies of the component tones. This is related to tone height. On the other hand, the specific acoustic features corresponding to the second dimension and the characteristics of the participants in the experiment as well as the correspondence with tone chroma, which indicates the cyclic nature of sound, were not found. Therefore, the second dimension in this study was interpreted as participants’ differences. This is based on the reports that various previous studies on pitch perception of compound tones have argued that there are large individual differences in pitch perception.

Although it was not able to make a quantitative proposal on the perception of pitch in compound tones in this study, future research using more complex compound tones may allow us to analyze the perception of pitch from multiple perspectives. In the past, most of the research has been done using stimuli that focused on overtone composition, but I hope that research will be done on sounds that have compositional patterns of other complex tones. I hope that future research will provide results that will support and stimulate sound designers.

要旨

スピネット・アグスティン・ホルヘ
音楽パフォーマンスのための視覚的なデジタルインターフェース
―Audiostellarを用いたアナログシンセサイザーの再意味付け―

本研究は、アナログシンセサイザーをデジタルな環境で視覚的インターフェースにより制御することにより、新たな音響の可能性を追求するものである。

開発の初期より、アナログシンセサイザーは多種多様なジャンルの多くの有名な音楽家達に用いられてきた。時間が経つにつれ、新しい技術がそれをデジタルに模擬しようとするようになったが、今日に至るまで、アナログシンセサイザーの音は享受され続けており、その結果、由緒あるモデルあるいは新しいモデルのアナログシンセサイザーが世界中で生産されている。

アナログシンセサイザーは、最も単純な波形としての正弦波によって複雑な音色を生み出すというコンセプトに基づいている。電圧制御発振器(VCO)、電圧制御増幅器(VCA)、低周波オシレーター(LFO)、フィルター、ノイズジェネレーターなどのモジュール群がこの目的のために開発された。これらのモジュールはフェーダー、ノブ(つまみ)、パッチケーブルなどによって制御され、生成される音のピッチや音色や音量を加工する一連の信号処理機構を形成する。しかしながら、このようなタイプのインターフェースの能力は、現在のデジタル・インターフェースの制御能力によって超えられている。アナログシンセサイザーはアナログサウンドを作り出すユニークな音源であるものの、その古いインターフェースからの制約を受ける。

本研究の目的は、アナログシンセサイザーを制御することのできるデジタルな視覚的インタフェースであるAudiostellarを使用することで、従来のアナログシンセサイザーの弱点であったインターフェースを拡張し、アナログシンセサイザーが設計された時点には不可能だった音やリズムを生成できるような三つの手法を提示することにある。Audiostellarは、オーディオ波形の特徴を解析し、機械学習による二次元的な可視化を行うソフトウェアである。そこではランダムなリズムパターンや予測不可能なピッチトリガーのような複数のコントロールの可能性がある。それと同時に、その視覚的インターフェースはOSCプロトコルによって外部のソフトウェアやハードウェアと通信する能力を持つ。本論文の最後の部分では、提案手法を用いて作曲した楽曲を提示・解説し、本研究の成果を示す。


SPINETTO, Agustin Jorge
Visual digital interfaces for music performance: redefining analog synthesizers through Audiostellar

This research will endeavor new sonic expansion possibilities by controlling analog synthesizers with a visual interface in a digital environment.

Since their first developments, analog synthesizers were adopted by a large number of notorious musicians from the most diverse genres. Along the years, new technologies try to imitate them, but their sound become so appreciated that remain current until this time. As a result, vintage and modern designs are being produce all over the world.

These instruments were created with the idea of developing complex audio timbres from the simplest sine waves. For this purpose, a series of modules such us VCO, Filters, VCA, LFO and Noise, were created. These modules are controlled by faders, knobs and patch cords and conform a chain of signal processing that make possible to modify the pitch, timbre and volume of the resulted sound. Nevertheless, these types of interfaces were exceeded by the control capabilities of digital interfaces. As a consequence, analogue synthesizers are unique sound sources of analogue sound which became limited by their own interface.

This research aims to demonstrate 3 different methods that, using Audiostellar as a visual interface to control analogue synthesizers, will make possible to produce sounds and rhythms impossible to be made by the time the synthesizers were designed. Audiostellar is a software that uses AI to create 2D visualizations by analyzing audio sample characteristics, with multiple control possibilities such as random rhythm patterns or unpredictable pitch triggers. At the same time, its visual interface has the right capabilities to communicate to external software and hardware by OSC protocol.

Finally, the results of this research will be demonstrated on a music composition which will be introduced and explained on the last part of this thesis.

要旨

伊 豊宇
異なる残響環境における箏演奏音の主観印象の違いについて

箏は日本伝統楽器のひとつであり、その独特な音色あるいは美しい余韻の変化は印象的である。音響的な視点から、従来の研究によって、箏の音色の物理特性、収音位置の違いによる箏の音色の主観印象の変化、立奏台や反射板の有無による箏の音色の物理特性及び主観印象は明らかにされてきた。しかし、従来の研究では、無響室の箏演奏音を対象にし、残響など空間的要素を排除して検討されている。しかし、近年、従来の演奏会場が段々少なくなり、箏などの和楽器の演奏会はクラシックのホールでも開催するようになった。演奏会場により、残響環境が異なることが考えられる。先行研究では、異なる残響が楽器の演奏音の主観評価に影響があることが判明した。そこで、本論は、異なる残響環境の中の箏の演奏音を刺激として用いた二つの主観評価実験を行い、残響環境による主観印象評価の違いについて明らかにすることを目的とする。

主観評価実験 (1) は、リバーブプラグインを用いて、残響時間、Sizeのパラメータを調整し、 数の残響のパタンを作り出した。それらの残響を無響室で録音した異なる音域の単音の箏演奏音に付加し、刺激として 9 人の実験参加者に提示した。実験は SD 法を利用し、実験参加者は一つの刺激に対して、用意された 10 種類の評価語尺度による 7 段階の評価を行った。主観評価実験 (1) のデータを因子分析を用いて分析した。その結果、三つの因子の作用が明らかになり、因子 1 は「残響時間に関する因子」、因子 2 は「美的因子」、因子 3 は「音高に関する因子」と命名した。

主観評価実験 (1) では、リバーブプラグインのアルゴリズムが明らかになっていないため、Sizeというパラメータを調整することが、主観評価にどのような影響を与えるかはっきりわからなかった。そこで、主観評価実験 (2) では、仮想音源理論 [6] を基に作られた残響プログラムを使用して、刺激を作成した。主観評価実験 (1) では、演奏音の音域による影響が強く見られたため、主観評価実験 (2) では、楽曲を音源として使用した。残響プログラムで容積及び平均吸音率を調整し、生成した 9 チャンネルのインパルス応答を楽曲の音源に畳み込んで刺激を作成した。実験参加者は箏演奏経験がない音響グループと箏演奏者の箏グループに分けられ、シェフェの一対比較を用いて、二つの音源を聞き比べ、用意された7つの評価語尺度それぞれを 7 段階の評価を行った。その結果、異なる残響環境における箏の音色の主観評価について、箏グループの実験参加者と音響グループの実験参加者は違う傾向があることがわかった。そして、特定の評価語の場合に、箏の演奏音に対する評価は音源の明瞭度と関係していることが判明した。


Fengyu YI
Subjective perception of Japanese Koto in different reverberant environments

Koto, one of the traditional Japanese instruments, has very impressive aspects such as its unique timbre and beautiful variations in its reverberation. In previous research of Koto’s timbre, the physical properties and perception at different recording positions, the perceptual with or without a stand, and reflection board had been clarified. However, due to the appli- cation of the anechoic sound source as stimuli, the effect of Koto’s timbre by reverberation was not mentioned in the previous research.

In this study, two listening tests have been implemented. By using Koto sound sources with different reverberation as stimuli, the differences in the subjective perception of Koto in the different reverberant environment have been tested.

In the first listening test, an artificial reverb plug-in was used to adjust the reverb time and size to create different reverberation patterns. These reverberations were added to anechoic Koto sound sources as the stimuli. Nine subjects compared the stimuli by using the semantic differential method. Three factors were found, and the author named factor1 as ”factor of reverb time,” factor2 as ”factor of beauty,” factor3 as ”factor of tone-height.”

In the second listening test, ten impulse responses in nine-channel were generated by a program. Parameters of volume and sound absorption coefficient were adjusted to gener- ate different room impulse responses. These impulse responses were then convolved with anechoic Koto sound source as the stimuli. Eighteen subjects were divided into two groups, using Scheffe’s paired comparison method to compare the stimuli’ differences. The evaluation influenced by clarity in some situations were found differences between the two groups.

要旨

任 偉
石井眞木の電子音楽における音響構造の研究

20世紀後半の現代音楽に関して、音響の概念を打ち出し、電子テクノロジーによって東洋の世界を表現した石井眞木の作品は、電子音楽を美学的および技術的の両側面からとらえる時代の要求に従い、日本独自の方向へと発展させ、充分な歴史的必然性を伴って、より多層的な音響を重視して生み出された。これは音楽構造の上で新しく自由な音響構造が可能な今日の作曲法にとって示唆的な例である。石井眞木によれば、雅楽や舞楽また聲明などの音楽ではリズムに指向性がなく、あるパッセージの同じような繰り返しには、音を堆積していくという概念があるという。このような音楽では、音は「動いている」が「静止」し「凝固」している状態であり、それは「音響の空間化」であるという。彼はこうした音楽が西欧の音楽を形成する、方向性のある音響概念とは大いに異なることを主張している。

本研究では、石井眞木の1967年〜1974年の制作期間を概観し、彼の作品の中で楽器と電子音の融合に関わる問題に焦点が当てられている《響応》《旋転》を中心に分析した。作品分析を通して、音響構造とエレクトロニクスの関係を問い、伝統音楽と電子音の内的関係づけがどのような作曲技法、音響構造を使うことで可能になるのかを探索した。

第1章ではまず20世紀後半の音楽の中で音響構造がどのように扱われていたのかという問題について概観し、石井眞木の電子音楽の「音響性」を重要な手がかりとして明らかにしていく。第2章においてはまず石井眞木の電子音を編成に含む作品を概観し、音響構造の要素を分類し、石井眞木にとって聲明がどのように捉えられていたかという問題について考察する。第3章では《響応》《旋転》2作品について、作品の詳細な楽曲分析を通して音響構造について明らかにしていく。そして第4章においては前章でおこなった作品分析の結果をふまえた上で、石井眞木の電子音楽に関わる音響の特徴を重層的断面から整理していく。そして最後に、本研究を通して導き出された石井眞木の電子音楽の音響構造に見られる独自性を論じた上で、音響構造の重層性では、さらに複雑なプロセスによる音響構造の変容が行われているという点を論じて結論とした。


REN Wei
Research of the sound structural elements and their constructions based on the electronic music works of Maki Ishii

With the development of electronic technology in the second half of the 20th century, a new form of music, electronic music, was born. Maki Ishii, as a pioneer of Eastern electronic music, has made a series of unique works by combining Eastern traditional aesthetics and audio technology through multi-level audio performance.

This is a suggestive example for today’s compositional methods that allow new and free costruction method of the sound structural elements on the musical structure.

According to Maki Ishii, the traditional music such as Gagaku, Bukaku and Shomyo has no directivity in rhythm. They are all caused by the constant accumulation of the same melody. The sound of this kind of music have 3 different states which is moving, stationary or solidified. The different state of sounds create the spatialization of sound. His music is quite different from the sound concept of Western European music that emphasizes directionality.

This research analyzed 2 works created by Maki Ishii between 1967 and 1974, which are focusing on the fusion of musical instruments and electronic sounds the “Correspondence” and the “Rotation”.

Through the analysis of these works, this research discussed the relationship between construction method of sound structural elements and electronics, and explored what kind of composition technique would enable the internal relationship between traditional music and electronic sounds.

As a result, it became clear that there is a possibility of developing ethnic sound structural elements and adding new creativity to musical instruments and sounds themselves.

要旨

張 涛
スピーカ再生における垂直音像定位と周波数帯域の関係について

モノ信号の位相や周波数成分に差を付けることで作成したチャネル間相関が低い二つの信号を左右のスピーカに振り分けると音像幅が広がるという非相関化手法がある。この手法が水平方向によく使用されたが、垂直方向に適用するための検証はまだ不十分である。

本研究では主観実験とダミーヘッドの測定の二部に分かれて、主観実験の回答の傾向と測定された高域にあるノッチを合わせて非相関化の効果を検討した。主観実験では前方縦一列に配置された下層、中層、上層の3 つのスピーカーからドラムループを提示し、非相関化なし1 チャネル再生の場合と2 チャネル再生、または8 種類の非相関化の2 チャネル再生といった条件で被験者にキック、スネア、ハイハットの垂直到来方向と音像幅を答えてもらった。回答の上限値と下限値を分析し、キック、スネア、ハイハットそれぞれに関する音像の広がりを調べた結果、非相関化による個別の音像幅の広がりの変化は示されなかった。1 チャネル再生の場合は上層提示されたキックの定位が下方向へのずれが生じる以外、剌激が再生位置に定位される。2 チャネル再生の場合は垂直方向のファンタム音像定位が上方のスピーカに寄せる傾向が見られて、ハイハット、スネア、キックの間の定位の差がl チャネル再生と一致した。さらに、2 チャネル信号を非相関化した場合は、音像幅の変化が見られなかった。垂直方向の定位の手がかりである高域にあるノッチの有無とVIS (垂直方向の音像幅)との関係が見えなかった。一方、周波数帯域の定位の差が生じることにより、全体をまとめて聞くと音像が広がる可能性がある。ダミーヘッドの測定の結果から見ると、処理なしの1 チャネル再生と2 チャネル再生の比較において、千渉による新たなノッチが生じると共に、一部のHRTF によるノッチがなくなることが示された。そして、非相関化においで相関信号の干渉で生じたノッチが埋められる様子が見られた。そのようなノッチの平滑化がHRTF による個人差の違いを縮められるかを検討する必要がある。


ZHANG Tao

Intercharinel decorrelation created by adding differences in the phase and frequency components of the mono signal. The perceptual effects of interchannel decorrelation have been investigated subjectively and objectively using complementary filter.In the subjective experiment, drum loops are presented from three speakers, the lower layer, middle layer, and upper layer, arranged in a single vertical line, with 1 channel reproduction without decorrelation and 2 channels reproduction, or 8 channels with 2 types of decorrelation. Under the conditions such as decorrelation, the subjects answered the vertical direction and sound image width of the kick, snare, and hi-hat. As a result of the subjective test, decorrelation seem no effective to the vertical sound image width.

From the result of the measurement of the dummy head, it was shown that a new notch due to interference was generated and notches due to some HRTFs were lost in the comparison between 1-channel reproduction and 2-channel reproduction without processing. Then, it was observed that notches caused by correlation signal interference were filled in the decorrelation. It is necessary to consider whether such notch smoothing can reduce differences in individual differences due to HRTF.

要旨

笠原 眞由
フルート演奏音のフルート演奏者および非フルート演奏者による音色評価

フルートを演奏するときに音色を変化させる手段として、倍音量(基音に対する倍音のエネルギー)を増減させる方法がよく用いられる。筆者が以前に行った研究では、倍音量を変化させたフルート演奏音の明るさについての印象がフルート演奏者と非フルート演奏者で異なることがあった。この研究では、「明るい」というただ1つの言葉を用いて調べる手法と、言葉を使わずに刺激同士の非類似度を評価させ、そこから音色空間を構成する手法を用いた。そこで本研究では、同じ刺激について複数の言葉を用いて多次元的に検討する方法を採用した。また、フルート演奏者の意図する明るさはいかなるものか調べるため、明るさおよびシャープさが変化するように吹き分けを行ったフルート演奏音を刺激とし、2つの実験を行った。

倍音量を変化させたフルート演奏音を複数の言葉で評価する実験では、因子分析の結果、明るさ・柔らかさ因子と、美的・叙情的および量的・空間的因子の2因子が見出された。9つの評価尺度がどちらの因子と関係しているかについては、フルート演奏者と非フルート演奏者の間でいくつかの違いが見られた。因子1には倍音量を表す音響特徴量であるHFRが、因子2にはノイズ成分のレベルが対応することがわかった。しかし、筆者の以前の研究で求めた非類似度判断による空間布置と比べてノイズレベルとの対応は弱いものであった。

明るさおよびシャープさを変化させたフルート演奏者については、まず、シェッフェの一対比較法により明るさ、シャープさおよび非類似度を判断させる実験を行った。明るさを変化させた刺激(刺激群b)は、刺激のスペクトル重心が高い値であるほど明るく、シャープであると評価された。シャープさを変化させた刺激(刺激群)では、刺激の立ち上がりの時間(RiseTime)が短いほど明るく、シャープであるとされた。この実験では、グループ平均の結果ではフルート演奏者と非フルート演奏者で差異は見られなかった。得られた非類似度から2次元の布置を求めたところ、この音色空間の各次元は、刺激群bではHFRとエネルギーの中央値に、刺激群sではHFRとノイズレベルに対応した。これについても、フルート演奏者と非フルート演奏者に違いはなかった。

次に、明るさおよびシャープさを変化させたフルート演奏音についても複数の言葉で評価させる実験を行った。倍音量を変化させたフルート演奏音を用いた実験と同様に、明るさ・柔らかさ因子と美的・叙情的および量的・空間的因子の2因子が見出された。この実験においても、各尺度と因子の関係についてはフルート演奏者と非フルート演奏者でいくつかの違いがあった。各因子は、刺激群bでHFRとノイズレベルに、刺激群sではRiseTimeとノイズレベルに対応した。ただし、因子2とノイズレベルの関係は、非フルート演奏者のグループによる刺激群sの評価を除いて、これらの相関は中程度であった。

これらの結果により、明るさおよびシャープさを変化させた刺激についての明るさ、シャープさの評価および刺激同士の差異はスペクトル重心やHFRで表される倍音の量と、刺激の立ち上がり時間(RiseTime)に影響されると言える。倍音の量とRiseTimeは関連のある音響特徴量だが、これらの相関が低いときにはRiseTimeが重視された。

本研究ではフルート演奏者による明るさの評価と物理量の関係が以前の研究とは異なる結果となったが、フルート演奏者がスペクトル重心やRiseTime以外の音響特徴を聞いて評価しているためであることが示唆された。


KASAHARA Mayu
Evaluation of Flute Timbres by Flute Players and Non-Flute Players

Flute players often increase or decrease the harmonics energy level (the total energy of the harmonics over the fundamental) in order to vary the timbre. In the author’s former study, the evaluation of “brightness” of the flute timbres of which harmonics energy level was controlled by players sometimes differed between flute players and non-flute players. In the above research, a method of pairwise comparison of,stimuli on the “brightness” attribute and a method that constructs a timbre space from dissimilarity between stimuli evaluated without using any verbal attributes were adopted. Therefore, in this study, the author took the method that constructs a timbre space from examining the same stimuli as the above study in multiple verbal attributes. In addition, in order to investigate what the flute player’s intended brightness is, two experiments were carried out with the flute timbres which had been played to vary their brightness and sharpness as stimuli.

In the experiment that had participants evaluate the flute timbres of which harmonics energy level was controlled in multiple verbal attributes, the factor analysis revealed two factors that were interpreted as the “brightness and softness” factor and “aesthetic/lyrical and mass/spatial” factor. There were some differences between flute players and non-flute players regarding which factors the attributes are loaded from. Factor 1 corresponds to HFR, which is an acoustic feature that represents harmonics energy level, and factor 2 corresponds to the level of noise components. However, the correspondence with the noise level was weaker than that at timbre space based on the dissimilarity judgment obtained in the author’s former research.

With the flute timbres of which brightness and sharpness were controlled, first, an exper- iment conducted that had participants evaluate the brightness, sharpness, and dissimilarity using the Scheffe’s pairwise comparison method. As a result, the stimuli of which bright- ness was controlled (stimuli group b) were evaluated as brighter and sharper as the spectral centroid of the stimulus was higher. The stimuli of which sharpness was controlled (stimuli groups) were evaluated as brighter and sharper as the RiseTime of the stimulus was shorter. In this experiment, the participant-group average results showed no difference between flute players and non-flute players.

A two-dimensional configurations were obtained from the dissimilarities. The dimensions of the timbre space corresponded to the HFR and median value of energy in stimuli group b, and to HFR and the noise level in stimuli groups. There was no difference between flute players and non-flute players.

The experiment using multiple verbal attributes was also carried on the stimuli of which brightness and sharpness were controlled. Similar to the experiment using the flute timbre of which harmonics energy level controlled, two factors were found: “brightness and softness” factor and “aesthetic/lyrical and mass/spatial” factor. Also in this experiment, there were some differences between flute players and non-flute players regarding the relationship be- tween factors and attributes. Factor 1 corresponds to HFR for stimuli group b and RiseTime for stimuli groups and factor 2 corresponds to the level of noise components. However, the relationship between factor 2 and the noise level was moderate, except for the evaluation on stimuli group s by a group of non-flute players.

It is revealed from these results that the evaluation on brightness, sharpness, and dissim- ilarity of flute timbre of which brightness and sharpness were controlled are influenced by the spectral centroid and HFR, which represent harmonics energy level, and RiseTime of the stimuli. However, when the correlation between harmonics energy level and RiseTime is low, participants have seemed to emphasis RiseTime.

In this study, the relationship between the evaluation of brightness by the flute players and acoustic features was different from the previous study. The possibility is suggested that the flute players evaluated stimuli based on acoustic features other than the spectral centroid and RiseTime.

要旨

長島 千尋
頭部伝達関数の個人差の考慮の有無が音色の知覚に与える影響について

「バイノーラル再生方式」は、聴取者の耳に入る音の音響的特徴を捉え、聴取者の耳の入り口で再生することによって、ヘッドフォン再生であっても立体的、臨場感のある音を再現することができる再生方式の一つである。過去の研究によって、頭部伝達関数(HRTF)の個人差の考慮の有無が、音像定位の知覚に影響を及ぼすことが明らかにされてきた。本論は、聴取者本人のHRTFと、本人のものでないHRTFを畳み込んだトランペット、ヴァイオリン、声楽(ソプラノ)、シロフォンの4種類の楽器の、残響など空間情報を含んだ音源を刺激として用いた2つの主観評価実験を9人の被験者に対して行ない、HRTFの個人差の考慮の有無が音色にどのような影響を与えているのかについて明らかにすることを目的とする。

主観評価実験(1)は、被験者本人のHRTFを含む9種類のHRTFを反映させた音源の非類似度を楽器ごとに11段階で回答し、また質問紙調査を通して、音色の類似点、または相違点に対してどのような評価語が用いられているのかについての調査を行なった。主観評価実験(1)の結果、HRTFの個人差によって生じる音色の違いを被験者は様々な評価尺度、評価語を用いて認識していることがわかった。また、複数の評価尺度に基づいた総合的な判断によって音色の違いを認識しているということが明らかになった。

主観評価実験(1)では被験者それぞれが別の評価語を用いて評価を行なっていたため、被験者間の結果の比較を行うことができない。そこで、主観評価実験(1)の実験を元に音色の比較によく使用されていた評価語を評価尺度ごとに抽出し、主観評価実験(2)では被験者全員が同じ11種類の評価語を用いて、7段階の評価を行なった。主観評価実験(2)の結果、トランペットの音色は、金属因子がHRTFの個人化の有無における音色の違いの評価の基準となっている被験者が多い傾向にあり、トランペットの音色は、本人のHRTFを使用した音源は鈍く、広い音であると判断される傾向がみられた。また、HRTFの個人化の有無はトランペットの音色の好ましさには影響を与えないことが示唆された。ヴァイオリンの音色は、金属因子がHRTFの個人化の有無における音色の違いの評価の基準となっている被験者が多い傾向にあり、本人のHRTFを使用した音源は固く、ぼんやりとした音であると判断される傾向がみられた。また、HRTFの個人差の有無はヴァイオリンの音色の滑らかさには影響を与えないことが示唆された。ソプラノの音色は、本人のHRTFを使用した音源は自然な音であると評価される傾向があった。また、HRTFの個人化の有無はソプラノの音色の鋭さには影響を与えないことがわかった。シロフォンの音色は、評価の基準となっている因子にはばらつきがあり、本人のHRTFを使用した音源は鈍く、軽い音であると判断される傾向がみられた。また、HRTFの個人化の有無はシロフォンの音色の明るさには影響を与えないことがわかった。

また、分散分析を行なった結果、HRTFの個人差の考慮の有無が、楽器の種類によらず「滑らかさ」「好ましさ」に影響を与えることがわかった。しかし、音色の非類似度の判断に寄与している音響特徴量を見つけることはできなかった。

実験の結果、HRTFの個人差の考慮の有無が「滑らかさ」「好ましさ」に影響を与えていることが明らかになった。今回は従来のHRTF測定方法に比べて、無響室ではなく響きのある音響スタジオで測定を行ない、また測定した再生音源方向の数も少ない簡易的な測定方法であったが、音の「滑らかさ」「好ましさ」において個人化HRTFの個人差の考慮が必要であることが示唆された。また、主観評価実験(1)の結果より、音色の判断の基準となっている評価語や評価尺度は人それぞれ異なり、また複数の評価語、評価尺度を用いた複雑かつ総合的な分析の元に音色の判断が行われていることが明らかになったことから、それぞれの音色の評価において判断の基準となっていた物理特徴量は異なる可能性があり、HRTFの個人差によって生じた物理特徴量の違いの中でも、具体的にどの部分の違いを聴いて音色の違いを判断していたかについては、個人差を考慮したより詳しい調査が必要であることが明らかになった。


NAGASHIMA Chihiro

Binaural reproduction is a technique that captures the acoustic characteristics of the sound at the entrance of the listener’s ears and reproduces them to reproduce three-dimensional and realistic sounds. Previous studies have shown that individual differences in head-related transfer functions (HRTF) influence of sound localization.

In this paper, two subjective evaluation experiments were conducted on 9 subjects. Four types of instruments sound were used as stimuli: trumpet, violin, vocal (soprano), and xylophone. They were convolved with individualized and non-individualized HRTF and included spatial information such as the reverberation. The purpose of this experiment is to clarify how the individual differences in HRTFs influence the timbre.

In experiment (1), participants were asked to answer the similarity in an 11-point scale between stimuli which reflected 9 types of HRTFs, including their own HRTF. In addition, through a questionnaire, I investigated what evaluation words were used to describe timbre similarities.

As a result of the experiment (1), it was found that the subjects could recognize the timbre differences caused by individual differences in HRTF using various evaluation scales and evaluation terms. Moreover, it became clear that the difference of a timbre was recognized by the overall judgment based on multiple evaluation scales. In the subjective evaluation experiment (1), each subject performed an evaluation using different evaluation terms, so the results cannot be compared between subjects. Therefore, based on the experiment (1), I extracted the 11 evaluation terms that were which were used frequently for timbre comparison.

In the subjective evaluation experiment (2), all the subjects evaluated on a 7-point scale using the same evaluation terms. With 9 HRTFs and 4 types of instrument sounds, a total of 36 sound stimuli were used.

As a result of the experiment (2), the timbre of trumpet tends to be evaluated based on the luminance factor. It seems that the sound stimuli using the individualized HRTF is “dull,” and “wide.” The timbre of violin tends to be evaluated based on the luminance factors. It seems that the sound stimuli using the individualized HRTF are “hard,” and “vague.” It was suggested that individualized or non-individualized HRTFs did not influence the smoothness of the timbre of violin. The timbre of soprano tended to be judged as a natural sound using the individualized HRTFs. It was also found that the individualization of HRTF does not influence the sharpness of soprano timbre. The timbre of xylophone tended to be evaluated based on many factors. It seems that the sound stimuli using the individualized HRTF are “dull,” and “light.” It was also found that the individualization of HRTF does not influence the brightness of xylophone timbre.

In addition, as a result of the analysis of variance, it was found that whether or not to consider individual differences in HRTF influence “smoothness” and “preference” regardless of the type of instrument. However, the acoustic feature quantity related to the determination of the timbre similarity cannot be found.

As a result of experiments, whether or not to consider individual differences in the HRTF has an effect on “smoothness” and “preference.” Therefore, it was suggested that even with a simple measurement method, it is necessary to consider individual differences in the HRTF. In addition, from the results of the experiment, It became clear that the evaluation terms and scales that are the criteria for timbre are different for each person, and multiple terms and scales are used based on complex and overall analysis. Therefore, the audio parameter that was used as a criterion in the evaluation of each timbre may differ. More specific investigations are needed to determine which acoustic feature quantity was used to determine differences in timbre, taking into account individual differences.