発表

1A-047

続々・声色の罠:-高いのに低い声?-
― 声のピッチ感の錯覚と疑似歌声・疑似ささやき声による検討 ―

[責任発表者] 内田 照久:1
1:大学入試センター

  問 題 と 目 的
 発声器官を音響管と見なした場合,スペクトル周波数軸の伸長圧縮は声道長の制御に相当し,声の音色を系統的に変化させる。しかし,その声色の変化は,たとえ基本周波数(fo)パターンが同じであっても,スペクトル軸を伸長させると高い声の知覚印象を生起させ,縮小時は低い声と評価される。その認知的なバイアスは,foの高低関係と声の高さの印象評価を逆転させるレベルであり,そこではピッチ感の錯覚が生ずる(Uchida, 2018)。
 しかし,歌声では,foが音高としての支配的な役割を担っているのは明らかである。それをふまえて本研究では,foの変動幅の時間的な安定性に着目する。そして,スペクトル軸の操作に加えて,foの変動幅を操作した音声,また疑似歌声を生成して対比較実験を行う。さらに,foや調波構造を取り除いた疑似ささやき声での評価も行う。
 方 法
 音声データベースSRV-DBから,男女各4名が発話した8種類の原音声を使用した。スペクトル周波数軸の伸縮とfoの操作には,WORLD v0.2.0_7を用いた。foの高低とスペクトル軸の伸縮の関係が,声のピッチ感に対して,互いに逆向きの影響を与える組合せとなる音声比較対を設定した(Fig.1)。
 スペクトル軸の伸縮 原音声の平滑化スペクトルの周波数軸を1.111(1/0.9)倍,0.9倍の2段階に変換した。スペクトルの対数パワーを変換し,帯域上限は16kHzに制限した。
 foの昇降 foの操作は,音高知覚と対応するmel尺度上で行った。そして,後述のfo変動幅の実験条件ごとに,それぞれの高低位置を±10melで昇降させた。
 (A)fo変動幅条件 fo軌跡のmel平均を中心軸とし,標準偏差(SD)を変動幅として操作した。その上で,(1) オリジナルの1.0倍,(2) ほぼフラットな0.02倍,(3) foを中心軸で高低を反転させた逆相fo軌跡(r.p.)での0.4倍を設定した。
 (B)疑似歌声条件 原音声のfoを音楽的音階に変換した。長調(Major)と短調(minor)を設定し,それぞれ上行(Ascending: Il-II-III-V-Ih),下行(Descending: Ih-V-III-II-Il)を配置した。比較対では,原音声のmel平均を±10melした高さを,各音階でのIV#に設定した。
 (C)疑似ささやき声条件 スペクトル軸を伸縮させた平滑化スペクトル包絡を用いて,駆動音源を雑音に変更し,さらに低域を減衰させた疑似ささやき声を生成した。
 手続き 東京都内の6つの国立大学の1年生140名(男:106名,女:34名: 18~23歳)が参加。参加者と音声対を10群に分割して配置。音声対の比較評価には,声の高さの印象評価を含む声質表現語の項目を用いた。
 携帯型CDプレーヤから,ステレオ・イヤホンで比較対を提示。参加者は,2つの声の話し方や印象について,項目ごとに,どちらの声がその項目にあてはまるかを,10段階で評定した。制限時間は60秒であった。
  結 果 と 考 察
 比較対の内,スペクトル軸を伸長,foを下降させた音声を評価音声,もう一方を対比音声とした。各項目の内容が,評価音声にあてはまるのが4.5~0.5点,対比音声が-4.5~-0.5点となるように換算した。そして,各音声対に割り当てられた参加者の項目別の評定値平均を,各対の項目ごとの評価指標とした。ここではピッチの評価を分析する。
 (A)fo変動幅 オリジナルの変動幅(1.0)とやや小さい逆相fo軌跡(r.p. 0.4)では,実際にはfoが低い評価音声の方が「高い」と評価されており,ピッチ感の錯覚が生じていた。しかし,foがフラットになると,今度は逆転してfoの高低と対応する評価に変わり,錯覚が消失した。
 (B)疑似歌声 1オクターブの変動範囲がある音声だが,先のfoがフラットな音声のように,foの高低と呼応する低めの評価がみられる。しかし,標準誤差を見ると他の条件よりも大きく,条件内でのバラツキがかなり大きかった。
 (C)疑似ささやき声 いずれの条件よりも,スペクトル軸を伸長した評価音声が高い声だと評価されていた。この条件ではfoが存在しないために,スペクトル重心の要因が,より直接ピッチ感に反映したと考えられる。
 文 献
Uchida,T. (2018). Acoust. Sci. & Tech., 39, 143-146.

キーワード
ピッチ/基本周波数/スペクトル重心


詳細検索