【Praat】ピッチカーブについて

目次

【Praat】ピッチカーブについて

 「あめ」を、「あ」が高く「め」が低く発音されると”雨”になり、「あ」が低く「め」が高く発音されると”飴”になるように、同じ音であっても音の高さが違うことで語の意味が変わるのが日本語です。この音の高さは音声学ではピッチ(pitch)と呼ばれ、時間の経過とともに変化する音の高さをピッチカーブ、もしくはピッチコンター(pitch contour)と呼びます。
 日本語はピッチ(音の相対的な高低)によって語の意味が弁別されるピッチアクセントの言語ですが、特段正確に言及する必要がない場合は、音の高さの違いを「ピッチ」という言い方を用いずに単に「アクセントが違う」と表現することがあります。また、一般には「イントネーションが違う」と表現されることもありますが、イントネーションは文単位の音の高さの変化を指すものであり、専門的には誤りです。

ピッチカーブの表示

 Objectsウィンドウで任意の音声ファイル(ここでは「飴2.wav」を使用)を選択して[View & Edit]をクリックすると SoundEditorウィンドウが表示され、画面下部にスペクトログラムが表示されます。表示されていない場合は、[Spectrogram]-[Show spectrogram]で表示可能です。

 スペクトログラム上に描かれた青い点がその時点におけるピッチで、それを繋ぐ青い線がピッチカーブです。もしピッチカーブが表示されていない場合は、[Pitch]-[Show pitch]から表示させられます。上の画像において、スペクトログラムの右側に書かれている青字の 800Hz、50Hz という数値は表示可能なピッチ範囲と上限と下限で、その中間に表示されている赤字の 128.8Hz は選択場所のピッチの値です。ドラッグで選択範囲を広げるとその平均ピッチが表示されます。

 上のピッチカーブを見ると前半は低く、後半は高くなっています。この音声は”飴”と発音しており、「あ」が低く、「め」が高く発音されていることが視覚的に分かります。

ピッチカーブの設定

 [Pitch]メニューを開くといくつかのピッチ解析法が並んでいて、そのうち[Pitch analysis method is filtered autocorrelation]が初期設定であり、その左側に☑が入っているはずです。ピッチ解析法を変更するとピッチカーブが変化しますが、ここは私自身も違いがよく分かっていないので、とりあえず一番上の初期設定[Pitch analysis method is filtered autocorrelation]のままにしておきます。

 ピッチカーブの設定は、その下にある[Pitch settings]からできます。初期設定のピッチ解析法が[Pitch analysis method is filtered autocorrelation]なので、すぐその下にある[Pitch settings(filtered autocorrelation)…]をクリックしましょう。

 [Pitch floor and top (Hz)]では、ピッチ範囲(ピッチの下限と上限)を変更できます。初期設定は 50.0~800.0Hz になっています。ピッチは話者によってピッチ範囲が異なるので、話者に合わせた範囲に設定したほうがいいです。Praatの取説(ここ)によると、平均的な男性の低めの声の場合は 50~600Hz、平均的な女性の高めの声の場合は 100~800Hz に設定するのが適切かもしれないと示されています。実際には 50~800Hz に設定することでほとんどの声に対応できますが、子どもの叫び声だと 2000Hz に達したり、がらがら声だと 30Hz まで下がることもあるそうなので、状況に合わせて設定を変更したほうがよさそうです。ピッチの設定はF0(第0フォルマント)の変化を捉えるために必要です。

 [Unit]のところでは、ピッチを分析するときの単位が変更できます。普通はヘルツ(Hz)で分析されますが、それ以外の単位を用いたい場合はここで変更します。

 [View range(units)]はピッチ解析範囲をそのままにして表示範囲だけ変えるときに使います。初期値は下限値も上限値も「0.0 (= auto)」ですが、もしピッチカーブの値がある範囲に集中している場合は、その範囲を設定することでピッチカーブを拡大してみることができるようになります。

 たとえば、ここで使用した「飴2.wav」のピッチカーブの値は最も低くて 91.6 Hz、最も高くて 129.6Hz だったので、だいたいこの辺りを拡大してピッチカーブを見るために、[View range(units)]の下限値に 80、上限値に 150 を入力してみます。すると上の画像の右側のようにピッチカーブがよりはっきり見ることができます。

ピッチカーブの値を調べる

 スペクトログラム上の選択位置におけるピッチの値(Hz)はスペクトログラムの右側に赤字として表示されますが、より正確な値を調べたい場合は[Pitch]メニューから操作可能です。

 ここでは[Pitch listing][Get pitch][Get minimum pitch][Get maximum pitch][Move cursor to minimum pitch][Move cursor to maximum pitch]について見ていきます。

[Pitch listing]

 [Pitch listing]をクリックすると、時間(Time_s)と基本周波数(F0_Hz:第0フォルマント)を見出しとして、その下に選択位置における時間と基本周波数が表示されます。範囲選択すると、その範囲内における時間と基本周波数がずらっと並びます。ピッチの値が不明な場合は「–undefined–」と表示されます。

[Get pitch]

 [Get pitch]は選択位置におけるピッチの値を表示します。範囲選択した場合は、選択範囲のピッチ値の平均を表示します。この操作は F5キー でも可能です。

[Get minimum pitch]と[Get maximum pitch]

 [Get minimum pitch]と[Get maximum pitch]は範囲選択された部分のピッチの最低値と最高値を表示します。範囲選択されていないと使用できません。ここで使用した「飴2.wav」においては、[Get minimum pitch]で「91.58893608145138 Hz (minimum pitch in SELECTION)」、[Get maximum pitch]で「129.55435212627367 Hz (maximum pitch in SELECTION)」と表示されます。

[Move cursor to minimum pitch]と[Move cursor to maximum pitch]

 [Move cursor to minimum pitch]と[Move cursor to maximum pitch]は範囲選択された部分における最低値と最高値にカーソルを移動させる操作です。「飴2.wav」を全体的に範囲選択して[Move cursor to maximum pitch]の操作を行うと、選択位置が上の画像のように 129.4Hz のところに移動します。

ピッチカーブを描画する

 論文などに使うためにピッチカーブを画像化したい場合は、ピッチカーブを Pictureウィンドウに描画するといいです。

 [Pitch]-[Draw visible pitch contour…]を選びます。

 設定画面が出てきますが、とりあえず初期値でいいので[OK]。

 すると Pictureウィンドウにピッチカーブが描画されます。ピンクで選択しながら Ctrl+C を押すとコピー可能です。それをペイントソフトに貼り付けて保存したり、Wordに張り付けたりすればおk。結果はこんな感じになります。

 縦の 0.657701812 は「飴2.wav」における 0.658秒 の位置を表します。 SoundEditorウィンドウ上で選択した位置が Pictureウィンドウにおける描画にも縦線で現れます。

 もし時間と縦線を表示させたくない場合は、さっきの設定画面にあった[Draw selection times]と[Draw selection hairs]のチェックを消すといいです。




コメント

コメントする

目次