エンジニアらしき人のひとりごと

100人中100人は興味を示さなくても、100万人居たら1人くらいは面白いと思ってくれそうな、重箱の隅をほじくってみるブログ。

PHSの音と3Gの音を比べてみた①

f:id:tokieng:20210111115013p:plain

はじめに

PHS(Personal Handy-phone System)という方式の携帯電話サービスが、令和3年(2021年)1月末に、終わろうとしています。
※「PHSは携帯電話とは別物」と語られることもありますが、PHSも携帯電話も「携帯できる電話」ということで、この記事ではひとくくりにします
※終了するのは公衆PHSサービスなだけで、自営PHSは引き続き使えるので、「PHSが終わる」ではなく「PHSの携帯電話サービスが終わる」と表現しています

PHSのメリットは「高音質」「(当時としては)高速通信」「低消費電力」「低コスト」など、いろいろありました。
ここでは「高音質」に的を絞って、PHSを記録したいと思います

PHSって

1995年にサービスを開始した、携帯電話サービスです。

おぉっと、26年前か…。

軽く当時の携帯電話事情を振り返ると、

  • スマートフォン(iPhone, Android)なんて影も形もない
  • i-mode, EZweb, J-Skyのようなインターネットサービスもまだ無い
  • メールサービスすらまだ無い
  • LTEFOMAcdmaOne方式での携帯電話サービスもまだ始まる前
  • ウサギの耳が11桁になるよりも前(参考:https://www.youtube.com/watch?v=PQEI-bfGz6g
  • NTTドコモが、1993年にデジタルムーバという愛称で、PDC方式によるサービスを開始したころ
  • ほかの各社も、PDC方式のサービスを提供開始したか、開始前くらい
  • PDC方式では、音声の伝送速度は11.2kbps(データ通信は9.6kbps)
  • 無線通信が大変混雑していたので、音声データを半減(5.6kbps)した「ハーフレート」も導入してた

という感じ。

ハーフレートなんて、人の声には遠すぎて、ほんとひどかったですね。
それだけ「外出中に電話したい」という需要が多くて、それを賄うだけの供給(無線通信の容量)が足りてない、という時代でした。

そしてPHSの「高音質」。PHSは音声データを32kbpsで伝送するので、当時のPDC方式と比べるとはるかに高音質でした。
なぜそんなことができたのかは、またいずれ…?

3Gとの音を比較したよ

そんなPHSの音質を他と比べてみました。
ただPHSとほぼ同期であるPDC方式は、2012年までに終了しているので、今回はPDCPHSとは比べることができず。
代わりに今回は、3G(W-CDMA)との比較を行いました。
ちなみにW-CDMAの登場は、2001年。PHSよりも6年後輩になります。

以下の構成で録音を行いました。

f:id:tokieng:20210103184120p:plain
録音の構成

MP3プレイヤーからの音を、電話回線を経由してパソコンで録音してみました。比較用に、MP3プレイヤーとパソコンを直接繋いだものも録音してます。

使用機材

iPhoneSE2、XPERIA XZ Premiumは、ともに4G&VoLTEに対応していますが、3Gで通話したいので、スマホ側でVoLTEを無効にした状態にしています。
ここでの3Gは、ソフトバンクの3G回線なので、つまりは W-CDMA ですね。

f:id:tokieng:20210110161834p:plain
3Gの機材(iPhoneSE2とXPERIA XZ Premium)
f:id:tokieng:20210110155047p:plain
PHSの機材(WX12K と イエデンワ2)
f:id:tokieng:20210110163117p:plain
変換ケーブル各種

それぞれの端末からは、3.5mmオーディオケーブルに変換するアダプターを使用しました。
USB⇔イヤホンマイクの変換ケーブルは、家電量販店とかでも入手できますが、マイク使用不可な製品もあるので、要注意です。
ちなみにイエデンワ2には、オーディオケーブルを接続する端子が無いので、受話器とつながる端子(RJ-9)に刺さるケーブルを自作しました。

①ナレーション編

動画を公開しています。

  • ナレーションのみ
  • ナレーション+小鳥のさえずり
  • ナレーション+滝の音
  • ナレーション+街の音

の4つのケースで、各々3つのパターンで録音したものを、順に再生します。
音源(MP3プレイヤーの音を録音したもの)
 ↓
3G(3G回線を経由した音を録音したもの)
 ↓
PHS(PHS回線を経由した音を以下略)

で、それぞれの「音の大きさ」と「周波数分布(どんな音が含まれているか)」が視覚的に捉えられるように、グラフを撮影しました。
 再生できなかったら、こちら↓
 【音量調整版】PHSとケータイの音質比較 ①ナレーション編 - ニコニコ動画

とりあえず、一通り聞いてみてくださいな。
ヘッドフォン推奨です。(音量に気を付けてください)

今回の音声データは、以下のものを利用させていただきました。

  • 効果音ラボ

soundeffect-lab.info

vsq.co.jp


以上終了。

なのですが、ここからは、「音」の知識ゼロな私による、個人の感想が並びますw

まずはナレーションのみで比較

動画を聞いたところ、
音源は、すごくはっきり聞こえて、丁寧に収録されたんだなぁと感じます。
3Gの音は、声がこもったような、詰まったような感じで聞こえます。そしてなんか機械的な、人工的な感じがします。でも何をしゃべっているかは分かります。
そしてPHSの音は、イエデンワ2の都合なのかノイズが乗ってるものの、3Gよりも自然な感じに聞こえます。

グラフを見てみますか。
全体としては、こんな感じ。

f:id:tokieng:20210109152823p:plain
ナレーションのみ

音の大きさに関しては、そんなに差がなさそう?
ということで、周波数分布見てみます。

「本日は」の部分の周波数分布が、こちら。

f:id:tokieng:20210109160806p:plain
ナレーションのみ(「本日は」の周波数分布)

音源は、8kHzを超えて、広い範囲の音が含まれています。

3Gは、だいたい4kHzより高い音がカットされてますね。
なぜ人工的な感じがするのかは、グラフからは私ちょっと掴めないなぁ。

そしてPHSも、だいたい4kHzより高い音がカットされています。
あと、全体的に青みがかかっているので、ノイズが乗ってるということも視覚的によく分かりますw
ちなみに、この画像の冒頭のノイズが少ない部分は、MP3プレイヤーで音を鳴らす前の状態です。

あと、なんとなく3Gのグラフでは、横に細長い赤い部分が、PHSと比べても若干太くて繊細さに欠けるような?

3GもPHSも、4kHzより高い音が失われていますが、これは私の環境の問題ではなく、各通信方式の仕様みたいです。
だいたい4kHzの音まで伝えることができれば、会話する人の声としてはOKっぽいらしい。

ちなみに固定電話のデジタル回線であるISDNでは、
 4kHzまでの音を伝える → サンプリング周波数8kHz
 データの細かさ→ 8bit
となっているそうです。つまり
 8bitのデータが8000個/秒 → 64kbps が必要
という計算になるので、ISDNの通信速度の基本が64kbpsだそうです。

ナレーション+小鳥のさえずり

ナレーションの音に、小鳥のさえずりを重ねたMP3データを作成して、試してみました。

(さっきと同じ動画ですが、途中から再生します)

3Gでも、小鳥のさえずりがよく聞こえます。が、人の声は、先ほどのに比べるとさらに音が詰まってるような、違和感があります。
PHSは、小鳥のさえずりも人の声も、高い音は出てないものの、割と自然に聞こえます。

全体のグラフは、こんな感じ。

f:id:tokieng:20210109162849p:plain
ナレーション+小鳥のさえずり

点が並んでいますが、これが小鳥のさえずりですね。
あと音源を見ると、0~1.5kHzの範囲に青い帯が見えます。屋外で収録したものなので、周辺の環境音ですね。
3Gでは、小鳥のさえずりはうまく再現できていますが、環境音はカットされてますね。
PHSでは、低周波の青みが濃くなっているので、環境音を含んでいることを表します。

で、「ありがとうございます」の部分を拡大しました。

f:id:tokieng:20210110111102p:plain
ナレーション+小鳥のさえずり(「ありがとうございます」の周波数分布)

違いが目立つ部分として、黄緑色で囲んだ箇所と、赤色で囲んだ箇所があるようです。
黄緑色は、ナレーションの音声の部分で、3Gは少し欠けている・薄くなっているように感じます。
赤色はさえずり部分で、3Gでは余韻の部分が欠けています。途切れた感じしましたよね。

ナレーション+滝の音

ナレーションの音に滝の音を重ねたMP3データを作成して、試してみました。

(これも、途中から再生します)

音源のものは、録音側PCの都合で、人の声にノイズが乗ってしまい、すごくザワザワした感じになってしまいました(MP3プレイヤーの音を直接聞くと、そんなことないんですけどねぇ)
うちのPC、ホワイトノイズのような音は、苦手なのかも。

3Gでは、滝の音が見事に消えています。冒頭2秒くらいは聞こえましたが、その後はノイズキャンセリングが働いたかのような、消え具合。その影響か、人の声は、こもった感じがします。
PHSは、相変わらずノイズ乗ってますが、滝の感じも聞こえてきます。人の声も、違和感なく聞ける気がします。

全体のグラフは、こんな感じ。

f:id:tokieng:20210110112105p:plain
ナレーション+滝の音

音源のグラフは、全体的に青色が広がってます。滝の音って、いろんな周波数の音を含んでいるのですね。
3Gは、差が歴然。最初の数秒間は滝の音っぽいものが聞こえますが、すぐにスーッと滝の音が消えてますね。そして、音がさらに詰まってる印象です。
PHSは、滝の音は伝えることができる感じですね。ノイズ乗りまくってるので、滝の音なのかノイズなのか、区別しづらいですがw

「本日は」の部分を拡大しました。

f:id:tokieng:20210110112900p:plain
ナレーション+滝の音(「本日は」の周波数分布)

さらに「ナレーションのみ」と比較してみましょうか。

f:id:tokieng:20210110113805p:plain
左:ナレーションのみ。右:ナレーション+滝の音

3Gは、人の声の成分が欠けているのが分かりますね。
一方のPHSでは、滝の音だけでなく、人の声も含まれているように見えます。

これが、「3Gだと人の声が聞き取りづらい」という現象のような気がします。
3Gでは、滝の音を消すついでに、人の声も一部消えているようです。周りが騒がしい状況では、3Gでは人の声が聞き取りづらいのだと思います。

ナレーション+街の音

これも、ナレーションに加えて、街の音を重ねてみました。
よくあるシチュエーションですよね。

(これまでと同じ動画で、途中から再生します)

音源:車が通りすぎる音、クラクション、自転車のブレーキ。横断歩道の誘導メロディが鳴ってるの、かすかに聞こえるかも。人の声の後ろにある車の音も、よく聞こえます。
3G:見事に街の音が消えています。代償として、人の声もこもっていますね。
PHS:街の音が伝わってきます。「いま外出中です」ということが分かる感じ。横断歩道の誘導メロディも、聞こえるかも。クラクションは、4kHzより高い音なのでかすかに含まれる程度。さすがに自転車のブレーキは、全く含まれてないですね。人の声も、違和感ない感じ。

全体のグラフはこんな感じ。

f:id:tokieng:20210110152400p:plain
ナレーション+街の音

冒頭の街の音だけを拡大すると、こんな感じ。

f:id:tokieng:20210110152452p:plain
ナレーション+街の音の、冒頭部分

 黄緑色:車の通りすぎる音
 赤色:クラクション
 黄色:自転車のブレーキ
3Gにはいずれも全く含まれていないですが、PHSには車の走行音が確認できますし、クラクションもかすかに入ってますね。自転車のブレーキは7kHz付近なので、さすがのPHSでも全く含まれず。

「本日は」の部分を比較してみましょう。

f:id:tokieng:20210110153708p:plain
左:ナレーションのみ。右:ナレーション+街の音

3Gは、「滝の音」ほどひどくはありませんが、やはり原型が失われてる感じがしますね。
特に黄色と赤色で囲んだところ。3Gでは、「ナレーションのみ」とだいぶ違いがあるなぁという印象です。

まとめると

3Gは、「人の声」だけを伝えようとして、それ以外の音を消そうとしている。
なので周囲がうるさい状況では、相手の声は聞き取りづらそう。

PHSは、周囲の音を含めて「音」を伝えようとしていて、少なくとも自然に聞こえる。

という感じがします。

あと、ほかにも動画がありますが、その解説は別記事にて。
tokieng.hatenablog.com