こんにちは、おゆひよこ(@oyu_sound)です!
この記事では、主要なSNSと音楽配信サービスの音声圧縮仕様(サンプリングレート/ビット深度/ラウドネスノーマライゼーション)についてまとめています
アップロードされた楽曲は各プラットフォームによって自動で圧縮されるため、オリジナルの音声と異なる可能性があるんですよね・・・
また、ダウンロードサイトやプラットフォームの仕様で音源の高音域がカットオフされる場合もあるので、楽曲制作の際のリファレンス曲として利用する場合には注意が必要です!
記載している情報は各プラットフォームの音声仕様についてのページを参照してまとめています。最新の情報につきましては公式サイトにてご確認をお願いいたします
【用語解説】サンプリングレート/ビット深度/ラウドネスノーマライゼーションとは
- サンプリングレート・・・音声をデジタル信号に変換する際に、1秒間に取得するサンプルの数を示す数値のこと
- ビット深度・・・音声データの精度を表す指標のひとつで、ビット数が多いほどより高精度なデータが得られる
- ラウドネスノーマライゼーション・・・音声のボリュームを調整することで、異なる音源間で同じ音量になるように調整する処理のこと
- ラウドネス・・・人間が耳で感じる音の大きさのこと
- LUFS(Loudness Units Full Scale)・・・音声のラウドネスを測定するための単位。音声を測定して平均ラウドネスを計算し、音圧レベル(dB)として表す
- コーデック・・・動画のエンコード(圧縮・変換)、デコード(復元)を行うプログラムのこと
一般的には、以下の音声仕様が推奨されていることが多いです
- サンプリングレート:44.1 kHz
- ビット深度:16 bit
- ラウドネスノーマライゼーション:-16 LUFS から -14 LUFS
ただし、各プラットフォームによって異なる場合があるので、楽曲をアップロードする際には公式ガイドラインを確認することをおすすめします(ちなみに、CD規格は16 bit / 44.1 kHzです)
SNSや音楽配信サービスで推奨される音声設定まとめ
主要なSNSや音楽配信サービスで推奨されている音声設定についてまとめています。楽曲をアップロードするときの参考にしてみてください
可能な限り正確な情報を記載するように心がけていますが、もし間違いがあった場合にはご指摘いただけると幸いです!
高音域のカットオフについて
各プラットフォーム、またはダウンロードサイトの仕様によって高音域にカットオフが入ることがあります
人の可聴域は一般的に「20 Hz から 20000 Hz」と言われていて、年齢を重ねるごとに聞き取れる高音はだんだんと低くなっていきます
ひとつの境目である16000 Hzは「20代よりも若い方でないと聞き取ることは難しい」とされているので、ほとんどのケースにおいては高音域にカットオフが入っても楽曲のクオリティが大きく劣化することはないように思います
ただし、「YouTubeやニコニコ動画から音源をダウンロードして楽曲制作の際のリファレンス曲(お手本)として利用する」といった場合には注意が必要です
間違っても僕のように『どの楽曲も16000 Hzから高音がカットされてる!プロはこういう手法を使っているんだ!(EQで16000 Hz以降の音を全カット)」なんてことをしないように・・・
※高音域がどの周波数帯からカットされているかについては、各プラットフォーム上で音声を再生し、Chromeの追加機能「Audio Analyser Extension」を利用して確認しています
YouTube
- コーデック:FLAC / リニアPCM
- サンプリングレート:44.1 kHz(48 kHzや96 kHzなども使用可)
- ビット深度:24 bit
- ラウドネス規制:-13 LUFS から -15 LUFS
- 高音域カットオフ:20000 Hz~
圧縮音声を利用する場合は以下の仕様が推奨されています
- コーデック:AAC-LC
- サンプリングレート:44.1 kHz
- ビットレート:320 kbps以上(256 kbpsも可)

YouTubeでは、画面プレイヤー上で右クリック or アプリの設定から「統計情報」を表示すると音声の制限度合いを見ることができます

たとえば、上の画像の場合は「Volume / Normalized 100% / 73% (content loudness 2.7dB)」となっています
Volumeは、動画の左下にある、ユーザーが操作できるボリュームメーターの音量を指しています。音声レベルのチェック時には100%にしておきましょう
Normalizedは、オリジナルの音声に比べてどのぐらいのパーセンテージで再生されているかを示しています。今回のケースだと、オリジナルに対して73%の大きさで再生されていることを意味します
content loudnessは、動画の音声が基準値に対してどのぐらいオーバーしているかを表します(今回のケースだと2.7dBオーバー)。もし基準値以下であれば「Volume / Normalized 100% / 100% (content loudness -1.0dB)」のようにマイナスで表記されます
参考:https://support.google.com/youtube/answer/6039860?hl=ja
ニコニコ動画
- 音声コーデック:AAC-LC
- サンプリングレート:48 kHz
- ビットレート:192 kbps
- ラウドネス規制:-15 LUFS(2020年1月29日に導入。設定からラウドネスのオンオフ切り替えが可能)
- 高音域カットオフ:なし(たぶん)

参考:https://ch.nicovideo.jp/nicotalk/blomaga/ar1848078
- コーデック:AAC-LC
- サンプリングレート:44.1 kHz
- ビット深度:16 bit
- ビットレート:最小128 kbps
- ラウドネス規制:なし
- 高音域カットオフ:約16000 Hz~

参考:https://developer.twitter.com/ja/docs/media/upload-media/uploading-media/media-best-practices
- コーデック:AAC-LC
- サンプリングレート: 44.1 kHz
- ビット深度:16 bit
- ビットレート:128 kbps
- ラウドネス規制:-14 LUFS
- 高音域カットオフ:20000 Hz~

TikTok
- コーデック:AAC-LC
- サンプリングレート:44.1 kHz
- ビット深度:16 bit
- ビットレート:128 kbps
- ラウドネス規制:なし(ただし、コンプレッサーとリミッターを使用した方式により音声が圧縮されている模様)
- 高音域カットオフ:約16000 Hz~

参考:https://youtu.be/wW_YSO14dp0
SoundCloud
- コーデック:AAC-LC
- サンプリングレート:44.1 kHz / 48 kHz
- ビット深度:16 bit / 24 bit
- ビットレート:64 kbps から 384 kbps
- ラウドネス規制:-8 LUFS から -13 LUFS
- 高音域カットオフ:約16000 Hz~(ノーマルプランの場合)

note
- コーデック:MP3
- サンプリングレート:320 kbps
- ビット深度:16 bit
- ビットレート:128 kbps
- ラウドネス規制:不明
- 高音域カットオフ:20000 Hz~

Spotify
- コーデック:FLAC / WAV(FLAC形式を推奨)
- ラウドネス規制:-14 LUFS(プレミアムメンバーは、Loud : -11 LUFS / Normal : -14 LUFS / Quiet : -23 LUFSの3種類から選択が可能)
- 高音域カットオフ:約16000 Hz~(フリープランの場合)
Spotifyに送られたオーディオファイルは、音質オプションに合わせて次の配信形式にトランスコードされます
- Ogg/Vorbis (96、160、320 kbps)
- AAC (128、256 kbps)
- HE-AACv2 (24 kbps)

参考:https://artists.spotify.com/ja/help/article/audio-file-formats?plain、https://artists.spotify.com/help/article/loudness-normalization
Apple Music
- コーデック:PCM / ALAC / FLAC
- サンプリングレート:44.1 kHz から 192 kHz
- ビット深度:16 bit /24 bit
- ラウドネス規制:-9 LUFS から -13 LUFS
参考:https://help.apple.com/itc/videoaudioassetguide/#/itc5a739206b
まとめ
今回こうしてSNSや音楽配信サービスの音声仕様について調査してみて、まだまだ音に関して勉強不足であることを実感しました・・・
音楽クリエイターの端くれとは言え、音というものに向き合っている以上、こういった専門知識もつけていかないとなと思いました!精進します