サンプリングレートとビット深度とは|録音の音質を決める2つの数値

2026.06.10
オーディオインターフェース

サンプリングレートとは、アナログの音を1秒あたり何回測って数値化するかを示す回数のことで、単位はHz(ヘルツ)です。ビット深度とは、その1回ごとに測った音の大きさ(振幅)を何段階の数値で表すかを示すビット数のことです。録音設定でよく見る「48kHz/24bit」という表記は、この2つの数値の組み合わせです。

サンプリングレートは時間方向の細かさ、ビット深度は振幅方向の細かさを担当し、役割が分かれています。結論から言えば、録音や配信で迷ったら48kHz/24bitが実務の定番です。数値は大きいほど良いというわけではなく、容量とパソコンの負荷とのトレードオフがあります。本記事では、Sound Picks編集部の現場経験をもとに、2つの数値の意味と、ナイキスト周波数・ダイナミックレンジといった数値の裏づけ、用途別の選び方までを順に整理します。

サンプリングレートとビット深度とは|2つの数値の役割

サンプリングレートとビット深度は、デジタル録音で別々の軸を受け持つ2つの数値です。サンプリングレートは「時間をどれだけ細かく区切って測るか」、ビット深度は「測った音の大きさをどれだけ細かい段階で表すか」を決めます。横軸(時間)と縦軸(振幅)を分担すると考えると整理しやすくなります。

図:サンプリングレート(時間軸)とビット深度(振幅軸)の役割分担
サンプリングレート=時間軸(横)
標本化(サンプリング)
1秒を細かく区切って音を測る回数。多いほど時間方向の波形をきめ細かく追える(例:48kHz=1秒48,000回)。
ビット深度=振幅軸(縦)
量子化(クオンタイズ)
測った音の大きさを何段階で表すか。多いほど小さな音から大きな音までの幅をきめ細かく表せる(例:24bit=約1,677万段階)。
2つは別の軸を担当します。サンプリングレートが時間(横)の細かさ、ビット深度が振幅(縦)の細かさを決め、両方そろって録音の解像度になります。

サンプリングレートの1文定義(時間=横軸の細かさ)

サンプリングレートとは、連続して変化するアナログの音を、1秒あたり何回測って点(標本)に置き換えるかを示す回数です。この「音を点で測る」処理を標本化(サンプリング)と呼びます。回数が多いほど、時間方向の波形をきめ細かく追えます。

ビット深度の1文定義(振幅=縦軸の細かさ)

ビット深度とは、標本化で測った1点ごとの音の大きさ(振幅)を、何段階の数値で表すかを示すビット数です。測った値を決まった段階に丸める処理を量子化と呼びます。段階が多いほど、小さな音から大きな音までの幅をきめ細かく表せます。

標本化と量子化のイメージ(時間と振幅で分担する)

標本化は時間軸(横)を細かく区切る処理、量子化は振幅軸(縦)を細かく刻む処理です。サンプリングレートを上げると横方向の解像度が、ビット深度を上げると縦方向の解像度が高まります。両者は別の軸を担うため、どちらか一方だけでは音の素性は決まりません。

サンプリングレートとは|標本化とナイキスト周波数

サンプリングレートとは、1秒あたりの標本化回数を表す数値で、48kHzなら1秒間に48,000回測ることを意味します。録音できる音の高さの上限は、このサンプリングレートの半分(ナイキスト周波数)までと決まっています。代表的なレートには44.1kHz・48kHz・96kHz・192kHzがあります。

サンプリングレート=1秒あたりの標本化回数[Hz]

サンプリングレートは、Hz(ヘルツ)またはkHz(キロヘルツ、1kHz=1,000Hz)で表します。44.1kHzは1秒あたり44,100回、48kHzは48,000回、96kHzは96,000回、音を測っているという意味です。回数が多いほど時間方向の波形を細かく記録できますが、後述するように記録するデータ量も増えます。

ナイキスト周波数(サンプリング周波数の1/2)

ナイキスト周波数とは、あるサンプリングレートで正しく記録できる音の高さの上限で、サンプリング周波数のちょうど1/2にあたります。たとえば44.1kHzなら上限は22.05kHz、48kHzなら24kHzです。人の可聴域の上限はおおむね20kHzとされるため、それを十分にカバーするには40kHzを超えるサンプリングレートが必要になり、CDの44.1kHzはこの条件を満たすために選ばれた経緯があります。

代表的なレート:44.1kHz・48kHz・96kHz・192kHz

44.1kHzはCD(音楽CD)の規格として広く使われてきたレートです。48kHzは映像・放送・配信で標準とされ、DAT(デジタルオーディオテープ)でも採用されてきました。96kHzや192kHzはハイレゾ(ハイレゾリューションオーディオ)の領域で、より高いレートを用います。どのレートを選ぶかは、後述する用途しだいです。

ビット深度とは|量子化とダイナミックレンジ

ビット深度とは、1標本の振幅を何段階で表すかを示すビット数で、ダイナミックレンジ(扱える音の大小の幅)の目安に直結します。16bitは65,536段階、24bitは約1,677万段階で振幅を表します。理論上のダイナミックレンジは16bitで約96dB、24bitで約144dBが目安です。

図:ビット深度とダイナミックレンジの対応(理論値・6.02×bit+1.76)
ビット深度 振幅の段階数 ダイナミックレンジ(理論値) 主な使いどころ
16bit 65,536段階 約96dB 音楽CD・最終配布フォーマット
24bit 約1,677万段階 約144dB 録音・配信の定番(ヘッドルームに余裕)
32bit float 浮動小数点で表現 実用上クリップしにくい フィールド録音・レベルが読みにくい現場
ダイナミックレンジは「6.02×ビット深度+1.76(dB)」の理論値(16bitで約98dB、24bitで約146dB)。概算で16bit≈96dB・24bit≈144dB。実機の値は変換回路やノイズの影響で下回ります。

ビット深度=1標本の振幅の段階数(量子化)

ビット深度のビット数は、表せる段階数の指数になります。16bitは2の16乗で65,536段階、24bitは2の24乗で約1,677万段階です。段階が細かいほど、量子化で丸めるときの誤差(量子化ノイズ)が小さくなり、小さな音までクリアに扱えます。

ダイナミックレンジの目安(16bit≈96dB・24bit≈144dB)

ダイナミックレンジとは、扱える最小の音から最大の音までの幅をデシベル(dB)で表した値です。ビット深度から理論上のダイナミックレンジを求める一般式は「6.02×ビット深度+1.76(dB)」で、16bitなら約98dB、24bitなら約146dBと計算できます。実務では概算として16bit≈96dB、24bit≈144dBと押さえておけば十分です。これは理論値で、機材の実測値は変換回路やノイズの影響で下回ります。録音時に24bitが定番とされるのは、このダイナミックレンジの余裕(ヘッドルーム)が大きく、録音レベルの設定にゆとりが生まれるためです。

32bit floatとは|実用上クリップしにくい録音形式

32bit float(32ビット・フロート、浮動小数点)とは、振幅の値を浮動小数点形式で記録する方式で、実用上クリップ(音割れ)しにくいのが特長です。0dBFS(デジタルの上限)を超える信号も破綻しにくく記録でき、録音後にDAW(楽曲制作ソフト)でゲインを下げれば、上限を超えて見えた波形も復元できる場合があります。近年は、入力レベルの異なる2つのAD変換回路を組み合わせるデュアルADC構成のレコーダーが登場し、録音時のレベル合わせの失敗をカバーしやすくなりました。ただしクリップしにくいのはAD変換以降の話で、マイク自体やマイクプリの段で歪む可能性は残ります。ここはゲイン設計の話につながるため、詳しくは「ゲインステージングとは」の記事も参考にしてください。

編集部が屋外で予測しづらい音量の収録をした際も、32bit float対応のレコーダーで録っておいたことで、想定外に大きな音が来た箇所を後から救えています。一方で、別の収録ではマイク側で歪んでいて32bit floatでも救えなかった経験があり、入力段のレベル管理は依然として重要だと感じました。

数値が大きいほど良いわけではない|トレードオフ

サンプリングレートやビット深度は、大きくすればするほど良いというわけではありません。数値を上げるとファイル容量とパソコンの処理負荷が増え、扱いにくくなります。多くの現場では48kHz/24bitが実用上のバランス点として定番になっています。

容量とCPU負荷のトレードオフ

サンプリングレートを2倍にすればデータ量はおおむね2倍、ビット深度を上げればその分も増えます。容量が増えるとストレージを圧迫し、再生やミックス時のCPU負荷も上がります。トラック数が多い制作では、この負荷が処理落ち(音切れ)の原因になることもあり、闇雲に数値を上げるのは得策ではありません。

48kHz/24bitが実務の定番になりやすい理由

48kHzは映像・配信との相性がよく、24bitは録音レベルの設定に余裕を持てます。この組み合わせは音質と扱いやすさのバランスがよく、録音・配信の現場で定番になりやすいのが実情です。まず48kHz/24bitを基準に置き、必要に応じて上げ下げを検討するのが無難です。

ハイレゾ(96/192kHz)が生きる場面

96kHzや192kHzといった高いレートは、ピッチ変更やタイムストレッチなど編集での加工耐性を高めたい場合や、ハイレゾ配信・納品の要件がある場合に生きます。一方で、最終的にCDや一般的な配信に落とし込むなら、48kHzで録っても実用上の差は小さい場面が多いです。用途と納品先から逆算して選ぶのが現実的です。

用途別のおすすめ設定|録音・配信・映像・ハイレゾ

用途別の目安は、音楽CD制作が44.1kHz/16bit、配信・映像・放送が48kHz/24bit、ハイレゾ制作が96kHzまたは192kHz/24bitです。録音段階では16bitより24bitが扱いやすく、サンプリングレートは納品先に合わせて選ぶのが基本になります。

図:用途別の推奨設定(目安)
用途 サンプリングレート ビット深度 ポイント
音楽CD制作 44.1kHz 録音24bit→最終16bit CDは44.1kHz/16bitが規格
配信・映像・放送 48kHz 24bit 迷ったらこれ。映像と相性◎
ハイレゾ制作 96kHz / 192kHz 24bit以上 加工耐性・ハイレゾ納品向け
フィールド録音 48kHz〜 24bit / 32bit float レベルが読みにくいなら32bit floatが安心
あくまで一般的な目安です。最終的な納品先のフォーマット要件に合わせて選ぶのが基本になります。
オーディオインターフェース/ミキサーのつまみのクローズアップ
サンプリングレートとビット深度は、オーディオインターフェースやレコーダーの設定で選ぶ。まずは48kHz/24bitが扱いやすい。

用途別の推奨設定表

音楽CDを最終形にするなら44.1kHzが基準で、ビット深度は録音時24bit・最終CDで16bitという流れが一般的です。配信や映像作品は48kHzが標準で、録音は24bitで余裕を持たせます。ハイレゾ制作では96kHzや192kHzを使い、24bit以上で記録します。フィールド録音では、レベルが読みにくい現場ほど32bit float対応機が安心材料になります。

設定はどこで変える(インターフェース・DAW・レコーダー)

サンプリングレートやビット深度は、オーディオインターフェースの設定アプリ(コントロールパネル)、DAWのオーディオ設定、ハンディレコーダーの本体メニューなどで変更します。機材どうしでレートが食い違うとトラブルの元になるため、プロジェクト全体でレートを揃えるのが基本です。インターフェース側の基礎は「オーディオインターフェースとは」、操作は「オーディオインターフェースの使い方」、現場の録音機は「ハンディレコーダーおすすめ」も参考になります。

編集部が複数人で配信の収録を分担した際、各自の機材が44.1kHzと48kHzで混在していて、後の編集で同期に手間取ったことがあります。以降はプロジェクトを48kHzに統一すると最初に決めるようにしてからは、こうした取り違えが減りました。

よくある質問(FAQ)

Q1 サンプリングレートは高いほど音は良くなりますか?

一概には言えません。ナイキスト周波数の理屈どおり、48kHzでも可聴域(約20kHz)は十分カバーできます。96kHzや192kHzは編集の加工耐性やハイレゾ要件で生きますが、容量とCPU負荷が増えるため、用途に対して過剰なら48kHzで十分な場面が多いです。

Q2 24bitと32bit floatはどちらで録ればいいですか?

レベル管理ができる据え置き環境なら24bitで十分実用的です。屋外などレベルが読みにくい現場では、クリップに強い32bit float対応機が安心です。ただし32bit floatでもマイクやマイクプリの段で歪む可能性は残るため、入力段のレベル管理は引き続き重要です。

Q3 配信は何kHz/何bitが無難ですか?

48kHz/24bitが無難です。映像・配信プラットフォームとの相性がよく、録音レベルにも余裕が持てます。複数の機材やソフトを使う場合は、全体を48kHzに統一しておくと取り違えを防げます。

Q4 ハイレゾの96kHz/192kHzは必要ですか?

必須ではありません。ハイレゾ配信・納品の要件がある場合や、編集での加工耐性を高めたい場合に意味が出ます。最終的に一般的な配信やCDに落とすなら、48kHzや44.1kHzでも実用上の差は小さい場面が多いです。

Q5 後からサンプリングレートやビット深度を上げれば音は良くなりますか?

元の録音に含まれていない情報は、後から数値を上げても増えません。44.1kHzで録った音を96kHzに変換しても、記録されていない高域が生まれるわけではないのです。音質は録音時の設定とマイク・変換回路の質で決まる部分が大きいと考えてください。

まとめ

サンプリングレートとは1秒あたりの標本化回数(時間方向の細かさ)、ビット深度とは1標本の振幅の段階数(振幅方向の細かさ)で、2つで録音の解像度を決めます。ナイキスト周波数はサンプリング周波数の1/2(44.1kHz→22.05kHz)、ダイナミックレンジの理論値は16bit≈96dB・24bit≈144dBが目安です。数値は大きいほど良いわけではなく、容量・負荷とのトレードオフを踏まえ、用途から選ぶのが要点です。

  • サンプリングレート=1秒あたりの標本化回数[Hz]、ビット深度=1標本の振幅を表すビット数。時間と振幅で役割が分かれる
  • ナイキスト周波数はサンプリング周波数の1/2。44.1kHz→22.05kHz、48kHz→24kHz。可聴域約20kHzのカバーに40kHz超が必要だった
  • ダイナミックレンジの理論値は6.02×bit+1.76で、16bit≈96dB・24bit≈144dB。32bit floatは実用上クリップしにくいが入力段のクリップは別
  • 用途別の目安はCD=44.1kHz/16bit、配信・映像=48kHz/24bit、ハイレゾ=96 or 192kHz/24bit。迷ったら48kHz/24bitが定番

数値の意味と裏づけを押さえたら、機材側の設定はオーディオインターフェースの基礎・使い方、現場の録音機の選び方も合わせて確認すると、設定で迷いにくくなります。

関連リンク

関連記事