信頼区間とは?95%信頼区間の意味や計算式をわかりやすく解説

はじめに

統計を勉強すると必ず出てくるのが95%信頼区間です。

しかし、「95%信頼区間とは何を意味しているのか?」「1.96という数字はどこから出てくるのか?」
「実務ではどんな使い方ができるのか?」と疑問に感じる方も多いのではないでしょうか。

信頼区間は、単に平均値を求めるだけでなく、「その平均値がどのくらい信用できるのか」を示してくれる非常に重要な考え方です。製造業の品質管理、実験データの評価、アンケート分析、回帰分析など、幅広い場面で使われています。

この記事では、95%信頼区間の意味、計算式、Excelでの求め方、解釈時の注意点までわかりやすく解説します。

▼この記事のポイント
・95%信頼区間は、「求めた平均値がどのくらい信用できるか」を示す指標
・1.96という値の意味や、95%信頼区間の計算方法をわかりやすく解説
・品質管理、実験、アンケート、回帰分析など実務での活用場面も紹介

母集団と標本を振り返ろう

我々は統計解析を実施する際、無意識に「標本から母集団を推定する」といったことをやっています。

・母集団:本来知りたい全体の集まり
・標本:母集団から一部だけ取り出したデータ

例えば、工程から生産される部品全体の厚みを知りたい場合を考えてみましょう。
工程から部品の厚みデータを10個取得したとします。

このとき、

・母集団:工程から生産される部品全体
・標本:今回取得した部品10個

となります。ほぼ無限大の母集団から、一部(標本)の抜き取って分析に回していることを意識しましょう。

もう少し具体的なデータを用いて解釈します。
例えば、取得した10個の厚みデータが以下だったとします。

No厚み(mm)
19.98
210.01
310.05
49.96
510.08
610.02
79.99
810.04
910.00
1010.03

このデータの平均値は10.016mmです。

しかし、この値は必ずしも母集団全体の真の平均値を示しているわけではありません。

同じ工程から再び10個データを取り出して平均を求めると、

測定回数 測定値
1回目 10.016mm
2回目 9.992mm
3回目 10.031mm

のように、毎回少しずつ結果が変わります。
この「標本を取り直すたびに平均値が変わる」という事実が非常に重要です。

場合によっては真の平均値より小さく見積もってしまったり、逆に大きく見積もってしまったりすることがあります。

このようなばらつきを考慮して、「真の平均値はこの範囲にある可能性が高い」と幅を持って推定するのが信頼区間です。←この解釈が超重要!

✔ あわせて読みたい
母集団と標本とは?統計解析の基本概念をわかりやすく解説【統計基礎】

統計解析の超基本概念「母集団と標本」についてわかりやすく解説!(最初に読みたい)

95%信頼区間とは?

●95%信頼区間の定義

95%信頼区間は、平均値の周りに「真の平均値が含まれると考えられる範囲」を示したものです。

母平均の95%信頼区間は、以下の式で表されます。

x̄ ± t0.975, n-1 × s / √n

構成要素は以下の通りです。

記号 意味
標本平均
t0.975, n-1 自由度 (n-1) のt値(95%信頼区間なので両側2.5%ずつ)
s 標本標準偏差
n サンプル数
s / √n 標準誤差

ここで重要なのは、信頼区間の構成要素に「サンプル数」と「標準偏差」があるという点です。

つまり、

・サンプル数が多いほど推定精度が上がり、信頼区間は狭くなる
・データのばらつきが小さいほど推定精度が上がり、信頼区間は狭くなる

という特徴があります。

高い精度で区間推定したい場合は、”十分なサンプル数を確保”し、”ばらつきの少ないデータを取得”することが重要です。

●t値とは?

95%信頼区間の式に登場する (t_{0.975,n-1}) は、「t値」「t係数」「t分布の臨界値」などと呼ばれます。

95%信頼区間では、自由度 (n-1) の
t0.975, n-1
を使用し、両側2.5%ずつを除いた中央95%の範囲を表します。

このt値もサンプル数に依存します。

・nが大きいほど推定精度が高くなるため、t値は小さくなる
・nが少ないほど推定精度が低くなるため、t値は大きくなる

つまり、サンプル数が少ない場合は、その不確実さを反映して、信頼区間が広くなるように補正されているのです。

●1.96とは?

95%信頼区間を学ぶと、1.96という数字をよく見かけます。

これは、サンプル数が十分大きい場合に使われる正規分布の係数です。

x̄ ± 1.96 × s / √n

この1.96は、先ほどの「t値」や「t係数」において、サンプル数 n が無限大に近づいたときに使われる値です。正規分布では、平均値から±1.96標準偏差の範囲に約95%のデータが含まれます。

そのため、サンプル数が十分多い場合は、t値の代わりに1.96を使って近似できます。

90%信頼区間・99%信頼区間との違い

信頼区間は、95%だけでなく90%信頼区間や99%信頼区間も使われます。

同じデータを使っても、信頼度が異なると区間幅が変わります。
例えば、同じデータから得られた信頼区間が以下だったとします。

信頼区間 下限 上限 区間幅
90%信頼区間 9.98 10.04 0.06
95%信頼区間 9.97 10.05 0.08
99%信頼区間 9.95 10.07 0.12

見てわかるように、信頼度が高くなるほど区間幅は広くなります。

これは、「より高い確率で真値を含みたいなら、より広く推定する必要がある」という考え方によるものです。

一般的には95%信頼区間を使用するケースがほとんどですが、分析の結果が人命や大きな事故など重大な結果に影響するケースがある際は99%信頼区間で広く結果を見積もるケースがあります。
(医療機器や医薬品メーカーではよく使われます)

95%信頼区間の解釈で注意すべきこと

95%信頼区間で最も誤解されやすいのが、その意味です。

「95%信頼区間の中に95%の確率で真値が入る」と考える人が多いですが、厳密には少し違います。

正しい解釈は、

「同じ条件で標本抽出と信頼区間の計算を100回繰り返したとき、そのうち約95回は真値を含む区間になる」

というものです。

真値は固定された1つの値です。一方、信頼区間の方がデータによって変化します。
つまり、真値が動くのではなく、標本の取り方によって信頼区間の位置が変わるのです。

この考え方は統計の中でも非常に重要なので、しっかり理解しておきましょう。

信頼区間と有意差の関係

信頼区間は、有意差の有無を判断する際にも使えます。

例えば、2つの群の平均差の95%信頼区間を求めたとき、その区間に0が含まれていなければ、有意差があると判断できます。
→なぜかというと、バラつきも考慮しても平均値差が+(または-)であることが揺るがないからです。

逆に、95%信頼区間に0が含まれている場合は、有意差なしと判断されます。
このように、信頼区間は単に「範囲を示す」だけでなく、有意差の判定にも役立つ重要な指標です。
(有意差検定を行う場合はp値も理解しておきたいところです。末尾に関連記事リンクを用意しておきました。)

Excelで95%信頼区間を求める方法

この項では、Excelを用いてある平均値の95%信頼区間を求める方法を学んでいきましょう!
信頼区間を構成するそれぞれの要素について、どう求めればよいかまで丁寧に解説しています↓

ここでは、データがB2:B11に入力されている場合を考えて計算していきましょう。
サンプルデータがあるので、ダウンロードしてみてください

改めて、95%信頼区間の式は以下です

x̄ ± t0.975, n-1 × s / √n

それぞれの構成要素は以下のExcel関数で求められます。

・標本平均:X

Excel関数
=AVERAGE(B2:B11)
AVERAGE関数は、指定した範囲の平均値を求める関数です。
この例では、B2~B11までのデータの平均を計算します。

・標本標準偏差:s

Excel関数
=STDEV.S(B2:B11)
STDEV.S関数は、標本データの標準偏差を求める関数です。
この例では、B2~B11までのデータのばらつきを計算します。

・サンプル数:n

Excel関数
=COUNT(B2:B11)
COUNT関数は、数値が入力されているセルの個数を数える関数です。
この例では、B2~B11までのデータ数を求めます。

・t値:t 0.975,n-1

Excel関数
=T.INV.2T(0.05,COUNT(B2:B11)-1)
T.INV.2T関数は、両側検定におけるt値を求める関数です。
この例では、有意水準5%、自由度 n-1 の95%信頼区間に対応するt値を計算します。

・標準誤差:s/√nの部分

Excel関数
=STDEV.S(B2:B11)/SQRT(COUNT(B2:B11))
標準誤差を求める式です。
標本標準偏差をサンプル数の平方根で割ることで、平均値のばらつきを計算します。

95%信頼区間の下限は以下で求められます

Excel関数
=AVERAGE(B2:B11)-T.INV.2T(0.05,COUNT(B2:B11)-1)*STDEV.S(B2:B11)/SQRT(COUNT(B2:B11))
95%信頼区間の下限値を求める式です。
平均値から、「t値 × 標準誤差」を差し引くことで下限を計算します。

95%信頼区間の上限は以下で求められます

Excel関数
=AVERAGE(B2:B11)+T.INV.2T(0.05,COUNT(B2:B11)-1)*STDEV.S(B2:B11)/SQRT(COUNT(B2:B11))
95%信頼区間の上限値を求める式です。
平均値に、「t値 × 標準誤差」を加えることで上限を計算します。

まとめ

信頼区間とは、標本データから母集団の真の値を幅を持って推定するための方法です。

95%信頼区間では、標本平均の周囲に「真値を含む可能性が高い範囲」を示します。

また、信頼区間の幅はサンプル数やデータのばらつきによって変わります。

・サンプル数が多いほど信頼区間は狭くなる
・ばらつきが小さいほど信頼区間は狭くなる
・信頼度が高いほど信頼区間は広くなる

これらの特徴を理解しておくと、単なる平均値だけでなく、「その推定値がどれくらい信頼できるか」まで判断できるようになります。

統計解析や品質管理を行う上で、信頼区間は非常に重要な考え方なので、ぜひ使いこなせるようになりましょう。

また、信頼区間を求めるうえで、構成要素である「平均値」や「標準偏差」について改めてきちんと理解することも大切です。関連記事を確認して学びを深めていきましょう!

✔ あわせて読みたい
平均・分散・標準偏差とは?統計の基本指標をわかりやすく解説【統計基礎】

基本統計量_平均・分散・標準偏差の意味合いとExcelを用いた計算方法について解説!

✔ あわせて読みたい
【初心者向け】p値とは?0.05の意味を“現場目線”とExcelで直感理解する

統計的仮説検定で必ず出てくる「p値」についてわかりやすく解説!

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール