帰無仮説と対立仮説とは?コイン投げの例で統計検定を分かりやすく解説

はじめに

T検定、回帰分析、分散分析など、統計的手法を使うと必ずと言ってよいほど出てくるのが「p値」です。
皆さんは、「p値<0.05」かどうかだけを見ていませんか?
確かに、p値を見れば統計的に有意差があるかどうかを判断できます。

しかし、統計的仮説検定の考え方を理解したうえで結果を解釈することは非常に重要です。
なぜなら、p値が算出されるまでの流れを知ることで、

・なぜ有意差が出なかったのか
・この結果は本当に信頼できるのか
・サンプル数は十分だったのか

といったことまで考えられるようになるためです。そこで必ず理解しておきたい概念が、「帰無仮説」「対立仮説」です。

今回は、統計的仮説検定で重要となる帰無仮説と対立仮説について、コイン投げの例を使いながら分かりやすく解説します。

▼この記事のポイント
□ 帰無仮説とは「差がない」「変化がない」とする仮説
□ 対立仮説とは「差がある」「変化がある」とする仮説
□ 統計検定では、「差がない」を否定することで「差がある」を示す
□ p値が5%未満なら、帰無仮説を棄却する

帰無仮説と対立仮説はなぜ設定される?

統計的仮説検定では、必ず

・帰無仮説
・対立仮説

を設定します。

これは、統計的仮説検定の論理そのものに関係しています。
統計的仮説検定では、いきなり「差がある」「効果がある」と証明することはできません。

そこで、まずは「差がない」という仮説を置きます

そして、その仮説を前提にしたときに、今回得られた結果がどのくらい起こりにくいかを考えます。
もし、非常に起こりにくい結果が出た場合は、「差がない」という仮説が間違っていたと考えます。

つまり、「差がないことを否定することで、差があることを示す」という流れで判断するのです。

事例:偽物のコインをどう証明する?

ここで、分かりやすい例として「偽物のコイン」を考えてみます。

あなたが持っているコインが、本物か偽物かを証明したいとします。
本物のコインなら、表と裏は1/2ずつ出るはずです。

つまり、表と裏の確率が大きく偏っているなら、「偽物ではないか?」と考えられます。
実際に20回コイントスしてみると、以下の結果が得られます。

ケース 表の回数 裏の回数
ケース1 13回 7回
ケース2 10回 10回
ケース3 6回 14回

この時、ケース1とケース3には結果に偏りがあります。

しかし、これだけで「偽物だ!」と言うのは少し乱暴です。なぜなら、本物のコインでも多少のばらつきは起こるからです。そこで、帰無仮説と対立仮説を設定して、統計的に判断します。

1. 帰無仮説を設定する

まずは、証明したいことと逆の仮説を置きます。

今回は、「コインは本物である」という仮説を置きます。
これは、「コインの表と裏の確率は1/2である」と言っているのと同じです。

👉これが帰無仮説です

一方で、「コインは偽物である」つまり、「コインの表と裏の確率は1/2ではない」というのが対立仮説になります。

2. 実際にデータを取得してみる

実際に20回コイントスを行ったとします。

その結果、今回は

・表15回
・裏5回

となりました。この結果だけを見ると、少し偏っているように見えます。
しかし、本当に「偽物」と言えるほど偏っているのでしょうか??

ここで、帰無仮説を前提にして考えます。

3. p値を求める

帰無仮説を前提にすると、コインは本物なので、表と裏はそれぞれ1/2の確率で出るはずです。

この条件で、20回コイントスしたときに、それぞれの表の回数になる確率を計算すると、次のようになります。

表の回数 裏の回数 確率
0200.0001%
1190.0019%
2180.0181%
3170.1087%
4160.4620%
5151.4786%
6143.6964%
7137.3929%
81212.0109%
91116.0146%
101017.6191%
11916.0146%
12812.0109%
1377.3929%
1463.6964%
1551.4786%
1640.4620%
1730.1087%
1820.0181%
1910.0019%
2000.0001%

👉今回得られた結果「表15回・裏5回」になる確率は、1.4786%です。

つまり、帰無仮説が正しいとすると、かなり起こりにくい結果と言えます。

4. p値が5%未満かどうかで判断する

統計では、一般的に5%未満しか起こらないような珍しい結果が出た場合、

「帰無仮説が間違っていたのではないか」と考えます。

今回の「表15回・裏5回」は、発生確率が1.4786%でした。
よって、5%未満だったいう結果をもって

・帰無仮説を棄却する
・対立仮説を受容する

という判断になります。

つまり、もともと証明したかった「このコインは偽物である」という結論に至ったわけです。
これが、統計的仮説検定の基本的な流れです。

まとめ

帰無仮説と対立仮説は、統計的仮説検定を理解するうえで非常に重要な考え方です。

統計では、いきなり「差がある」「効果がある」とは言いません。

まずは「差がない」という帰無仮説を置き、その仮説では説明できないほど珍しい結果が出た場合に、帰無仮説を棄却します。

その結果として、「差がある」「効果がある」という対立仮説を採択します。

T検定、F検定、回帰分析、分散分析なども、基本的にはすべて同じ考え方で成り立っています。

p値だけを見るのではなく、その背景にある帰無仮説と対立仮説まで理解できるようになると、統計結果の見方が一段深くなります。

✔ あわせて読みたい
【初心者向け】p値とは?0.05の意味を“現場目線”とExcelで直感理解する

統計的仮説検定で必ず出てくる「p値」についてわかりやすく解説!

✔ あわせて読みたい
Excelで実践 T検定|使う局面と具体的な手順

Excel分析ツールを用いたT検定の手順・結果の解釈をわかりやすく解説!

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール