正規性検定とは?|初心者でもわかる判定方法とExcelでの実践ガイド

はじめに

統計解析を行う上で、「データが正規分布に従っているか」は非常に重要です。
なぜなら、多くの代表的な統計手法は正規性を前提として設計されているためです。

例えば、以下のような分析で正規性は前提条件として扱われることが多いです。

分類 手法 正規性が重要な理由
品質管理 工程能力指数(Cpk) 分布形状に依存するため、正規性が前提
品質管理 管理図(Xbar-R管理図など) 管理限界の計算に正規分布を仮定
仮説検定 t検定・F検定・分散分析(ANOVA) 検定統計量の分布が正規性を前提としている
回帰分析 残差の正規性 推定や検定の妥当性に影響する
推定 信頼区間の推定 区間推定の精度に影響する
多変量解析 主成分分析など 一部手法で正規性が前提となる

このように、正規性は「統計の土台」とも言える重要な概念です。
そのため、分析に入る前にデータの正規性を確認することが基本ステップとなります。

正規性の判定方法

正規性を確認する方法はいくつかありますが、代表的なものは次の3つです。

判定方法 概要 特徴
ヒストグラム・正規確率プロット 分布の形状を視覚的に確認する方法 直感的に理解しやすいが、主観に依存する
歪度・尖度 分布の歪みや尖り具合を数値で評価 客観性はあるが、明確な基準が分かりにくい
正規性検定 統計的に正規分布かどうかを検定 最も信頼性が高く、定量的に判断可能

これらは「簡単さ」の順に並んでいますが、
統計的に明確な判断ができるのは正規性検定のみです。

視覚的な方法はあくまで補助的な判断であり、最終的には検定で判断するのが基本です。
そのため、本記事では正規性検定について詳しく解説していきます。

正規性検定とは?

正規性検定とは、「そのデータが正規分布に従っているか」を統計的に判定する手法です。

考え方はシンプルで、まず
「このデータは正規分布である」という仮説(帰無仮説)を立てます。

その上で、実際のデータがその仮説とどれくらいズレているかを評価し、
「偶然のズレか、それとも明確に違うのか」を判断します。

代表的な正規性検定には以下があります。

・シャピロ・ウィルク検定(Shapiro-Wilk)
・コルモゴロフ・スミルノフ検定(K-S検定)
・アンダーソン・ダーリング検定

特に実務では、シャピロ・ウィルク検定が最もよく使われます。

■ 判定基準(p値)

正規性検定の判定は、p値を用いて行います。

p値 判定 意味
p値 < 0.05 正規性なし 正規分布に従っているとは言えない
p値 > 0.05 正規性あり 正規分布と有意差なし

※P>0.05は厳密には「正規分布と有意に異ならない」と解釈します

ここで重要なのは、
「p値が大きい=完全に正規分布」という意味ではないという点です。
あくまで「統計的に否定できない」というだけであることに注意が必要です。

Excelでやってみよう

本来、正規性検定はRやPython、JMPなどの統計ソフトで行うのが一般的です。
しかし、初心者の方でも扱いやすいように、Excelで実施できるテンプレートを用意しました。

データを入力するだけで
・歪度尖度
・グラフ(正規確率プロット/ヒストグラム)
・正規性検定←重要

をすべて一括で行うことができます。

今回は、誰でも簡単に実施できる方法を紹介します。

■ 手順①:データを入力する

まず、テンプレートの入力欄にデータを貼り付けます。
特別な設定は不要で、数値をそのまま入力するだけでOKです。

手順②:結果を解釈する

データ入力後、テンプレートには以下3つの結果が自動で表示されます。

・歪度・尖度
・正規性検定(p値)
・グラフ(ヒストグラム・正規確率プロット)

それぞれの見方は以下の通りです。

・歪度・尖度

分布の形状を数値で確認します。

・歪度が0に近い → 左右対称(正規分布に近い)
・尖度が0に近い → 標準的な山の形(正規分布に近い)

※目安として「±1以内」であれば大きな問題はないケースが多いです

・正規性検定(p値) ※重要

統計的に正規分布かどうかを判定します。

・p値 >= 0.05 → 正規性あり(正規分布と有意差なし)
・p値 < 0.05 → 正規性なし(正規分布とは言えない)

※最も客観的な判断基準になります

・グラフ(ヒストグラム・正規確率プロット)

視覚的に分布の形を確認します。

・正規確率プロットが直線に近い → 正規分布に近い
・ヒストグラムが左右対称の山形 → 正規分布に近い

正規性が得られなかったらどうする?

正規性が得られなかった場合でも、分析をあきらめる必要はありません。
実務では以下のような対応が一般的です。

・対数変換や平方根変換などの変数変換を行う
・外れ値の影響を確認する
・ノンパラメトリック手法(マン・ホイットニー検定など)を使用する
・適切な分布(対数正規分布、ワイブル分布など)に当てはめる

特に製造業では、データが正規分布ではなく
ワイブル分布や対数正規分布に従うケースも多いため注意が必要です。

✔ あわせて読みたい
変数変換とは?正規分布に近づける適切な手法をわかりやすく解説!

正規性が得られなかったときにどうする?変数変換について詳しく解説!

✔ あわせて読みたい
外れ値とは?データ分析で注意すべき理由と見つけ方を解説【統計基礎】

統計解析のするうえで要注意。”外れ値”について体系的に解説!

まとめ

正規性検定は、統計解析の出発点とも言える重要なステップです。

多くの統計手法は正規性を前提としているため、
分析前に正規性を確認するかどうかで結果の信頼性が大きく変わります。

まずは、
・ヒストグラムでざっくり確認
・正規性検定で定量的に判断

という流れを習慣化することが大切です。

正規性の理解は、統計スキルを一段引き上げる重要なポイントです。
ぜひ実務や学習の中で積極的に活用してみてください。

このサイトでは、製造業の実務で活用できる統計解析手法について体系的にまとめています。
その他の記事も是非確認してください。
また、ココナラでの統計解析相談も受けてけております。
相談次項のある方は、サイドバーのリンクよりアクセスしご相談ください(見積もりは無料です)。

✔ あわせて読みたい
度数分布表・ヒストグラムとは?作り方と見方をわかりやすく解説

QC七つ道具_ヒストグラム+度数分布表についてわかりやすく解説!

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール