
「同じ人が測っても、毎回結果が違う」「人によって評価がバラバラになる」
現場で測定や評価をしていると、このような悩みはよくあります。
たとえば、同じ製品の寸法を測っているのに、担当者Aと担当者Bで結果が違う。あるいは、同じ担当者が同じ製品を測ったのに、昨日と今日で数値が少し違う。
このような「測定値の安定性」や「評価の一致度」を確認したいときに使われるのが、級内相関係数(ICC:Intraclass Correlation Coefficient)です。
ICCは、単に「相関があるか」を見る指標ではありません。
「同じ対象を繰り返し測定したときに、どれだけ同じような結果になるか」を評価するための指標です。特に、検者内信頼性や検者間信頼性を確認したい場面で非常によく使われます。
ICCはどんな場面で使うのか?
ICCは、以下のような場面で使われます。
✅同じ測定者が何回測っても同じ結果になるか確認したい
✅複数人で測定したときに結果が一致しているか確認したい
✅測定器や検査方法の再現性を確認したい
✅アンケートの採点や評価基準が安定しているか確認したい
たとえば、工場でノギスを使って寸法を測る場合を考えてみます。
担当者Aが同じ製品を3回測定し、毎回ほぼ同じ値が出ていれば、その測定方法は安定しているといえます。
一方で、担当者Aは100.1mm、担当者Bは99.3mm、担当者Cは101.0mmのように人によって大きく違うなら、その測定方法は信頼性が低い可能性があります。
このような「測定値のばらつき」を定量的に評価するのがICCです。 (日本理学療法学会連合)
相関係数との違い
ICCは相関係数と似ているように見えますが、実は役割が異なります。
相関係数は、「2つの値がどれくらい同じ動きをするか」を確認する指標です。
たとえば、担当者Aの測定値が高いときに担当者Bの測定値も高いなら、相関係数は高くなります。
しかし、担当者Aが毎回「+5mm大きく測る癖」があったとしても、両者が同じ動きをしていれば相関係数は高くなってしまいます。
つまり、相関係数は「一致しているか」ではなく、「同じ傾向か」を見ているだけです。
一方でICCは、「本当に同じ値になっているか」を評価できます。
そのため、測定の信頼性や再現性を評価したい場合には、相関係数ではなくICCを使う必要があります。
データの関連性を見る統計指標!相関係数についてわかりやすく解説!
ICCの考え方
ICCは、「全体のばらつきのうち、対象そのものの違いがどれくらいを占めているか」を見る指標です。
簡単にいうと、
- 被験者や製品そのものの違いによるばらつき
- 測定誤差によるばらつき
を比較し、測定誤差が小さいほどICCは高くなります。
ICCの基本的な考え方は、以下の式で表されます。
この式では、
- 分子:対象そのものの違いによる分散
- 分母:対象の違い+測定誤差の分散
となっています。
つまり、測定誤差が小さいほど、ICCは1に近づきます。
逆に、誤差が大きいほどICCは0に近づきます。 (J-STAGE)
ICCの値はどう解釈する?
ICCは0〜1の範囲を取ります。
一般的には、以下のように解釈されることが多いです。
✅0.50未満:信頼性が低い
✅0.50〜0.75:中程度の信頼性
✅0.75〜0.90:良好な信頼性
✅0.90以上:非常に高い信頼性
たとえば、ICC=0.92なら「かなり安定した測定方法」と判断できます。
逆に、ICC=0.45なら、測定者や測定タイミングによるばらつきが大きく、「この測定結果は信用しづらい」と考えられます。
ICC(1,1)、ICC(2,1)、ICC(3,1)の違い
ICCは非常にややこしいのですが、実務でよく見るのは主にICC(1,1)、ICC(2,1)、ICC(3,1)です。
まず、ICC(1,1)は「同じ人が繰り返し測ったときの安定性」を見る指標です。
たとえば、担当者Aが同じ製品を3回測ったとき、その測定値がどれくらい一致しているかを確認する場合に使います。これは”検者内信頼性”と呼ばれます。
次に、ICC(2,1)は「複数人が測ったときに一致しているか」を見る指標です。
たとえば、担当者A、B、Cの3人が同じ製品を測ったとき、どれくらい結果が一致するかを評価します。これは検者間信頼性に使われます。
ICC(2,1)は「絶対一致」を重視するため、Aが100mm、Bが102mmのようにズレていれば低くなります。
一方でICC(3,1)も検者間信頼性に使われますが、「順位や傾向が同じならOK」と考える指標です。
たとえば、Aが全体的に少し高めに測る癖があっても、製品ごとの大小関係が一致していればICC(3,1)は高くなることがあります。
ICC(1,1)の代表的な数式
ICC(1,1)は、一元配置分散分析の結果を使って以下のように求めます。
ここで、
- (MS_B):対象間平方平均
- (MS_W):誤差平方平均
- (k):同じ対象を測定した回数
を表します。
対象間のばらつきが大きく、誤差が小さいほどICCは高くなります。逆に、測定誤差が大きいとICCは低くなります。
ICCを使うときの注意点
ICCは便利な指標ですが、いくつか注意点があります。
✅対象者のばらつきが小さいとICCは低く出やすい
✅サンプルサイズが少ないと結果が不安定になる
✅外れ値の影響を受けやすい
✅どのICCを使うかで結果が変わる
特に、対象者がみんな似たような数値ばかりだと、対象間の差が小さくなるためICCが低く出ることがあります。
また、ICCは「ICC(1,1)なのか」「ICC(2,1)なのか」を間違えると、解釈が大きく変わります。
論文や報告書では、「ICC=0.85」だけではなく、「ICC(2,1)=0.85」のように、どのタイプを使ったのかまで書くことが重要です。

まとめ
級内相関係数(ICC)は、測定や評価の信頼性を確認するための重要な指標です。
単なる相関係数とは異なり、「本当に同じ値になっているか」を確認できるため、現場では非常に役立ちます。
特に、同じ人が繰り返し測る場合はICC(1,1)、複数人で測る場合はICC(2,1)やICC(3,1)を使い分けることが重要です。
統計では「差があるか」ばかりに目が向きがちですが、実際には「その測定は信用できるのか」を確認することも同じくらい重要です。
ICCは、その信頼性を数値で示してくれる指標だと考えると理解しやすいでしょう!
属性MSAの指標のひとつ。測定者間の一致度を比較するk係数についてわかりやすく解説!