κ係数とは?一致率との違い・計算方法・見方をわかりやすく解説

k係数(カッパ係数)とは、2つの測定結果の一致度合いを評価する指標のことです。
おもに質的データ(属性データ)の測定システム評価にて用いられます。

また、量的データ(連続量データ)の2つの測定結果の一致度合いを評価する指標としては級内相関係数(ICC)が用いられます。
本記事では、k係数(カッパ係数)について、数式まで踏み込んで解説していきます。

✔ あわせて読みたい
級内相関係数(ICC)とは?検者内・検者間の信頼性をわかりやすく解説!

ICCの意味や相関係数との違い、ICC(1,1)・ICC(2,1)・ICC(3,1)の使い分けまで、測定の信頼性をわかりやすく解説

はじめに(一致度について)

測定システム評価について、「判定がどれくらい一致しているか」を見るとき、多くの人はまず一致率を使います。

例えば、以下の様に測定者Aさんと測定者Bさんの100個の部品を判定したとします。

このうち、対角の80個が一致しているので

一致率 = 80%

となります。

しかし、ここで注意したいのは、「 偶然でも一致してしまう可能性がある」という点です。
例えば、2人とも「全部良品」と判定すれば、一致率は高くなります。

ですが、それでは本当に判定精度が高いとは言えません。
そこで使うのが、 κ係数(カッパ係数)です。

κ係数は、偶然一致する分を除いて、本当に意味のある一致だけを評価する指標です。


■ κ係数は何を見る指標?

先述の通り、κ係数は、「2人の判定が、偶然以上にどれだけ一致しているか」を見るための指標です。

例えば、以下の場面で用います

・測定者Aと測定者Bの判定が一致しているか
・真値と測定者の判定が一致しているか
・1回目と2回目の判定結果が一致しているか

特に属性MSA(クロスタブ法)では、「測定者間の一致性」

を確認するために非常によく使われます。

✔ あわせて読みたい
属性データの測定システム評価(クロスタブ法)とは?

計数値/属性データの測定システム評価に欠かせない知識をここに集約!


■ 数式について

一致率は、単純に「同じ判定だった割合」です。
以下の計算式で求めることができます。

一致率 = 一致した件数 ÷ 全データ数

一方でκ係数は、(Po)(Pe)の二つの記号を使って以下の式で計算します。

κ = (Po - Pe) ÷ (1 - Pe)

ここで、PoとPeはそれぞれ以下を示します

・Po:観測一致率(実際の一致率)
・Pe:偶然一致率

つまり、「偶然一致した分」を差し引いて、本当の一致度を見ているというのがκ係数の特徴です。


■ 事例_κ係数の計算イメージ

例えば、次のようなクロス集計表があるとします。

測定者B:良品測定者B:不良
測定者A:良品4010
測定者A:不良545

この場合、数式に当てはめて一致率を考えると

・全体数:100
・一致数:40 + 45 = 85
・一致率(Po):85 / 100 = 0.85

となります。

次に、偶然一致率(Pe)を計算します。
計算は以下の数式で算出できます。

Pe = ((50×45) + (50×55)) ÷ 100²
   = 0.50

よって、先ほどのk数の数式に当てはめることで

κ = (0.85 - 0.50) ÷ (1 - 0.50)
  = 0.70

となります。このように、κ係数は単なる一致率よりも厳しく判定されます。


■ κ係数の見方

κ係数は、一般的に以下のように解釈されます。
二つの測定システムの一致性が良好か評価する際の参考にしてください。

κ係数評価
0未満一致していない
0.00〜0.20わずかな一致
0.21〜0.40やや一致
0.41〜0.60中程度の一致
0.61〜0.80良好な一致
0.81〜1.00非常に良好な一致

→実務では、κ係数が0.6以上あれば、ある程度良好と考えられることが多いです。


■ κ係数が低くなる原因

κ係数が低い場合、次のような原因が考えられます。

・測定者ごとに判定基準が違う
・良品・不良の基準が曖昧
・判定教育が不足している
・特定の測定者だけ判定が偏っている

つまり、 κ係数が低い = 人によって判定がバラバラということです。

この場合は、

・判定基準の見直し
・サンプル写真の共有
・判定教育の実施

などを行うと改善しやすくなります。


■ κ係数を使うときの注意点

κ係数は便利ですが、計算するうえでは注意すべき点があります。

例えば、以下の様なケース

・ほとんどが良品ばかり
・不良が極端に少ない
・判定が偏っている

といった場合には、κ係数が低く出ることがあります。
そのため、 一致率だけでなく、誤判定率やクロス集計表も一緒に見ることが重要です。


■ まとめ

κ係数とは、偶然一致を除いた「本当の一致度」を見る指標です。

一致率だけでは見えない、

・判定基準のブレ
・測定者間の差
・真の一致性

を確認することができます。属性MSAやクロスタブ法では非常に重要な指標なので、
まずは一致率とセットで見られるようにしておきましょう。

✔ あわせて読みたい
クロス集計表とは? 2つのデータの関係を“見える化”する統計の基本

属性データを集計し見える化するクロス集計表についてわかりやすく解説!

✔ あわせて読みたい
MSAとは?測定システム解析をわかりやすく解説【Gauge R&R・TMVとの関係】

測定システムの妥当性評価MSAについてわかりやすく解説!(最初に読みたい)

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール