실험실 간 비교 결과의 시각화된 그래프 Mandel's h & k plot 내용을 알아보자.
만델의 k & h 도표(Mandel's h & k plot)는 h & k 통계량(Mandel's h & k statistics)을 시각화한 그래프로
실험실 간 비교에서 이상치(outlier)를 식별하고 실험 결과의 일관성(consistency)을 평가하는 데 사용된다.
실험실 간 비교 데이터 (실험실: 3개, 샘플 농도: 5개)의 모든 평균과 표준편차를 그래프로 작성하면 아래와 같이 나타난다.

평균은 농도가 증가하면서 측정값이 비례하기 때문에 낮은 농도의 실험실 간 차이는 확인이 어려웠고,
측정값이 증가하면 표준편차도 비례하기 때문에 각 실험실의 표준편차가 확인될 뿐 실험실 간 차이를 명확히 구분하기 어렵다.
평균과 표준편차를 기준값(기준 농도)으로 보정한 상대오차와 상대표준편차로 변환해서 그래프로 작성하면 아래와 같이 나타난다.

농도에 반비례하는 오차와 상대표준편차의 영향으로 모든 농도에서 실험실 간 차이를구분하기는 어려웠다.
만델의 k & h 도표는 위 그래프들의 단점을 보완한 그래프로 실험실 간 비교를 한 번에 파악할 수 있도록 되어있다.
이 방법은 ISO 5725-2 및 ASTM E691 등에서 실험실 간 비교 평가하기 위한 방법으로 소개되고 있다.
만델의 h-통계량 (Mandel's h-statistics)
h-통계량 (h-statistic): 모든 실험실의 평균값을 기준으로 각 실험실의 평균 차이를 상대적으로 나타낸 값이다.
h-통계량은 농도 $j$ 를 구분해서 계산되며, 수식은 아래와 같다.
$$h_{ij} = \frac{\overline{m}_{ij} - \overline{\overline{m}}_j}{\sqrt{\frac{1}{p_j - 1} \sum_{i=1}^{p_j} (\overline{m}_{ij} - \overline{\overline{m}}_j)^2}}$$
- $\overline{m}_{ij}$ : 농도 $j$ 에서 실험실 $i$ 의 평균
- $\overline{\overline{m}}_j$ : 농도 $j$ 에서의 전체 평균
- $\sqrt{\frac{1}{p_j - 1} \sum_{i=1}^{p_j} (\overline{m}_{ij} - \overline{\overline{m}}_j)^2}$: 농도 $j$ 에서 모든 실험실 평균들의 표준편차
- $p_j$: 농도 $j$ 에서 실험실의 수
모든 농도에서 $h$ 값의 부호가 같으면 실험실 편향(Bias)이 존재할 가능성이 있고,
특정 농도에서 $h$ 값이 너무 크거나 작으면 해당 실험실의 평균값이 다른 실험실에 비해서 확연히 다른 것으로 나타난다.
만델의 k-통계량 (Mandel's k-statistics)
k-통계량 (k-statistic): 모든 실험실의 통합된 표준편차를 기준으로 각 실험실의 표준편차 차이를 상대적으로 나타낸 값이다.
k-통계량은 $j$ 를 구분해서 계산되며, 수식은 아래와 같다.
$$k_{ij} = \frac{SD_{ij}}{SD_{rj}}$$
- $SD_{ij}$: 농도 $j$ 에서 실험실 $i$ 의 표준편차
- $SD_{rj}$: 농도 $j$ 에서 모든 실험실 통합된 표준편차
$$s_{rj} = \sqrt{\frac{\sum s_{ij}^2}{p_j}}$$ - $p_j$: 농도 $j$ 에서 실험실의 수
$SD_{rj}$는 각 실험실의 표준편차 값들의 평균을 나타내고 있어서 특정 실험실의 표준편차가 상대적으로 크면 $k$ 값이 증가된다.
특정 실험실의 $k$ 값이 크면 해당 실험실의 반복성(Repeatability)이 상대적으로 차이 나는 것을 나타냅니다.
만델의 h & k 도표 (Mandel's h & k plot)
계산된 통계량은 일반적으로 막대그래프(barplot) 형태로 표현된다.
아래 그래프는 앞에서 보여준 그래프의 데이터를 h & k 통계량으로 변환한 것이다.

위 그래프는 이전 그래프와 달리 전체 실험실 평균과 표준편차 평균에서 벗어난 정도를 보여주므로
실험실 간 차이를 명확하게 보여주고 농도 차이에 대한 부분도 사라져서 낮은 농도에서도 차이나는 것이 잘 보여진다.
그래프에서 차이 나는 것을 확인할 수 있지만 부적합 데이터를 거르는 데는 한계가 있다.
그래서 신뢰할 수 있는 구간을 확인할 수 있는 임계값(Critical value)으로 부적합 데이터를 평가할 수 있다.
신뢰 구간 분포는 실험실 수($p$)와 반복 측정 횟수($n$)에 달라지기 때문에
신뢰 구간을 구분할 수 있는 임계값을 ISO 문서에서 통계표를 제공하고 있다.
h-통계량은 실험실 수($p$)로 구분된 임계값과 k-통계량은
실험실 수($p$)와 반복 측정 횟수($n$)로 구분된 임계값을 확인할 수 있다.
임계값은 신뢰 수준 99%, 95%로 구분되며
95% 신뢰 수준 임계값 이상의 통계량은 의심치(Straggler)로
99% 신뢰 수준 임계값 이상의 통계량은 이상치(outlier)로 평가된다.
만델의 h & k 통계량의 임계값 기준으로 평가되는 의심치 와 이상치는
정밀성 분석 단계에서 먼저 수행되는 검토 내용으로 오류를 확인하기 위한 가이드 역할을 합니다.
평가된 의심치와 이상치는 이 단계에서 바로 삭제되지 않고 추가 검토를 통해서 삭제 여부를 결정합니다.
만델의 h & k 통계량은 초기 스크리닝 단계로 이상치 포함 유무를 체크한 다음
정밀한 검증 방법인 Cochran, Grubbs 검정으로 이상치를 확정하고 데이터를 제거합니다.
결론적으로 멘델의 h & k 도표는 실험실 간 일관성을 한눈에 보여주기 위한 그래프로 사용되며
h & k 통계량은 특정 실험실의 벗어난 결과를 초기에 검토하는 방법으로 사용된다.
자세한 내용은 첨부된 엑셀 파일로 확인할 수 있다.
'데이터 통계 분석' 카테고리의 다른 글
| [Excel] 실험실 간 비교 - 재현성 (Reproducibility) (1) | 2026.01.18 |
|---|---|
| [Excel] 반복 측정에서 평균과 정밀도의 상관성 (0) | 2026.01.03 |
| 정량분석 결과의 유효숫자 (Significant figure) (3) | 2026.01.02 |
| [Excel] 다수 이상치 (Multiple outliers) 확인 : Grubbs' test (0) | 2025.09.28 |
| [Excel] 분산분석에서 이상치 (Outlier) 확인 : Cochran's C test (0) | 2025.09.27 |