본문 바로가기
데이터 통계 분석

[Excel] 실험실 간 비교 - Mandel's h & k plot

by 어날켐 2026. 1. 21.
728x90
반응형

 

실험실 간 비교 결과의 시각화된 그래프 Mandel's h & k plot 내용을 알아보자. 

만델의 k & h 도표(Mandel's h & k plot)는 h & k 통계량(Mandel's h & k statistics)을 시각화한 그래프로
실험실 간 비교에서 이상치(outlier)를 식별하고 실험 결과의 일관성(consistency)을 평가하는 데 사용된다.

실험실 간 비교 데이터 (실험실: 3개, 샘플 농도: 5개)의 모든 평균과 표준편차를 그래프로 작성하면 아래와 같이 나타난다. 

평균은 농도가 증가하면서 측정값이 비례하기 때문에 낮은 농도의 실험실 간 차이는 확인이 어려웠고,
측정값이 증가하면 표준편차도 비례하기 때문에 각 실험실의 표준편차가 확인될 뿐 실험실 간 차이를 명확히 구분하기 어렵다. 

평균과 표준편차를 기준값(기준 농도)으로 보정한 상대오차와 상대표준편차로 변환해서 그래프로 작성하면 아래와 같이 나타난다. 

농도에 반비례하는 오차와 상대표준편차의 영향으로 모든 농도에서 실험실 간 차이를구분하기는 어려웠다.

만델의 k & h 도표는 위 그래프들의 단점을 보완한 그래프로 실험실 간 비교를 한 번에 파악할 수 있도록 되어있다. 
이 방법은 ISO 5725-2 및 ASTM E691 등에서 실험실 간 비교 평가하기 위한 방법으로 소개되고 있다. 

만델의 h-통계량 (Mandel's h-statistics)

h-통계량 (h-statistic): 모든 실험실의 평균값을 기준으로 각 실험실의 평균 차이를 상대적으로 나타낸 값이다.
h-통계량은 농도 $j$ 를 구분해서 계산되며, 수식은 아래와 같다. 
$$h_{ij} = \frac{\overline{m}_{ij} - \overline{\overline{m}}_j}{\sqrt{\frac{1}{p_j - 1} \sum_{i=1}^{p_j} (\overline{m}_{ij} - \overline{\overline{m}}_j)^2}}$$

  • $\overline{m}_{ij}$ : 농도 $j$ 에서 실험실 $i$ 의 평균
  • $\overline{\overline{m}}_j$ : 농도 $j$ 에서의 전체 평균
  • $\sqrt{\frac{1}{p_j - 1} \sum_{i=1}^{p_j} (\overline{m}_{ij} - \overline{\overline{m}}_j)^2}$: 농도 $j$ 에서 모든 실험실 평균들의 표준편차
  • $p_j$: 농도 $j$ 에서 실험실의 수

모든 농도에서 $h$ 값의 부호가 같으면 실험실 편향(Bias)이 존재할 가능성이 있고, 
특정 농도에서 $h$ 값이 너무 크거나 작으면 해당 실험실의 평균값이 다른 실험실에 비해서 확연히 다른 것으로 나타난다.

만델의 k-통계량 (Mandel's k-statistics)

k-통계량 (k-statistic): 모든 실험실의 통합된 표준편차를 기준으로 각 실험실의 표준편차 차이를 상대적으로 나타낸 값이다. 
k-통계량은 $j$ 를 구분해서 계산되며, 수식은 아래와 같다. 
$$k_{ij} = \frac{SD_{ij}}{SD_{rj}}$$

  • $SD_{ij}$: 농도 $j$ 에서 실험실 $i$ 의 표준편차
  • $SD_{rj}$: 농도 $j$ 에서 모든 실험실 통합된 표준편차
    $$s_{rj} = \sqrt{\frac{\sum s_{ij}^2}{p_j}}$$
  • $p_j$: 농도 $j$ 에서 실험실의 수

$SD_{rj}$는 각 실험실의 표준편차 값들의 평균을 나타내고 있어서 특정 실험실의 표준편차가 상대적으로 크면 $k$ 값이 증가된다. 
특정 실험실의 $k$ 값이 크면 해당 실험실의 반복성(Repeatability)이 상대적으로 차이 나는 것을 나타냅니다. 

만델의 h & k 도표 (Mandel's h & k plot)

계산된 통계량은 일반적으로 막대그래프(barplot) 형태로 표현된다.
아래 그래프는 앞에서 보여준 그래프의 데이터를 h & k 통계량으로 변환한 것이다. 

위 그래프는 이전 그래프와 달리 전체 실험실 평균과 표준편차 평균에서 벗어난 정도를 보여주므로 
실험실 간 차이를 명확하게 보여주고 농도 차이에 대한 부분도 사라져서 낮은 농도에서도 차이나는 것이 잘 보여진다. 

그래프에서 차이 나는 것을 확인할 수 있지만 부적합 데이터를 거르는 데는 한계가 있다. 
그래서 신뢰할 수 있는 구간을 확인할 수 있는 임계값(Critical value)으로 부적합 데이터를 평가할 수 있다. 
신뢰 구간 분포는 실험실 수($p$)와 반복 측정 횟수($n$)에 달라지기 때문에 
신뢰 구간을 구분할 수 있는 임계값을 ISO 문서에서 통계표를 제공하고 있다. 
h-통계량은 실험실 수($p$)로 구분된 임계값과 k-통계량은
실험실 수($p$)와 반복 측정 횟수($n$)로 구분된 임계값을 확인할 수 있다. 

임계값은 신뢰 수준 99%, 95%로 구분되며 
95% 신뢰 수준 임계값 이상의 통계량은 의심치(Straggler)로  
99% 신뢰 수준 임계값 이상의 통계량은 이상치(outlier)로 평가된다. 

만델의 h & k 통계량의 임계값 기준으로 평가되는 의심치 와 이상치는 
정밀성 분석 단계에서 먼저 수행되는 검토 내용으로 오류를 확인하기 위한 가이드 역할을 합니다. 
평가된 의심치와 이상치는 이 단계에서 바로 삭제되지 않고 추가 검토를 통해서 삭제 여부를 결정합니다. 
만델의 h & k 통계량은 초기 스크리닝 단계로 이상치 포함 유무를 체크한 다음
정밀한 검증 방법인 Cochran, Grubbs 검정으로 이상치를 확정하고 데이터를 제거합니다. 

결론적으로 멘델의 h & k 도표는 실험실 간 일관성을 한눈에 보여주기 위한 그래프로 사용되며
h & k 통계량은 특정 실험실의 벗어난 결과를 초기에 검토하는 방법으로 사용된다.

자세한 내용은 첨부된 엑셀 파일로 확인할 수 있다.

실험실 간 비교 그래프_V1.xlsx
0.06MB

728x90
반응형