반복 측정 결과들의 평균과 정밀도의 함수적 관계를 알아보자.
반복 측정 결과에서 평균값과 정밀도(상대표준편차) 값 사이의 상관성은
측정 불확도와 데이터 품질을 올바르게 평가하기 위한 목적으로 사용됩니다.
일반적인 상대표준편차(RSD)는 분석법 측정 범위에서 일정한 값을 나타낸다.
하지만, 일부 분석법에서는 측정값이 변동되면서 상대표준편차가 변경되는 현상이 발생된다.
동일한 분석법에서 측정된 상대표준편차가 적합한 결과인지 확인하는 검증 방법이 필요하다.
이와 관련된 내용이 ISO 5725-2 (Basic method for the determination of repeatability and reproducibility of a standard measurement method)에서 확인된다. 해당 문서에서 제시된 검증 방법을 예시와 함께 자세한 내용을 설명하였다.
평균과 정밀도의 함수적 관계 구분
정밀도 실험은 분석 범위에서 다양한 분석물질 농도가 포함된시료를 반복 측정해서
농도별 RSD($= \frac{Mean}{SD} $)를 통해서 평가된다.
일반적인 실험에서는 농도 값이 증가할수록 표준편차(SD) 값은 증가된고, RSD는 감소되는 경향을 나타낸다.
측정된 농도의 평균과 정밀도를 나타내는 RSD의 상관성은 아래 그래프와 같이 나타난다.

- Type 1 구간: 일정한 RSD 나타내는 범위
- Type 2 구간: 농도가 감소하면서 RSD가 일정하게 증가하는 범위
- Type 3 구간: 농도가 감소하면서 RSD가 급격하게 증가하는 범위
설정된 정량 범위에서 농도와 RSD의 상관성이 확인된다면 농도별 측정불확도의 평가와 오류 데이터 포함 여부를 확인할 수 있다.
Type 1 - 함수적 관계
Type 1에서 평균(m)과 표준편차(SD)의 상관성은 아래와 같은 수식으로 표현된다.
$$ SD = a\times m $$
직선 수식의 기울기(a)는 $SD/m$ 으로 정리되며 범위에서 m의 RSD를 나타낸다.
Type 1의 데이터 패턴은 평균 차이가 있어도 비슷한 RSD를 보여준다.
[예시 1]
농도별 반복 측정한 결과를 평균과 표준편차로 정리한 내용은 다음 표와 같다.
| Level 1 | Level 2 | Level 3 | Level 4 | Level 5 | |
|---|---|---|---|---|---|
| Conc. | 1 | 10 | 50 | 100 | 300 |
| n | 10 | 10 | 10 | 10 | 10 |
| m | 0.992 | 9.988 | 49.448 | 100.866 | 300.137 |
| SD | 0.019 | 0.173 | 0.784 | 1.907 | 5.459 |
| RSD | 1.93% | 1.73% | 1.59% | 1.89% | 1.82% |
기울기(a)는 RSD 값과 동일한값으로 모든 RSD를 평균한 값이다.
$$a=\dfrac{\sum SD_i}{q} \ \ \ \ \text{ (q = number of levels)} $$
$$a=\dfrac{0.0193+0.0173+0.0159+0.0189+0.0182}{5}=0.01789\approx 0.018 $$
m과 SD를 그래프로 작성하면 다음과 같은 상관성이 나타난다.

선형 회귀분석 결과의 기울기 a는 RSD 평균과 근사한 값을 나타낸다.
평균이 작아지면 표준편차가 0에 수렴하는 함수적 관계식으로 표현된다.
이와 같은 관계식을 바탕으로 측정 결과의 정밀성이 타당한지 검증된다.
만약, 반복 측정 결과에 부적합 결과가 포함된다면 위와 같은 관계식을 벗어나게 된다.
아래 그래프는 농도 10의 측정 결과 중 이상치 1개가 포함된 데이터의 관계식이다.

빨간색 점으로 표기된 SD는 상관식 (점선)에서 벗어난 것이 확인된다.
Type 2 - 함수적 관계
Type 2에서 평균(m)과 표준편차(SD)의 상관성은 아래와 같은 수식으로 표현된다.
$$ SD = a \times m + b$$
직선 수식의 기울기(a)는 RSD를 나타내고, 절편(b)은 고정된 SD를 나타낸다.
Type 2의 데이터 패턴은 평균이 감소하면서 증가는 RSD를 보여준다.
기기분석에서 측정되는 결과는 일정한 변동 폭이 발생되는데 주된 원인은 측정 기기의 노이즈(noise)로 생성된다.
모든 측정 결과에는 노이즈 변동 값이 동일하게 적용되는데 측정 세기가 감소될수록 노이즈 변동 폭이 더 크게 반영된다.
이와 같은 경우에는 일정한 노이즈 변동 값은 절편(b)으로 일정한 RSD는 기울기(a)로 관계식이 형성된다.
[예시 2]
농도별 반복 측정한 결과를 평균과 표준편차로 정리한 내용은 다음 표와 같다.
| Level 1 | Level 2 | Level 3 | Level 4 | Level 5 | |
|---|---|---|---|---|---|
| Conc. | 1 | 10 | 50 | 100 | 300 |
| n | 10 | 10 | 10 | 10 | 10 |
| m | 1.009 | 9.974 | 50.066 | 99.246 | 299.733 |
| SD | 0.095 | 0.326 | 1.035 | 1.893 | 4.833 |
| RSD | 9.42% | 3.27% | 2.07% | 1.91% | 1.61% |
농도가 낮아지면서 RSD 값이 지속적으로 증가된 패턴을 나타낸다.
고정된 표준편차 (노이즈)는 측정값이 낮아지면서 측정 결과에 영향을 주는 비율이 증가되기 때문이다.
평균과 표준편차의 관계식 Type 1($y=ax$)과 Type 2($y=ax+b$)를 비교하면 다음과 같은 그래프로 확인된다.


관계식의 적합도가 확인되는 결정계수 ($R^2$)를 비교해 보면 절편이 포함된 수식이 1에 가까운 결정계수로 확인된다.
Type 2 구간에서는 변화되는 RSD를 나타내기 때문에 선형 관계를 벗어나는 값이 일부 나타나기도 한다.
정확한 예측 표준편차를 확인하기 위해서 가중치를 추가해서 적합한 관계식을 찾을 수 있다.
아래 그래프는 기존 수식에 가중치를 적용해서 관계식을 확인한 내용이다.

가중치 설정 후 결정계수가 반올림해서 1로 나타나는 관계식이 만들어진다.
가중치(W)는 $\dfrac{1}{SD^2}$ 로 계산되고, 회귀분석에서 수식이낮은 값에 더 가깝게 설정되도록 변형시키는 방법이다.
변형된 수식으로 m을 대입해서 SD를 다시 계산하면 실험 결과에 더 가까운 SD를 추정할 수 있다.
가중치를 설정해서 다시 SD를 계산하는 과정을 여러 번 반복하면 일정한 값에 수렴하는 상수를 얻게 되고,
그 관계식이 평균과 표준편차의 상관성을 나타낸다.
가중치 내용의 자세한 내용은 이전 글에서 확인할 수 있다.
2023.12.24 - [기기분석 데이터] - [Excel] 검정 곡선 (Calibration Curve) 교정 : 가중치 (Weighting)
[Excel] 검정 곡선 (Calibration Curve) 교정 : 가중치 (Weighting)
엑셀로 선형 검정 곡선 (Calibration curve)의 가중치 (Weighting) 설정하기 선형의 검정 곡선 (y = ax +b)은 농도 (concentration)와 장비 반응 (response)의 회귀분석 결과로 만들어진다. 농도와 장비 반응의 상관
analchem.tistory.com
ISO 문서에는 가중치 값으로 간단히 기울기와 절편을 계산할 수 있도록 수식을 제공하고 있다.
우선 5개 상수를 아래 공식으로 계산하고, 5개 상수를 사용해서 기울기(a)와 절편(b)을 계산할 수 있다.
$$T_1 = \sum W, \ \ T_2=\sum W\times m,\ \ T_3=\sum W\times m^2,\ \ T_4=\sum W\times SD,\ \ T_5=\sum W \times m \times SD $$
$$a=\dfrac{T_1T_5-T_2T_4}{T_1T_3-T_2^2}, \ \ \ \ \ b=\dfrac{T_3T_4-T_2T_5}{T_1T_3-T_2^2}$$
가중치가 적용된 관계식이 선형관계를 잘 나타내지 않는다면
새로운 관계식으로 m을 대입해서 계산된 SD로 가중치를 다시 설정해서 보정된 선형 관계식을 얻을 수 있다.
이 과정을 반복하면 기울기와 절편이 일정해지는 관계식이 나타난다.
Type 3 - 함수적 관계
Type 3에서 평균(m)과 표준편차(SD)의 상관성은 아래와 같은 수식으로 표현된다.
$$SD=10^d \times m^c \ \ \ or \ \ \ \log SD = c\times \log m + d$$
지수 함수 관계로 로그 스케일에서 기울기(c)는 변형된 RSD를 나타내고, 절편(d)은 변형된 고정 SD를 나타낸다.
Type 3의 데이터 패턴은 평균이 감소하면서 RSD가 급격히 증가한다.
분석법의 정량한계(LOQ) 농도에 가까워질수록 RSD가 증가하는 비율이 증가한다.
측정 기기의 노이즈(noise)가 Type 2에 비해서 더 많은 비율로 적용되기 때문이다.
[예시 3]
농도별 반복 측정한 결과를 평균과 표준편차로 정리한 내용은 다음 표와 같다.
| Level 1 | Level 2 | Level 3 | Level 4 | Level 5 | |
|---|---|---|---|---|---|
| Conc. | 1 | 10 | 50 | 100 | 300 |
| n | 10 | 10 | 10 | 10 | 10 |
| Mean | 0.994 | 9.697 | 49.709 | 100.254 | 300.594 |
| SD | 0.105 | 0.724 | 1.972 | 2.638 | 4.865 |
| RSD | 10.61% | 7.46% | 3.97% | 2.63% | 1.62% |
농도가 낮아지면서 RSD 값이 급격히 증가된 패턴을 나타낸다.
평균과 표준편차의 관계식 Type 1($y=ax$)과 Type 3($\log y=c\log x+d$)를 비교하면 다음과 같은 그래프로 확인된다.


로그 스케일로 변형된 선형 관계식이 결정계수가 1에 가까운 값을 나타낸다.
Type 3의 데이터 패턴은 관계식 적합성을 확인할 때 로그 스케일로 변형하면 더 적합한 관계식을 확인할 수 있다.
가중치를 적용한 선형 관계식을 확인하는 방법도 가능하지만,
예측된 표준편차의 오류가 더 많이 발생하기 때문에 적합한 방법이 아니다.
ISO 문서에는 로그로 변형된 기울기와 절편을 계산할 수 있도록 수식을 제공하고 있다.
우선 4개 상수를 아래 공식으로 계산하고, 4개 상수를 사용해서 기울기(a)와 절편(b)을 계산할 수 있다.
$$T_1 = \sum \log m, \ \ T_2=\sum (\log m)^2,\ \ T_3=\sum \log SD,\ \ T_4=\sum \log m \times \log SD $$
$$c=\dfrac{qT_4-T_1T_3}{qT_2-T_1^2}\ \ \ , \ \ \ \ d=\dfrac{T_2T_3-T_1T_4}{qT_2-T_1^2} $$
자세한 내용은 첨부된 엑셀 파일로 내용을 확인할 수 있다.
'데이터 통계 분석' 카테고리의 다른 글
| [Excel] 실험실 간 비교 - Mandel's h & k plot (1) | 2026.01.21 |
|---|---|
| [Excel] 실험실 간 비교 - 재현성 (Reproducibility) (1) | 2026.01.18 |
| 정량분석 결과의 유효숫자 (Significant figure) (3) | 2026.01.02 |
| [Excel] 다수 이상치 (Multiple outliers) 확인 : Grubbs' test (0) | 2025.09.28 |
| [Excel] 분산분석에서 이상치 (Outlier) 확인 : Cochran's C test (0) | 2025.09.27 |