본문 바로가기
기기분석 데이터

[Excel] 검정 곡선 (calibration Curve) 평가 : 등분산성 (Homoscedasticity)

by 어날켐 2023. 12. 31.
728x90

검정곡선 (calibration curve)의 등분산성 (homoscedasticity)을 엑셀로 평가하기 

검정곡선 (calibration curve) 수식을 만드는 점들의 분산 차이가 증가하는 경우
잔차도 (residual plot)에서 농도에 따른 분산 차이가 나타나고,
계산된 농도의 오차도 증가되는 현상이 나타난다. 
아래 내용을 보시면 위 내용의 예시를 확인할 수 있습니다. 
2023.12.26 - [기기분석 데이터] - [Excel] 검정 곡선 (calibration Curve) 평가 : 잔차도 (Residual Plot)

 

[Excel] 검정 곡선 (Calibration Curve) 평가 : 잔차도 (Residual Plot)

잔차도 (residual plot)를 엑셀로 작성하고, 검정곡선 (calibration curve)의 적합성 확인하기 잔차도 (residual plot)은 검정 곡선의 각 농도의 잔차 (residual)를 확인하기 위한 내용이다. 잔차는 각 농도의 측

analchem.tistory.com

잔차도에서는 분산 차이가 뚜렷이 차이나는 경우는 평가에 어려움이 없지만, 
분산 차이가 불분명할 경우 등분산성 (homoscedasticity) 테스트로 평가가 가능하다.
등분산성 테스트는 분산의 차이를 평가하는 통계적 방법이다. 
아래 참고문헌에서 제시된 내용이 일반적으로 사용되는 방법으로
검정곡선의 가장 낮은 농도의 y-축 반응값 분산과 
가장 높은 농도의 y-축 반응값 분산의 비를 계산하여 F 값 (F_experimental)을 확인한다. 
각 농도의 분산의 비율인 F 값은 분산의 차이를  
반복 측정 결과에서 발생할 수 있는 분산이 같을 확률 99%가 적용된 임계치 F 값 (F_critical one tail)과 비교한다.
실험 결과의 F 값이 임계치 F 보다 크면,
두 농도의 분산 차이가 있다고 평가된다.   

참고문헌: Almeida, A. M. D., Castel-Branco, M. M., & Falcão, A. C. (2002). Linear regression for calibration lines revisited: weighting schemes for bioanalytical methods. Journal of Chromatography B, 774(2), 215-222. 

 
낮은 농도와 높은 농도의 분산을 비교하는 이유는
장비 측정값은 농도가 감소될수록 측정 오차가 증가하기 때문이다.
그런 이유로 분산의 차이를 확인할 때 
가장 낮은 농도와 가장 높은 농도를 비교하면 차이를 확인할 수 있다. 
엑셀 수식으로 등분산성 확인에 필요한 계산은 다음과 같다.

분산 (Variance) = VAR.S (value range) 
 F_experimental = 가장 높은 농도의 분산 / 가장 낮은 농도의 분산
 F_critical one tail = =F.INV(probability, degree of freedom 1, degree of freedom 2)

임계값 F는 확률과 반복 측정 횟수로 계산되는 자유도 (degree of freedom)을 입력하면 확인할 수 있다. 
예를 들어, 각 농도에서 측정된 반복 측정 횟수가 5회라면 자유도는 n-1로 계산되어 4가 된다. 
분산 비교에 있어서 99% 확률로 비교한다면, 확률에 0.99를 입력한다. 
= F.INV (0.99, 4, 4)
표기된 결과 값은 반복측정과 확률에 근거한 분산 차이의 임계값을 보여준다. 
이 값보다 큰 값을 나타내는 결과라면 통계적으로 유의한 분산 차이가 있다고 해석되며, 
'이분산성 (heteroscedasticity)' 이라고 지칭하기도 한다. 
등분산성 평가는 p-value 값으로도 유의성을 확인할 수 있다.
p-value는 각 그룹의 데이터 분산이 동일할 확률 99%을 벗어난 확률을 표기한 값이다.
분산 검증에 사용되는 F 테스트는 F 값을 확률값인 p-value로 평가된 결과를 보여준다.
F 테스트의 p-value는 엑셀에서 다음 수식으로 확인된다.

F-test (p-value) = F.TEST (value range 1, value range 2)

결과에서 p-value 값이 0.01 (1%) 보다 낮다면
유의한 분산 차이가 있다고 
F 테스트의 통계 분석을 엑셀에서 지원하며,
'메뉴 > 데이터 >  데이터분석' 를 선택하고 세부 메뉴에서
F-검정 테스트를 사용하면 동일한 결과를 얻을 수 있다.   


다음 예시는 각 배치별로 측정된 5개 검정곡선의 잔차도 결과이다. 

잔차도 결과에도 낮은 농도와 높은 농도의 잔차 분산은 큰 차이가 없는 것으로 예상된다. 
해당 내용을 등분산성 테스트로 확인하면, 다음과 같은 결과를 얻을 수 있다. 

Level Variance Degree of freedom (n-1)
First Level 1104826 4
Last Level 10239253 4
F_experimental 9.27
p-value 0.0266
Probability 99%
F_critical one-tail 15.98
Homoscedaticity Yes

측정값의 분산과 5회 반복 측정 결과 자유도는 4이다. 
실험적인 F 값은 9.27로 확인되고, 임계치 15.98 보다 낮기 때문에
검정곡선의 유의한 등분산성이 나타난다고 평가된다. 
등분산성의 유의성을 확인할 수 있는 p-value 값도 0.01 보다 큰 것이 확인된다. 
다음 예시는 측정값이 이전과 다른 결과로 잔차도 내용은 다음과 같다. 

잔차도 결과에서 등분산성의 평가가 육안으로 명화하지 않는 것이 확인되어
등분산성의 평가 결과를 위와 동일한 방법으로 확인하였다.

Level Variance Degree of freedom (n-1)
First Level 142207 4
Last Level 3686131 4
F_experimental 25.92
p-value 0.0040
Probability 99%
F_critical one-tail 15.98
Homoscedaticity No

등분산성 결과를 보면 이전과 달리 유의한 분산 차이가 있는 결과를 나타낸다.  
F_experimental = 25.92 > F_critical one-tail = 15.98
p-value = 0.004 < 0.01
하지만, 등분산성이 없는 경우라도 검정곡선에 문제가 있다고 평가되지는 않는다. 
위 내용의 검정곡선 평가 내용 중 back-calculated concentration 값을 확인해보면
실험에서 설정한 정확성 허용기준 (%RE within ±10%)을 벗어나지 않는 것이 확인된다. 

Response
(1)
Accuracy
(%RE)
Response
(2)
Accuracy
(%RE)
Response
(3)
Accuracy
(%RE)
Response
(4)
Accuracy
(%RE)
Response
(5)
Accuracy
(%RE)
1.83 -8.3% 1.82 -9.2% 1.80 -9.8% 1.82 -8.8% 2.10 5.2%
4.87 -2.7% 4.86 -2.8% 5.16 3.2% 5.03 0.5% 5.00 0.1%
9.95 -0.5% 10.15 1.5% 9.94 -0.6% 10.34 3.4% 10.20 2.0%
20.22 1.1% 19.81 -1.0% 20.27 1.3% 20.13 0.6% 19.66 -1.7%
39.82 -0.5% 40.24 0.6% 39.68 -0.8% 39.63 -0.9% 40.14 0.4%
80.35 0.4% 80.15 0.2% 80.22 0.3% 80.19 0.2% 79.65 -0.4%
120.19 0.2% 120.17 0.1% 119.94 -0.1% 119.75 -0.2% 120.25 0.2%
199.77 -0.1% 199.81 -0.1% 199.99 0.0% 200.12 0.1% 199.98 0.0%

등분산성 테스트는 분산의 차이를 검증하는 방법이지만, 
검정곡선의 적합성 평가에서 절대적인 기준으로 사용되지는 않는다. 
등분산성 테스트는 보조적인 검증 방법으로 사용되며, 
이분산성이 확인되도 농도 계산에 문제가 없다면 무시될 수 있다. 
위 내용의 엑셀 작업 내용을 첨부파일로 업로드합니다. 
자세한 내용은 엑셀 파일을 참고해 주세요. 
감사합니다. 

Calibration curve_Homoscedasticity_V1.xlsx
0.05MB

 
 

728x90