본문 바로가기
기기분석 데이터

[Excel] 검정 곡선 (Calibration Curve) 평가 : 잔차도 (Residual Plot)

by 어날켐 2023. 12. 26.
728x90

잔차도 (residual plot)를 엑셀로 작성하고,
검정곡선 (calibration curve)의 적합성 확인하기

잔차도 (residual plot)은 검정 곡선의 각 농도의 잔차 (residual)를 확인하기 위한 내용이다. 
잔차는 각 농도의 측정값 (measured value)과 수식의 예상값 (predicted value)편차 (difference value) 이다. 

잔차도는 잔차를 y축으로 설정해서 각 농도의 잔차를 확인할 수 있도록 작성된 그래프이다.
잔차도를 작성해서 별도로 내용을 확인하는 이유는
장비 반응값의 범위가 잔차 범위보다 크기 때문에 검정곡선에서는 잔차의 내용이 잘 확인되지 않기 때문이다. 

검정곡선 (calibration curve)의 여러가지 평가 방법 중
대표적인 평가 방법으로는 결정계수 ( $r^2$ )가 있다.
결정계수는 점과 수식의 선이 가까운 정도를 수치로 표현한 값으로
1에 근접한 값을 나타내는 검정곡선은 점과 수식에 큰 차이가 없다는 것을 표현한다. 
검정곡선의 결정계수가 1에 가까운 값으로 계산되었지만, 
특정 범위에서 시료의 농도 값이 정확성 허용범위를 초과하는 경우가 있다. 
이런 경우에는 특정 농도의 잔차가 정상 범위를 벗어나서 생기는 현상으로
검정곡선에서 확인되지 않는 문제의 측정 농도를 
잔차도를 작성하면 문제가 발생된 농도의 잔차를 확인할 수 있다.  
검정곡선의 정확성과 안정성을 확보하기 위한 방법으로
측정 범위 안에서 표준물질 농도를 5개 이상 설정하라고 가이드한다.  
각 농도에서 발생하는 잔차가 무작위 오차 (random error)로 인해서 
무작위 잔차들이 증가와 감소로 인해서 일정한 검정곡선을 만들게 된다.   
안정적인 검정곡선을 만들 수 있는 무작위 잔차가 최소 5개가 필요하다는 것이 확인되어서
표준물질 측정 농도를 5개 이상 설정해야 한다는 것이다.


[ 정상 잔차도 예시 ]

아래 그래프는 각각 배치 (batch) 별로 작성된 검정곡선과 잔차도의 내용이다. 
각 배치별 결정계수는 0.99996, 0.99996, 0.99997 로 1에 가까운 값으로 계산되었다. 

위 잔차도는 정상적인 결과로
점들이 특별한 경향이 없이 무작위 오차 (random error) 패턴을 나타내고 있다. 
정상적인 잔차도의 가지는 검정곡선은
농도 계산의 오차 결과도 허용기준 (%RE : < 10%) 보다 낮은 것을 아래에서 확인할 수 있다. 

Back-calculated concentration
Response
(1)
Accuracy
(%RE)
Response
(2)
Accuracy
(%RE)
Response
(3)
Accuracy
(%RE)
1.92 -3.8% 2.13 6.5% 1.80 -9.8%
5.33 6.6% 4.57 -8.7% 5.40 8.0%
9.71 -2.9% 10.17 1.7% 9.75 -2.5%
20.57 2.8% 19.67 -1.6% 20.32 1.6%
39.41 -1.5% 40.52 1.3% 39.53 -1.2%
80.39 0.5% 79.61 -0.5% 80.45 0.6%
119.41 -0.5% 120.62 0.5% 119.64 -0.3%
200.27 0.1% 199.72 -0.1% 200.10 0.1%

[ 비정상 잔차도 예시 1 ]

넓은 측정 범위 설정 또는 부적절한 표준물질 농도 간격으로 
검정곡선에 잔차의 시스템 오차 (systematic error)가 생성된다면 
특정 범위에서 농도 계산의 오차가 증가하게 된다. 
아래 예시는 위 내용과 동일한 배치의 결과로 동일한 측정 범위와 다른 측정 결과를 가지고 있다. 
각 배치별 결정계수는 0.99997, 0.99997, 0.99998 로 이전 예시와 비슷한 값으로 계산되었다.

하지만, 잔차도의 결과를 보면 정상적인 무작위 패턴 대신 경향성을 나타나는 점들이 관찰된다. 
포물선으로 나타나는 잔차도 패턴이 나타나는 경우
장비의 반응값이 측정 농도 범위에서 직선이 나타나지 않는 상황에서 
직선의 회귀분석 수식을 계산한 결과이다. 
해당 직선의 수식으로 농도를 계산한다면,
낮은 농도의 오차가 허용기준 (%RE : < 10%)을 벗어나는 것이 아래 표에서 확인된다.  

Back-calculated concentration
Response
(1)
Accuracy
(%RE)
Response
(2)
Accuracy
(%RE)
Response
(3)
Accuracy
(%RE)
1.35 -32.3% 1.37 -31.4% 1.51 -24.4%
4.80 -4.0% 4.99 -0.2% 4.87 -2.6%
9.97 -0.3% 9.88 -1.2% 10.09 0.9%
20.26 1.3% 20.37 1.9% 20.06 0.3%
40.42 1.1% 40.11 0.3% 40.56 1.4%
80.27 0.3% 80.55 0.7% 80.06 0.1%
120.31 0.3% 120.02 0.0% 119.95 0.0%
199.61 -0.2% 199.73 -0.1% 199.89 -0.1%

[ 비정상 잔차도 예시 2 ]

다음 예시는 각 배치별 검정곡선의 기울기는 거의 차이가 없었지만, 절편의 편차가 증가된 상황으로
일차방정식의 결정계수는 0.999 값 이상으로 나타난 경우이다.

 

해당 검정곡선의 잔차도는 높은 농도에서 잔차 편차가 증가하는 시스템 오류가 나타났다. 
개별 배치의 일차방정식 수식으로 농도를 계산하면, 
낮은 농도의 오차가 허용기준 (%RE : < 10%)을 벗어나는 것이 아래 표에서 확인된다. 

Back-calculated concentration
Response
(1)
Accuracy
(%RE)
Response
(2)
Accuracy
(%RE)
Response
(3)
Accuracy
(%RE)
2.58 29.1% 2.58 28.9% 2.74 37.2%
5.78 15.7% 5.37 7.4% 6.14 22.9%
10.14 1.4% 10.50 5.0% 9.99 -0.1%
20.44 2.2% 18.82 -5.9% 20.09 0.4%
37.13 -7.2% 39.71 -0.7% 37.63 -5.9%
81.72 2.2% 78.12 -2.4% 81.95 2.4%
118.48 -1.3% 122.53 2.1% 117.02 -2.5%
200.72 0.4% 199.37 -0.3% 201.44 0.7%

이와 같은 경우에는 높은 농도의 잔차 증가 때문에
기울기 오차가 발생해서 기울기의 편차는 소량 증가하고, 
절편 값의 편차가 많이 증가하는 결과를 나타냈다. 
이로 인하여, 낮은 농도의 정확성이 허용오차를 벗어나는 것을 보여주었다.     


[ 비정상 잔차도 예시 3 ]

다음 예시는 앞의 예시와 반대로 낮은 농도의 측정 오차 증가로 인하여 절편의 편차가 증가된 상황으로
일차방정식의 결정계수는 0.9999 값 이상으로 나타난 경우이다.

해당 검정곡선의 잔차도는 낮은 농도에서 잔차 편차가 증가하는 시스템 오류가 나타났다. 
개별 배치의 일차방정식 수식으로 농도를 계산하면, 
낮은 농도의 오차가 허용기준 (%RE : < 10%)을 벗어나는 것이 아래 표에서 확인된다. 

Back-calculated concentration
Response
(1)
Accuracy
(%RE)
Response
(2)
Accuracy
(%RE)
Response
(3)
Accuracy
(%RE)
2.38 19.0% 1.77 -11.5% 1.51 -24.4%
4.69 -6.1% 5.35 7.1% 5.62 12.4%
10.06 0.6% 9.77 -2.3% 9.82 -1.8%
19.77 -1.1% 20.29 1.5% 20.16 0.8%
40.07 0.2% 39.78 -0.5% 39.87 -0.3%
79.93 -0.1% 80.13 0.2% 80.07 0.1%
120.14 0.1% 119.84 -0.1% 119.93 -0.1%
199.95 0.0% 200.06 0.0% 200.02 0.0%

이와 같은 경우에는 낮은 농도의 잔차 증가 때문에
낮은 농도의 정확성과 정밀성이 허용오차를 벗어나는 것을 보여주었다.     


회귀분석으로 생성된 수식에 시스템 오차로 문제가 발생하면
오류 내용을 평가할 수 있는 잔차도 (residual plot)가 예시들을 확인해 보았다.   

잔차도 평가 방법은 수치로 평가하는 방법을 사용하지 않고, 
분포된 점들의 패턴을 보고 확인한다. 
무작위 오차는 실험에서 자연적으로 발생하는 것으로 
잔차에서도 무작위 패턴이 나타나면 정상적이고 판단한다. 

하지만, 시스템 오류가 발생한다면 잔차도에 비정상적 패턴이 발생하고
농도 계산에 허용범위를 초과하는 오차를 발생시키게 된다. 
결정계수는 점과 수식의 가까운 정도를 나타내기 때문에 
잔차의 수치는 평가에 중요한 요소가 되지 않는다.  

농도와 측정값은 선형 관계가 아니라 실제로는 곡선의 형태를 지니고 있다.
일부 좁은 범위의 측정 구간이라면 선형 관계가 명확하게 나타나지만,
넓은 측정 범의 또는 측정 구간이 측정한계치에 가까워지면
곡선의 관계가 더 두드러지게 나타난다.
곡선 구간에서 직선의 수식을 작성한다면
농도 계산에 큰 오차를 발생시키게 된다. 
이런 오류를 결정계수로 확인이 불가하므로 
잔차도를 작성해서 확인이 필요하다. 
잔차도는 일반적으로 처음 검정곡선을 생성하고 검정할 때 주로 사용된다. 
위 자료의 엑셀 내용을 첨부 파일로 올립니다. 
잔차도 작성에 자세한 내용은 엑셀 파일로 확인해 보세요.
긴 내용 확인해 주셔서 감사합니다. 

Calibration curve_Residual plot_V2.xlsx
0.08MB

728x90