본문 바로가기
기기분석 데이터

[Excel] 검정 곡선 (Calibration Curve) 교정 : 가중치 (Weighting)

by 어날켐 2023. 12. 26.
728x90

엑셀로 선형 검정 곡선 (Calibration curve)의
가중치 (Weighting) 설정하기

선형의 검정 곡선 (y = ax +b)은
농도 (concentration)와 장비 반응 (response)의 회귀분석 결과로 만들어진다.
농도와 장비 반응의 상관성을 검정 곡선으로 확인하고, 
시료의 장비 반응 결과를 검정 곡선에 대입하면 
검정 곡선 범위에서 시료의 농도를 계산할 수 있다. 

농도 변화에 따른 장비의 반응도가 수식처럼 선형을 나타내면 농도 계산에 오차가 발생하지 않겠지만,
일부 범위에서 수식과 다른 상관성을 가지면서 측정 농도에 오차를 발생하기도 한다.
예를 들어, 낮은 농도를 포함해서 농도를 측정하는 경우
낮은 농도에서만 측정 오차가 크게 발생하는 경우가 있다.

아래 표에 검정 곡선의 결과를 살펴보면
농도 (concentration)와 장비 반응 (response)의 결과로 확인된 선형 수식은 
$y = 210860 \times x + 140903$ 이고,  
결정계수 $(r^2)$는 0.099995 로 1에 가까운 값을 나타낸다.  

Concentration Response Back-calculated concentration Accuracy 
(%RE)
0.2 1.79E+05 0.18 -9.76%
0.5 2.45E+05 0.49 -1.35%
1 3.54E+05 1.01 0.97%
2 5.61E+05 1.99 -0.32%
5 1.21E+06 5.07 1.41%
10 2.22E+06 9.88 -1.17%
20 4.38E+06 20.13 0.63%
30 6.45E+06 29.94 -0.19%

해당 수식을 이용해서 장비 반응 값을 수식에 대해서 농도를 환산한 값 (back-calculated concentration)을 확인하면, 
농도 0.2의 장비 반응 값으로 계산된 농도는 0.18로 계산되고, 상대 오차 (%RE: relative error)는 -9.76%로 확인된다. 
실험 방법의 정확성 허용 기준이 ±10%로 설정된 분석법이라면 문제되지 않지만, 
허용 기준이 ±2%로 설정된 분석법이라면
농도 0.2의 샘플 농도는 2% 이상의 오차가 발생되고, 
0.2 보다 높은 농도에서는 오차가 2% 이하로 나타난다. 
위의 내용 처럼 일정 범위에서만 농도 오차가 발생한다면 가중치 (weighting)를 설정해서 오차를 줄일 수 있다.
이런 경우에는 수식의 변경보다는 가중치 설정이 더 효과적이다.

검정 곡선의 농도 오차를 교정하기 위해서 사용되는 가중치 설정은
일반적으로 장비 소프트웨어에서 제공하고 있지만,
엑셀에서는 해당 내용의 편의 사항이 제공되지 않고 있다.
가중치 설정의 내용을 엑셀 함수로 구현해서 설명하려고 한다.

일반적으로 검정 곡선의 낮은 농도 교정에 사용되는 가중치 계수 (weighting factor)는
1/$x$, 1/$x^2$, 1/$y$, 1/$y^2$ 가 주로 사용된다.

회귀 분석으로 계산된 선형의 검정 곡선은 점과 선의 차이가 최소가 되도록 만들어진다.
점과 선의 y축 오차를 잔차 (residual)라고 지칭하며,
회귀 분석의 검정 곡선은 잔차가 최소가 되도록 수식의 상수가 결정된다.

위와 같은 경우 처럼 모든 잔차를 동일하게 차이가 나도록 수식이 만들어지면,
일정 구간에서는 농도의 오차가 크게 나타나기도 한다.
잔차의 오차를 모든 농도에서 동일하게 적용하지 않고,
농도 차이에 따라서 다르게 잔차를 적용해서
수식을 만들도록 하는 것이 가중치 (weighting) 입니다.    

가중치 적용이 없는 경우에는 각 농도별 오차의 차이가 동일하게 적용되므로 
가중치 계수는 "1"로 적용되고, 점의 갯수로 수식에 반영된다.  
낮은 농도 잔차를 줄이기 위해서는 가중치 계수를 적용하는데 
예를 들어, 1/$x$ 를 적용하면 농도 값의 역수를 수식에 적용하게 되는데
농도가 낮은 경우에는 잔차가 수식에 많이 적용되고, 
농도가 높은 경우에는 잔차가 수식에 적게 적용된다.

참고문헌: Almeida, A. M. D., Castel-Branco, M. M., & Falcão, A. C. (2002). Linear regression for calibration lines revisited: weighting schemes for bioanalytical methods. Journal of Chromatography B, 774(2), 215-222.

수식에서 가중치 계수의 변수는 "w"로 각 농도(X)와 반응값(Y) 계산에 같이 곱해서
각 농도 또는 반응값에 적용되어 선형 수식의 기울기와 절편 값에 영향을 미치게된다. 
부분합 ∑x∙y 에 같이 계산되는 w는 농도가 다르면 다르게 적용된다. 

가중치가 적용된 수식을 확인하기 위해서는
먼저 각 농도에 적용될 가중치 계수를 다음과 같이 계산해야 한다. 

Concentration None 1/$x$ 1/$x^2$ 1/$y$ 1/$y^2$
0.2 1.0 5.00E+00 2.50E+01 5.59E-06 3.12E-11
0.5 1.0 2.00E+00 4.00E+00 4.08E-06 1.67E-11
1 1.0 1.00E+00 1.00E+00 2.83E-06 7.99E-12
2 1.0 5.00E-01 2.50E-01 1.78E-06 3.17E-12
5 1.0 2.00E-01 4.00E-02 8.26E-07 6.83E-13
10 1.0 1.00E-01 1.00E-02 4.49E-07 2.02E-13
20 1.0 5.00E-02 2.50E-03 2.28E-07 5.20E-14
30 1.0 3.33E-02 1.11E-03 1.55E-07 2.40E-14

그 다음 수식을 이용해서 가중치 계수 1/$x$, 1/($x^2$), 1/$y$, 1/($y^2$) 에 따른 
선형 회귀 분석의 기울기와 절편을 각각 계산하면 된다. 
수식의 부분합 ∑x∙y 은 엑셀의 함수 "SUMPRODUCT(배열1, 배열2,......)"을 적용해서 계산했다.
가중치 계수가 적용된 계산된 수식은 다음과 같다. 

Weighting
factor
Linear eqation  Y = aX + b
Data No. (n) Slope (a) Intercept (b) $R^2$
None 8 210859.8  140903.2  0.99995 
1/$x$ 8 211161.8  138309.2  0.99993 
1/$x^2$ 8 212821.6  136814.5  0.99976 
1/$y$ 8 211029.8  139352.4  0.99994 
1/$y^2$ 8 211700.4  138165.2  0.99985 

가중치가 적용된 수식을 살펴보면 기울기와 절편의 값이 다소 변경된 것을 확인할 수 있고, 
결정계수 값도 아주 큰 차이를 보여주지 않는다. 
그래프 내용을 확인해도 점과 검정곡선의 차이점은 육안으로 큰 차이점이 없어 보인다.

하지만, 농도를 계산한 정확도 내용을 확인해 보면 차이점이 나타난다.
아래 표에는 가중치 계수가 적용된 각각의 수식을 사용해서  
back-calculated concentration과 %RE를 확인하면
특정 가중치 계수에서 오차가 적게 나타나는 것을 확인할 수 있다.

None 1/$x$ 1/$x^2$ 1/$y$ 1/$y^2$
Back-calculated concentration % RE Back-calculated concentration % RE Back-calculated concentration % RE Back-calculated concentration % RE Back-calculated concentration % RE
0.18  -9.8% 0.19  -3.7% 0.20  -1.0% 0.19  -6.2% 0.19  -3.6%
0.49  -1.4% 0.50  1.0% 0.51  1.6% 0.50  0.0% 0.50  0.8%
1.01  1.0% 1.02  2.1% 1.02  2.0% 1.02  1.6% 1.02  1.9%
1.99  -0.3% 2.00  0.1% 1.99  -0.3% 2.00  0.0% 2.00  -0.1%
5.07  1.4% 5.08  1.5% 5.04  0.9% 5.07  1.5% 5.06  1.3%
9.88  -1.2% 9.88  -1.2% 9.81  -1.9% 9.88  -1.2% 9.86  -1.4%
20.13  0.6% 20.11  0.5% 19.96  -0.2% 20.12  0.6% 20.06  0.3%
29.94  -0.2% 29.91  -0.3% 29.69  -1.0% 29.93  -0.2% 29.84  -0.5%
Total %RE 15.8% Total %RE 10.5% Total %RE 8.8% Total %RE 11.3% Total %RE 10.0%

위 표의 내용에서 오차가 가장 적게 나타나는 가중치 계수는 1/$x^2$으로 확인되며, 
전체 오차를 계산한 "Total %RE"에서도 가장 낮은 값을 보이고 있다. 

가중치 미적용과 다른 가중치 적용 농도 계산방법은
가장 낮은 농도 0.2에서 허용기준치 2%를 초과하는 오차를 나타내고 있다.
해당 내용을 그래프에서 비교해 보면 다음과 같다. 

농도 0.2 에서 가중치를 적용하는 수식에 따라서 점과 가까워지는 수식이 있다는 것이 확인된다. 
잔차값이 증가하는 수식은 농도를 계산할 때 농도 오차가 커지므로 
정확도를 평가하는 %RE 값이 증가하는 것이 나타난다. 
반대로 높은 농도의 경우 잔차값이 다소 증가해도
농도 오차 비율이 크게 증가하지 않기 때문에 정확도 %RE 값은 큰 변동이 없다.
예를 들어, 잔차가 모든 농도에서 1이 되도록 수식이 계산되어 농도의 오차 0.1이 발생한다면
농도가 1인 경우에는 잔차로 인한 오차가 0.1일 발생하므로 
%RE = 100*(1 + 0.1) / 1 이므로 10% 농도 오차가 발생한다.
농도가 10인 경우에는 잔차로 인하 오차가 0.1일 발생되어도    
%RE = 100*(10 + 0.1) / 10 이므로 1% 농도 오차가 발생한다.

동일한 잔차의 회귀분석 수식을 이용해서 농도를 계산하는 경우
낮은 농도 범위에서 오차가 발생한다면,
검정 곡선의 오차를 줄이기 위해서 가중치를 설정해서 교정하고 설정하는 것을 엑셀로 확인했다. 

검정 곡선의 교정에 필요한 가중치 설정을 엑셀로 계산한 내용을 첨부 파일로 업로드합니다. 

감사합니다. 

Calibration curve_weighting factor_V1.xlsx
0.04MB

728x90