데이터 처리 방법

[Excel] 측정 방법의 비교 분석 : Deming Regression

어날켐 2023. 11. 19. 13:06
728x90
반응형

두 개의 분석법에서 얻은 측정 결과의 상관성 분석:
엑셀 (Excel)로 Deming regression 결과 확인하기

데밍 회귀 (Deming regression)는 2차원 데이터의 상관성을 확인하는 분석 방법으로
두 변수인 X와 Y가 모두 오차로 측정되는 2차원 데이터에서 상관성을 확인합니다.
데밍 회귀는 임상 분석처럼 시료에 측정 오류 변수가 많은 경우
두 측정 방법 간의 차이를 확인하고 검증하기 위해서 주로 사용됩니다.

이것은 검정 곡선 (calibration curve)을 생성하는 단순 선형 회귀 (simple linear regression) 분석과 차이가 있다. 
단순 선형 회귀는 단일 Y 변수만 오차로 측정되는 데이터에서 상관성을 확인하는 것으로
X 변수로 사용되는 농도는 오차가 없다는 가정으로 회귀 분석해서 결과를 도출한다.

데밍 회귀 분석에는 단순 선형 회귀와 비교해서 추가 설정값이 필요하다.
단순 선형 회귀에는 X값과 그 값에 대응하는 Y값이 필요하지만,
데밍 회귀에는 추가로 각각의 X, Y의 측정 오차를 확인할 수 있는 분산 (variation) 값이 필요합니다.

  Method A (Reference) Method B (New)
Variation ($SD^2$) 0.03 0.06
     
Sample No. Method A Method B
1 7.0 7.9
2 8.3 8.2
3 8.0 9.6
4 9.0 9.0
5 10.0 11.0
6 8.0 10.0
7 10.2 10.2
8 10.3 10.6
... ... ...
30 5.8 8.2

분산은 $(표준편차)^2$ 값으로 측정범위에서 확인된 반복측정의 결과로 계산할 수 있다. 

데밍 회귀는 엑셀에서 지원하지 않으므로 수식을 확인해서 계산을 진행했다.
수식 내용은 아래 참고 문헌을 통해서 확인했다.

참고문헌
1. https://real-statistics.com/regression/deming-regression/deming-regression-basic-concepts/
2. https://www.ncss.com/wp-content/themes/ncss/pdf/Procedures/NCSS/Deming_Regression.pdf

1번 참고 자료에서는 수식의 오타가 확인되어 원본 자료인 2번 참고 자료를 이용해서 수정하였다.
각각의 계산 항목 (Parameter)과 계산 수식은 아래 표에 정리되어 있다.

Parameter Value Comments Equations and functions
8.89 Mean of Data by method A $= \frac{(x_1 + x_2 + \cdots + x_n)}{n}$
8.69 Mean of Data by method B $= \frac{(y_1 + y_2 + \cdots + y_n)}{n}$
μ 215.84 Sum of squared deviations by method A $= \sum_{i=1}^{n} (x_i - ẋ)^2$
υ 175.71 Sum of squared deviations by method B $= \sum_{i=1}^{n} (y_i - ẏ)^2$
ε 166.038 Sum of deviations by method A anb B $= \sum_{i=1}^{n} (x_i - ẋ)^2 (y_i - ẏ)^2$
n 30 Number of data  
λ 2 Measurement error variance ratio $= \frac{\text{Variation of Method B}}{\text{Variation of Method A}}$
b 0.3292 Intercept of Deming regression line $= ẏ - a \times ẋ$
a 0.9401 Slope of Deming regression line $ = \frac{λυ - μ +((λυ - μ)^2 + 4λε^2)^{0.5}}{2λε} $

데밍 회귀의 수식은 항목의 a, b 를 이용해서 생성할 수 있다. 
측정 결과 비교 분산형 원과 데밍 회귀 수식 (빨간색 점선)을 겹쳐서 작성하면 다음과 같다. 

단순 선형 회귀분석과 차이점을 보여주기 위해서 단순 선형 회귀 수식은 검은색 점선으로 표기하였다.

데밍 회귀 수식은 y= 0.94x + 0.329 으로 계산되었지만, 
분석 결과 차이는 기울기의 값이 1에 가까운 정도를 보고 평가하기에는 판단 근거가 부족하다.
그래서 두 분석 결과의 상관성은 Jackknife SE 값을 산출해서 통계적인 유의성을 실시하고, 
분석 결과의 차이는 기울기 값이 1에 근접한 값인지 확인하는 통계적인 유의성을 검증으로 확인했다.
데이터 상관성을 확인한 p-value 값은 < 0.001 보다 낮은 값이 계산되어
자료들이 수식에 근접한 상태로 양의 상관 관계를 잘 나타내고 있다고 설명될 수 있다. 
분석 결과의 차이를 확인한 p-value 값은 가정을 기울기가 1에 가까운지 확률로 계산했을 때
통계적으로 유의한 차이를 보이지 않는 값 0.6209를 나타내었다. 
두 분석 방법의 결과는 큰 차이를 보이지 않는 것으로 평가되었다. 

데이터에 이상치가 포함되어 데밍 회귀 수식에 영향이 있었는지 확인하기 위해서
데밍 회귀 수식에서 계산된 최적 잔차 (Optimal Residual) 값의 정규성을 검증하였다.  

정규성 검증 내용에 대한 자세한 계산 방법은 아래 링크를 통해서 확인이 가능하다.

2023.11.06 - [데이터 처리 방법] - [Excel] 정규성 검증 : Q-Q plot 만들기

데밍 회귀 분석의 엑셀 테이터 분석 결과는 첨부파일로 공유합니다. 
추가 의견 또는 오류에 대한 의견이 있으시면 댓글 부탁드립니다. 
감사합니다.

Deming regression_V1.xlsx
0.04MB

 

728x90
반응형