본문 바로가기
데이터 처리 방법

[Excel] 분석법 비교 방법 : Bland-Altman Plot (단일 측정 결과)

by 어날켐 2024. 2. 5.
728x90

두 가지 분석법 결과의 차이를 평가하는 "Bland-Altman plot" 
엑셀 (Excel)로 작성하는 방법을 알아보자!

두 가지 분석법의 결과 차이를 확인하는 대표적인 방법 중 하나로 
분석법 가이드라인에 "cross validation" 결과를 제시할 때
Bland-Altman plot 을 작성해서 보고하라는 내용이 있다.
아래 그래프는 Bland-Altman plot 예시로 개별 분석법으로 측정된 1회 측정 결과의 비교 내용이다.

해당 비교 분석 방법은 1999년 발표한 논문 저자의 이름을 명칭으로 사용하였다. 
Bland-Altman plot은 측정 가능 범위에서 두 방법의 차이를 확인하는 그래프로

방법 차이가 발생되는 농도 영역과 이상 패턴을 확인하기 좋은 방법이다.    
그래프 작성 방법은 아래 참고문헌을 바탕으로 작성하였다. 

참고문헌: Bland, J. M., & Altman, D. G. (1999). Measuring agreement in method comparison studies. Statistical methods in medical research, 8(2), 135-160. 

 

Bland-Altman plot 은 두 가지 분석법 결과의 평균과 차이로 작성된다.
x 축은 평균 값으로 설정하고, y 축은 차이 값으로 설정해서 점으로 표기한다.
(엑셀 차트에서 분산형으로 작성한다.)

가운데 빨간 점선은 분석법 차이 값들의 평균값을 나타내는 것이고,
두 분석법의 결과 차이 (difference)를 나타내는 것으로 
차이의 평균값이 " Zero (0) " 에 근접한 결과를 나타내면
측정 범위에서 두 분석법의 결과 차이가 적은 것으로 추정한다. 
측정된 범위에서 모든 농도 값의 차이가 비슷한 수준을 나타내지 않기 때문에
허용 범위를 설정해서 차이가 발생 가능한 범위에서 나타나는지 확인이 가능하다.  

그래프에서 가장 높은 빨간 점선과 낮은 빨간 점선은
허용 범위 (Limits of agreement)의 최대값과 최소값을 나타낸다.
허용 범위의 계산은 두 측정값 차이의 평균과 표준편차를 사용한다.
계산식은 아래와 같다. 
(차이의 평균 : Difference Mean; 차이의 표준편차 : Difference SD)

$ \text{Upper Limit} = \text{Difference Mean} + 1.96 \times \text{Difference SD}$
$ \text{Lower Limit} = \text{Difference Mean} - 1.96 \times \text{Difference SD}$

측정값의 차이가 정규분포 (z-distribution)를 나타낸다고 가정하고
95% 데이터가 존재하는 범위를 허용범위로 설정하였다.
95% 구간 설정의 z 값 “1.96” 을 적용해서 계산하였다. 
참고문헌에서는 근사치 값인 “2” 를 사용할 수 있다는 내용도 언급되어 있다.
아마도 차이 값이 개별 측정 변동에 의해서 최소 또는 최대가 될 수 있으므로
허용 가능한 반올림한 최대치 “2” 를 적용할 수 있다고 언급한 것으로 생각된다.  

위와 같은 공식으로 설정된 허용범위는 동일 샘플을 이용해서
개별 분석법으로 1회 측정된 결과로 확인되었다.
다양한 농도의 다수 샘플을 모아서 정리한 결과이기 때문에
개별 분석법의 측정 오차로 계산된 차이 값에는 오차 범위가 존재한다.
즉, 동일한 시료로 측정된 차이 값은 일정한 오차 범위가 나타난다는 것이다.
계산된 허용 범위의 값의 오차 범위는 95% 신뢰 구간(CI) 으로 계산되며, 
오차 범위 계산 수식은 논문에서 다음과 같이 제시되어 있다. 

$ \text{95% CI of Upper Limit} = \text{Upper Limit} \pm \sqrt{\left(\frac{1}{n} + \dfrac{1.96^2}{2(n-1)} \right)} \times \text{Difference SD}$

$ \text{95% CI of Lower Limit} = \text{Lower Limit} \pm \sqrt{\left(\frac{1}{n} + \dfrac{1.96^2}{2(n-1)}\right)} \times \text{Difference SD}$

 

범위를 설정하는 수식 $\sqrt{\left(\dfrac{1}{n} + \dfrac{1.96^2}{2(n-1)} \right)}$ 은 
n 수가 적지 않다면, n 과  n-1 의 값이 가까운 값을 나타내기 때문에
n = n-1 같다고 가정해서 내용을 정리하면 다음과 같은 수식을 얻을 수 있다.

$\sqrt{\left(\dfrac{1}{n} + \dfrac{1.96^2}{2(n-1)} \right)}$ ⁓ $\sqrt{\left(1 + \dfrac{1.96^2}{2}\right) \times \dfrac{1}{n}}$ = $\sqrt{ \dfrac{2.92}{n}}$ ⁓ $\sqrt{ \dfrac{3}{n}}$

복잡한 수식 내용이 상수 값 "2.92" 으로 정리되며, 
해당 값을 반올림해서 "3" 으로 적용한 논문도 확인이 된다. 

참고문헌:  Giavarina, D. (2015). Understanding bland altman analysis. Biochemia medica, 25(2), 141-151.

오차 범위를 확인할 수 있는 95% 신뢰 구간은
허용 범위 설정값에 인접한 초과 값에 적합성 여부를 판별할 때 사용된다. 

모든 내용을 정리해서 그래프로 표기하면 다음과 같이 확인된다. 

그래프 가운데 점선은 편차의 평균 값이고, 상단의 빨간색 점선과 하단의 빨간색 점선은 허용 범위를 나타낸다. 
보라색 점선은 인근에 위치한 점선의 오차 범위를 나타내는 것이다. 
엑셀로 작성된 그래프는 첨부파일로 공유합니다. 

Bland Altman plot_Single_V1.xlsx
0.02MB

해당 내용은 단일 측정의 분석법 비교 방법인 내용을 기반으로 작성되었다.  
동일 시료의 반복 측정 결과를 이용한 Bland-Altman plot 을 작성한다면
논문에 제시된 허용 범위의 계산 수식이 달라지므로 주의가 필요하다.
자세한 내용은 아래 내용을 참고하시면 됩니다. 

2024.02.06 - [데이터 처리 방법] - [Excel] 분석법 비교 방법 : Bland-Altman Plot (반복 측정 결과)

728x90