본문 바로가기
카테고리 없음

[Excel] 선형 회귀 분석 (Linear Regression) 수식

by 어날켐 2023. 11. 24.
728x90
반응형

선형 회귀 분석 (Linear Regression) 수식을 알아보고, 엑셀과 차이점 확인하기

선형 회귀 분석은 검정 곡선을 작성하는데 사용되는 통계 방법이다. 
엑셀에서 적용하는 수식을 확인해보고, 
엑셀 결과와 차이점이 있는지 확인하였다. 

참고문헌에서 확인된 선형 회귀 분석의 수식은 다음과 같다.

참고문헌
Almeida, A. M. D., Castel-Branco, M. M., & Falcão, A. C. (2002). Linear regression for calibration lines revisited: weighting schemes for bioanalytical methods. Journal of Chromatography B, 774(2), 215-222.

기울기 수식
절편 수식
상관 계수 수식 (결정계수 = 상관계수*상관계수)

해당 수식들은 기본 자료를 평균, 표준편차를 적용하지 않고 계산하는 방식으로
평균, 표준편차를 이용한 다른 수식과 차이가 있을 수 있지만, 
결과에는 차이가 없는 것으로 확인되었다.    

엑셀 결과와 차이점이 있는지 확인하기 위해서
엑셀 함수 결과와 수식을 이용한 계산을 비교했다. 

원본 테이터는 아래 결과 내용을 사용하였다. 

Data No. Concentration Response
1 1.0 120
2 2.0 250
3 5.0 500
4 10.0 980
5 20.0 2010
6 30.0 3049
7 40.0 3987
8 50.0 5102

수식을 이용해서 계산한 결과는 다음과 같이 확인되었다. 

Parameter Value Comments
n 8 Number of data
a 100.94 Slope of linear regression line
b 6.2295 Intercept of linear regression line 
r 0.999810 Correlation coefficient

파리미터 "r"은 상관계수로 결정계수는 상관계수 제곱값으로 확인할 수 있다.

엑셀에서 계산된 내용은 분산형 그래프와 추세선 설정으로 확인하였다. 

수식 계산과 엑셀 계산 방법에는 차이가 없는 것으로 확인되었다. 
수식에서 계산된 상관계수(r)은 결정계수로 변환하면, 
$R^2 = r \times r = 0.999810 \times 0.999810 = 0.99962$ 
반올림하면 엑셀 결과 0.9996과 동일하다. 

샘플 테스트 결과 (Response)로 농도 (Concentration)를 계산하는 내용도 추가해서 엑셀 파일로 공유합니다. 

Sample Result Input data Output data
Response Concentration
Test1 3454 34.2
Test2 4905 48.5

Input data에 측정 결과를 입력하면 농도가 계산되도록 설정되었다.  

728x90
반응형