분석화학

분석화학 student의 t, 신뢰구간 #10

캐미14 2021. 10. 1. 17:24
반응형

Student t 테스트는 앞에서 얘기했던 평균을 비교하는 것이다.
A, B 병원에서 얻은 혈당을 비교하는 것! 탄산이온 농도 두 기기로부터 측정했는데 그 평균을 비교해서 서로 다르냐 다르지 않냐 통계적으로 밝혀냅니다. F 테스트를 하고 F 테스트를 통해서 표준편차가 상당히 다른지 같은지 결론을 내고 다른 경우에는 a라는 방법을 통해서 평균을 비교하고, 다르지 않은 경우에는 b라는 방법을 통해서 평균을 비교합니다. A, B 병원에서 얻은 수치를 비교해서 내가 당뇨인지 알고 싶고~ 탄산이온 측정 기기도 두 기기가 서로 같은 결과를 주는 기기냐 따라 측정값 평균을 비교하고 싶다. 말의 탄산이온의 농도가 기기에 따라 얼마나 다른지 같은지 알고 싶어 한다. t 테스트는 F 테스트보다 더 중요하다. 신뢰구간이나 t 테스트의 t 값을 활용하는 방법에 대해 공부할 것 오늘은 여기까지~

t-test하기 위해서 필요한 개념이 신뢰 구간이다. 화학 측정에서 참(모집단) 평균과 참(모집단) 표준편차를 구할 수 없어서 샘플을 가지고 평균값과 표준편차를 구하여 모평균을 추정한다. 어떤 범위 내 표준편차를 구하여 평균에 표시하면 다음과 같다.
x ± s !! 이 범위 안의 참값이 있을 거라 예상하는 것. 이 범위를 정하는 것은 과학적으로 잡아야지 그 안에 모평균(참값)이 있을 거란 근거가 될 것이다. 이전까지 간단하게 범위를 표준편차만 가지고 제시했다. 그 범위 안의 실제 참값(모평균)이 그 안에 들어있다를 보고 한 것이다. 표준 편차로 범위를 가장 간단한 초보적인 방법이고 신뢰구간은 더 고차원적인 과학적인 통계적인 접근이다. 신뢰 구간과 표준편차와 가장 다른 점은 신뢰 수준을 얘기할 수 있다는 것!

표준편차는 안에 모 평균이 100%가 있다 정도만 얘기 가능하고, 신뢰 구간은 신뢰 수준을 95%, 90% 로 다양하게 신뢰하는 정도를 가지고 범위를 말할 수 있다. 계산 방법은 위 식과 같이 샘플의 평균과 샘플의 표준편차를 구하고 루트 시행회수로나누고 t 벨류를 곱한다. 평균 ± 표준편차 t / √n 계산에 의해 어떤 범위가 그 범위 안의 참값이 몇 퍼 (신뢰 수준)을 적어야 한다. t가 그 신뢰수준과 n(횟수)에 따라 값이 달라지고 테이블에 값이 있다.


문제의 50% 90%가 신뢰 수준이다. t 찾을 때는 자유도를 썼고 표준편차에서는 시행 횟수를 넣었따. 헷갈리지마~큰 범위와, 작은 범위로 나타나고 당연히 모평균은 큰 범위에 들어갈 확률이 높다. 신뢰 수준이 높을수록 모평균 발견할 확률이 높고 당연히 범위도 더 크다.

신뢰 구간 이해하는 중요한 그림이며 중간고사에 이 그림 설명하라는 문제를 자주 냈다. y 축은 측정 4번한 값의 평균이고 표의 박스의 중심값이 평균값이다.
x 축은 4번 평균한 것을 100번 반복한 것이다. (4번 평균하고 신뢰구간 구해서 점 하나 찍고 에러바 표시하고 반복) 에러바로 표시한 것은 신뢰 구간을 계산한 것을 ±로 나타낸 것으로 90%가 훨씬 더 넓은 걸 볼 수 있다. 100번 반복했으니 박스는 100개 있고 검정 박스는 모 평균을 포함하지 않은 경우!! 하얀 박스는 모평균을 포함하는 경우, 위의 50%, 90%는 전체 100개 박스 중에서 하얀 박스(신뢰구간이 모평균을 포함하는)가 50개, 90개 있다는 것!100번이 아니고 수없이 반복하면 더 50%에 가까워질 것이고 숫자가 작으면 50%에 안 나올 수 있따.

반응형