t-test
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionNext revisionBoth sides next revision | ||
t-test [2020/05/10 23:04] – [모집단의 평균만을 알고 있을 경우, 예] hkimscil | t-test [2022/04/24 19:02] – [예 2] hkimscil | ||
---|---|---|---|
Line 62: | Line 62: | ||
<WRAP info> | <WRAP info> | ||
그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까? | 그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까? | ||
- | $ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } $ | + | $ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } = 197 - \mu $ |
< | < | ||
qt(.05/ | qt(.05/ | ||
Line 251: | Line 251: | ||
\end{eqnarray*} | \end{eqnarray*} | ||
이 선언문을 (educated guess) 직접 테스트할 수는 없으므로, | 이 선언문을 (educated guess) 직접 테스트할 수는 없으므로, | ||
- | $$ \text{H0: } \;\; \overline{X} \;\; (=123) & = & \mu \;\;\; (=120) | + | \begin{eqnarray*} |
- | 영가설은 [[:Central Limit Theorem|중심극한정리를]] (CLT) 이용하여, | + | \text{H0: } \;\; \overline{X} \;\; (=123) & = & \mu \;\;\; (=120) |
+ | \end{eqnarray*} | ||
+ | 영가설은 [[:Central Limit Theorem|중심극한정리를]] (CLT) 이용하여, | ||
+ | t-test 일반에서 설명한 것처럼 이를 테스트하기 위해서는 <fc # | ||
+ | |||
+ | 아래는 이것을 R에서 확인해 보는 작업이다. | ||
< | < | ||
+ | ## 모집단의 평균값 | ||
mu <- 120 | mu <- 120 | ||
+ | ## 샘플들의 (n=15) 혈압 데이터 | ||
bp <- c(131, 115, 118, 120, 126, 137, | bp <- c(131, 115, 118, 120, 126, 137, | ||
125, 116, 117, 122, 123, 128, | 125, 116, 117, 122, 123, 128, | ||
110, 124, 133) | 110, 124, 133) | ||
- | m.bp <- mean(bp) | + | m.bp <- mean(bp) |
m.bp | m.bp | ||
- | sd.bp <- sd(bp) | + | sd.bp <- sd(bp) |
sd.bp | sd.bp | ||
- | n.bp <- length(bp) | + | n.bp <- length(bp) |
n.bp | n.bp | ||
- | diff <- m.bp-mu | + | diff <- m.bp-mu |
- | se.bp <- sd.bp/ | + | ## 표준오차 = 샘플평균들의 표준편차 |
+ | ## standard error = standard deviation of sample means | ||
+ | ## 즉, 랜덤에러 | ||
+ | se.bp <- sd.bp/ | ||
+ | ## 차이를 랜덤에러로 나눈 값 | ||
t.value <- diff/se.bp | t.value <- diff/se.bp | ||
t.value | t.value | ||
+ | ## 우리가 비교해봐야 할 값 | ||
qt(c(.025, .975), 14) | qt(c(.025, .975), 14) | ||
</ | </ | ||
+ | < | ||
+ | > ## 모집단의 평균값 | ||
+ | > mu <- 120 | ||
+ | > ## 샘플들의 (n=15) 혈압 데이터 | ||
+ | > bp <- c(131, 115, 118, 120, 126, 137, | ||
+ | + 125, 116, 117, 122, 123, 128, | ||
+ | + 110, 124, 133) | ||
+ | > m.bp <- mean(bp) ## 샘플평균 | ||
+ | > m.bp | ||
+ | [1] 123 | ||
+ | > sd.bp <- sd(bp) ## 샘플표준편차 | ||
+ | > sd.bp | ||
+ | [1] 7.329003 | ||
+ | > n.bp <- length(bp) ## 샘플갯수 | ||
+ | > n.bp | ||
+ | [1] 15 | ||
+ | > | ||
+ | > diff <- m.bp-mu ## 샘플-모집단 차이 | ||
+ | > ## 표준오차 = 샘플평균들의 표준편차 | ||
+ | > ## standard error = standard deviation of sample means | ||
+ | > ## 즉, 랜덤에러 | ||
+ | > se.bp <- sd.bp/ | ||
+ | > | ||
+ | > ## 차이를 랜덤에러로 나눈 값 | ||
+ | > t.value <- diff/se.bp | ||
+ | > t.value | ||
+ | [1] 1.585338 | ||
+ | > | ||
+ | > ## 우리가 비교해봐야 할 값 | ||
+ | > qt(c(.025, .975), 14) | ||
+ | [1] -2.144787 | ||
+ | > | ||
+ | </ | ||
+ | t.value가 (1.59) +-2.145점 안 쪽에 존재하므로 영가설을 부정할 수 없게 된다. | ||
+ | |||
===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 ===== | ===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 ===== | ||
Line 472: | Line 519: | ||
According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15. | According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15. | ||
When critical value = .05, $ t_{crit} = \pm{2.13} $ | When critical value = .05, $ t_{crit} = \pm{2.13} $ | ||
+ | |||
+ | ==== 예 1 ==== | ||
< | < | ||
Line 586: | Line 635: | ||
</ | </ | ||
+ | ==== 예 2 ==== | ||
+ | < | ||
+ | # sample size = n | ||
+ | n <- 36 # 36명이 있다 | ||
+ | # 이들이 평가한 네이버의 UI 점수는 76점이고 | ||
+ | # 이들이 시간을 두고 평가한 새로운 네이버의 UI는 80점이라고 하고. | ||
+ | # 이 차이가 UI가 향상했다는 증거로 삼을 수 있는지 검증하고자 한다. | ||
+ | n <- 36 | ||
+ | rnorm2 <- function(n, | ||
+ | set.seed(101) | ||
+ | time1 <- rnorm2(n, 76, 5) | ||
+ | time2 <- rnorm2(n, 80, 5) | ||
+ | time1 | ||
+ | time2 | ||
+ | # 위에서 t1과 t2는 동일한 집단 (샘플) | ||
+ | # 샘플의 평균이 다를 뿐 | ||
+ | time.diff <- time2 - time1 | ||
+ | mean.diff <- mean(time.diff) | ||
+ | se.diff <- sd(time.diff)/ | ||
+ | t.calc <- mean.diff/ | ||
+ | mean.diff | ||
+ | se.diff | ||
+ | t.calc | ||
+ | # 위의 t calculated value를 t distribution table의 t값과 비교 (t critical value) | ||
+ | # t.crit 값은 qt를 이용해서 구함 | ||
+ | t.crit <- qt(.975, 35) # n-1 = 35 | ||
+ | t.crit | ||
+ | |||
+ | t.calc > t.crit | ||
+ | # 위의 값이 true이므로 t2와 t1 간의 차이가 충분히 크다고 판단하여 | ||
+ | # naver의 UI 점수가 t2에서 좋아졌다고 검증한다. | ||
+ | </ | ||
+ | |||
===== 가설테스트, | ===== 가설테스트, |
t-test.txt · Last modified: 2022/07/07 10:05 by hkimscil