t-test
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
t-test [2022/04/24 18:49] – [동일집단 간의 차이에 대해서 알아볼 때] hkimscil | t-test [2022/07/07 10:05] (current) – [예] hkimscil | ||
---|---|---|---|
Line 437: | Line 437: | ||
[1] -2.100922 </ | [1] -2.100922 </ | ||
- | * $\displaystyle t= \frac {\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} $ | + | * $\displaystyle t= \frac {\text{difference between the two groups}}{\text{random error}} |
* $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $ | * $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $ | ||
* $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $ | * $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $ | ||
Line 443: | Line 443: | ||
따라서 | 따라서 | ||
* $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $ | * $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $ | ||
- | * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population을 가진 | + | * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population에 속한 |
따라서, C는 다음과 같이 보고한다. | 따라서, C는 다음과 같이 보고한다. | ||
Line 635: | Line 635: | ||
</ | </ | ||
+ | ==== 예 2 ==== | ||
+ | < | ||
+ | # sample size = n | ||
+ | n <- 36 # 36명이 있다 | ||
+ | # 이들이 평가한 네이버의 UI 점수는 76점이고 | ||
+ | # 이들이 시간을 두고 평가한 새로운 네이버의 UI는 80점이라고 하고. | ||
+ | # 이 차이가 UI가 향상했다는 증거로 삼을 수 있는지 검증하고자 한다. | ||
+ | n <- 36 | ||
+ | rnorm2 <- function(n, | ||
+ | set.seed(101) | ||
+ | time1 <- rnorm2(n, 76, 5) | ||
+ | time2 <- rnorm2(n, 80, 5) | ||
+ | time1 | ||
+ | time2 | ||
+ | # 위에서 t1과 t2는 동일한 집단 (샘플) | ||
+ | # 샘플의 평균이 다를 뿐 | ||
+ | time.diff <- time2 - time1 | ||
+ | mean.diff <- mean(time.diff) | ||
+ | se.diff <- sd(time.diff)/ | ||
+ | t.calc <- mean.diff/ | ||
+ | mean.diff | ||
+ | se.diff | ||
+ | t.calc | ||
+ | # 위의 t calculated value를 t distribution table의 t값과 비교 (t critical value) | ||
+ | # t.crit 값은 qt를 이용해서 구함 | ||
+ | t.crit <- qt(.975, 35) # n-1 = 35 | ||
+ | t.crit | ||
+ | |||
+ | t.calc > t.crit | ||
+ | # 위의 값이 true이므로 t2와 t1 간의 차이가 충분히 크다고 판단하여 | ||
+ | # naver의 UI 점수가 t2에서 좋아졌다고 검증한다. | ||
+ | </ | ||
+ | |||
===== 가설테스트, | ===== 가설테스트, | ||
Line 683: | Line 716: | ||
두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다. | 두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다. | ||
+ | |||
+ | ===== 가설테스트 예 2 ===== | ||
+ | 가설. 가상현실 세계에서 교육을 받을 때 가상교수자가 존재하는 것과 목소리만으로 교육을 받는 것 간에 차이가 있을 것이다. | ||
+ | * 독립변인. 가상현실의 교수방법 | ||
+ | * 변인의 종류. 가상교수자의 존재/ | ||
+ | * 가상교수자의 존재 -> w.Char | ||
+ | * 목소리만 -> w.Voc | ||
+ | * 종속변인. 교육결과 | ||
+ | * 숫자변인 | ||
+ | * Data | ||
+ | w.Char = c(82, 89, 80, 87, 87, 94, 90, 84, 92, 83, 89, 79, 96, 73, 83, 83) | ||
+ | w.Voc = c(74, 81, 74, 65, 80, 87, 79, 69, 87, 70, 85, 80, 85, 85, 88, 83) | ||
+ | |||
+ | |||
+ | < | ||
+ | set.seed(101) | ||
+ | n1 <- 16 | ||
+ | n2 <- 16 | ||
+ | w.Char <- round(rnorm(n1, | ||
+ | w.Voc <- round(rnorm(n2, | ||
+ | |||
+ | |||
+ | g.diff <- mean(w.Char)-mean(w.Voc) | ||
+ | df1 <- 16-1 | ||
+ | df2 <- 16-1 | ||
+ | ss1 <- var(w.Char) * df1 | ||
+ | ss2 <- var(w.Voc) * df2 | ||
+ | |||
+ | pooled.v <- (ss1 + ss2) / (df1 + df2) | ||
+ | se <- sqrt((pooled.v/ | ||
+ | t.calc <- g.diff/se | ||
+ | |||
+ | t.out <- t.test(w.Char, | ||
+ | t.out | ||
+ | t.calc | ||
+ | |||
+ | </ | ||
+ | |||
===== 가설테스트 요약 ===== | ===== 가설테스트 요약 ===== |
t-test.1650793768.txt.gz · Last modified: 2022/04/24 18:49 by hkimscil