User Tools

Site Tools


t-test

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
t-test [2020/05/10 23:05] – [모집단의 평균만을 알고 있을 경우, 예] hkimscilt-test [2022/07/07 10:05] (current) – [예] hkimscil
Line 62: Line 62:
 <WRAP info> <WRAP info>
 그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까? 그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까?
-$ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } $+$ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } = 197 - \mu $
 <code> <code>
 qt(.05/2,399)  qt(.05/2,399) 
Line 251: Line 251:
 \end{eqnarray*} \end{eqnarray*}
 이 선언문을 (educated guess) 직접 테스트할 수는 없으므로, 이를 뒤집어서 영가설을 만든다. 이 선언문을 (educated guess) 직접 테스트할 수는 없으므로, 이를 뒤집어서 영가설을 만든다.
-$$ \text{H0: } \;\; \overline{X} \;\; (=123) & = & \mu \;\;\; (=120)  $$+\begin{eqnarray*} 
 +\text{H0: } \;\; \overline{X} \;\; (=123) & = & \mu \;\;\; (=120)  \\ 
 +\end{eqnarray*} 
 + 
 영가설은 [[:Central Limit Theorem|중심극한정리를]] (CLT) 이용하여, 모집단에 속한 임산부에서 취할 수 있는 샘플의 (n=15) 평균이 나올 수 있는 범위를 se를 구하여 알 수있고, 연구자의 샘플평균이 이 범위에서 나온다면, 포도주를 섭취하지 않은 평범한 샘플 중의 하나라고 판단할 수 있고, <fc #ff0000>이 범위 밖에서</fc> 나온다면 <fc #ff0000>모집단에 속한 평범한 샘플이 아니라고 판단</fc>할 수 있게 된다. 영가설은 [[:Central Limit Theorem|중심극한정리를]] (CLT) 이용하여, 모집단에 속한 임산부에서 취할 수 있는 샘플의 (n=15) 평균이 나올 수 있는 범위를 se를 구하여 알 수있고, 연구자의 샘플평균이 이 범위에서 나온다면, 포도주를 섭취하지 않은 평범한 샘플 중의 하나라고 판단할 수 있고, <fc #ff0000>이 범위 밖에서</fc> 나온다면 <fc #ff0000>모집단에 속한 평범한 샘플이 아니라고 판단</fc>할 수 있게 된다.
  
 +t-test 일반에서 설명한 것처럼 이를 테스트하기 위해서는 <fc #008000>샘플평균과 모집단평균의 차이에</fc> <fc #ff0000>랜덤에러(표준오차)가</fc> <fc #00ff00>몇개나 들어가</fc>나 보아서 __2에 유사한 점수와__ ((t-test이므로 +-1.96(2)가 아닌, [[:t distribution table]]을 이용해서 판단한다)) 비교해 보려고 하는 것이다. 
 +
 +아래는 이것을 R에서 확인해 보는 작업이다.
  
 <code> <code>
 +## 모집단의 평균값
 mu <- 120 mu <- 120
 +## 샘플들의 (n=15) 혈압 데이터
 bp <- c(131, 115, 118, 120, 126, 137,  bp <- c(131, 115, 118, 120, 126, 137, 
          125, 116, 117, 122, 123, 128,           125, 116, 117, 122, 123, 128, 
          110, 124, 133)          110, 124, 133)
-m.bp <- mean(bp)+m.bp <- mean(bp) ## 샘플평균
 m.bp m.bp
-sd.bp <- sd(bp)+sd.bp <- sd(bp) ## 샘플표준편차
 sd.bp sd.bp
-n.bp <- length(bp)+n.bp <- length(bp) ## 샘플갯수
 n.bp n.bp
  
-diff <- m.bp-mu +diff <- m.bp-mu ## 샘플-모집단 차이 
-se.bp <- sd.bp/sqrt(n.bp)+## 표준오차 = 샘플평균들의 표준편차   
 +## standard error = standard deviation of sample means  
 +## 즉, 랜덤에러 
 +se.bp <- sd.bp/sqrt(n.bp)  
  
 +## 차이를 랜덤에러로 나눈 값
 t.value <- diff/se.bp t.value <- diff/se.bp
 t.value t.value
  
 +## 우리가 비교해봐야 할 값
 qt(c(.025, .975), 14) qt(c(.025, .975), 14)
  
 </code> </code>
 +<code>
 +> ## 모집단의 평균값
 +> mu <- 120
 +> ## 샘플들의 (n=15) 혈압 데이터
 +> bp <- c(131, 115, 118, 120, 126, 137, 
 ++         125, 116, 117, 122, 123, 128, 
 ++         110, 124, 133)
 +> m.bp <- mean(bp) ## 샘플평균
 +> m.bp
 +[1] 123
 +> sd.bp <- sd(bp) ## 샘플표준편차
 +> sd.bp
 +[1] 7.329003
 +> n.bp <- length(bp) ## 샘플갯수
 +> n.bp
 +[1] 15
 +
 +> diff <- m.bp-mu ## 샘플-모집단 차이
 +> ## 표준오차 = 샘플평균들의 표준편차  
 +> ## standard error = standard deviation of sample means 
 +> ## 즉, 랜덤에러
 +> se.bp <- sd.bp/sqrt(n.bp)  
 +
 +> ## 차이를 랜덤에러로 나눈 값
 +> t.value <- diff/se.bp
 +> t.value
 +[1] 1.585338
 +
 +> ## 우리가 비교해봐야 할 값
 +> qt(c(.025, .975), 14)
 +[1] -2.144787  2.144787
 +
 +</code>
 +t.value가 (1.59) +-2.145점 안 쪽에 존재하므로 영가설을 부정할 수 없게 된다.
 +
  
 ===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 ===== ===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 =====
Line 388: Line 437:
 [1] -2.100922 </code> [1] -2.100922 </code>
  
-  * $\displaystyle t= \frac {\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} $+  * $\displaystyle t= \frac {\text{difference between the two groups}}{\text{random error}} = \frac {\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} $
   * $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $   * $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $
   * $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $   * $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $
Line 394: Line 443:
 따라서  따라서 
   * $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $   * $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $
-  * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population을 가진 집단이라고 가정했을때에 나올 수 있는 차이를 훨씬 넘어선다. +  * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population에 속한 집단이라고 가정했을때에 나올 수 있는 차이를 훨씬 넘어선다. 
  
 따라서, C는 다음과 같이 보고한다.  따라서, C는 다음과 같이 보고한다. 
Line 470: Line 519:
 According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15. According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15.
 When critical value = .05, $ t_{crit} = \pm{2.13} $ When critical value = .05, $ t_{crit} = \pm{2.13} $
 +
 +==== 예 1 ====
  
 <code> <code>
Line 584: Line 635:
  
 </code> </code>
 +==== 예 2 ====
 +<code>
 +# sample size = n 
 +n <- 36 # 36명이 있다
 +# 이들이 평가한 네이버의 UI 점수는 76점이고 
 +# 이들이 시간을 두고 평가한 새로운 네이버의 UI는 80점이라고 하고.
 +# 이 차이가 UI가 향상했다는 증거로 삼을 수 있는지 검증하고자 한다.
 +n <- 36
 +rnorm2 <- function(n,mean,sd) { mean+sd*scale(rnorm(n)) }
 +set.seed(101)
 +time1 <- rnorm2(n, 76, 5)
 +time2 <- rnorm2(n, 80, 5)
 +time1
 +time2
 +# 위에서 t1과 t2는 동일한 집단 (샘플)
 +# 샘플의 평균이 다를 뿐
 +time.diff <- time2 - time1
 +mean.diff <- mean(time.diff)
 +se.diff <- sd(time.diff)/sqrt(n)
 +t.calc <- mean.diff/se.diff
 +mean.diff
 +se.diff
 +t.calc
 +# 위의 t calculated value를 t distribution table의 t값과 비교 (t critical value)
 +# t.crit 값은 qt를 이용해서 구함
 +t.crit <- qt(.975, 35) # n-1 = 35
 +t.crit
 +
 +t.calc > t.crit 
 +# 위의 값이 true이므로 t2와 t1 간의 차이가 충분히 크다고 판단하여 
 +# naver의 UI 점수가 t2에서 좋아졌다고 검증한다.
 +</code>
 +
  
 ===== 가설테스트, 예 ===== ===== 가설테스트, 예 =====
Line 632: Line 716:
  
 두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다. 두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다.
 +
 +===== 가설테스트 예 2 =====
 +가설. 가상현실 세계에서 교육을 받을 때 가상교수자가 존재하는 것과 목소리만으로 교육을 받는 것 간에 차이가 있을 것이다. 
 +  * 독립변인. 가상현실의 교수방법
 +    * 변인의 종류. 가상교수자의 존재/비존재(목소리만)
 +    * 가상교수자의 존재 -> w.Char
 +    * 목소리만 -> w.Voc
 +  * 종속변인. 교육결과 
 +    * 숫자변인
 +  * Data
 +w.Char = c(82, 89, 80, 87, 87, 94, 90, 84, 92, 83, 89, 79, 96, 73, 83, 83)
 +w.Voc  = c(74, 81, 74, 65, 80, 87, 79, 69, 87, 70, 85, 80, 85, 85, 88, 83)
 + 
 +
 +<code>
 +set.seed(101)
 +n1 <- 16
 +n2 <- 16
 +w.Char <- round(rnorm(n1, 85, 8))
 +w.Voc <- round(rnorm(n2, 81, 8))
 +
 +
 +g.diff <- mean(w.Char)-mean(w.Voc)
 +df1 <- 16-1
 +df2 <- 16-1
 +ss1 <- var(w.Char) * df1
 +ss2 <- var(w.Voc) * df2
 +
 +pooled.v <- (ss1 + ss2) / (df1 + df2)
 +se <- sqrt((pooled.v/n1) + (pooled.v/n2))
 +t.calc <- g.diff/se
 +
 +t.out <- t.test(w.Char, w.Voc)
 +t.out
 +t.calc
 +
 +</code>
 +
  
 ===== 가설테스트 요약 ===== ===== 가설테스트 요약 =====
t-test.1589119522.txt.gz · Last modified: 2020/05/10 23:05 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki