User Tools

Site Tools


t-test

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
t-test [2020/05/10 21:03] hkimscilt-test [2022/07/07 10:05] (current) – [예] hkimscil
Line 7: Line 7:
 \begin{eqnarray} \begin{eqnarray}
 z\;\;\;\text{or}\;\;\;t = \frac{\overline{X}-\mu}{\sigma_{\overline{X}} }  \\ z\;\;\;\text{or}\;\;\;t = \frac{\overline{X}-\mu}{\sigma_{\overline{X}} }  \\
-\\ 
 t = \frac{\overline{X}-\mu}{s_{\overline{X}}  } \\ t = \frac{\overline{X}-\mu}{s_{\overline{X}}  } \\
-\\ 
 t = \frac{(\overline{X_a}-\overline{X_b})-(\mu_a-\mu_b)}{\sigma_{diff}} \\  t = \frac{(\overline{X_a}-\overline{X_b})-(\mu_a-\mu_b)}{\sigma_{diff}} \\ 
-\\ +t = \frac{\overline{D}-0}{s_{ \overline{D} }} = \frac {\overline{D}}{ \frac{s_D}{\sqrt{N}} } 
-t = \frac{\overline{D}-0}{s_{ \overline{D} }} = \frac {\overline{D}}{ \frac{s_D}{\sqrt{N}} } \\ +
 \end{eqnarray} \end{eqnarray}
  
Line 66: Line 62:
 <WRAP info> <WRAP info>
 그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까? 그렇다면 이 감자 집단의 진짜 (그들만의 모집단) 평균은 어디일까?
-$ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } $+$ \displaystyle \pm t_{\alpha=.05}(399) = \pm 1.965927 = \frac {197 - \mu} {se} = \frac {197 - \mu} {\frac {20} {\sqrt{400}} } = 197 - \mu $
 <code> <code>
 qt(.05/2,399)  qt(.05/2,399) 
Line 246: Line 242:
  
 </code> </code>
 +===== 모집단의 평균만을 알고 있을 경우, 예 =====
 +임산부의 혈압이 전국 평균 120 mmHg 임을 알고 있다. 그러나, 표준편차 값은 알고 있지 못하다. 임산부들이 아주 약한 수준의 포도주를 마시게 되면 혈압이 높아져서 건강에 좋지 않다는 것을 알고 싶다. 이에 따라서 15명의 임산부를 모집하여 아주 약한 수준의 포도주를 섭취하도록 하고 혈압을 재어보았다. 이 데이터를 가지고 혈압이 올랐는지를 검증하려고 한다. 
 +
 +평균은 123, 표준편차는 7.33이었다. 시그마는 알고 있지 못한 상태이고, 모집단의 평균은 120 이다. 이 연구는 알코올의 영향력이 있는가를 알아보는 것으로, 가설은 연구자의 포도주섭취자샘플의 평균이 임산부모집단의 평균과 다르다 선언하는 것이다. 
 +
 +\begin{eqnarray*}
 +\text{H1: } \;\; \overline{X} \;\; (=123) & \ne & \mu \;\;\; (=120)  \\
 +\end{eqnarray*}
 +이 선언문을 (educated guess) 직접 테스트할 수는 없으므로, 이를 뒤집어서 영가설을 만든다.
 +\begin{eqnarray*}
 +\text{H0: } \;\; \overline{X} \;\; (=123) & = & \mu \;\;\; (=120)  \\
 +\end{eqnarray*}
 +
 +
 +영가설은 [[:Central Limit Theorem|중심극한정리를]] (CLT) 이용하여, 모집단에 속한 임산부에서 취할 수 있는 샘플의 (n=15) 평균이 나올 수 있는 범위를 se를 구하여 알 수있고, 연구자의 샘플평균이 이 범위에서 나온다면, 포도주를 섭취하지 않은 평범한 샘플 중의 하나라고 판단할 수 있고, <fc #ff0000>이 범위 밖에서</fc> 나온다면 <fc #ff0000>모집단에 속한 평범한 샘플이 아니라고 판단</fc>할 수 있게 된다.
 +
 +t-test 일반에서 설명한 것처럼 이를 테스트하기 위해서는 <fc #008000>샘플평균과 모집단평균의 차이에</fc> <fc #ff0000>랜덤에러(표준오차)가</fc> <fc #00ff00>몇개나 들어가</fc>나 보아서 __2에 유사한 점수와__ ((t-test이므로 +-1.96(2)가 아닌, [[:t distribution table]]을 이용해서 판단한다)) 비교해 보려고 하는 것이다. 
 +
 +아래는 이것을 R에서 확인해 보는 작업이다.
 +
 +<code>
 +## 모집단의 평균값
 +mu <- 120
 +## 샘플들의 (n=15) 혈압 데이터
 +bp <- c(131, 115, 118, 120, 126, 137, 
 +         125, 116, 117, 122, 123, 128, 
 +         110, 124, 133)
 +m.bp <- mean(bp) ## 샘플평균
 +m.bp
 +sd.bp <- sd(bp) ## 샘플표준편차
 +sd.bp
 +n.bp <- length(bp) ## 샘플갯수
 +n.bp
 +
 +diff <- m.bp-mu ## 샘플-모집단 차이
 +## 표준오차 = 샘플평균들의 표준편차  
 +## standard error = standard deviation of sample means 
 +## 즉, 랜덤에러
 +se.bp <- sd.bp/sqrt(n.bp)  
 +
 +## 차이를 랜덤에러로 나눈 값
 +t.value <- diff/se.bp
 +t.value
 +
 +## 우리가 비교해봐야 할 값
 +qt(c(.025, .975), 14)
 +
 +</code>
 +<code>
 +> ## 모집단의 평균값
 +> mu <- 120
 +> ## 샘플들의 (n=15) 혈압 데이터
 +> bp <- c(131, 115, 118, 120, 126, 137, 
 ++         125, 116, 117, 122, 123, 128, 
 ++         110, 124, 133)
 +> m.bp <- mean(bp) ## 샘플평균
 +> m.bp
 +[1] 123
 +> sd.bp <- sd(bp) ## 샘플표준편차
 +> sd.bp
 +[1] 7.329003
 +> n.bp <- length(bp) ## 샘플갯수
 +> n.bp
 +[1] 15
 +
 +> diff <- m.bp-mu ## 샘플-모집단 차이
 +> ## 표준오차 = 샘플평균들의 표준편차  
 +> ## standard error = standard deviation of sample means 
 +> ## 즉, 랜덤에러
 +> se.bp <- sd.bp/sqrt(n.bp)  
 +
 +> ## 차이를 랜덤에러로 나눈 값
 +> t.value <- diff/se.bp
 +> t.value
 +[1] 1.585338
 +
 +> ## 우리가 비교해봐야 할 값
 +> qt(c(.025, .975), 14)
 +[1] -2.144787  2.144787
 +
 +</code>
 +t.value가 (1.59) +-2.145점 안 쪽에 존재하므로 영가설을 부정할 수 없게 된다.
 +
  
 ===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 ===== ===== 두 집단 간의 평균과 표준편차만으로 판단하는 경우 =====
Line 358: Line 437:
 [1] -2.100922 </code> [1] -2.100922 </code>
  
-  * $\displaystyle t= \frac {\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} $+  * $\displaystyle t= \frac {\text{difference between the two groups}}{\text{random error}} = \frac {\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} $
   * $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $   * $\displaystyle \text{Pooled variance} = s_p^2 = \frac{SS_a+SS_b}{df_a+df_b} = \frac{360}{18} = 20 $
   * $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $   * $\displaystyle se = \sqrt{\frac{s_p^2}{n_a}+\frac{s_p^2}{n_b}}= \sqrt{\frac{20}{10}+\frac{20}{10}} = 2 $
Line 364: Line 443:
 따라서  따라서 
   * $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $   * $\displaystyle t = \frac{\overline{X_a} - \overline{X_b}} {s_{\overline{X_a}-\overline{X_b}}} = \frac{19-25}{2} = -3 $
-  * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population을 가진 집단이라고 가정했을때에 나올 수 있는 차이를 훨씬 넘어선다. +  * $\displaystyle t_{calculated} > t_{crit}$ 이므로, 영가설을 부정한다. 즉, 이 두 집단의 평균차이는 (-6)은 두 집단이 대동소이한 집단이라고 가정할 때, 즉 동일한 population에 속한 집단이라고 가정했을때에 나올 수 있는 차이를 훨씬 넘어선다. 
  
 따라서, C는 다음과 같이 보고한다.  따라서, C는 다음과 같이 보고한다. 
Line 440: Line 519:
 According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15. According to (1), $t_{cal}=3.844$ . Then what is the value of $df$ (case number-1)? = (16-1) = 15.
 When critical value = .05, $ t_{crit} = \pm{2.13} $ When critical value = .05, $ t_{crit} = \pm{2.13} $
 +
 +==== 예 1 ====
  
 <code> <code>
Line 554: Line 635:
  
 </code> </code>
 +==== 예 2 ====
 +<code>
 +# sample size = n 
 +n <- 36 # 36명이 있다
 +# 이들이 평가한 네이버의 UI 점수는 76점이고 
 +# 이들이 시간을 두고 평가한 새로운 네이버의 UI는 80점이라고 하고.
 +# 이 차이가 UI가 향상했다는 증거로 삼을 수 있는지 검증하고자 한다.
 +n <- 36
 +rnorm2 <- function(n,mean,sd) { mean+sd*scale(rnorm(n)) }
 +set.seed(101)
 +time1 <- rnorm2(n, 76, 5)
 +time2 <- rnorm2(n, 80, 5)
 +time1
 +time2
 +# 위에서 t1과 t2는 동일한 집단 (샘플)
 +# 샘플의 평균이 다를 뿐
 +time.diff <- time2 - time1
 +mean.diff <- mean(time.diff)
 +se.diff <- sd(time.diff)/sqrt(n)
 +t.calc <- mean.diff/se.diff
 +mean.diff
 +se.diff
 +t.calc
 +# 위의 t calculated value를 t distribution table의 t값과 비교 (t critical value)
 +# t.crit 값은 qt를 이용해서 구함
 +t.crit <- qt(.975, 35) # n-1 = 35
 +t.crit
 +
 +t.calc > t.crit 
 +# 위의 값이 true이므로 t2와 t1 간의 차이가 충분히 크다고 판단하여 
 +# naver의 UI 점수가 t2에서 좋아졌다고 검증한다.
 +</code>
 +
  
 ===== 가설테스트, 예 ===== ===== 가설테스트, 예 =====
Line 602: Line 716:
  
 두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다. 두 번째의 판단을 채택하게 되면, A는 위에서의 NullHypothesis를 부정하는 것이 된다. 이를 다시 이야기 하면 [[research hypothesis]]를 채택하는 것이고, 이는 C사는 평균이 400g인 감자를 납품하고 있지 않다는 판단이다.
 +
 +===== 가설테스트 예 2 =====
 +가설. 가상현실 세계에서 교육을 받을 때 가상교수자가 존재하는 것과 목소리만으로 교육을 받는 것 간에 차이가 있을 것이다. 
 +  * 독립변인. 가상현실의 교수방법
 +    * 변인의 종류. 가상교수자의 존재/비존재(목소리만)
 +    * 가상교수자의 존재 -> w.Char
 +    * 목소리만 -> w.Voc
 +  * 종속변인. 교육결과 
 +    * 숫자변인
 +  * Data
 +w.Char = c(82, 89, 80, 87, 87, 94, 90, 84, 92, 83, 89, 79, 96, 73, 83, 83)
 +w.Voc  = c(74, 81, 74, 65, 80, 87, 79, 69, 87, 70, 85, 80, 85, 85, 88, 83)
 + 
 +
 +<code>
 +set.seed(101)
 +n1 <- 16
 +n2 <- 16
 +w.Char <- round(rnorm(n1, 85, 8))
 +w.Voc <- round(rnorm(n2, 81, 8))
 +
 +
 +g.diff <- mean(w.Char)-mean(w.Voc)
 +df1 <- 16-1
 +df2 <- 16-1
 +ss1 <- var(w.Char) * df1
 +ss2 <- var(w.Voc) * df2
 +
 +pooled.v <- (ss1 + ss2) / (df1 + df2)
 +se <- sqrt((pooled.v/n1) + (pooled.v/n2))
 +t.calc <- g.diff/se
 +
 +t.out <- t.test(w.Char, w.Voc)
 +t.out
 +t.calc
 +
 +</code>
 +
  
 ===== 가설테스트 요약 ===== ===== 가설테스트 요약 =====
t-test.1589112191.txt.gz · Last modified: 2020/05/10 21:03 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki