User Tools

Site Tools


r:t-test

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
r:t-test [2021/04/15 09:43] – [one sample t-test] hkimscilr:t-test [2024/04/15 08:52] (current) – [One sample t-test against population parameter mu and sigma] hkimscil
Line 30: Line 30:
 > potato_sample_large <- rnorm2(2500, 194,20) > potato_sample_large <- rnorm2(2500, 194,20)
 > mean(potato_sample_large) > mean(potato_sample_large)
-[1] 191+[1] 194
 > sqrt(var(potato_sample_large)) > sqrt(var(potato_sample_large))
 [1]   20 [1]   20
Line 82: Line 82:
 t <- (sample_mean - pop_mean) / (sample_sd/sqrt(n)) t <- (sample_mean - pop_mean) / (sample_sd/sqrt(n))
  
-abs(qt(0.05/2, 50))+abs(qt(0.05/2, 49))
  
 # or  # or 
-1-pt(t,n-1)+2*(1-pt(t,n-1))
 # n = 50 이었음 # n = 50 이었음
 # t = 계산된 값 # t = 계산된 값
 +</code>
 +
 +<code>
 +tout <- t.test(height_sample_biased, mu=pop_mean)
 +tout
 </code> </code>
 ====== One sample t-test population sigma unknown ====== ====== One sample t-test population sigma unknown ======
Line 279: Line 284:
 ====== one sample t-test ====== ====== one sample t-test ======
 <code> <code>
-s.n <- 25 +s.n <- 36 
-s.mean <- 52+s.mean <- 53.5
 s.sd <- 5 s.sd <- 5
 set.seed(1) set.seed(1)
Line 288: Line 293:
 </code> </code>
  
-위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (55점). 전국평균이 50점임을 알고 있다고 할 때, 강사는 이 55점으로 자신의 학습방법이 효과가 있다는 것을 증명하려고 한다. +위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (53.5, n=36). 전국평균이 51점임을 (표준편차는 샘플과 같이 5라고 하자) 알고 있다고 할 때, 강사는 이 55점으로 자신의 학습방법이 효과가 있다는 것을 증명하려고 한다. 
  
 +  * 모집단의 표준오차값은 무엇인가?
 +  * 자신의 학습방법이 효과가 있다는 것을 증명하시오
 +    * 가설
 +    * 영가설
 +    * 표준오차
 +    * 영가설 기각범위
 +    * 확인
 <code> <code>
-t.test(s1, mu=50)+t.test(s1, mu=51)
 </code> </code>
  
-<+표준편차가 샘플과 모집단이 서로 다르다고 한다면  
 +<code> 
 +t.test(s1, mu=51, var.equal=FALSE) 
 +</code> 
 + 
 +<code> 
 +# 이것을 손으로 풀면  
 +# 가설: 강사의 학습방법이 효과가 있을 것이다 
 +# 가설: 강사의 학생들의 점수와 모집단의 평균점수가 다를 것이다.  
 + 
 +# 모집단 평균: 51 
 +s.mu <- 51 
 +# 강사집단의 평균: 53.5, sd = 5 
 + 
 +# 이 때 se 값은  
 +se <- sqrt(s.sd^2/s.n) 
 +se2 <- se * 2 
 +# 영가설 기각 범위는 아래 두 점수 사이 
 +s.mu - se2 
 +s.mu + se2 
 +# mean(s1)값이 이 점수 밖에 존재하는가? 
 +mean(s1) 
 + 
 +</code> 
 +====== Two sample test ====== 
 +[[:t-test]] 
 + 
 +게임회사의 직원인 강태원씨는 게임에 접속하는 사용자의 게임에 대한 강박성이 존재할 때, 가장 접속을 많이 할 것이라는 가설을 세웠다. 강박성이란 게임의 진행과정이 머리에 끊임없이 떠올라서 게임상황을 활성화하는 정도를 말한다. 이런 방법으로 강태원은 강박성이 높은 그룹과 낮은 그룹 두 그룹을 구하고, 각 그룹의 게임에 쓴 비용을 구하였다. 정말 차이가 있을까? 
 + 
 +HI group  
 +평균: 6000 
 +n: 16 
 +LO group 
 +평균: 4000 
 +n: 16 
 + 
 +<code> 
 +s.n <- 16 
 +s.hi <- 6000 
 +s.sd <- 500 
 +s.lo <- 4000 
 + 
 +set.seed(101) 
 +s.hi <- round(rnorm(s.n, s.hi, s.sd)) 
 +s.lo <- round(rnorm(s.n, s.lo, s.sd)) 
 + 
 +s.hi 
 +s.lo 
 + 
 +mean(s.hi) 
 +mean(s.lo) 
 + 
 +t.test(s.hi, s.lo, var.equal=T) 
 +</code> 
 + 
 +====== Paired sample t-test ====== 
 +미디어교육을 초등학교 5학년 학생에게 하여, 이 학생들이 게임에 쓴 시간을 조절을 할 수 있게 된다고 학부모들을 설득하려고 한다. 이를 위해서 강경태 게임회사 기획자는 미디어교육 방법을 개발하고 이를 5학년 학생 집단 10명에게 적용한 후 게임에 쓴 시간을 측정을 하였다. 그 결과는 아래와 같다. 
 +  * se 값을 구해보시오 
 +  * t 값을 구해보시오 
 + 
 +<code> 
 +before <- c(392.9, 393.2, 345.1, 393, 434, 427.9, 422, 383.9, 392.3, 352.2) 
 +after <- c(200.1, 190.9, 192.7, 213, 241.4, 196.9, 172.2, 185.5, 205.2, 193.7) 
 + 
 +bminusa <- before-after 
 +mean(bminusa) 
 +sd(bminusa) 
 + 
 +se <- sqrt(sd(bminusa)^2/10) 
 +t.value <- (mean(before)-mean(after))/se 
 + 
 +t.test(before, after, paired=TRUE) 
 +</code>
  
r/t-test.1618447439.txt.gz · Last modified: 2021/04/15 09:43 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki