Differences

This shows you the differences between two versions of the page.

--- r:t-test [2021/04/15 09:43] – [one sample t-test] hkimscil
+++ r:t-test [2024/04/15 08:52] (current) – [One sample t-test against population parameter mu and sigma] hkimscil
@@ Line 30: / Line 30: @@
 > potato_sample_large <- rnorm2(2500, 194,20)
 > mean(potato_sample_large)
-[1] 191
+[1] 194
 > sqrt(var(potato_sample_large))
 [1]   20
@@ Line 82: / Line 82: @@
 t <- (sample_mean - pop_mean) / (sample_sd/sqrt(n))
-abs(qt(0.05/2, 50))
+abs(qt(0.05/2, 49))
 # or
--pt(t,n-1)
+*(1-pt(t,n-1))
 # n = 50 이었음
 # t = 계산된 값
+</code>
+<code>
+tout <- t.test(height_sample_biased, mu=pop_mean)
+tout
 </code>
 ====== One sample t-test population sigma unknown ======
@@ Line 279: / Line 284: @@
 ====== one sample t-test ======
 <code>
-s.n <- 100
+s.n <- 36
-s.mean <- 52
+s.mean <- 53.5
 s.sd <- 5
 set.seed(1)
@@ Line 288: / Line 293: @@
 </code>
-위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (55점). 전국평균이 50점임을 알고 있다고 할 때, 강사는 이 55점으로 자신의 학습방법이 효과가 있다는 것을 증명하려고 한다.
+위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (53.5점, n=36). 전국평균이 51점임을 (표준편차는 샘플과 같이 5라고 하자) 알고 있다고 할 때, 강사는 이 55점으로 자신의 학습방법이 효과가 있다는 것을 증명하려고 한다.
+  * 모집단의 표준오차값은 무엇인가?
+  * 자신의 학습방법이 효과가 있다는 것을 증명하시오
+    * 가설
+    * 영가설
+    * 표준오차
+    * 영가설 기각범위
+    * 확인
 <code>
-t.test(s1, mu=50)
+t.test(s1, mu=51)
 </code>
-<
+표준편차가 샘플과 모집단이 서로 다르다고 한다면
+<code>
+t.test(s1, mu=51, var.equal=FALSE)
+</code>
+<code>
+# 이것을 손으로 풀면
+# 가설: 강사의 학습방법이 효과가 있을 것이다
+# 가설: 강사의 학생들의 점수와 모집단의 평균점수가 다를 것이다.
+# 모집단 평균: 51
+s.mu <- 51
+# 강사집단의 평균: 53.5, sd = 5
+# 이 때 se 값은
+se <- sqrt(s.sd^2/s.n)
+se2 <- se * 2
+# 영가설 기각 범위는 아래 두 점수 사이
+s.mu - se2
+s.mu + se2
+# mean(s1)값이 이 점수 밖에 존재하는가?
+mean(s1)
+</code>
+====== Two sample test ======
+[[:t-test]]
+게임회사의 직원인 강태원씨는 게임에 접속하는 사용자의 게임에 대한 강박성이 존재할 때, 가장 접속을 많이 할 것이라는 가설을 세웠다. 강박성이란 게임의 진행과정이 머리에 끊임없이 떠올라서 게임상황을 활성화하는 정도를 말한다. 이런 방법으로 강태원은 강박성이 높은 그룹과 낮은 그룹 두 그룹을 구하고, 각 그룹의 게임에 쓴 비용을 구하였다. 정말 차이가 있을까?
+HI group
+평균: 6000
+n: 16
+LO group
+평균: 4000
+n: 16
+<code>
+s.n <- 16
+s.hi <- 6000
+s.sd <- 500
+s.lo <- 4000
+set.seed(101)
+s.hi <- round(rnorm(s.n, s.hi, s.sd))
+s.lo <- round(rnorm(s.n, s.lo, s.sd))
+s.hi
+s.lo
+mean(s.hi)
+mean(s.lo)
+t.test(s.hi, s.lo, var.equal=T)
+</code>
+====== Paired sample t-test ======
+미디어교육을 초등학교 5학년 학생에게 하여, 이 학생들이 게임에 쓴 시간을 조절을 할 수 있게 된다고 학부모들을 설득하려고 한다. 이를 위해서 강경태 게임회사 기획자는 미디어교육 방법을 개발하고 이를 5학년 학생 집단 10명에게 적용한 후 게임에 쓴 시간을 측정을 하였다. 그 결과는 아래와 같다.
+  * se 값을 구해보시오
+  * t 값을 구해보시오
+<code>
+before <- c(392.9, 393.2, 345.1, 393, 434, 427.9, 422, 383.9, 392.3, 352.2)
+after <- c(200.1, 190.9, 192.7, 213, 241.4, 196.9, 172.2, 185.5, 205.2, 193.7)
+bminusa <- before-after
+mean(bminusa)
+sd(bminusa)
+se <- sqrt(sd(bminusa)^2/10)
+t.value <- (mean(before)-mean(after))/se
+t.test(before, after, paired=TRUE)
+</code>