r:t-test
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
r:t-test [2021/04/15 09:43] – [one sample t-test] hkimscil | r:t-test [2024/04/15 08:52] (current) – [One sample t-test against population parameter mu and sigma] hkimscil | ||
---|---|---|---|
Line 30: | Line 30: | ||
> potato_sample_large <- rnorm2(2500, | > potato_sample_large <- rnorm2(2500, | ||
> mean(potato_sample_large) | > mean(potato_sample_large) | ||
- | [1] 191 | + | [1] 194 |
> sqrt(var(potato_sample_large)) | > sqrt(var(potato_sample_large)) | ||
[1] 20 | [1] 20 | ||
Line 82: | Line 82: | ||
t <- (sample_mean - pop_mean) / (sample_sd/ | t <- (sample_mean - pop_mean) / (sample_sd/ | ||
- | abs(qt(0.05/ | + | abs(qt(0.05/ |
# or | # or | ||
- | 1-pt(t,n-1) | + | 2*(1-pt(t,n-1)) |
# n = 50 이었음 | # n = 50 이었음 | ||
# t = 계산된 값 | # t = 계산된 값 | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | tout <- t.test(height_sample_biased, | ||
+ | tout | ||
</ | </ | ||
====== One sample t-test population sigma unknown ====== | ====== One sample t-test population sigma unknown ====== | ||
Line 279: | Line 284: | ||
====== one sample t-test ====== | ====== one sample t-test ====== | ||
< | < | ||
- | s.n <- 100 | + | s.n <- 36 |
- | s.mean <- 52 | + | s.mean <- 53.5 |
s.sd <- 5 | s.sd <- 5 | ||
set.seed(1) | set.seed(1) | ||
Line 288: | Line 293: | ||
</ | </ | ||
- | 위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (55점). 전국평균이 | + | 위의 샘플은 수학 강사인 A가 특별한 방법으로 학생들을 가르친 후 얻은 평균 점수이다 (53.5점, n=36). 전국평균이 |
+ | * 모집단의 표준오차값은 무엇인가? | ||
+ | * 자신의 학습방법이 효과가 있다는 것을 증명하시오 | ||
+ | * 가설 | ||
+ | * 영가설 | ||
+ | * 표준오차 | ||
+ | * 영가설 기각범위 | ||
+ | * 확인 | ||
< | < | ||
- | t.test(s1, mu=50) | + | t.test(s1, mu=51) |
</ | </ | ||
- | < | + | 표준편차가 샘플과 모집단이 서로 다르다고 한다면 |
+ | <code> | ||
+ | t.test(s1, mu=51, var.equal=FALSE) | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | # 이것을 손으로 풀면 | ||
+ | # 가설: 강사의 학습방법이 효과가 있을 것이다 | ||
+ | # 가설: 강사의 학생들의 점수와 모집단의 평균점수가 다를 것이다. | ||
+ | |||
+ | # 모집단 평균: 51 | ||
+ | s.mu <- 51 | ||
+ | # 강사집단의 평균: 53.5, sd = 5 | ||
+ | |||
+ | # 이 때 se 값은 | ||
+ | se <- sqrt(s.sd^2/ | ||
+ | se2 <- se * 2 | ||
+ | # 영가설 기각 범위는 아래 두 점수 사이 | ||
+ | s.mu - se2 | ||
+ | s.mu + se2 | ||
+ | # mean(s1)값이 이 점수 밖에 존재하는가? | ||
+ | mean(s1) | ||
+ | |||
+ | </ | ||
+ | ====== Two sample test ====== | ||
+ | [[: | ||
+ | |||
+ | 게임회사의 직원인 강태원씨는 게임에 접속하는 사용자의 게임에 대한 강박성이 존재할 때, 가장 접속을 많이 할 것이라는 가설을 세웠다. 강박성이란 게임의 진행과정이 머리에 끊임없이 떠올라서 게임상황을 활성화하는 정도를 말한다. 이런 방법으로 강태원은 강박성이 높은 그룹과 낮은 그룹 두 그룹을 구하고, 각 그룹의 게임에 쓴 비용을 구하였다. 정말 차이가 있을까? | ||
+ | |||
+ | HI group | ||
+ | 평균: 6000 | ||
+ | n: 16 | ||
+ | LO group | ||
+ | 평균: 4000 | ||
+ | n: 16 | ||
+ | |||
+ | < | ||
+ | s.n <- 16 | ||
+ | s.hi <- 6000 | ||
+ | s.sd <- 500 | ||
+ | s.lo <- 4000 | ||
+ | |||
+ | set.seed(101) | ||
+ | s.hi <- round(rnorm(s.n, | ||
+ | s.lo <- round(rnorm(s.n, | ||
+ | |||
+ | s.hi | ||
+ | s.lo | ||
+ | |||
+ | mean(s.hi) | ||
+ | mean(s.lo) | ||
+ | |||
+ | t.test(s.hi, | ||
+ | </ | ||
+ | |||
+ | ====== Paired sample t-test ====== | ||
+ | 미디어교육을 초등학교 5학년 학생에게 하여, 이 학생들이 게임에 쓴 시간을 조절을 할 수 있게 된다고 학부모들을 설득하려고 한다. 이를 위해서 강경태 게임회사 기획자는 미디어교육 방법을 개발하고 이를 5학년 학생 집단 10명에게 적용한 후 게임에 쓴 시간을 측정을 하였다. 그 결과는 아래와 같다. | ||
+ | * se 값을 구해보시오 | ||
+ | * t 값을 구해보시오 | ||
+ | |||
+ | < | ||
+ | before <- c(392.9, 393.2, 345.1, 393, 434, 427.9, 422, 383.9, 392.3, 352.2) | ||
+ | after <- c(200.1, 190.9, 192.7, 213, 241.4, 196.9, 172.2, 185.5, 205.2, 193.7) | ||
+ | |||
+ | bminusa <- before-after | ||
+ | mean(bminusa) | ||
+ | sd(bminusa) | ||
+ | |||
+ | se <- sqrt(sd(bminusa)^2/ | ||
+ | t.value <- (mean(before)-mean(after))/ | ||
+ | |||
+ | t.test(before, | ||
+ | </ | ||
r/t-test.1618447409.txt.gz · Last modified: 2021/04/15 09:43 by hkimscil