types_of_error:output01
> N.p <- 1000000 > m.p <- 50 > sd.p <- 15 > > p1 <- rnorm2(N.p, m.p, sd.p) > mean(p1) [1] 50 > sd(p1) [1] 15 > > p2 <- rnorm2(N.p, m.p+10, sd.p) > mean(p2) [1] 60 > sd(p1) [1] 15 > > n1 <- 25 > msm251 <- mean(p1) > se251 <- sd(p1)/sqrt(n1) > msm251 [1] 50 > se251 [1] 3 > se251.5 <- se251*5 > se251.2 <- se251*2 > > msm252 <- mean(p2) > se252 <- sd(p2)/sqrt(n1) > msm252 [1] 60 > se252 [1] 3 > se252.5 <- se252*5 > se252.2 <- se252*2 > > start <- msm251-se251.5 > end <- msm252+se252.5 > x.span <- seq(start, end, by=.1) > y.1 <- dnorm(x.span, msm251, se251) > y.2 <- dnorm(x.span, msm252, se252) > sm.1 <- msm251+se251.2+(se251/2) > sm.1 [1] 57.5 > sm.2 <- msm251+se251+(se251/2) > sm.2 [1] 54.5 > > > plot(x.span, y.1, col = "blue", type='l', lwd=2) > lines(x.span, y.2, col = "red", type='l', lwd=2) > abline(v=c(msm251-se251.2, msm251, msm251+se251.2), col="darkgrey") > abline(v=sm.1, col="green") > abline(v=sm.2, col="black") > > pnorm(sm.1, msm251, se251, lower.tail = F)*2 [1] 0.01241933 > # sm.1 의 샘플점수가 나올 확률 > # .05보다 작으므로 영가설을 부정 > # 연구가설 검증한 것으로 판단 > # 즉, 점수의 차이가 있음 (57.5 - 50) > # 이 때 범할 수 있는 에러는? > # 녹색선의 확률을 근거로 연구자는 > # 이 녹색선이 (샘플의 평균이) 빨간 색 집단에서 > # 나온 것이라고 판단함 (빨간 색에서 나왔기 때문에 > # 점수 차이가 있다고 판단한 것) > # 이 판단이 잘못되었을 확률은 위의 pnorm값 (양방향으로 > # 보기 때문에 2를 곱함) > # 이것이 알파, p-level, type 1 error > > pnorm(sm.2, msm251, se251, lower.tail = F)*2 [1] 0.1336144 > # sm.2 의 샘플점수가 나올 확률 > # .05보다 크므로 영가설 부정에 실패 > # 연구가설에 대해서 뭐라 할말이 없게됨 > # 즉, 점수의 차이가 있다고 할 수 없음 (54.5 - 50) > # 이 때 범할 수 있는 에러는? > # 검정색 선의 확률을 근거로 연구자는 > # 이 검정선이 (샘플의 평균이) 파란색 선집단에서 > # 나온 것이라고 판단함 (파란색에서 나왔기 때문에 > # 점수 차이가 없다고 판단한 것) > # 이 판단이 잘못되었다는 말은? > # 이 검정색 선이 (샘플이) 사실은 붉은색 집단에서 > # 나왔을 때의 오류를 말함. > # 이것이 beta, type 2 error > > sm.1 [1] 57.5 > sm.2 [1] 54.5 >
types_of_error/output01.txt · Last modified: by hkimscil

