User Tools

Site Tools


c:mrm:standard_error

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
c:mrm:standard_error [2020/05/17 17:51] – [퍼센티지에서의 표준오차] hkimscilc:mrm:standard_error [2020/05/17 17:54] – [퍼센티지에서의 표준오차] hkimscil
Line 189: Line 189:
  
 이 논리는 분자부분이 probability sampling을 취했다면 약간의 오차라도 큰 차이가 나지 않을 것이며, n이 충분히 크면, se 값이 충분히 작을 것이라는 논리이다.  이 논리는 분자부분이 probability sampling을 취했다면 약간의 오차라도 큰 차이가 나지 않을 것이며, n이 충분히 크면, se 값이 충분히 작을 것이라는 논리이다. 
- +===== R 에서의 simulation =====
- +
-<code> +
-set.seed(12032) +
-p.n <- 100000 +
- +
-pop <- sample(c("a", "b", "c", "g"), size=p.n, replace=TRUE, prob=c(0.4, 0.3, 0.1,0.2)) +
-pop <- factor(pop) +
- +
-s.2500 <- factor(sample(pop,2500)) +
-s.1600 <- factor(sample(pop,1600)) +
-s.900 <- factor(sample(pop,900)) +
-s.400 <- factor(sample(pop, 400)) +
-s.100 <- factor(sample(pop, 100)) +
-s.49 <- factor(sample(pop, 49)) +
- +
-t.2500 <-data.frame(summary(s.2500)/2500)  +
-t.1600 <-data.frame(summary(s.1600)/1600)  +
-t.900 <- data.frame(summary(s.900)/900) +
-t.400 <- data.frame(summary(s.400)/400) +
-t.100 <- data.frame(summary(s.100)/100) +
-t.49 <- data.frame(summary(s.49)/49) +
- +
-p <- t.100[1,1] +
-q <- 1-p +
-n <- length(s.100) +
- +
-sd.p <- sqrt(p*q) ## 표준편차값 +
-se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기 +
-se2 <- 2*se +
- +
-se +
-se2 +
- +
-p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율 +
-p ## 샘플에서 구한 지지율 +
- +
-data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율 +
- +
-</code>+
  
 <code> <code>
Line 338: Line 299:
  
 {{:c:mrm:pasted:20200517-172121.png}} {{:c:mrm:pasted:20200517-172121.png}}
 +
 +<code>
 +set.seed(12032)
 +p.n <- 100000
 +pa <- .4
 +pb <- .35
 +pc <- .05
 +pg <- .2
 +
 +pop <- sample(c("a", "b", "c", "g"), 
 +    size=p.n, replace=TRUE, 
 +    prob=c(pa, pb, pc, pg))
 +pop <- factor(pop)
 +
 +s.2500 <- factor(sample(pop,2500))
 +s.1600 <- factor(sample(pop,1600))
 +s.900 <- factor(sample(pop,900))
 +s.400 <- factor(sample(pop, 400))
 +s.100 <- factor(sample(pop, 100))
 +s.49 <- factor(sample(pop, 49))
 +
 +t.2500 <-data.frame(summary(s.2500)/2500) 
 +t.1600 <-data.frame(summary(s.1600)/1600) 
 +t.900 <- data.frame(summary(s.900)/900)
 +t.400 <- data.frame(summary(s.400)/400)
 +t.100 <- data.frame(summary(s.100)/100)
 +t.49 <- data.frame(summary(s.49)/49)
 +
 +p <- t.100[1,1]
 +q <- 1-p
 +n <- length(s.100)
 +
 +sd.p <- sqrt(p*q) ## 표준편차값
 +se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기
 +se2 <- 2*se
 +
 +se
 +se2
 +
 +p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율
 +p ## 샘플에서 구한 지지율
 +
 +data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율
 +
 +</code>
 +
 +
c/mrm/standard_error.txt · Last modified: 2023/05/18 10:19 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki