Differences

This shows you the differences between two versions of the page.

--- c:mrm:standard_error [2020/05/17 17:51] – [퍼센티지에서의 표준오차] hkimscil
+++ c:mrm:standard_error [2020/05/17 17:54] – [퍼센티지에서의 표준오차] hkimscil
@@ Line 189: / Line 189: @@
 이 논리는 분자부분이 probability sampling을 취했다면 약간의 오차라도 큰 차이가 나지 않을 것이며, n이 충분히 크면, se 값이 충분히 작을 것이라는 논리이다.
+===== R 에서의 simulation =====
-<code>
-set.seed(12032)
-p.n <- 100000
-pop <- sample(c("a", "b", "c", "g"), size=p.n, replace=TRUE, prob=c(0.4, 0.3, 0.1,0.2))
-pop <- factor(pop)
-s.2500 <- factor(sample(pop,2500))
-s.1600 <- factor(sample(pop,1600))
-s.900 <- factor(sample(pop,900))
-s.400 <- factor(sample(pop, 400))
-s.100 <- factor(sample(pop, 100))
-s.49 <- factor(sample(pop, 49))
-t.2500 <-data.frame(summary(s.2500)/2500)
-t.1600 <-data.frame(summary(s.1600)/1600)
-t.900 <- data.frame(summary(s.900)/900)
-t.400 <- data.frame(summary(s.400)/400)
-t.100 <- data.frame(summary(s.100)/100)
-t.49 <- data.frame(summary(s.49)/49)
-p <- t.100[1,1]
-q <- 1-p
-n <- length(s.100)
-sd.p <- sqrt(p*q) ## 표준편차값
-se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기
-se2 <- 2*se
-se
-se2
-p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율
-p ## 샘플에서 구한 지지율
-data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율
-</code>
 <code>
@@ Line 338: / Line 299: @@
 {{:c:mrm:pasted:20200517-172121.png}}
+<code>
+set.seed(12032)
+p.n <- 100000
+pa <- .4
+pb <- .35
+pc <- .05
+pg <- .2
+pop <- sample(c("a", "b", "c", "g"),
+    size=p.n, replace=TRUE,
+    prob=c(pa, pb, pc, pg))
+pop <- factor(pop)
+s.2500 <- factor(sample(pop,2500))
+s.1600 <- factor(sample(pop,1600))
+s.900 <- factor(sample(pop,900))
+s.400 <- factor(sample(pop, 400))
+s.100 <- factor(sample(pop, 100))
+s.49 <- factor(sample(pop, 49))
+t.2500 <-data.frame(summary(s.2500)/2500)
+t.1600 <-data.frame(summary(s.1600)/1600)
+t.900 <- data.frame(summary(s.900)/900)
+t.400 <- data.frame(summary(s.400)/400)
+t.100 <- data.frame(summary(s.100)/100)
+t.49 <- data.frame(summary(s.49)/49)
+p <- t.100[1,1]
+q <- 1-p
+n <- length(s.100)
+sd.p <- sqrt(p*q) ## 표준편차값
+se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기
+se2 <- 2*se
+se
+se2
+p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율
+p ## 샘플에서 구한 지지율
+data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율
+</code>