User Tools

Site Tools


c:mrm:standard_error

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
c:mrm:standard_error [2020/05/17 17:51] – [퍼센티지에서의 표준오차] hkimscilc:mrm:standard_error [2021/04/14 08:00] – [평균에서의 표준오차] hkimscil
Line 17: Line 17:
  
 $ \overline{X} \sim \text{N} \left(\mu, \dfrac{\sigma^2}{n} \right)$ $ \overline{X} \sim \text{N} \left(\mu, \dfrac{\sigma^2}{n} \right)$
 +
 +  * 위에서 $\overline{X} $ 는 X bar 들의 분포를 이야기한다. 즉 샘플평균들의 분포(집합)를 말한다. 
 +  * N 은 Normal distribution 을 뜻한다.
 +  * 괄호의 내용은 이 Normal distribution이 
 +    * 평균값으로 $\mu$ 값을 갖고, 
 +    * 분산값으로 $\dfrac{\sigma^2}{n}$ 값을 갖는다는 뜻이다
 +
  
 예, 예,
Line 189: Line 196:
  
 이 논리는 분자부분이 probability sampling을 취했다면 약간의 오차라도 큰 차이가 나지 않을 것이며, n이 충분히 크면, se 값이 충분히 작을 것이라는 논리이다.  이 논리는 분자부분이 probability sampling을 취했다면 약간의 오차라도 큰 차이가 나지 않을 것이며, n이 충분히 크면, se 값이 충분히 작을 것이라는 논리이다. 
- +===== R 에서의 simulation =====
- +
-<code> +
-set.seed(12032) +
-p.n <- 100000 +
- +
-pop <- sample(c("a", "b", "c", "g"), size=p.n, replace=TRUE, prob=c(0.4, 0.3, 0.1,0.2)) +
-pop <- factor(pop) +
- +
-s.2500 <- factor(sample(pop,2500)) +
-s.1600 <- factor(sample(pop,1600)) +
-s.900 <- factor(sample(pop,900)) +
-s.400 <- factor(sample(pop, 400)) +
-s.100 <- factor(sample(pop, 100)) +
-s.49 <- factor(sample(pop, 49)) +
- +
-t.2500 <-data.frame(summary(s.2500)/2500)  +
-t.1600 <-data.frame(summary(s.1600)/1600)  +
-t.900 <- data.frame(summary(s.900)/900) +
-t.400 <- data.frame(summary(s.400)/400) +
-t.100 <- data.frame(summary(s.100)/100) +
-t.49 <- data.frame(summary(s.49)/49) +
- +
-p <- t.100[1,1] +
-q <- 1-p +
-n <- length(s.100) +
- +
-sd.p <- sqrt(p*q) ## 표준편차값 +
-se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기 +
-se2 <- 2*se +
- +
-se +
-se2 +
- +
-p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율 +
-p ## 샘플에서 구한 지지율 +
- +
-data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율 +
- +
-</code>+
  
 <code> <code>
Line 338: Line 306:
  
 {{:c:mrm:pasted:20200517-172121.png}} {{:c:mrm:pasted:20200517-172121.png}}
 +
 +<code>
 +set.seed(12032)
 +p.n <- 100000
 +pa <- .4
 +pb <- .35
 +pc <- .05
 +pg <- .2
 +
 +pop <- sample(c("a", "b", "c", "g"), 
 +    size=p.n, replace=TRUE, 
 +    prob=c(pa, pb, pc, pg))
 +pop <- factor(pop)
 +
 +s.2500 <- factor(sample(pop,2500))
 +s.1600 <- factor(sample(pop,1600))
 +s.900 <- factor(sample(pop,900))
 +s.400 <- factor(sample(pop, 400))
 +s.100 <- factor(sample(pop, 100))
 +s.49 <- factor(sample(pop, 49))
 +
 +t.2500 <-data.frame(summary(s.2500)/2500) 
 +t.1600 <-data.frame(summary(s.1600)/1600) 
 +t.900 <- data.frame(summary(s.900)/900)
 +t.400 <- data.frame(summary(s.400)/400)
 +t.100 <- data.frame(summary(s.100)/100)
 +t.49 <- data.frame(summary(s.49)/49)
 +
 +p <- t.100[1,1]
 +q <- 1-p
 +n <- length(s.100)
 +
 +sd.p <- sqrt(p*q) ## 표준편차값
 +se <- sd.p/sqrt(n) ## 표준오차값 sqrt(n)으로 나눠주기
 +se2 <- 2*se
 +
 +se
 +se2
 +
 +p+(c(-se2, se2)) ## 샘플지지율에서 추론한 모집단 지지율
 +p ## 샘플에서 구한 지지율
 +
 +data.frame(summary(pop)/p.n)[1,1] ## 실제 모집단의 지지율
 +
 +</code>
 +
 +
c/mrm/standard_error.txt · Last modified: 2023/05/18 10:19 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki