c:mrm:standard_error
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
c:mrm:standard_error [2020/05/17 17:54] – [퍼센티지에서의 표준오차] hkimscil | c:mrm:standard_error [2023/05/18 10:19] (current) – [R 에서의 simulation] hkimscil | ||
---|---|---|---|
Line 17: | Line 17: | ||
$ \overline{X} \sim \text{N} \left(\mu, \dfrac{\sigma^2}{n} \right)$ | $ \overline{X} \sim \text{N} \left(\mu, \dfrac{\sigma^2}{n} \right)$ | ||
+ | |||
+ | * 위에서 $\overline{X} $ 는 X bar 들의 분포를 이야기한다. 즉 샘플평균들의 분포(집합)를 말한다. | ||
+ | * N 은 Normal distribution 을 뜻한다. | ||
+ | * 괄호의 내용은 이 Normal distribution이 | ||
+ | * 평균값으로 $\mu$ 값을 갖고, | ||
+ | * 분산값으로 $\dfrac{\sigma^2}{n}$ 값을 갖는다는 뜻이다 | ||
+ | |||
예, | 예, | ||
Line 193: | Line 200: | ||
< | < | ||
set.seed(1203) | set.seed(1203) | ||
+ | # p.n 숫자의 모집단을 생성한다. | ||
+ | # 모집단은 a, b, c, g 를 지지하는 비율이 | ||
+ | # .40, 35, .05, .20 과 같다. | ||
p.n <- 100000 | p.n <- 100000 | ||
pa <- .4 | pa <- .4 | ||
Line 202: | Line 212: | ||
prob=c(pa, pb, pc, pg)) | prob=c(pa, pb, pc, pg)) | ||
+ | # 위의 모집단에서 샘플을 (n = 100) 취하되 | ||
+ | # 이를 만번 반복한다 | ||
iter <- 10000 | iter <- 10000 | ||
n <- 100 | n <- 100 | ||
- | psa <- rep (NA, iter) | + | psa <- rep (NA, iter) # 샘플에서 (100) a를 선택하는 비율을 기록 |
- | ps <- matrix(data=NA, | + | ps <- matrix(data=NA, |
for(i in 1:iter){ | for(i in 1:iter){ | ||
- | ps[i, ] = sample(pop, n) | + | ps[i, ] = sample(pop, n) # 만번 반복하여 n개의 (100) sample을 pop에서 취하여 ps matrix에 기록 |
- | psa[i] = (length(which(ps[i, | + | psa[i] = (length(which(ps[i, |
- | } | + | } |
+ | # 정리 | ||
+ | # 40%의 a 선택자를 가진 모집단에서 (population) | ||
+ | # 100명의 샘플링을 만번 취했을 때, 그 샘플의 a 선택비율을 기록함 | ||
sd.a <- sqrt(pa*(1-pa)) | sd.a <- sqrt(pa*(1-pa)) |
c/mrm/standard_error.1589705669.txt.gz · Last modified: 2020/05/17 17:54 by hkimscil