b:head_first_statistics:estimating_populations_and_samples
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| b:head_first_statistics:estimating_populations_and_samples [2025/11/02 23:23] – [What about variance] hkimscil | b:head_first_statistics:estimating_populations_and_samples [2025/11/04 23:18] (current) – [Exercise] hkimscil | ||
|---|---|---|---|
| Line 438: | Line 438: | ||
| < | < | ||
| + | > a <- pnorm(lower, | ||
| + | > b <- pnorm(upper, | ||
| + | > b-a | ||
| + | [1] 0.95 | ||
| + | > lower | ||
| + | [1] 0.1651311 | ||
| + | > upper | ||
| + | [1] 0.3348689 | ||
| + | > | ||
| + | > # 위의 그래프가 의미하는 것은 rbinom(1, n, p) / n로 | ||
| + | > # 얻은 하나의 샘플의 proportion의 (비율) 값은 | ||
| + | > # 95/100 확률로 lower에서 upper사이에 있을 것이라는 | ||
| + | > # 뜻 | ||
| + | > rbinom(1, n, p)/n | ||
| + | [1] 0.29 | ||
| + | > rbinom(1, n, p)/n | ||
| + | [1] 0.24 | ||
| + | > | ||
| > k <- 100 | > k <- 100 | ||
| > sa1 <- rbinom(k, n, p) / n | > sa1 <- rbinom(k, n, p) / n | ||
| > head(sa1) | > head(sa1) | ||
| - | [1] 0.18 0.22 0.24 0.30 0.20 0.30 | + | [1] 0.29 0.29 0.23 0.23 0.27 0.29 |
| - | > table(sa1 < lower | sa1 > upper) | + | > sa1 < lower |
| + | [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [8] FALSE FALSE FALSE TRUE FALSE FALSE FALSE | ||
| + | [15] FALSE FALSE FALSE FALSE FALSE TRUE FALSE | ||
| + | [22] FALSE FALSE FALSE FALSE FALSE FALSE TRUE | ||
| + | [29] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [36] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [43] FALSE FALSE TRUE FALSE FALSE FALSE FALSE | ||
| + | [50] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [57] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [64] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [71] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [78] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [92] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [99] FALSE FALSE | ||
| + | > sa1 > upper | ||
| + | [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [8] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [15] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [22] FALSE TRUE FALSE FALSE FALSE FALSE FALSE | ||
| + | [29] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [36] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [43] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [50] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [57] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [64] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [71] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [78] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [92] FALSE FALSE FALSE FALSE FALSE FALSE FALSE | ||
| + | [99] FALSE FALSE | ||
| + | > table(sa1 < lower) | ||
| FALSE TRUE | FALSE TRUE | ||
| | | ||
| + | > table(sa1 > upper) | ||
| + | |||
| + | FALSE TRUE | ||
| + | | ||
| + | > | ||
| + | > table(sa1 < lower | sa1 > upper) | ||
| + | |||
| + | FALSE TRUE | ||
| + | | ||
| > table(sa1 < lower | sa1 > upper) / k | > table(sa1 < lower | sa1 > upper) / k | ||
| FALSE TRUE | FALSE TRUE | ||
| - | 0.96 0.04 | + | 0.95 0.05 |
| - | > | + | |
| > | > | ||
| + | |||
| </ | </ | ||
| Line 458: | Line 517: | ||
| 그렇다면 만약에 30% 이상이 red gumball일 확률은 무엇이라는 질문이라면 | 그렇다면 만약에 30% 이상이 red gumball일 확률은 무엇이라는 질문이라면 | ||
| 우리는 X ~ B(100, 1/4)에서 도출되는 | 우리는 X ~ B(100, 1/4)에서 도출되는 | ||
| - | X ~ N(p, se) 에서 P(X> | + | X ~ N(p, se^2) 에서 P(X> |
| 1-pnorm(0.295, | 1-pnorm(0.295, | ||
| < | < | ||
| Line 570: | Line 629: | ||
| 헷갈릴까봐 정리 | 헷갈릴까봐 정리 | ||
| | | | | | | ||
| - | | | bag 1 | bag 2 | bag 3 | . . . . | bag n-1 | bag n | | + | | | sample 01 | sample 02 | sample 03 | . . . . | sample |
| - | | | 9 | 10 | 12 | . . . . | 8 | 7 | | + | | bag01 | 9 | 10 | 12 | . . . . | 8 | 7 | |
| - | | | 5 | 12 | 9 | . . . . | 12 | 10 | | + | | bag02 | 5 | 12 | 9 | . . . . | 12 | 10 | |
| - | | | 11 | 8 | 10 | . . . . | 10 | 9 | | + | | bag03 | 11 | 8 | 10 | . . . . | 10 | 9 | |
| - | | . . . | .. | .. | .. | . . . . | .. | .. | | + | | . . . | .. | .. | .. | . . . . | .. | .. | |
| - | | mean of $\overline{X}s = E(\overline{X})$ | + | | |
| + | | mean of $\overline{X}s = E(\overline{X}) $ | $ E(\overline{X}) = \displaystyle E\left( \frac{X_{1} + X_{2} + . . . + X_{n}}{n}\right) $ |||||| | ||
| + | < | ||
| + | * b: | ||
| + | * b: | ||
| + | </ | ||
| Line 610: | Line 674: | ||
| {{: | {{: | ||
| + | |||
| + | see [[: | ||
| \begin{eqnarray*} | \begin{eqnarray*} | ||
| Line 625: | Line 691: | ||
| ===== Using CLT for the binomial distribution ===== | ===== Using CLT for the binomial distribution ===== | ||
| $X \sim B(n, p)$ 에서 $\mu = np$, $\sigma^2 = npq$ 이고, | $X \sim B(n, p)$ 에서 $\mu = np$, $\sigma^2 = npq$ 이고, | ||
| - | n이 30이 넘는 조건에서 이항분포가 정상분포를 이룬다고 하므로 | + | n이 30이 넘는 조건에서 이항분포가 정상분포를 이룬다고 하므로 |
| - | $\overline{X} \sim N(\mu, \frac{\sigma^2}{n})$에 대입해 보면: | + | $\overline{X} \sim N (\mu, \frac{\sigma^2}{n} ) $에 대입해 보면: |
| - | $$\overline{X} \sim N(np, \; pq) $$ | + | $$\overline{X} \sim N \left(np, \; pq \right) $$ |
| {{: | {{: | ||
| Line 671: | Line 737: | ||
| > pnorm(b/a) | > pnorm(b/a) | ||
| [1] 1.053435e-16 | [1] 1.053435e-16 | ||
| - | |||
| </ | </ | ||
| + | |||
| + | |||
| ====== Recap ====== | ====== Recap ====== | ||
| Distribution of **Sample** <fc # | Distribution of **Sample** <fc # | ||
b/head_first_statistics/estimating_populations_and_samples.1762125793.txt.gz · Last modified: by hkimscil
