b:head_first_statistics:constructing_confidence_intervals
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionNext revisionBoth sides next revision | ||
b:head_first_statistics:constructing_confidence_intervals [2019/12/03 14:08] – [Just one more problem...] hkimscil | b:head_first_statistics:constructing_confidence_intervals [2019/12/09 08:54] – [Four steps for finding confidence intervals] hkimscil | ||
---|---|---|---|
Line 10: | Line 10: | ||
Rather than specify an exact value, we can specify two values we expect flavor duration to lie between. | Rather than specify an exact value, we can specify two values we expect flavor duration to lie between. | ||
- | {{: | + | [{{: |
- | The far side of each end, (a, b) is called | + | |
- | {{:b: | + | The far side of each end, (a, b) is called a **// |
+ | |||
+ | 즉, 샘플의 평균을 Point estimate로 사용하고, | ||
===== Four steps for finding confidence intervals ===== | ===== Four steps for finding confidence intervals ===== | ||
- | Step 1: Choose your population statistic | + | {{: |
- | Step 2: Find its sampling distribution | + | |
- | [{{: | + | <fs large>**Step 1:**</ |
- | Mighty Gumball | + | If we go back to the work we did in the last chapter, then the sampling distribution |
- | estimates, and they have calculated that s2 = 25. This means that | + | {{: |
+ | |||
+ | <fs large> | ||
+ | 샘플평균들의 분산은 ($Var(\overline{X})$) 모집단의 특성인데 (parameter), | ||
+ | |||
+ | {{: | ||
+ | |||
+ | 위대한 풍선껌은 (Mighty Gumball) 100개의 풍선검을 샘플로 이용하여 단맛의 지속시간을 측정하고, 이 샘플의 | ||
+ | * 평균값으로 62.7을 | ||
+ | * 분산값으로 (s< | ||
+ | 이를 이용하여 샘플평균들의 (n=100일 때) 분포의 (distribution) 분산값을 예측해보면 0.25를 얻는다. | ||
{{: | {{: | ||
+ | |||
+ | 위를 일반화해서 생각해보면 $X \sim N(\mu, \sigma^{2})$이라고 할 때, 샘플의 숫자가 충분히 크다고 할 때 (n=100과 같이), $E(\overline{X})$ 값과 $Var(\overline{X})$ 값은 아래와 같다. | ||
{{: | {{: | ||
- | Step 3: Decide on the level of confidence | + | <fs large>**Step 3:**</ |
- | Step 4: Find the confidence limits | + | Confidence interval, 즉 a 지점과 |
- | {{:b: | + | |
+ | <fs large> | ||
+ | 위에서 얻은 $\overline{X} \sim N(\mu, 0.25)$를 가정하고 아래의 a, b 구간을 95%라고 하면, 양 쪽 끝은 각각, 0.025 씩이 될 것이다. | ||
+ | {{: | ||
+ | 즉, 우리는 $P(\overline{X} < a) = 0.025$ 에서의 a와, $P(\overline{X} > b) = 0.025$에서의 b를 구해서 이를 confidence limits의 경계값으로 삼으면 된다. 그런데 위의 그림과 같은 분포에서의 2.5%에 해당하는 부분을 직접 찾을 수는 없으므로 (r과 같은 프로그램이 없다고 가정), 표준점수를 기준으로 생각하여 z-table에서의 2.5%에 해당하는 z 점수를 찾아야 한다. | ||
{{: | {{: | ||
+ | |||
{{: | {{: | ||
+ | <WRAP box> | ||
$$P(z_{a} < Z < z_{b}) = 0.95$$ | $$P(z_{a} < Z < z_{b}) = 0.95$$ | ||
$$P(Z < z_{a}) = 0.025$$ | $$P(Z < z_{a}) = 0.025$$ | ||
Line 70: | Line 89: | ||
$\overline{X} = 62.7$ 이었으므로 $62.7 - 0.98$와 $62.7 + 0.98$이 구하는 공간 (interval). 즉, | $\overline{X} = 62.7$ 이었으므로 $62.7 - 0.98$와 $62.7 + 0.98$이 구하는 공간 (interval). 즉, | ||
- | $(61.72, 63.68)$ | + | $(61.72, 63.68)$ |
+ | </ | ||
===== Handy shortcuts for confidence intervals ===== | ===== Handy shortcuts for confidence intervals ===== | ||
Line 98: | Line 118: | ||
====== Just one more problem... ====== | ====== Just one more problem... ====== | ||
- | Step 1: Choose your population statistic | + | ==== Step 1: Choose your population statistic |
Mighty Gumball has taken a representative sample of 10 gumballs and weighed each one. In their sample, x = 0.5 oz and s< | Mighty Gumball has taken a representative sample of 10 gumballs and weighed each one. In their sample, x = 0.5 oz and s< | ||
- | Step 2: Find its sampling distribution | + | ==== Step 2: Find its sampling distribution |
The normal distribution isn't a good approximation for every situation. | The normal distribution isn't a good approximation for every situation. | ||
Line 119: | Line 137: | ||
{{: | {{: | ||
- | Step 3: Decide on the level of confidence | + | ==== Step 3: Decide on the level of confidence |
{{: | {{: | ||
- | Step 4: Find the confidence limits | + | |
+ | ==== Step 4: Find the confidence limits | ||
{{: | {{: | ||
+ | |||
+ | ===== The t-distribution vs. the normal distribution ===== | ||
{{: | {{: |
b/head_first_statistics/constructing_confidence_intervals.txt · Last modified: 2023/11/15 08:24 by hkimscil