hypothesis_testing
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionLast revisionBoth sides next revision | ||
hypothesis_testing [2022/05/15 11:18] – hkimscil | hypothesis_testing [2023/11/27 07:24] – [가설검증] hkimscil | ||
---|---|---|---|
Line 106: | Line 106: | ||
<wrap # | <wrap # | ||
- | $\displaystyle | + | $\displaystyle |
즉, $ \text{H(0): | 즉, $ \text{H(0): | ||
+ | |||
+ | 위의 영가설은 정확한 의미에서 내 샘플이 50점 모집단에서 나오지 않았다는, | ||
+ | |||
+ | $\displaystyle | ||
alternative hypothesis 혹은 research hypothesis는 위의 $ \text{H(0): | alternative hypothesis 혹은 research hypothesis는 위의 $ \text{H(0): | ||
- | $\text{H(1): | + | $\text{H(1): |
+ | $\text{H(1): | ||
라고 선언하는 것을 말한다. 위의 선언문은 treatment인 wiki가 효과가 있다는 것을 의미한다. 단, 이 선언에서 주의해서 봐야 할 점은 wiki가 점수를 올리거나 내린다는 선언을 한 것은 아니라는 점이다. 단지 일반 population과 다를 것이라는 점만을 선언하였다 ((만약에 연구자가 wiki의 사용이 학생들의 성적을 올릴 것을 확신한다면, | 라고 선언하는 것을 말한다. 위의 선언문은 treatment인 wiki가 효과가 있다는 것을 의미한다. 단, 이 선언에서 주의해서 봐야 할 점은 wiki가 점수를 올리거나 내린다는 선언을 한 것은 아니라는 점이다. 단지 일반 population과 다를 것이라는 점만을 선언하였다 ((만약에 연구자가 wiki의 사용이 학생들의 성적을 올릴 것을 확신한다면, | ||
Line 125: | Line 130: | ||
* 그런데, 이 특정한 샘플의 평균은 60점이다. 이 점수가 의미하는 것은 두 가지이다. | * 그런데, 이 특정한 샘플의 평균은 60점이다. 이 점수가 의미하는 것은 두 가지이다. | ||
* 첫 째는 100중 95는 샘플의 평균이 45에서 55에서 나와야 하는데, 이 번 샘플은 이 확률에 걸리지 않은 특이한 케이스이다. 즉, 나머지 5%의 확률에 걸려 60점이라는 점수가 나왔다. 이는 위키의 효과가 없었음을 가정하고, | * 첫 째는 100중 95는 샘플의 평균이 45에서 55에서 나와야 하는데, 이 번 샘플은 이 확률에 걸리지 않은 특이한 케이스이다. 즉, 나머지 5%의 확률에 걸려 60점이라는 점수가 나왔다. 이는 위키의 효과가 없었음을 가정하고, | ||
- | * 다른 하나는, 이 위키 샘플이 평범한 학생의 샘플이 아니다. 즉, N(50, 10)의 모집단에서 추출되는 그런 샘플이 아닌, 특별한 샘플이기에 학생들의 평균이 높은 것이다. 이를 알기 쉽게 이야기하면 오른 쪽 빨간 집단에 속하는 학생이기에 그런 점수가 나온 것이다. 이것이 의미하는 것은 위키를 이용한 학생은 평범한 모집단에 속하지 않는다는 것을 말하는데, | + | * 다른 하나는, 이 위키 샘플이 평범한 학생의 샘플이 아니다. 즉, $\overline{X} \sim N(50, 100)$의 모집단에서 추출되는 그런 샘플이 아닌, 특별한 샘플이기에 학생들의 평균이 높은 것이다. 이를 알기 쉽게 이야기하면 오른 쪽 빨간 집단에 속하는 학생이기에 그런 점수가 나온 것이다. 이것이 의미하는 것은 위키를 이용한 학생은 평범한 모집단에 속하지 않는다는 것을 말하는데, |
+ | * 그리고 위에서 구한 $45 ~ 55$의 구간을 우리는 confidence interval이라고 부르며 | ||
+ | * standard error 두 단위를 쓴 95%를 confidence level 이라고 부른다. | ||
+ | * 반면에 5%의 error 가능성을 type I error 혹은 probability level이라고 (줄여서 p-level 혹은 p-value) 부른다. | ||
+ | |||
+ | 위에서 언급한 두개의 standard error를 사용하여 confidence interval을 구하는 것을 책에서는 | ||
+ | $ a = where 95% = 2 (1.96)$ | ||
+ | $ a = where 99% = 3 (2.58)$ | ||
+ | |||
+ | $$ \overline{X} \pm a * \frac{\sigma}{\sqrt{n}} $$ | ||
+ | $$ \overline{X} \pm a * \frac{s}{\sqrt{n}} $$ | ||
====== z test ====== | ====== z test ====== |
hypothesis_testing.txt · Last modified: 2023/11/27 07:25 by hkimscil