User Tools

Site Tools


hypothesis_testing

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
hypothesis_testing [2023/11/27 07:12] – [가설검증] hkimscilhypothesis_testing [2023/11/27 07:24] – [가설검증] hkimscil
Line 130: Line 130:
   * 그런데, 이 특정한 샘플의 평균은 60점이다. 이 점수가 의미하는 것은 두 가지이다.    * 그런데, 이 특정한 샘플의 평균은 60점이다. 이 점수가 의미하는 것은 두 가지이다. 
     * 첫 째는 100중 95는 샘플의 평균이 45에서 55에서 나와야 하는데, 이 번 샘플은 이 확률에 걸리지 않은 특이한 케이스이다. 즉, 나머지 5%의 확률에 걸려 60점이라는 점수가 나왔다. 이는 위키의 효과가 없었음을 가정하고, 그럼에도 불구하고, 특이하게 높은 점수가 나왔다고 주장하는 것이 된다. 그러나, 이 주장의 확률은 5%에 불과하다.     * 첫 째는 100중 95는 샘플의 평균이 45에서 55에서 나와야 하는데, 이 번 샘플은 이 확률에 걸리지 않은 특이한 케이스이다. 즉, 나머지 5%의 확률에 걸려 60점이라는 점수가 나왔다. 이는 위키의 효과가 없었음을 가정하고, 그럼에도 불구하고, 특이하게 높은 점수가 나왔다고 주장하는 것이 된다. 그러나, 이 주장의 확률은 5%에 불과하다.
-    * 다른 하나는, 이 위키 샘플이 평범한 학생의 샘플이 아니다. 즉, N(50, 10)의 모집단에서 추출되는 그런 샘플이 아닌, 특별한 샘플이기에 학생들의 평균이 높은 것이다. 이를 알기 쉽게 이야기하면 오른 쪽 빨간 집단에 속하는 학생이기에 그런 점수가 나온 것이다. 이것이 의미하는 것은 위키를 이용한 학생은 평범한 모집단에 속하지 않는다는 것을 말하는데, 이는 곧 위키의 효과가 있다는 것을 주장하는 것이 된다. 그런데, 이 주장이 맞을 확률이 이 전과 같이 5%가 아닌, 95%이다. 따라서, 후자를 택하는 것이 더 안전한 결론이 된다. 이는 곧 영가설을 부정하고 (위키가 효과가 없다는 것), 연구가설을 채택하는 것이 된다. **이로써 우리는 연구가설을 검증한 것이 된다**.+    * 다른 하나는, 이 위키 샘플이 평범한 학생의 샘플이 아니다. 즉, $\overline{X} \sim N(50, 100)$의 모집단에서 추출되는 그런 샘플이 아닌, 특별한 샘플이기에 학생들의 평균이 높은 것이다. 이를 알기 쉽게 이야기하면 오른 쪽 빨간 집단에 속하는 학생이기에 그런 점수가 나온 것이다. 이것이 의미하는 것은 위키를 이용한 학생은 평범한 모집단에 속하지 않는다는 것을 말하는데, 이는 곧 위키의 효과가 있다는 것을 주장하는 것이 된다. 그런데, 이 주장이 맞을 확률이 이 전과 같이 5%가 아닌, 95%이다. 따라서, 후자를 택하는 것이 더 안전한 결론이 된다. 이는 곧 영가설을 부정하고 (위키가 효과가 없다는 것), 연구가설을 채택하는 것이 된다. **이로써 우리는 연구가설을 검증한 것이 된다**. 
 +    * 그리고 위에서 구한 $45 ~ 55$의 구간을 우리는 confidence interval이라고 부르며 
 +    * standard error 두 단위를 쓴 95%를 confidence level 이라고 부른다.  
 +    * 반면에 5%의 error 가능성을 type I error 혹은 probability level이라고 (줄여서 p-level 혹은 p-value) 부른다.  
 + 
 +위에서 언급한 두개의 standard error를 사용하여 confidence interval을 구하는 것을 책에서는  
 +$ a = where 95% = 2 (1.96)$ 
 +$ a = where 99% = 3 (2.58)$ 
 + 
 +$$ \overline{X} \pm a * \frac{\sigma}{\sqrt{n}} $$ 
 +$$ \overline{X} \pm a * \frac{s}{\sqrt{n}} $$
  
 ====== z test ====== ====== z test ======
hypothesis_testing.txt · Last modified: 2023/11/27 07:25 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki