hypothesis_testing
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
hypothesis_testing [2019/04/01 11:24] – [check] hkimscil | hypothesis_testing [2023/11/27 07:25] (current) – [가설검증] hkimscil | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== | + | ====== |
가설에는 차이와 관련을 나타내는 것이 있다고 하였다 ([[Hypothesis]] 참조). 가설에 나타나는 IV 와 DV 가 어떻게 측정(measure)이 되었는가에 따라서 차이와 관련의 가설로 나누게 된다. 아래 가설들은 각각의 변인(독립, | 가설에는 차이와 관련을 나타내는 것이 있다고 하였다 ([[Hypothesis]] 참조). 가설에 나타나는 IV 와 DV 가 어떻게 측정(measure)이 되었는가에 따라서 차이와 관련의 가설로 나누게 된다. 아래 가설들은 각각의 변인(독립, | ||
Line 6: | Line 6: | ||
가설1] 여성과 남성 간의 수학점수에는 차이가 있을 것이다. | 가설1] 여성과 남성 간의 수학점수에는 차이가 있을 것이다. | ||
- | 위의 가설관 관련된 변인은 성(gender)과 수학점수(math score) 이 있다. 전자는 독립변인(IV) 후자는 종속변인(DV)으로 볼 수 있다 ([[:Types of Variable|Variable Identification]] 참조). 각각의 변인은 어떻게 측정되어야 할까? 이 가설의 경우에는 쉽다. | + | 위의 가설관 관련된 변인은 성(gender)과 수학점수(math score) 이 있다. 전자는 독립변인(IV) 후자는 종속변인(DV)으로 볼 수 있다 ([[:Types of Variables|Variable Identification]] 참조). 각각의 변인은 어떻게 측정되어야 할까? 이 가설의 경우에는 쉽다. |
- | * 성: 남/ | + | * 성: 남/ |
- | * 수학점수: | + | * 수학점수: |
- 위의 측정을 위해서 연구자인 당신이 해야할 일은 무엇인가? | - 위의 측정을 위해서 연구자인 당신이 해야할 일은 무엇인가? | ||
Line 85: | Line 85: | ||
- | ====== | + | ====== |
+ | Hypothesis testing. | ||
Hypothesis test란, 샘플을 이용한 통계학 방법을 가르키는 말로서, 모집단의 성격에 대한 가설을 평가하는 작업을 말한다. | Hypothesis test란, 샘플을 이용한 통계학 방법을 가르키는 말로서, 모집단의 성격에 대한 가설을 평가하는 작업을 말한다. | ||
Line 95: | Line 96: | ||
가설은 대개 위와 같이 현 상태를 진단하기 위해서 세워지기 보다는 약품, 방법, 처치 등의 (일종의) 자극의 효과를 알아보기 위해서 세워지는 경우가 많다. | 가설은 대개 위와 같이 현 상태를 진단하기 위해서 세워지기 보다는 약품, 방법, 처치 등의 (일종의) 자극의 효과를 알아보기 위해서 세워지는 경우가 많다. | ||
- | 가령 예를 들면, 어느 시간 강사가 강의에 사용하는 wiki의 효과를 측정해 보기 위해서 가설 테스트(hypothesis testing)를 하는 것이다. 즉, 강사의 wiki 사용(treatment)으로 학생들의 학습효과가 높아 졌는가를 확인(test)하기 위해서 wiki를 사용한 그룹(mean=? | + | 가령 예를 들면, 어느 시간 강사가 강의에 사용하는 wiki의 효과를 측정해 보기 위해서 가설 테스트(hypothesis testing)를 하는 것이다. 즉, 강사의 wiki 사용(treatment)으로 학생들의 학습효과가 높아 졌는가를 확인(test)하기 위해서 wiki를 사용한 그룹(mean=? |
- | {{ | + | {{: |
- | 우선 | + | 연구자는 조사방법론 수업을 듣는 전체 모집단 학생들의 평균(이런 종류의 테스트가 있다고 가정)이 얼마인지를 알고 있다(평균 = 50, stdev = 10). |
연구자는 wiki를 사용하여 한 학기의 수업을 한 후에 같은 종류의 테스트를 wiki사용자들에게 하여, 이들의 평균이 wiki를 사용하지 않는 평범한 학생들의 성적과 차이가 있음을 밝힌다면, | 연구자는 wiki를 사용하여 한 학기의 수업을 한 후에 같은 종류의 테스트를 wiki사용자들에게 하여, 이들의 평균이 wiki를 사용하지 않는 평범한 학생들의 성적과 차이가 있음을 밝힌다면, | ||
- | {{anchor:null_hypothesis}} 이를 위해서 흔히 연구자는 **null hypothesis**를 세우게 되는데, 이것은 아래와 같이 나타낸다. | + | <wrap #null_hypothesis |
- | $\displaystyle | + | $\displaystyle |
즉, $ \text{H(0): | 즉, $ \text{H(0): | ||
- | alternative hypothesis 혹은 research hypothesis는 | + | 위의 |
- | $\text{H(1): } \mu_{\text{student with wiki}} \neq 50 $ | + | $\displaystyle |
- | 라고 | + | alternative hypothesis 혹은 research hypothesis는 위의 $ \text{H(0): |
- | 만약에 연구자가 wiki의 사용이 학생들의 성적을 올릴 것을 확신한다면, | + | $\text{H(1): } \overline{X}_{\text{student with wiki}} \neq \mu $ |
- | $\text{H(1): | + | $\text{H(1): |
- | 이런 종류의 research hypothesis 를 directional hypothesis라고 한다. 당분간은 이와 같은 directional hypothesis는 다루지 않겠다. | + | 라고 선언하는 것을 말한다. 위의 선언문은 treatment인 wiki가 효과가 있다는 것을 의미한다. 단, 이 선언에서 주의해서 봐야 할 점은 wiki가 점수를 올리거나 내린다는 선언을 한 것은 아니라는 점이다. 단지 일반 population과 다를 것이라는 점만을 선언하였다 ((만약에 연구자가 wiki의 사용이 학생들의 성적을 올릴 것을 확신한다면, |
- | 아뭏든, 앞에서 다루었듯이, 연구자는 테스트를 위해서 샘플들의 평균값들이 | + | 가설을 검증하기 위해서는 (즉, 위키페이지를 효과를 검증하기 위해서는) 영가설을 이용하여 |
+ | * 모집단 평균 = 50, 표준편차 = 10 의 집합에서 | ||
+ | * n=16의 사이즈를 갖는 샘플을 구해 평균을 낸 집합에 속하는 (distribution of sample means) 성격을 갖을 것이다. | ||
+ | * 즉, CLT의 논리에 따라서 | ||
+ | * 이 집합의 평균은 = 50 | ||
+ | * SD 는 (샘플평균의 표준편차) = $\dfrac{\sigma}{n} = \dfrac{10}{\sqrt{16}} = \dfrac{10}{4} = 2.5 $ 일것이다 (우리는 이를 standard error라고 부른다). | ||
+ | * 위에 따라서, 우리는 100번의 샘플링한다면 그 중 95번은 모집단의 평균인 50을 중심으로 +- 2se값에서 그 샘플의 평균이 나타날 것을 알 수 있다. 이 값은 45에서 55점이다. | ||
+ | * 그런데, 이 특정한 샘플의 평균은 60점이다. 이 점수가 의미하는 것은 두 가지이다. | ||
+ | * 첫 째는 100중 95는 샘플의 평균이 45에서 55에서 나와야 하는데, 이 번 샘플은 이 확률에 걸리지 않은 특이한 케이스이다. 즉, 나머지 5%의 확률에 걸려 60점이라는 점수가 나왔다. 이는 위키의 효과가 없었음을 가정하고, | ||
+ | * 다른 하나는, 이 위키 샘플이 평범한 학생의 샘플이 아니다. 즉, $\overline{X} \sim N(50, 100)$의 모집단에서 추출되는 그런 샘플이 아닌, 특별한 샘플이기에 학생들의 평균이 높은 것이다. 이를 알기 쉽게 이야기하면 오른 쪽 빨간 집단에 속하는 | ||
+ | * 그리고 위에서 구한 $45 ~ 55$의 구간을 | ||
+ | * standard error 두 단위를 쓴 95%를 confidence level 이라고 부른다. | ||
+ | * 반면에 5%의 error 가능성을 type I error 혹은 probability level이라고 (줄여서 p-level 혹은 p-value) 부른다. | ||
- | $n = 16; \mu = 50$ 이다. | + | 위에서 언급한 두개의 standard error를 사용하여 confidence interval을 구하는 것을 책에서는 |
+ | $ a = 2 (1.96)$ | ||
+ | $ a = 3 (2.58)$ | ||
- | 이 분포는 다시 두개의 종류로 나위어서 생각될 수 있는데, | + | $$ \overline{X} \pm a * \frac{\sigma}{\sqrt{n}} $$ |
- | - 첫 째는 nh가 참인 경우 나올 수 있는 샘플의 평균값 범위에 포함되는 샘플평균값과 | + | $$ \overline{X} \pm a * \frac{s}{\sqrt{n}} $$ |
- | - 둘 째는, nh가 참인 경우에 나올 수 있는 샘플의 평균값 범위에 속하지 않는 샘플의 평균값이다. | + | |
- | 이것을 그래프로 나타내면, | + | ====== z test ====== |
- | {{ h-testing.jpg }} | + | 위의 테스트 방법에서 우리는 모집단의 평균에서 표준오차 점수 2단위를 빼고 더한 범위에 우리 샘플의 평균이 존재하는가를 보았다. 이를 보다 편리하게 결정하는 방법은 내 샘플의 평균이 모집단의 평균에서 표준오차를 하나의 유닛으로 몇개나 떨어져 있는가를 보는 것이다. 즉, 내 샘플의 평균점수는 60이므로 모집단 평균의 50에서 10만큼 떨어져 있는데, 이 점수차이 10은 표준오차로 4개만큼 오른 쪽으로 떨어져 있는 것을 의미한다. 그런데, 위의 논리에 의하면 우리는 표준오차가 2개보다 더 많이 떨어진 점수는 확률 95%에 드는 점수가 아니므로 영가설 부정에 사용하기로 하였다. 따라서, 4라는 점수는 2보다 크므로 영가설을 부정하고, |
- | 이와는 반대로 양 쪽의 부분은 이 sampling distribution에서 나오기 어려운 sample mean들의 범위이다. 그런데, 이 sampling distribution 분포는 null hypothesis 가 참이라는 것을 가정했을 때 나타나는 normal distribution이므로, | + | 이런 |
- | 만약에 이와 반대로 양 쪽 끝에서 sample의 평균점수가 발견되었다면, | + | sampling mean을 위한 z -score 의 공식은 |
- | + | ||
- | 양 쪽의 rare 부분(Extreme, | + | |
- | + | ||
- | 2개의 standard deviation units이 의미하는 것은 위의 그림에서 빗금친 부분의 합이 5%라는 것을 의미한다. 즉, H0가 참일 때, 양 쪽의 빗금 친 부분에서 mean이 발견될 확률은 **100 중 5** 즉, **5%** 라는 의미이다. 이 빗금친 부분을 **critical region** 이라고 한다. 다시 말하자면, | + | |
- | + | ||
- | <WRAP box> | + | |
- | ... 만약에 wiki의 효과가 없었다고 하면, 이 샘플의 평균은 보통 샘플들(H0가 참인 경우의 샘플들)의 distribution 곡선에 따라서 나타나야 하는데, 빗금친 부분은 흔치 않은 경우(5%의 확률)이므로, | + | |
- | </ | + | |
- | + | ||
- | 라는 의미의 해석을 할 것이다. | + | |
- | + | ||
- | 아래의 그래프는 위의 그래프를 z-score로 변환을 한것이다. | + | |
- | + | ||
- | {{ h-testing-z2.jpg | + | |
- | + | ||
- | 이 단계에서 강사는 실제로 샘플들에게 테스트를 실시하여 샘플의 statistics를 얻어 낸 후, 이 샘플의 statistics를 H0의 것과 비교를 하게 된다. 보통 이런 비교는 z-score 변환을 통해서 한다. | + | |
- | + | ||
- | sampling mean을 위한 z -score 의 공식은: | + | |
$\displaystyle z = \frac{ \overline{X} - \mu } {\sigma_{\overline{X}}} $ | $\displaystyle z = \frac{ \overline{X} - \mu } {\sigma_{\overline{X}}} $ | ||
Line 158: | Line 154: | ||
위의 공식에서 $\overline{X}$ 는 샘플에서 얻은 평균 값이며, $\mu=50$ 과 $\sigma_{\overline{X}}$ 는 $\text{H(0)}$ 에서 얻은 것이다. | 위의 공식에서 $\overline{X}$ 는 샘플에서 얻은 평균 값이며, $\mu=50$ 과 $\sigma_{\overline{X}}$ 는 $\text{H(0)}$ 에서 얻은 것이다. | ||
- | 다음으로 우선 | + | 만약에 한 샘플의 평균값이 57.5이었다는 가정을 하면 (case A), |
$\displaystyle \sigma_{\overline{X}}=\frac{10}{\sqrt{16}}=2.5$ | $\displaystyle \sigma_{\overline{X}}=\frac{10}{\sqrt{16}}=2.5$ | ||
Line 171: | Line 167: | ||
이 경우에는 z-score = 1 이고, 이는 critical region에 포함되므로, | 이 경우에는 z-score = 1 이고, 이는 critical region에 포함되므로, | ||
+ | |||
+ | z test는 이와 같이 샘플의 점수와 모집단 평균 점수 차이를 표준오차로 나눈 점수를 가지고 영가설 부정을 하는 판단에 사용하는 것을 말한다. | ||
+ | |||
+ | |||
+ | ====== 질문 ====== | ||
+ | 만약에 n = 16이 아닌 n = 36 이었고, 이 샘플의 평균이 위의 case b 처럼 52.5였다면 어떻게 판단해야 할까? | ||
====== check ====== | ====== check ====== |
hypothesis_testing.1554085464.txt.gz · Last modified: 2019/04/01 11:24 by hkimscil