types_of_error
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
types_of_error [2017/03/31 12:07] – [E.G.] hkimscil | types_of_error [2023/11/21 20:49] (current) – [Types of error] hkimscil | ||
---|---|---|---|
Line 2: | Line 2: | ||
{{keywords> | {{keywords> | ||
====== Types of error ====== | ====== Types of error ====== | ||
- | < | + | < |
요약 | 요약 | ||
- | * black line(bl): $\overline{x}=0, | + | * black line(bl): $\overline{x}=0, |
- | * red line(rl): | + | * red line(rl): |
* green line: 가설테스트를 했을 때 영가설을 부정하게 되는 기준 (sd=2). | * green line: 가설테스트를 했을 때 영가설을 부정하게 되는 기준 (sd=2). | ||
* 노란색 부분: type I error | * 노란색 부분: type I error | ||
Line 11: | Line 11: | ||
설명 | 설명 | ||
- | * H1: $\display\mu_{\text{black}} \neq \mu_{\text{red}} \;\;\; (0 \neq 3) $ | + | * H1: $\mu_{\text{black}} \neq \mu_{\text{red}} \;\;\; (0 \neq 3) $ |
- | * H0: $\display\mu_{\text{black}} = \mu_{\text{red}} \;\;\; (0 = 3) $ | + | * H0: $\mu_{\text{black}} = \mu_{\text{red}} \;\;\; (0 = 3) $ |
- | * H1: 새로운 약의 효과가 3시간 지속되어 | + | * H1: 새로운 약의 효과는 기존 약과 다를 것이다. |
* H0: 새로운 약의 효과가 없을 것이다. | * H0: 새로운 약의 효과가 없을 것이다. | ||
- | 실제 현상이 (약의 효과가) 있는 것으로 가정하면 붉은 선이 현실이 된다. 그러나 연구자는 붉은 선은 가정을 할 뿐 알 수 없으며, 검은 선을 가지고 (즉 영가설을 가지고) 판단을 하게 된다. 이 때 판단의 기준은 녹색 선이며, 이는 SE 단위 둘을 사용한 .05를 가르킨다. | + | 실제 현상이 (약의 효과가) 있는 것으로 가정하면 붉은 선이 현실이 된다. 그러나 연구자는 붉은 선은 가정을 할 뿐, 실제로는 |
<WRAP classes # | <WRAP classes # | ||
Line 33: | Line 33: | ||
알파의 경우는 연구자가 정하는 방법으로 컨트롤할 수 있다. 그러나, 베타의 경우는 알파와 같은 방법을 사용할 수는 없다. 베타를 줄이는, 즉 영가설이 거짓으로 부정을 해야하는데 그렇게 하지 못하는 경우를 줄이는 방법으로 상식, 보편적인 것은 샘플의 n을 키우는 것이다. 좀 더 설명하자면, | 알파의 경우는 연구자가 정하는 방법으로 컨트롤할 수 있다. 그러나, 베타의 경우는 알파와 같은 방법을 사용할 수는 없다. 베타를 줄이는, 즉 영가설이 거짓으로 부정을 해야하는데 그렇게 하지 못하는 경우를 줄이는 방법으로 상식, 보편적인 것은 샘플의 n을 키우는 것이다. 좀 더 설명하자면, | ||
+ | |||
+ | < | ||
+ | < | ||
+ | |||
====== E.G. ====== | ====== E.G. ====== | ||
Line 38: | Line 42: | ||
이는 아래를 보면 더 확연해진다. | 이는 아래를 보면 더 확연해진다. | ||
- | < | + | < |
+ | rnorm2 <- function(n, | ||
potato_sample <- rnorm2(25, 194,20) | potato_sample <- rnorm2(25, 194,20) | ||
mean(potato_sample) | mean(potato_sample) | ||
Line 55: | Line 60: | ||
mean of x | mean of x | ||
194 | 194 | ||
- | > | + | > |
- | abs(qt(0.05/ | + | </ |
+ | |||
+ | 아래의 qt 펑션 이해를 위해서는 [[https:// | ||
+ | < | ||
+ | > abs(qt(0.05/ | ||
[1] 2.063899 | [1] 2.063899 | ||
+ | </ | ||
+ | 즉, +-2.063899 이상이 되어야지 영가설을 부정할 수 있는데, 현재의 t-score는 -1.5이므로 영가설을 부정할 수 없는 상태이다. | ||
+ | se 값을 구하는 공식으로 sqrt(25)=5 이니 se = 20/5 = 4 이다. 만약에 n값이 (샘플사이즈) 2500 이라면 se값은 0.4일 것이다 (아래 참조) | ||
+ | < | ||
+ | > 20/ | ||
+ | [1] 4 | ||
</ | </ | ||
Line 63: | Line 78: | ||
potato_sample_large <- rnorm2(2500, | potato_sample_large <- rnorm2(2500, | ||
mean(potato_sample_large) | mean(potato_sample_large) | ||
- | [1] 191 | + | [1] 194 |
> sqrt(var(potato_sample_large)) | > sqrt(var(potato_sample_large)) | ||
[1] 20 | [1] 20 | ||
Line 78: | Line 93: | ||
mean of x | mean of x | ||
194 | 194 | ||
- | | + | </ |
- | > </ | + | <code> |
+ | > abs(qt(0.05/ | ||
+ | [1] 1.960914 | ||
+ | </ | ||
+ | 위의 경우 critical t value는 +-1.960914 (approx. 2)면 영가설을 부정할 수 있는데, calculated t value는 -15이므로 부정할 수 있다. | ||
+ | < | ||
+ | > # standard error value | ||
+ | > 20/ | ||
+ | [1] 0.4 | ||
+ | > | ||
+ | </ | ||
<WRAP help> 위 둘의 se를 비교해 보라. 그리고, 이를 type I and type II error와 관련지어 설명하라 </ | <WRAP help> 위 둘의 se를 비교해 보라. 그리고, 이를 type I and type II error와 관련지어 설명하라 </ | ||
+ | mu = 200, sigma = 20 인 상황에서 a___ 뒤의 숫자가 샘플의 크기라고 하면, | ||
- | < | + | < |
- | > b <- rnorm(50000, | + | > a100 <- rnorm(50000, |
- | > pa <- hist(a) | + | > a400 <- rnorm(50000, |
- | > pb <- hist(b) | + | > a900 <- rnorm(50000, |
- | > plot(pa, col=rgb(0,0,1,1/4), xlim=c(185, | + | > a1600 <- rnorm(50000, |
- | > plot(pb, col=rgb(1,0,1,1/4), xlim=c(185, | + | > a2500 <- rnorm(50000, |
+ | > a3600 <- rnorm(50000, | ||
+ | > a4900 <- rnrom(50000, | ||
+ | > a6400 <- rnorm(50000, | ||
+ | > a8100 <- rnorm(50000, | ||
+ | > pa25 <- hist(a25) | ||
+ | > pa100 <- hist(a100) | ||
+ | > pa400 <- hist(a400) | ||
+ | > pa900 <- hist(a900) | ||
+ | > pa1600 <- hist(a1600) | ||
+ | > pa2500 <- hist(a2500) | ||
+ | > pa3600 <- hist(a3600) | ||
+ | > pa4900 <- hist(a4900) | ||
+ | > pa6400 <- hist(a6400) | ||
+ | > pa8100 <- hist(a8100) | ||
+ | > plot(pa25, col=rgb(.1,.1,.1,.1), xlim=c(185, | ||
+ | > plot(pa100, col=rgb(.2, | ||
+ | > plot(pa400, col=rgb(.3, | ||
+ | > plot(pa900, col=rgb(.4, | ||
+ | > plot(pa1600, col=rgb(.5,.5,.5,.5), xlim=c(185, | ||
+ | > plot(pa2500, | ||
+ | > plot(pa3600, | ||
+ | > plot(pa4900, | ||
+ | > plot(pa6400, | ||
+ | > plot(pa8100, | ||
</ | </ | ||
+ | {{: | ||
+ | {{: | ||
+ | |||
+ | {{: | ||
{{: | {{: | ||
Where is my 194 (sample' | Where is my 194 (sample' | ||
{{tag>" | {{tag>" |
types_of_error.1490931451.txt.gz · Last modified: 2017/03/31 12:07 by hkimscil