types_of_error
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| types_of_error [2017/04/02 23:34] – hkimscil | types_of_error [2023/11/21 11:49] (current) – [Types of error] hkimscil | ||
|---|---|---|---|
| Line 2: | Line 2: | ||
| {{keywords> | {{keywords> | ||
| ====== Types of error ====== | ====== Types of error ====== | ||
| - | < | + | < |
| 요약 | 요약 | ||
| - | * black line(bl): $\overline{x}=0, | + | * black line(bl): $\overline{x}=0, |
| - | * red line(rl): | + | * red line(rl): |
| * green line: 가설테스트를 했을 때 영가설을 부정하게 되는 기준 (sd=2). | * green line: 가설테스트를 했을 때 영가설을 부정하게 되는 기준 (sd=2). | ||
| * 노란색 부분: type I error | * 노란색 부분: type I error | ||
| Line 11: | Line 11: | ||
| 설명 | 설명 | ||
| - | * H1: $\display\mu_{\text{black}} \neq \mu_{\text{red}} \;\;\; (0 \neq 3) $ | + | * H1: $\mu_{\text{black}} \neq \mu_{\text{red}} \;\;\; (0 \neq 3) $ |
| - | * H0: $\display\mu_{\text{black}} = \mu_{\text{red}} \;\;\; (0 = 3) $ | + | * H0: $\mu_{\text{black}} = \mu_{\text{red}} \;\;\; (0 = 3) $ |
| - | * H1: 새로운 약의 효과가 3시간 지속되어 | + | * H1: 새로운 약의 효과는 기존 약과 다를 것이다. |
| * H0: 새로운 약의 효과가 없을 것이다. | * H0: 새로운 약의 효과가 없을 것이다. | ||
| - | 실제 현상이 (약의 효과가) 있는 것으로 가정하면 붉은 선이 현실이 된다. 그러나 연구자는 붉은 선은 가정을 할 뿐 알 수 없으며, 검은 선을 가지고 (즉 영가설을 가지고) 판단을 하게 된다. 이 때 판단의 기준은 녹색 선이며, 이는 SE 단위 둘을 사용한 .05를 가르킨다. | + | 실제 현상이 (약의 효과가) 있는 것으로 가정하면 붉은 선이 현실이 된다. 그러나 연구자는 붉은 선은 가정을 할 뿐, 실제로는 |
| <WRAP classes # | <WRAP classes # | ||
| Line 33: | Line 33: | ||
| 알파의 경우는 연구자가 정하는 방법으로 컨트롤할 수 있다. 그러나, 베타의 경우는 알파와 같은 방법을 사용할 수는 없다. 베타를 줄이는, 즉 영가설이 거짓으로 부정을 해야하는데 그렇게 하지 못하는 경우를 줄이는 방법으로 상식, 보편적인 것은 샘플의 n을 키우는 것이다. 좀 더 설명하자면, | 알파의 경우는 연구자가 정하는 방법으로 컨트롤할 수 있다. 그러나, 베타의 경우는 알파와 같은 방법을 사용할 수는 없다. 베타를 줄이는, 즉 영가설이 거짓으로 부정을 해야하는데 그렇게 하지 못하는 경우를 줄이는 방법으로 상식, 보편적인 것은 샘플의 n을 키우는 것이다. 좀 더 설명하자면, | ||
| + | |||
| + | < | ||
| + | < | ||
| + | |||
| ====== E.G. ====== | ====== E.G. ====== | ||
| Line 38: | Line 42: | ||
| 이는 아래를 보면 더 확연해진다. | 이는 아래를 보면 더 확연해진다. | ||
| - | < | + | < |
| + | rnorm2 <- function(n, | ||
| potato_sample <- rnorm2(25, 194,20) | potato_sample <- rnorm2(25, 194,20) | ||
| mean(potato_sample) | mean(potato_sample) | ||
| Line 55: | Line 60: | ||
| mean of x | mean of x | ||
| 194 | 194 | ||
| - | > | + | > |
| + | </ | ||
| + | |||
| + | 아래의 qt 펑션 이해를 위해서는 [[https:// | ||
| + | < | ||
| > abs(qt(0.05/ | > abs(qt(0.05/ | ||
| [1] 2.063899 | [1] 2.063899 | ||
| + | </ | ||
| + | 즉, +-2.063899 이상이 되어야지 영가설을 부정할 수 있는데, 현재의 t-score는 -1.5이므로 영가설을 부정할 수 없는 상태이다. | ||
| + | se 값을 구하는 공식으로 sqrt(25)=5 이니 se = 20/5 = 4 이다. 만약에 n값이 (샘플사이즈) 2500 이라면 se값은 0.4일 것이다 (아래 참조) | ||
| + | < | ||
| > 20/ | > 20/ | ||
| [1] 4 | [1] 4 | ||
| Line 80: | Line 93: | ||
| mean of x | mean of x | ||
| 194 | 194 | ||
| - | | + | </ |
| + | < | ||
| > abs(qt(0.05/ | > abs(qt(0.05/ | ||
| [1] 1.960914 | [1] 1.960914 | ||
| + | </ | ||
| + | 위의 경우 critical t value는 +-1.960914 (approx. 2)면 영가설을 부정할 수 있는데, calculated t value는 -15이므로 부정할 수 있다. | ||
| + | < | ||
| > # standard error value | > # standard error value | ||
| > 20/ | > 20/ | ||
| Line 91: | Line 108: | ||
| <WRAP help> 위 둘의 se를 비교해 보라. 그리고, 이를 type I and type II error와 관련지어 설명하라 </ | <WRAP help> 위 둘의 se를 비교해 보라. 그리고, 이를 type I and type II error와 관련지어 설명하라 </ | ||
| + | mu = 200, sigma = 20 인 상황에서 a___ 뒤의 숫자가 샘플의 크기라고 하면, | ||
| - | < | + | < |
| - | > b <- rnorm(50000, | + | > a100 <- rnorm(50000, |
| - | > pa <- hist(a) | + | > a400 <- rnorm(50000, |
| - | > pb <- hist(b) | + | > a900 <- rnorm(50000, |
| - | > plot(pa, col=rgb(0,0,1,1/4), xlim=c(185, | + | > a1600 <- rnorm(50000, |
| - | > plot(pb, col=rgb(1,0,1,1/4), xlim=c(185, | + | > a2500 <- rnorm(50000, |
| + | > a3600 <- rnorm(50000, | ||
| + | > a4900 <- rnrom(50000, | ||
| + | > a6400 <- rnorm(50000, | ||
| + | > a8100 <- rnorm(50000, | ||
| + | > pa25 <- hist(a25) | ||
| + | > pa100 <- hist(a100) | ||
| + | > pa400 <- hist(a400) | ||
| + | > pa900 <- hist(a900) | ||
| + | > pa1600 <- hist(a1600) | ||
| + | > pa2500 <- hist(a2500) | ||
| + | > pa3600 <- hist(a3600) | ||
| + | > pa4900 <- hist(a4900) | ||
| + | > pa6400 <- hist(a6400) | ||
| + | > pa8100 <- hist(a8100) | ||
| + | > plot(pa25, col=rgb(.1,.1,.1,.1), xlim=c(185, | ||
| + | > plot(pa100, col=rgb(.2, | ||
| + | > plot(pa400, col=rgb(.3, | ||
| + | > plot(pa900, col=rgb(.4, | ||
| + | > plot(pa1600, col=rgb(.5,.5,.5,.5), xlim=c(185, | ||
| + | > plot(pa2500, | ||
| + | > plot(pa3600, | ||
| + | > plot(pa4900, | ||
| + | > plot(pa6400, | ||
| + | > plot(pa8100, | ||
| </ | </ | ||
| + | {{: | ||
| + | {{: | ||
| + | |||
| + | {{: | ||
| {{: | {{: | ||
| Where is my 194 (sample' | Where is my 194 (sample' | ||
| {{tag>" | {{tag>" | ||
types_of_error.1491176074.txt.gz · Last modified: by hkimscil
