degrees_of_freedom
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
degrees_of_freedom [2019/09/24 12:34] – hkimscil | degrees_of_freedom [2021/03/03 11:24] (current) – old revision restored (2020/04/14 15:33) hkimscil | ||
---|---|---|---|
Line 30: | Line 30: | ||
| | Xi | ds | ds< | | | Xi | ds | ds< | ||
- | | | + | | 1 | 2 | -1 | 1 | |
- | | | + | | 2 | 3 | 0 | 0 | |
- | | | + | | 3 | 2 | -1 | 1 | |
- | | | + | | 4 | 4 | 1 | 1 | |
- | | | + | | 5 | 5 | 2 | 4 | |
- | | | + | | 6 | 5 | 2 | 4 | |
- | | | + | | 7 | 2 | -1 | 1 | |
- | | | + | | 8 | 2 | -1 | 1 | |
- | | | + | | 9 | 4 | 1 | 1 | |
- | | | + | | 10 | 1 | -2 | 4 | |
| sum | 30 | 0 | 18 | | | sum | 30 | 0 | 18 | | ||
| N | 10 | | | N | 10 | | ||
Line 58: | Line 58: | ||
|variance | |variance | ||
- | 위에서 보면, 샘플의 평균은 3.5이고 (모집단 분산에서 사용되는 분산식을 사용한) 분산은 1.25이다. 이는 실제 모집단의 분산값인 1.8에 훨씬 못 미치는 수치이다. 그러나 n대신에 n-1로 나누어 주면, 샘플의 분산값은 1.67이 된다. 이 분산 값이 모집단의 분산값에 더 가깝다. 또한 샘플의 분산값 계산에 쓰인 n-1인 3은 3개의 개체가 어떤 값을 가져도 나머지 한개의 값이 조정만된다면 전체 샘플의 평균값인 3.5를 유지할 수 있다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. 따라서 우리는 이 샘플이 n-1의 자유도를 가졌다고 한다. 이 자유도는 ' | + | 위에서 보면, 샘플의 평균은 3.5이고 (모집단 분산에서 사용되는 분산식을 사용한) 분산은 1.25이다. 이는 실제 모집단의 분산값인 1.8에 훨씬 못 미치는 수치이다. 그러나 n대신에 n-1로 나누어 주면, 샘플의 분산값은 1.67이 된다. 이 분산 값이 모집단의 분산값에 더 가깝다. |
- | 수학적인 증명을 보려면 [[: | + | 또한 샘플의 분산값 계산에 쓰인 n-1인 3은 3개의 개체가 어떤 값을 가져도 나머지 한개의 값이 조정만된다면 전체 샘플의 평균값인 3.5를 유지할 수 있다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. 따라서 우리는 이 샘플이 |
+ | ====== n-1 로 나누는 예 ====== | ||
- | < | + | 아래는 r에서 이를 확인하는 작업이다. 집합 |
- | > mean(k) | + | * n = 10, |
- | [1] 3 | + | * mean = 3, |
- | > var(k) | + | * sd = sqrt(2) = 1.414214 |
- | [1] 2 | + | |
- | > sd(k) | + | 4개의 샘플을 |
- | [1] 1.414214 | + | * mean = 2.25 |
- | > | + | |
- | </ | + | * n-1 대신 n을 사용했을 때는 0.9437293 |
< | < | ||
- | set.seed(1024) | + | ############ |
- | ks <- sample(k, | + | set.seed(1010) |
- | mean(ks) | + | n.pop <- 20 |
- | sd(ks) | + | k <- sample(1: |
- | (sd(ks)*3)/4 | + | k.mean <- mean(k) |
+ | k.pvar <- var(k)*((n.pop-1)/ | ||
+ | k.mean | ||
+ | k.pvar | ||
+ | ############ | ||
+ | n.samp <- 3 | ||
+ | ks <- sample(k, | ||
+ | ks | ||
+ | ks.mean <- mean(ks) | ||
+ | ks.var <- var(ks) | ||
+ | ks.pvar <- var(ks)*((n.samp-1)/n.samp) | ||
+ | |||
+ | ks.mean ## sample mean | ||
+ | ks.var ## sample variance | ||
+ | ks.pvar ## sample variance as population | ||
+ | k.mean ## population mean | ||
+ | k.pvar ## population variance as pop | ||
+ | ############ | ||
</ | </ | ||
+ | |||
+ | |||
+ | 수학적인 증명을 보려면 [[:why n-1]] 참조 | ||
+ | |||
{{tag>" | {{tag>" | ||
degrees_of_freedom.1569296045.txt.gz · Last modified: 2019/09/24 12:34 by hkimscil