degrees_of_freedom
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
degrees_of_freedom [2020/04/09 04:45] – hkimscil | degrees_of_freedom [2021/03/03 11:24] (current) – old revision restored (2020/04/14 15:33) hkimscil | ||
---|---|---|---|
Line 58: | Line 58: | ||
|variance | |variance | ||
- | 위에서 보면, 샘플의 평균은 3.5이고 (모집단 분산에서 사용되는 분산식을 사용한) 분산은 1.25이다. 이는 실제 모집단의 분산값인 1.8에 훨씬 못 미치는 수치이다. 그러나 n대신에 n-1로 나누어 주면, 샘플의 분산값은 1.67이 된다. 이 분산 값이 모집단의 분산값에 더 가깝다. 또한 샘플의 분산값 계산에 쓰인 n-1인 3은 3개의 개체가 어떤 값을 가져도 나머지 한개의 값이 조정만된다면 전체 샘플의 평균값인 3.5를 유지할 수 있다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. 따라서 우리는 이 샘플이 n-1의 자유도를 가졌다고 한다. 이 자유도는 ' | + | 위에서 보면, 샘플의 평균은 3.5이고 (모집단 분산에서 사용되는 분산식을 사용한) 분산은 1.25이다. 이는 실제 모집단의 분산값인 1.8에 훨씬 못 미치는 수치이다. 그러나 n대신에 n-1로 나누어 주면, 샘플의 분산값은 1.67이 된다. 이 분산 값이 모집단의 분산값에 더 가깝다. |
+ | |||
+ | 또한 샘플의 분산값 계산에 쓰인 n-1인 3은 3개의 개체가 어떤 값을 가져도 나머지 한개의 값이 조정만된다면 전체 샘플의 평균값인 3.5를 유지할 수 있다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. 따라서 우리는 이 샘플이 n-1의 자유도를 가졌다고 한다. 이 자유도는 ' | ||
+ | |||
+ | ====== n-1 로 나누는 예 ====== | ||
아래는 r에서 이를 확인하는 작업이다. 집합 k의 parameter가 아래와 같을 때 | 아래는 r에서 이를 확인하는 작업이다. 집합 k의 parameter가 아래와 같을 때 | ||
Line 69: | Line 73: | ||
* sd = 1.258306 | * sd = 1.258306 | ||
* n-1 대신 n을 사용했을 때는 0.9437293 | * n-1 대신 n을 사용했을 때는 0.9437293 | ||
- | |||
< | < | ||
- | k <- c(2, 3, 2, 4, 5, 5, 2, 2, 4, 1) | + | ############ |
- | k | + | set.seed(1010) |
- | mean(k) | + | n.pop <- 20 |
- | var(k) ## SS값을 n-1인 9로 나누어 구하는 variance값 | + | k <- sample(1:20, n.pop, replace = T) |
- | var(k)*(9/10) ## k vector를 | + | k.mean <- mean(k) |
- | </ | + | k.pvar <- var(k)*((n.pop-1)/n.pop) ## population |
- | + | k.mean | |
- | < | + | k.pvar |
- | set.seed(1024) | + | ############ |
- | ks <- sample(k, | + | n.samp <- 3 |
+ | ks <- sample(k, | ||
ks | ks | ||
- | mean(ks) | + | ks.mean <- mean(ks) |
- | var(ks) | + | ks.var <- var(ks) |
- | var(ks)*(3/4) # n으로 구한 | + | ks.pvar <- var(ks)*((n.samp-1)/n.samp) |
+ | |||
+ | ks.mean ## sample mean | ||
+ | ks.var ## sample variance | ||
+ | ks.pvar ## sample variance as population | ||
+ | k.mean ## population mean | ||
+ | k.pvar ## population variance as pop | ||
+ | ############ | ||
</ | </ | ||
+ | |||
수학적인 증명을 보려면 [[:why n-1]] 참조 | 수학적인 증명을 보려면 [[:why n-1]] 참조 |
degrees_of_freedom.1586375124.txt.gz · Last modified: 2020/04/09 04:45 by hkimscil