User Tools

Site Tools


degrees_of_freedom

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
degrees_of_freedom [2019/09/24 12:43]
hkimscil
degrees_of_freedom [2020/04/14 15:42] (current)
hkimscil
Line 30: Line 30:
  
 |   | Xi  | ds  | ds<​sup>​2</​sup> ​ | |   | Xi  | ds  | ds<​sup>​2</​sup> ​ |
-  ​| 2  | -1  | 1  | +| 2  | -1  | 1  | 
-  ​| 3  | 0  | 0  | +| 3  | 0  | 0  | 
-  ​| 2  | -1  | 1  | +| 2  | -1  | 1  | 
-  ​| 4  | 1  | 1  | +| 4  | 1  | 1  | 
-  ​| 5  | 2  | 4  | +| 5  | 2  | 4  | 
-  ​| 5  | 2  | 4  | +| 5  | 2  | 4  | 
-  ​| 2  | -1  | 1  | +| 2  | -1  | 1  | 
-  ​| 2  | -1  | 1  | +| 2  | -1  | 1  | 
-  ​| 4  | 1  | 1  | +| 4  | 1  | 1  | 
-  ​| 1  | -2  | 4  |+10 | 1  | -2  | 4  |
 | sum  | 30  | 0  | 18  | | sum  | 30  | 0  | 18  |
 | N  | 10  |   ​| ​  | | N  | 10  |   ​| ​  |
Line 48: Line 48:
 위의 사례를 정리해 보면, 평균은 3, 분산은 1.8인 성격을 갖는 모집단이 된다. 이제 여기서 4개의 샘플단위를 뽑아서 샘플을 만들면 아래와 같다. 위의 사례를 정리해 보면, 평균은 3, 분산은 1.8인 성격을 갖는 모집단이 된다. 이제 여기서 4개의 샘플단위를 뽑아서 샘플을 만들면 아래와 같다.
  
-|  |  | Xi  | ds  | ds2  | +|  | Xi | Xi  | ds  | ds2  | 
-|  |  | 2  | -1.5  | 2.25  | +|  | X<​sub>​1</​sub> ​| 2  | -1.5  | 2.25  | 
-|  |  | 5  | 1.5  | 2.25  | +|  | X<​sub>​2</​sub> ​| 5  | 1.5  | 2.25  | 
-|  |  | 3  | -0.5  | 0.25  | +|  | X<​sub>​3</​sub> ​| 3  | -0.5  | 0.25  | 
-|  |  | 4  | 0.5  | 0.25  |+|  | X<​sub>​4</​sub> ​| 4  | 0.5  | 0.25  |
 |  |sum  | 14  |  | 5  | |  |sum  | 14  |  | 5  |
 |  |average ​ | 3.5  |  |  | |  |average ​ | 3.5  |  |  |
Line 58: Line 58:
 |variance ​ |n-1  | 3  |  | 1.67  | |variance ​ |n-1  | 3  |  | 1.67  |
  
-위에서 ​보면, 샘플의 ​평균은 3.5이고 (모집단 분산에서 사용되는 분산식을 사용한) 분산은 1.25이다. ​이는 실제 모집단의 분산값인 1.8에 훨씬 못 미치는 수치그러나 n대신에 n-1로 나누어 주면, 샘플의 분산은 1.67이 다. 이 분산 값이 모집단의 분산값에 더 다. 또한 샘플의 분산값 계산에 쓰인 n-1인 3은 3개의 개체가 어떤 값을 ​가져도 나머지 한개의 ​값이 ​조정만다면 전체 샘플의 평균값인 3.5를 유지할 수 있다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. ​따라서 ​우리는 이 샘플이 n-1의 자유도를 가졌다고 한다. 이 자유도는 '​df'​로 줄여서 많이 쓰인다. +의 샘플을 나타내는 표에서 ​그 평균은 3.5이다. ​그리고, 각각의 샘플 요소 중 하나인 X<​sub>​1</​sub>​는 평균값이 3.5가 되기 위해서는 ​떤 값이라도 가질 자유가 있다. 이는 X<​sub>​2</​sub>​와 X<​sub>​3</​sub>​ 도 마찬지이다. 그러나, 마지막 X<​sub>​4</​sub>​값은 ​위의 ​3개가 어떤 값을 ​차례대로 갖게 된 상태에서는 "​어떤  ​값이라도 가질 자유"​를 잃게 ​된다. 다시 이야기 하면, 마지막 한 개의 값은 다른 개체와는 달리 어떤 숫자라도 가질 수 있는 자유를 잃게 된다. ​이 때 우리는 이 샘플이 n-1의 자유도를 ​(degrees of freedom) ​가졌다고 한다. 이 자유도는 '​df'​로 줄여서 많이 쓰인다. ​위의 예에 대한 실증적인 와 수학적인 증명은 [[:why n-1]]를 참조하라.
- +
-아래는 r서 이를 확하는 작업이다. 집합 k의 parameter가 아래와 같을 때 +
-  * n = 10,  +
-  * mean = 3,  +
-  * sd = sqrt(2) = 1.414214 +
- +
-4개의 샘플을 (ks) 구했을 때, ks의 statistics는 아래와 같다.  +
-  * mean = 2.25 +
-  * sd = 1.258306 +
-  * n-1 대신 n을 사용했을 때는 0.9437293 +
- +
- +
-<​code>​ +
-k <- c(2, 3, 2, 4, 5, 5, 2, 2, 4, 1) +
-set.seed(1024) +
-ks <- sample(k, 4) +
-mean(ks) +
-sd(ks) +
-(sd(ks)*3)/​4 +
-######### +
-mean(k) +
-sd(k) +
- +
-</​code>​ +
- +
-<​code>​ +
-> k <- c(2, 3, 2, 4, 5, 5, 2, 2, 4, 1) +
-> k +
- [1] 2 3 2 4 5 5 2 2 4 1 +
->  +
-> set.seed(1024) +
-> ks <- sample(k, 4) +
-> mean(ks) +
-[1] 2.25 +
-> sd(ks) +
-[1] 1.258306 +
-> (sd(ks)*3)/​4 +
-[1] 0.9437293 +
->  +
-> sd(k) +
-[1] 1.414214 +
->  +
-> mean(k) +
-[1] 3 +
-</​code>​ +
- +
- +
-수학적인 증명을 보려면 ​[[:why n-1]] 참조+
  
  
 {{tag>"​research methods"​ statistics n-1 "​degrees of freedom"​ 자유도}} {{tag>"​research methods"​ statistics n-1 "​degrees of freedom"​ 자유도}}
  
degrees_of_freedom.1569296598.txt.gz · Last modified: 2019/09/24 12:43 by hkimscil