variance
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
variance [2025/08/24 11:24] – hkimscil | variance [2025/08/24 12:12] (current) – hkimscil | ||
---|---|---|---|
Line 14: | Line 14: | ||
* 개인의 차이 점수를 모아서 보면 그 집합이 전체특징에서 (평균) 얼마나 멀리 떨어져 있는지를 (개인점수의 분포) 알려준다. | * 개인의 차이 점수를 모아서 보면 그 집합이 전체특징에서 (평균) 얼마나 멀리 떨어져 있는지를 (개인점수의 분포) 알려준다. | ||
* 단 차이점수의 합은 언제나 0이 되므로 차이점수를 제곱해서 모아 본 점수를 가지고 " | * 단 차이점수의 합은 언제나 0이 되므로 차이점수를 제곱해서 모아 본 점수를 가지고 " | ||
- | * 위의 설명을 수식으로 요약하면 | + | * 위의 설명을 수식으로 요약하면 $ \sum{(Yi - \overline{Y})^2} $ 라고 쓸 수 있다. |
- | * $ \sum{(Yi - \overline{Y})^2} $ | + | * 우리는 이것을 Sum of Square 라고 (제곱의 합) 부른다. |
+ | * 그런데 위는 다음 처럼도 설명할 수 있다. | ||
+ | * 각 개인의 점수를 예측하라고 하면 평균값을 가지고 예측하는 것이 가장 오차가 적은 결과를 낳을 것을다. | ||
+ | * 따라서 개인의 점수를 평균으로 예측했을 때, 각 오차를 제곱해서 더해 보면 오차가 얼마나 큰지를 알려주는 지표가 된다. | ||
+ | * 이 때의 오차는 위의 설명과 마찬가지로 개인의 점수가 평균을 중심으로 얼마나 떨어져 있는지를 알려주는 지표가 된다. | ||
+ | * 따라서 먼저 언급한 제곱의 합은 " | ||
+ | * 이를 Sum of Square Error 라고도 부른다 | ||
+ | * 혹은 Sum of Square Deviation Score 라고도 부르는데 deviation score라는 것은 개인 점수가 (Yi) 평균에서 얼마나 떨어져 있는가를 (deviated 되어 있는가) 알려준다고 설명하기 때문이다. 따라서 deviation score는 error score (from the mean) 와 같은 것이다. | ||
+ | * 또한 SS Error는 Sum of Square Residual이라고도 부른다. 여기서 residual의 의미는 샘플의 전체특징힌 평균값을 뺀 나머지라는 (residual) 뜻에서의 residual이다. | ||
+ | * 마지막으로 Sum of Square Total이라고도 부르는데 이 때 Total의 의미는 Y 변인의 (평균에서의) 오차 전체를 의미한다고 보면 된다. | ||
- | + | | |
- | + | * 그런데 실제로는 n으로 | |
- | | + | * 이에 대해서는 |
- | * 어느 집합의 개인 점수가 | + | * 따라서 분산값은 아래처럼 요약된다. |
- | * 분산은 일종의 | + | \begin{eqnarray*} |
- | * 분산은 숫자로 측정된 하나의 집합 내에 속한 개인점수를 평균으로 예측했을 때, 그 오차를 (평균과 실제점수 간의 차이) 알려주는 지표이다. 따라서 분산은 | + | \sigma^2 & = & \dfrac {\text{SS}} {\text{df}} \\ |
- | * 분산은 일종의 불확실성이다. | + | & = & \dfrac{\text{Sum of Error Square}}{\text{df}} \\ |
+ | & = & \dfrac{\text{Sum of Residual Square}}{\text{df}} \\ | ||
+ | & = & \dfrac{\text{Sum of DS Square}}{\text{df}}, | ||
+ | & = & \dfrac{\sum{(Yi - \overline{Y})^2}}{n-1}, | ||
+ | \end{eqnarray*} | ||
variance.1756002273.txt.gz · Last modified: 2025/08/24 11:24 by hkimscil