Differences

This shows you the differences between two versions of the page.

--- estimated_standard_deviation [2020/11/05 18:39] – [temp] hkimscil
+++ estimated_standard_deviation [2023/09/13 11:00] (current) – hkimscil
@@ Line 11: / Line 11: @@
 \begin{eqnarray*}
-\hat{\sigma}^{2} = \frac {\displaystyle\sum_{i=1}^{n}{(X_{i}-\overline{X})}} {n}
+\hat{\sigma}^{2} \neq \frac {\displaystyle\sum_{i=1}^{n}{(X_{i}-\overline{X})}} {n}
 \end{eqnarray*}
@@ Line 50: / Line 50: @@
 |    |    | SS<sub>samp</sub>  | 98  |
-이렇게 얻은 SS<sub>samp</sub>값은 98인데, 이 값은 SS<sub>pop</sub> 값보다 작다. 아래의 R code는 이를 확인해 보는 작업이다. 각각의 샘플에서 (n=3) 취한 SS<sub>samp</sub> 값은 대개는 SS<sub>pop</sub>값보다 작은 경향을 띈다. 따라서 이 작은 값을 상쇄하기 위해서 n 대신 n-1 로 SS<sub>samp</sub> 값을 나누어 준다.
+이렇게 얻은 SS<sub>samp</sub>값은 98인데, 이 값은 SS<sub>pop</sub> 값보다 작다. 아래의 R code는 이를 확인해 보는 작업이다. 각각의 샘플에서 (n=3) 취한 SS<sub>samp</sub> 값은 SS<sub>pop</sub>값보다 작게 된다. 따라서 이 작은 값을 상쇄하기 위해서 n 대신 n-1 로 SS<sub>samp</sub> 값을 나누어 준다.
@@ Line 223: / Line 223: @@
 ''sum%%(%%%%(%%ks-k.mean)^2) '' > ''sum%%(%%%%(%%ks-ks.mean)^2) ''  즉,
-$\sum({X_{i}-\mu})^{2} > \sum({X_{i}-\overline{X}})^{2}$ 의 경향이 있다.
+$\sum({X_{i}-\mu})^{2} > \sum({X_{i}-\overline{X}})^{2}$ 이다.
 이를 그림으로 설명하면 다음과 같다. 아래에서 녹색의 세로선은 모집단의 평균값이고, 붉은색의 세로선은 3개로 이루어진 샘플의 평균값이다. 그리고 녹색 가로선은 3개의 샘플요소와 모집단평균과의 ($\mu$) 차이값들이고, 적색가로선은 3개의 샘플요소와 샘플평균과의 ($\overline{X}$) 차이값이다. 이 차이값들을 모아서 길이를 비교한 것이 그래프의 하단이다. 적색가로선 세개의 합이 녹색가로선 세개의 합보다 작다.
@@ Line 352: / Line 352: @@
 평균이  20, 표준편차가 4인 집단에서 4개의 샘플을 취하여 그 평균을 구하고, 그 평균을 이용하 SS 부분을 (Sum of Square) 구한다고 했을 때, 평균외에 다른 점수를 이용했을 때 어떻게 되는가를 본 것이다 (range <- seq(1:40)과 같이). ss값이 가장 작았을 때의 x값을 보면 샘플의 평균값임을 알  수 있다.
-마지막 그래프에서 가장 작은 기울기값을 갖는 v 값을 구하는 미분을 한다고 가정하고 이해를 하면 수학적으로 이해할 수 있다.
+마지막 그래프에서 가장 작은 기울기값을 갖는 v 값을 구한다고 (derivatives) 가정하고 이해를 하면 수학적으로 이해할 수 있다. ((see https://www.mathsisfun.com/calculus/derivatives-introduction.html))
 {{:pasted:20200504-223320.png}}
@@ Line 378: / Line 378: @@
 ====== 수학적 증명 ======
 우선,
@@ Line 385: / Line 384: @@
        & = & E[(X^{2} - 2 X \mu + \mu^{2})] \\
 & = & E[X^{2}] - 2 \mu E[X] + E[\mu^2] \\
-& = & E[X^{2}] - 2 \mu E[X] + E[\mu^{2}], \;\; \text{because E[X]=} \mu \text{, \; E[} \mu^2 \text{] = } \mu^2, \\
+& = & E[X^{2}] - 2 \mu E[X] + E[\mu^{2}], \;\; \text{because}\; E[X] = \mu \text{, } \; E[\mu^2] = \mu^2, \\
 & = & E[X^{2}] - 2 \mu^{2} + \mu^{2}   \\
 & = & E[X^{2}] - \mu^{2}
@@ Line 392: / Line 391: @@
 이므로
-\begin{eqnarray*}
+\begin{align}
-E[X^2] & = & Var[X] + \mu^2 \\
+E\left[X^2\right] & = Var\left[X\right] + \mu^2 \nonumber \\
-& = & \sigma^{2} + \mu^2 \;\;\; \dots\dots\dots\dots\dots (1)
+& = \sigma^{2} + \mu^2 \\
-\end{eqnarray*}
+\end{align}
 마찬가지로
+\begin{align}
-\begin{eqnarray*}
+Var \left[ \overline{X}\right] & =  E \left[\overline{X}^2 \right] - \left[E(\overline{X})\right]^2 \nonumber \\
-Var[\overline{X}] & = & E[\overline{X}^2] - [E(\overline{X})]^2 \\
+& = E\left[\overline{X}^{2}\right] - \mu^{2} \nonumber
-& = & E[\overline{X}^{2}] - \mu^{2}
+\end{align}
-\end{eqnarray*}
 따라서
-\begin{eqnarray*}
+\begin{align}
-E[\overline{X}^{2}]  & = & Var[\overline{X}] + \mu^2 \\
+E\left[\overline{X}^{2}\right]  & = Var\left[\overline{X}\right] + \mu^2 \nonumber \\
-& = & \frac {\sigma^{2}} {n} + \mu^{2} \;\;\; \dots\dots\dots\dots\dots (2)
+& = \frac {\sigma^{2}} {n} + \mu^{2}
-\end{eqnarray*}
+\end{align}
-참고로 위에서 $Var[\overline{X}] = \dfrac {\sigma^{2}} {n} $ 에 해당하는 설명은 [[:mean and variance of the sample mean]] 문서를 볼 것.
+참고로 위에서 $Var\left[\overline{X}\right] = \dfrac {\sigma^{2}} {n} $ 에 해당하는 설명은 [[:mean and variance of the sample mean]] 문서를 볼 것.
 ----
@@ Line 417: / Line 415: @@
 X,Y are Independent variables.
-\begin{eqnarray*}
+\begin{align*}
-E[aX] &=& a E[X] \\
+E[aX] & = a E[X] \\
-E[X+Y] &=& E[X] + E[Y] \\
+E[X+Y] & = E[X] + E[Y] \\
-Var[aX] &=& a^{\tiny{2}} Var[X] \\
+Var[aX] & = a^{\tiny{2}} Var[X] \\
-Var[X+Y] &=& Var[X] + Var[Y]
+Var[X+Y] & = Var[X] + Var[Y]
-\end{eqnarray*}
+\end{align*}
 </WRAP>
 ----
 우리가 알고자 하는 것은 아래의 식이 population의 parameter인 $\sigma^{2}$ 의 값과 같은가이다.
-\begin{eqnarray*}
+\begin{align*}
-E[s^{2}] & = & E \left[\frac{\displaystyle\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}{n-1} \right] \dots\dots\dots (a) \\
+E[s^{2}] & = E \left[\frac{\displaystyle\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}{n-1} \right] \qquad
-& = & \sigma^{2}
+\cdot\cdot\cdot\cdot\cdot\cdot\cdot\cdot\cdot\cdot\cdot\cdot \;\; (a)  \\
-\end{eqnarray*}
+& = \sigma^{2}
+\end{align*}
 위의 식에서 일부만을 추출해서 먼저 보자.
-\begin{eqnarray*}
-E \left[\sum{(X_{i}-\overline{X})^{2}} \right] & = & E \left[\sum(X_{i}^{2}- 2 X_{i} \overline{X} + \overline{X}^{2})\right] \\
-& = & E \left[ \sum{X_{i}^2} - \sum{2X_{i} \overline{X}} + \sum {\overline{X^2}}  \right]  \\
-& = & E \left[ \sum{X_{i}^2} - 2 \overline{X} \sum{X_{i}} + \sum{\overline{X^2}}  \right]  \\
-& = & E \left[ \sum{X_{i}^2} - 2 \overline{X} \sum{X_{i}} + n \overline{X^2} \right]  \\
-& = & E \left[ \sum{X_{i}^2} - 2 \overline{X} \cdot (n \overline{X}) + n \overline {X^2} \right] \\
-& = & E \left[ \sum{X_{i}^2} - n \overline{X}^2 \right] \\
-& = & \sum {E(X_{i}^2)} - E(n\overline{X}^2)  \\
-& = & \sum {E(X_{i}^2)} - n E(\overline{X}^2)  \;\;\; \dots\dots\dots\dots\dots (3)
-\end{eqnarray*}
-한 편, 위의 (1), (2)에서
+\begin{align*}
+E \left[\sum{(X_{i}-\overline{X})^{2}} \right] & = E \left[\sum(X_{i}^{2}- 2 X_{i} \overline{X} + \overline{X}^{2})\right] \\
+& = E \left[ \sum{X_{i}^2} - \sum{2X_{i} \overline{X}} + \sum {\overline{X^2}}  \right]  \\
-====== Headline ======
+& = E \left[ \sum{X_{i}^2} - 2 \overline{X} \sum{X_{i}} + \sum{\overline{X^2}}  \right]  \\
+& = E \left[ \sum{X_{i}^2} - 2 \overline{X} \sum{X_{i}} + n \overline{X^2} \right]  \\
+& = E \left[ \sum{X_{i}^2} - 2 \overline{X} \cdot (n \overline{X}) + n \overline {X^2} \right] \\
+& = E \left[ \sum{X_{i}^2} - n \overline{X}^2 \right] \\
+& = \sum {E\left(X_{i}^2\right)} - E\left(n\overline{X}^2\right)  \\
+& = \sum {E\left(X_{i}^2\right)} - n E\left(\overline{X}^2\right)  \;\;\; \dots\dots\dots\dots\dots (3)
+\end{align*}
+한 편, 위의 $(1), (2)$에서
 <WRAP box>
-\begin{eqnarray*}
+\begin{align*}
-E[X_{i}^{2}] & = & \sigma^{2} + \mu^2 \;\;\; \dots\dots\dots\dots\dots (1) \\
+E\left[X_{i}^{2}\right] & = \sigma^{2} + \mu^2 \;\;\; \dots\dots\dots\dots\dots (1) \\
-E[\overline{X}^{2}] & = & \dfrac {\sigma^{2}} {n} + \mu^{2} \;\;\; \dots\dots\dots\dots\dots (2)
+E\left[\overline{X}^{2}\right] & = \dfrac {\sigma^{2}} {n} + \mu^{2} \;\;\; \dots\dots\dots\dots\dots (2)
-\end{eqnarray*}
+\end{align*}
 </WRAP>
-위의 (1), (2)를 (3)에 대입해보면
+위의 $(1), (2)$를 $(3)$에 대입해보면
-\begin{eqnarray*}
+\begin{align*}
-E \left[\sum{(X_{i}-\overline{X})^{2}} \right] & = & \sum{E(X_{i}^{2})} - n E(\overline{X}^{2})  \\
+E \left[\sum{(X_{i}-\overline{X})^{2}} \right] & = \sum{E\left(X_{i}^{2}\right)} - n E\left(\overline{X}^{2}\right)  \\
-& = & \sum{(\sigma^{2} + \mu^{2})} - n (\dfrac{\sigma^2}{n} + \mu^2) \\
+& = \sum{\left(\sigma^{2} + \mu^{2}\right)} - n \left(\dfrac{\sigma^2}{n} + \mu^2\right) \\
-& = & n\sigma^{2} + n\mu^{2} - \sigma^{2} - n\mu^{2} \\
+& = n\sigma^{2} + n\mu^{2} - \sigma^{2} - n\mu^{2} \\
-& = & (n-1) \sigma^{2}
+& = \left(n-1\right) \sigma^{2}
-\end{eqnarray*}
+\end{align*}
 위는 식 (a)의 일부이므로 이를 온전한 식에 대입해보면,
@@ Line 483: / Line 479: @@
 \end{eqnarray*}
+----
 만약에 우리가 population의 variance를 구하듯이 n을 이용한다고 하면,
@@ Line 489: / Line 487: @@
 & = & \dfrac{1}{n} E \left[\sum{(X_{i}-\overline{X})^{2}} \right] \\
 & = & \dfrac{1}{n} (n-1) \sigma^{2} \\
-& = & (\dfrac{n-1}{n}) \sigma^{2} \\
+& = & \left(\dfrac{n-1}{n}\right) \sigma^{2} \\
 \end{eqnarray*}
 즉, 원래 $\sigma^2$ 값보다 조금 작은 값을 갖게 될 것이다 (이를 biased result라고 한다).
 {{tag>"research methods" "조사방법론" "표준편차" "n-1" "자유도" "degrees of freedom" "n-1" "표준오차"}}