−Table of Contents
Mean and variance of sample mean
전제: Expected value (기대값)와 Variance (분산)의 연산에 과한 법칙으로는 1) 참조.
X,Y are Independent variables.
E[aX]=aE[X]E[X+Y]=E[X]+E[Y]Var[aX]=a2Var[X]Var[X+Y]=Var[X]+Var[Y]Var[X−Y]=Var[X]+Var[Y]
Mean of the sample mean
평균이 (mean) μ 이고, 분산이 (variance) σ2 인 모집단에서 (population) 독립적으로 추출되어 관찰되는 X1,X2,...,Xn 이 있다고 하자. 이 샘플링은 아래와 같이 도식화되어 생각될 수 있다.
X1,X2,X3,...,XnX1,X2,X3,...,XnX1,X2,X3,...,Xn....X1,X2,X3,...,Xn
이 때 X2 에 대한 기대값은 E[X2] 일 것이고, 이는 μ 일 것이다. 또한 X2 에 대한 분산값은 Var[X2] 일 것이고, 이는 σ2 일 것이다. 이를 일반화하면,
E[Xi]=μVar[Xi]=σ2
한편, ¯X (평균) 값은
¯X=X1+X2+...+Xnn
이라고 표현할 수 있다. 이에 대한 기대값은 (샘플평균들의 기대값 = 샘플평균들의 평균) 아래처럼 표현 된다.
E[¯X]=E[X1+X2+...+Xnn]=(1n)E[X1+X2+...+Xn]=(1n)(E[X1+X2+...+Xn])=(1n)(E[X1]+E[X2]+...+E[Xn])=(1n)(μ+μ+...+μ)=(1n)(nμ)=μE[¯X]=μ¯X=μ
이렇게 샘플 평균들의 기대값은 (샘플 평균들의 평균은) 원래 모집단의 기대값이 된다.
Variance of the sample mean
Var[¯X]=Var[X1+X2+...+Xnn]=(1n)2Var[X1+X2+...+Xn]=(1n)2(Var[X1+X2+...+Xn])=(1n)2(Var[X1]+Var[X2]+...+Var[Xn])=(1n)2(σ2+σ2+...+σ2)=1n2nσ2=σ2nVar[¯X]=σ2nσ2¯X=σ2nσ¯X=σ√n
위는 샘플 평균들의 집합에서 나타나는 분산값은 원래 모집단의 (population의) 분산값을 샘플의 크기, n으로 나누어 준 값을 갖는다는 것을 보여준다.