====== 표준편차, kr ====== Standard Deviation(표준편차)는 [[:Variance|variance(분산)]]값을 square root한 값을 말한다. 애초에 분산의 정도를 구하기 위해서 deviation score를 제곱한 값을 사용하였으므로 이에 다시 제곱근을 한 것이다. $$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\mu)^2}{N}} $$ $$s=\sqrt{s^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\overline{X})^2}{n-1}} $$ $$s=\sqrt{s^2} $$ 아래는 평균:100, 표준편차:20 인 변인 X 의 데이터를 그래프로 나타낸 것이다. [[:Normal Distribution|normal distribution 정상분포]]의 전체 면적을 1 이라고 했을 때, 평균을 중심으로 한 [[standard deviation]]의 한 단위는 아래쪽과 위쪽 면적의 합은 전체 면적의 약 68%를 차지한다. 두 단위 아래 위쪽을 포함하는 면적은 약 95%; 그리고 세단위를 사용한 면적은 약 99%를 차지한다. {{ :pasted:20200414-201919.png }} 위의 그래프가 어느 집단의 IQ라는 변인을 측정한 데이타라고 가정한다면 SD 한 단위에 해당하는 80-120 사이의 사람들은 약 68%이며, 60-140은 95%, 그리고 40-160사이의 사람들은 99%를 차지한다고 생각할 수 있다. 단, IQ 점수의 분포가 정상분포곡선을 이룬다는 가정에서이다. 정확한 퍼센티지는 다음과 같다. > pnorm(1)-pnorm(-1) ## 68%로 줄여서 암기 [1] 0.6826895 > pnorm(2)-pnorm(-2) ## 95%로 줄여서 암기 [1] 0.9544997 > pnorm(3)-pnorm(-3) ## 99%로 줄여서 암기 [1] 0.9973002 >