Normality

통계적 방법

Normality는 skewness와 kurtosis 값을 이용하여 케이스의 분포가 Normal distiribution을 따르는 가를 판단하기 위해서 사용되는 용어이다. skewness와 kurtosis 값의 standard error값을 이용하여, 유의도검사를 하게 되는데, 이때 각각의 stnadard error 값은:
$$ S_{s} = \sqrt{\frac{6}{N}}$$
$$S_{k} = \sqrt{\frac{24}{N}}$$
이고 이를 이용하여 아래의 z-score에 대한 검증을 하게 된다.
$$z = \frac{S-0}{S_{s}}$$
$$z = \frac{K-0}{S_{k}}$$
흔히, 이때의 p값은 .01 혹은 .001 의 유의도를 채택하여 검증을 한다. 이 계산을 이용할 때, 주의할 점은 샘플의 사이즈가 (N) 클때, 가설의 검증이 쉽게 이루어지는 경향이 있으므로, 전체 distribution 곡선의 모양을 함께 살펴보는 것이 권장된다.

시각적 방법

시각적인 방법으로는:

examine
  variables=crime
  /plot boxplot histogram npplot.

(1) histogram이나 boxplot을 살펴본다.
Fig. 1: histogram

Fig. 2: Boxplot
위의 예에서 유독 한 케이스만이 다른 케이스들과 동떨어져 있음을 알 수 있다.

(2) normal plot을 만들어 살펴본다. 이는 데이터가 normal할 경우의 기대치를 계산한 후 기 기대치에 맞추어 실제 데이터를 나열하는 것을 말한다 (위의 명령어 참조).
Fig. 3: nnplot

(3) Regression을 이용하여 residual(오차)의 분포를 살펴보는 방법이 있다.

regression
  /dependent crime
  /method=enter pctmetro pctwhite poverty single
  /scatterplot(*zresid *pred).

Fig. 4: scatterplot predicted value by zresiduals

COMMunication
RESearch.NET

Table of Contents

Normality

통계적 방법

시각적 방법