User Tools

Site Tools


standard_deviation

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
standard_deviation [2024/09/10 23:18] hkimscilstandard_deviation [2026/03/15 23:30] (current) hkimscil
Line 1: Line 1:
 ====== 표준편차, kr ====== ====== 표준편차, kr ======
 Standard Deviation(표준편차)는 [[:Variance|variance(분산)]]값을 square root한 값을 말한다. 애초에 분산의 정도를 구하기 위해서 deviation score를 제곱한 값을 사용하였으므로 이에 다시 제곱근을 한 것이다.  Standard Deviation(표준편차)는 [[:Variance|variance(분산)]]값을 square root한 값을 말한다. 애초에 분산의 정도를 구하기 위해서 deviation score를 제곱한 값을 사용하였으므로 이에 다시 제곱근을 한 것이다. 
- +\begin{eqnarray*} 
-$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\mu)^2}{N}} $$ +\sigma^2 & = & \frac{SS}{N} = \frac{SS}{N-1} \\  
-$$s=\sqrt{s^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\overline{X})^2}{n-1}} $$ + & = &  \frac{SS}{df} = \frac{\sum\limits_{i=1}^n (X_i-\mu)^2}{N-1} \\ 
-$$s=\sqrt{s^2$$ +\sigma \sqrt{\sigma^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\mu)^2}{N-1}}  \\ 
 +\sqrt{s^2}=\sqrt{\frac{\sum\limits_{i=1}^n (X_i-\overline{X})^2}{n-1}} \\ 
 +\end{eqnarray*}
 아래는 평균:100, 표준편차:20 인 변인 X 의 데이터를 그래프로 나타낸 것이다. [[:Normal Distribution|normal distribution 정상분포]]의 전체 면적을 1 이라고 했을 때, 평균을 중심으로 한 [[standard deviation]]의 한 단위는 아래쪽과 위쪽 면적의 합은 전체 면적의 약 68%를 차지한다. 두 단위 아래 위쪽을 포함하는 면적은 약 95%; 그리고 세단위를 사용한 면적은 약 99%를 차지한다.  아래는 평균:100, 표준편차:20 인 변인 X 의 데이터를 그래프로 나타낸 것이다. [[:Normal Distribution|normal distribution 정상분포]]의 전체 면적을 1 이라고 했을 때, 평균을 중심으로 한 [[standard deviation]]의 한 단위는 아래쪽과 위쪽 면적의 합은 전체 면적의 약 68%를 차지한다. 두 단위 아래 위쪽을 포함하는 면적은 약 95%; 그리고 세단위를 사용한 면적은 약 99%를 차지한다. 
  
-{{  :pasted:20200414-201919.png  }} +[{{:pasted:20200414-201919.png?500|위의 그래프에서 var = 20 이 아니라 sd = 20 }}]
  
 위의 그래프가 어느 집단의 IQ라는 변인을 측정한 데이타라고 가정한다면 SD 한 단위에 해당하는 80-120 사이의 사람들은 약 68%이며, 60-140은 95%, 그리고 40-160사이의 사람들은 99%를 차지한다고 생각할 수 있다. 단, IQ 점수의 분포가 정상분포곡선을 이룬다는 가정에서이다. 위의 그래프가 어느 집단의 IQ라는 변인을 측정한 데이타라고 가정한다면 SD 한 단위에 해당하는 80-120 사이의 사람들은 약 68%이며, 60-140은 95%, 그리고 40-160사이의 사람들은 99%를 차지한다고 생각할 수 있다. 단, IQ 점수의 분포가 정상분포곡선을 이룬다는 가정에서이다.
Line 27: Line 27:
  
 <code> <code>
 +> one.sd <- .68
 +> two.sd <- .95
 +> thr.sd <- .99
 +> 1-one.sd
 +[1] 0.32
 +> (1-one.sd)/2
 +[1] 0.16
 > qnorm(0.16) > qnorm(0.16)
 [1] -0.9944579 [1] -0.9944579
-> qnorm(0.84)+> qnorm(1-0.16)
 [1] 0.9944579 [1] 0.9944579
  
->+1-two.sd 
 +[1] 0.05 
 +> (1-two.sd)/
 +[1] 0.025 
 +> qnorm(0.025) 
 +[1] -1.959964
 > qnorm(0.975) > qnorm(0.975)
 [1] 1.959964 [1] 1.959964
-> qnorm(0.025) 
-[1] -1.959964 
  
-> 0.01/2+1-thr.sd 
 +[1] 0.01 
 +> (1-thr.sd)/2
 [1] 0.005 [1] 0.005
 > qnorm(0.005) > qnorm(0.005)
Line 47: Line 59:
 </code> </code>
 위의 값은 정확은 하지만 개념적으로 표준편차의 특징을 이해하는데 방해가 되는 면이 있다. 따라서 표준편차 1, 2, 3 만큼은 각각 68, 95, 99%로 기억해두는 것이 편리하다.  위의 값은 정확은 하지만 개념적으로 표준편차의 특징을 이해하는데 방해가 되는 면이 있다. 따라서 표준편차 1, 2, 3 만큼은 각각 68, 95, 99%로 기억해두는 것이 편리하다. 
-<code> +
-> sd.1 <- qnorm(0.16) +
-> sd.2 <- qnorm(0.025) +
-> sd.3 <- qnorm(0.01/2) +
-+
-> sd.1 +
-[1] -0.9944579 +
-> sd.2 +
-[1] -1.959964 +
-> sd.3 +
-[1] -2.575829 +
-+
-> pnorm(-sd.1)-pnorm(sd.1) +
-[1] 0.68 +
-> pnorm(-sd.2)-pnorm(sd.2) +
-[1] 0.95 +
-> pnorm(-sd.3)-pnorm(sd.3) +
-[1] 0.99 +
->  +
-</code>+
standard_deviation.1726010287.txt.gz · Last modified: by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki