User Tools

Site Tools


central_limit_theorem

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
central_limit_theorem [2020/04/22 16:59] hkimscilcentral_limit_theorem [2020/12/10 21:32] (current) hkimscil
Line 1: Line 1:
 ====== 중심극한정리 (Central Limit Theorem) ====== ====== 중심극한정리 (Central Limit Theorem) ======
 수학적으로 간단히 표현하면, 수학적으로 간단히 표현하면,
-$\overline{X} \sim \displaystyle \text{N} \left(\mu, \dfrac{\sigma^{2}}{n} \right)$ 혹은 +$\overline{X} \sim \displaystyle \text{N} \left(\mu, \dfrac{\sigma^{2}}{n} \right)$ 을 말한다.
-$\overline{X} \sim \displaystyle \text{N} \left(\mu, \left(\dfrac{\sigma}{\sqrt{n}}\right)^{2} \right)$ 을 말한다.+
  
 ===== 소개 ===== ===== 소개 =====
Line 33: Line 32:
  
 우리는 샘플의 사이즈가 커질 수록 (n의 크기가 커질 수록, 즉, 4,36, 100, 400, 900 과 같이), 그 샘플평균들의 SD값은 작아짐을 위의 그래프를 통해서 알았다. 그리고, 이는 [[:mean and variance of the sample mean]]이라는 문서를 통해서도 그것을 알수 있다 우리는 샘플의 사이즈가 커질 수록 (n의 크기가 커질 수록, 즉, 4,36, 100, 400, 900 과 같이), 그 샘플평균들의 SD값은 작아짐을 위의 그래프를 통해서 알았다. 그리고, 이는 [[:mean and variance of the sample mean]]이라는 문서를 통해서도 그것을 알수 있다
-  * n = 4 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{2} = 7.5$ +  * n = 4 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{2} = 7.5$ 
-  * n = 36 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{6} = 2.5$  +  * n = 36 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{6} = 2.5$  
-  * n = 100 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{10} = 1.5$ +  * n = 100 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{10} = 1.5$ 
-  * n = 400 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{20} = 0.75$ +  * n = 400 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{20} = 0.75$ 
-  * n = 900 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{30} = 0.5$+  * n = 900 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{30} = 0.5$
   * . . .    * . . . 
-  * n = 2500 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{50} = 0.3$ +  * n = 2500 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{50} = 0.3$ 
-  * n = 3600 일 때, $\sigam_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrace {15}{60} = 0.25$+  * n = 3600 일 때, $\sigma_{\overline{X}} = \dfrac{\sigma}{\sqrt{n}} = \dfrac {15}{60} = 0.25$
  
-그런데, 각 단계에서 $\sigam_{\overline{X}} $의 차이값은+그런데, 각 단계에서 $\sigma_{\overline{X}} $의 차이값은
   * n = 4,    * n = 4, 
   * n = 36, 7.5 - 2.5 = 5   * n = 36, 7.5 - 2.5 = 5
Line 51: Line 50:
   * n = 3600, 0.3 - 0.25  = 0.05   * n = 3600, 0.3 - 0.25  = 0.05
  
-즉, 샘플의 숫자가 커질 수록 $\sigam_{\overline{X}} $ 의 단위는 작아지는데, 작아지는 정도가 (스케일이) 점차 줄어든다. 즉, 처음에는 5만큼으로 드라마틱하게 줄고, 다음은 1만큼, 다음은 3/4만큼, 다음은 1/4만큼, . . . . +즉, 샘플의 숫자가 커질 수록 $\sigma_{\overline{X}} $ 의 단위는 작아지는데, 작아지는 정도가 (스케일이) 점차 줄어든다. 즉, 처음에는 5만큼으로 드라마틱하게 줄고, 다음은 1만큼, 다음은 3/4만큼, 다음은 1/4만큼, . . . . 
  
 위의 이야기는 아래와 같이 정리할 수 있다.  위의 이야기는 아래와 같이 정리할 수 있다. 
Line 61: Line 60:
   * sample을 취하는 population이 normal distribution을 이룬다   * sample을 취하는 population이 normal distribution을 이룬다
  
-__그 샘플분포의 평균은 모집단의 평균을 따른다__.+__그 샘플평균분포의 평균은 모집단의 평균을 따른다__.
   * "mean of sample means은 population의 mean값과 같다" 즉, 샘플평균들의 평균은 모집단의 평균값과 같아진다.   * "mean of sample means은 population의 mean값과 같다" 즉, 샘플평균들의 평균은 모집단의 평균값과 같아진다.
   * 위의 문장이 의미하는 것은 수 많은 샘플을 취했을 때, 그 샘플들의 평균은 실제 population의 평균값에 근사하게 된다는 것을 의미한다. (위의 이유에서, the mean of the distribution of sample means를 expected value of $ \overline{X}$ 라고 부른다.)    * 위의 문장이 의미하는 것은 수 많은 샘플을 취했을 때, 그 샘플들의 평균은 실제 population의 평균값에 근사하게 된다는 것을 의미한다. (위의 이유에서, the mean of the distribution of sample means를 expected value of $ \overline{X}$ 라고 부른다.) 
   * 이는 $E[\overline{X}] = \mu $ 라고 설명한 부분이다.   * 이는 $E[\overline{X}] = \mu $ 라고 설명한 부분이다.
  
-__샘플평균 분포의 분산은__ $\dfrac{\sigma^{2}}{n}$ __을 갖는다__+__샘플평균분포의 분산은__ $\dfrac{\sigma^{2}}{n}$ __을 따른다__
 standard deviation of the distribution of the sample mean를 (샘플평균들의 표준편차를) 특별히  standard deviation of the distribution of the sample mean를 (샘플평균들의 표준편차를) 특별히 
-standard error of $ \overline{X}$ 라고 (샘플평균의 표준오차)부르는데 그 값은 $ \dfrac{\sigma}{\sqrt{n}}$를 이룬다.+standard error of $ \overline{X}$ 라고 (샘플평균의 표준오차)부르는데 그 값은 $ \dfrac{\sigma}{\sqrt{n}}$를 따르게 된다.
  
 [[Standard Error]] 또한 standard deviation 이므로 (즉, standard deviation of distribution of sample means), 각 샘플의 평균이 샘플들의 평균값(the mean of distribution of sample means)에서 얼마나 떨어져 있는 가를 나타내는 지표로 쓰인다. 다시 말하면, 이 특별한 standard deviation은 내가 샘플링을 했을 때, 그 __샘플의 평균값(the mean of an sample)이 모집단의 평균값(the mean of population)에서 얼마나 떨어져 있을 수 있는가__의 가능성(확율)을 나타내는 값이다. 즉, standard error = $ \sigma_{\overline{X}}$ = standard deviation distance between $ \overline{X}$ and $ \mu$ 라고 할 수 있다. 이 standard error 값에 영향을 주는 것은 두 가지가 있다.  [[Standard Error]] 또한 standard deviation 이므로 (즉, standard deviation of distribution of sample means), 각 샘플의 평균이 샘플들의 평균값(the mean of distribution of sample means)에서 얼마나 떨어져 있는 가를 나타내는 지표로 쓰인다. 다시 말하면, 이 특별한 standard deviation은 내가 샘플링을 했을 때, 그 __샘플의 평균값(the mean of an sample)이 모집단의 평균값(the mean of population)에서 얼마나 떨어져 있을 수 있는가__의 가능성(확율)을 나타내는 값이다. 즉, standard error = $ \sigma_{\overline{X}}$ = standard deviation distance between $ \overline{X}$ and $ \mu$ 라고 할 수 있다. 이 standard error 값에 영향을 주는 것은 두 가지가 있다. 
Line 93: Line 92:
 \end{eqnarray} \end{eqnarray}
  
 +즉, 이는 
 +$\overline{X} \sim \displaystyle \text{N} \left(\mu, \dfrac{\sigma^{2}}{n} \right)$ 를 말한다.
 ===== e.g., ===== ===== e.g., =====
 Central Limit Theorem이 사용되는 예를 들어보면 . . . . \\ Central Limit Theorem이 사용되는 예를 들어보면 . . . . \\
central_limit_theorem.1587542357.txt.gz · Last modified: 2020/04/22 16:59 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki