sampling

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
sampling [2019/11/21 08:46] – [Probability sampling] hkimscilsampling [2020/12/04 22:37] (current) – old revision restored (2020/10/14 14:56) hkimscil
Line 7: Line 7:
 따라서, 연구자는 population에서 일정 대상을 선출하여, 이에 대한 조사를 바탕으로 population의 성격을 추론해 내게 된다. 이렇게 선정되는 population의 일부를 [[:Sample|sample]]이라고 한다.  따라서, 연구자는 population에서 일정 대상을 선출하여, 이에 대한 조사를 바탕으로 population의 성격을 추론해 내게 된다. 이렇게 선정되는 population의 일부를 [[:Sample|sample]]이라고 한다. 
  
 +<BOOKMARK:parameter_statistics> Parameters and statistics
 <WRAP box> <WRAP box>
 통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다.  통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다. 
 </WRAP> </WRAP>
  
 +<BOOKMARK:landon_roosevelt_election>Landon vs Roosevelt Election
 <WRAP box> <WRAP box>
   * Alf Landon 대 Franklin Roosevelt    * Alf Landon 대 Franklin Roosevelt 
Line 19: Line 21:
 -- http://en.wikipedia.org/wiki/United_States_presidential_election,_1936 -- http://en.wikipedia.org/wiki/United_States_presidential_election,_1936
  
-{{anchor:Literary_Digest}}+<BOOKMARK:Literary_Digest>Literary Digest
 __Literary Digest지의 여론조사 오류__ __Literary Digest지의 여론조사 오류__
   * 1916년 Literary Digest지는 Woodrow Wilson 과 Charles Hughes 대통령 후보자에 관한 여론조사를 통해 당선자를 예측하고 정확히 맞힘   * 1916년 Literary Digest지는 Woodrow Wilson 과 Charles Hughes 대통령 후보자에 관한 여론조사를 통해 당선자를 예측하고 정확히 맞힘
Line 28: Line 30:
     * 그러나 Roosebelt 61% 로 승리     * 그러나 Roosebelt 61% 로 승리
   * 틀리게 된 이유로는 Literary Digest지가 설문을 요청한 샘플을 구한 방법이      * 틀리게 된 이유로는 Literary Digest지가 설문을 요청한 샘플을 구한 방법이   
-    * 전화번호부 + 자동차소유주 명부 → 1천만명 중 2백만명 응답 (22% 회수율 혹은 응답률)+    * 전화번호부 + 자동차소유주 명부 ([[:sampling#sampling_frame|샘플링 프레임]]) %%->%% 1천만명 중 2백만명 응답 (22% 회수율 혹은 응답률)
     * 그러나, 당시(1936년)에 전화와 자동차를 소유한 사람들은 대부분 중상류층으로      * 그러나, 당시(1936년)에 전화와 자동차를 소유한 사람들은 대부분 중상류층으로 
     * 공화당지지자가 대다수     * 공화당지지자가 대다수
Line 39: Line 41:
 </WRAP> </WRAP>
  
-{{anchor:sampling_frame}}+<BOOKMARK:sampling_frame>Sampling Frame
 이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, 이 명부가 sampling frame이다. 연구자가 전화번호부를 이용하였다면 전화번호부의 명단이 sampling frame이다. Sampling frame와 population의 다른 점은 말 그대로이다. 즉, 중고등학교 학생과 학생명단의 차이점이다. 이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, 이 명부가 sampling frame이다. 연구자가 전화번호부를 이용하였다면 전화번호부의 명단이 sampling frame이다. Sampling frame와 population의 다른 점은 말 그대로이다. 즉, 중고등학교 학생과 학생명단의 차이점이다.
  
Line 60: Line 62:
     * unconscious     * unconscious
 ==== 종류 ==== ==== 종류 ====
-  - {{anchor:simple_random_sampling:Simple random sampling}} +  - <BOOKMARK:simple_random_samplingSimple random sampling 
-  - Systematic sampling: +    - with replacement 
 +    - without replacement 
 +  - Systematic random sampling: 
     * $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size     * $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size
   - Stratified sampling: [[http://study.com/academy/lesson/stratified-random-sample-example-definition-quiz.html|See a video]]   - Stratified sampling: [[http://study.com/academy/lesson/stratified-random-sample-example-definition-quiz.html|See a video]]
 +  - Cluster sampling
 +    * 지도에서 구역을 블럭화(클러스터화) 하고, 이를 랜덤하게 고른 후, 여기의 개인을 서베이 하는 경우 이를 Cluster sampling 이라고 할 수 있다. 
   - Multistage cluster sampling:   - Multistage cluster sampling:
   - Stratified in multistage cluster sampling:   - Stratified in multistage cluster sampling:
sampling.1574293571.txt.gz · Last modified: 2019/11/21 08:46 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki