User Tools

Site Tools


sampling

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
sampling [2018/03/13 16:49] – [Sample statistics] hkimscilsampling [2020/12/04 22:37] (current) – old revision restored (2020/10/14 14:56) hkimscil
Line 7: Line 7:
 따라서, 연구자는 population에서 일정 대상을 선출하여, 이에 대한 조사를 바탕으로 population의 성격을 추론해 내게 된다. 이렇게 선정되는 population의 일부를 [[:Sample|sample]]이라고 한다.  따라서, 연구자는 population에서 일정 대상을 선출하여, 이에 대한 조사를 바탕으로 population의 성격을 추론해 내게 된다. 이렇게 선정되는 population의 일부를 [[:Sample|sample]]이라고 한다. 
  
 +<BOOKMARK:parameter_statistics> Parameters and statistics
 <WRAP box> <WRAP box>
 통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다.  통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다. 
 </WRAP> </WRAP>
  
 +<BOOKMARK:landon_roosevelt_election>Landon vs Roosevelt Election
 <WRAP box> <WRAP box>
   * Alf Landon 대 Franklin Roosevelt    * Alf Landon 대 Franklin Roosevelt 
Line 18: Line 20:
 That same year, George Gallup, an advertising executive who had begun a scientific poll, predicted that Roosevelt would win the election, based on a **quota sample** of 50,000 people. He also predicted that the //Literary Digest// would mis-predict the results. His correct predictions made public opinion polling a critical element of elections for journalists and indeed for politicians. The Gallup Poll would become a staple of future presidential elections, and remains one of the most prominent election polling organizations. That same year, George Gallup, an advertising executive who had begun a scientific poll, predicted that Roosevelt would win the election, based on a **quota sample** of 50,000 people. He also predicted that the //Literary Digest// would mis-predict the results. His correct predictions made public opinion polling a critical element of elections for journalists and indeed for politicians. The Gallup Poll would become a staple of future presidential elections, and remains one of the most prominent election polling organizations.
 -- http://en.wikipedia.org/wiki/United_States_presidential_election,_1936 -- http://en.wikipedia.org/wiki/United_States_presidential_election,_1936
 +
 +<BOOKMARK:Literary_Digest>Literary Digest
 +__Literary Digest지의 여론조사 오류__
 +  * 1916년 Literary Digest지는 Woodrow Wilson 과 Charles Hughes 대통령 후보자에 관한 여론조사를 통해 당선자를 예측하고 정확히 맞힘
 +  * 그 이후 4년마다 여론조사를 실시하였고 예측이 잘 맞아 왔음
 +  * 1936년 Landon vs. Roosevelt 예측에서 크게 실패함
 +    * 천만명 (10 million)에게 우편서베이를 실시하여 2백3십만 (2.3 million)이 응답을 하였고
 +    * Landon 57% vs Roosebelt 43% 로 예측함 
 +    * 그러나 Roosebelt 61% 로 승리
 +  * 틀리게 된 이유로는 Literary Digest지가 설문을 요청한 샘플을 구한 방법이   
 +    * 전화번호부 + 자동차소유주 명부 ([[:sampling#sampling_frame|샘플링 프레임]]) %%->%% 1천만명 중 2백만명 응답 (22% 회수율 혹은 응답률)
 +    * 그러나, 당시(1936년)에 전화와 자동차를 소유한 사람들은 대부분 중상류층으로 
 +    * 공화당지지자가 대다수
 +    * 따라서 무작위 샘플이 아닌, biased sample인 결과
 +한편, 
 +  * 같은 해에 신생의 작은 여론조사회사는 Roosevelt 가 승리할 것으로 맞힘
 +  * 이 회사가 George Gallup이라는 청년이 세운 Gallup 사
 +  * Gallup사는 Quota sampling 방법을 통해서 인구구성비율에 맞는 샘플을 채취함.
 +  * 이를 통해 인구에 회자되면서 현재의 갤럽사로 성장함
 </WRAP> </WRAP>
  
-{{anchor:sampling_frame}}+<BOOKMARK:sampling_frame>Sampling Frame
 이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, 이 명부가 sampling frame이다. 연구자가 전화번호부를 이용하였다면 전화번호부의 명단이 sampling frame이다. Sampling frame와 population의 다른 점은 말 그대로이다. 즉, 중고등학교 학생과 학생명단의 차이점이다. 이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, 이 명부가 sampling frame이다. 연구자가 전화번호부를 이용하였다면 전화번호부의 명단이 sampling frame이다. Sampling frame와 population의 다른 점은 말 그대로이다. 즉, 중고등학교 학생과 학생명단의 차이점이다.
  
Line 36: Line 57:
 ==== 원리  ==== ==== 원리  ====
   * Representativeness (대표성)   * Representativeness (대표성)
-    * ECBS (Equal Chance of Being Selected)+    * ECoBS (Equal Chance of Being Selected)
   * Sampling bias (샘플링 바이어스)   * Sampling bias (샘플링 바이어스)
     * concscious     * concscious
     * unconscious     * unconscious
 ==== 종류 ==== ==== 종류 ====
-  - Systematic sampling: +  - <BOOKMARK:simple_random_sampling> Simple random sampling 
 +    - with replacement 
 +    - without replacement 
 +  - Systematic random sampling: 
     * $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size     * $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size
   - Stratified sampling: [[http://study.com/academy/lesson/stratified-random-sample-example-definition-quiz.html|See a video]]   - Stratified sampling: [[http://study.com/academy/lesson/stratified-random-sample-example-definition-quiz.html|See a video]]
 +  - Cluster sampling
 +    * 지도에서 구역을 블럭화(클러스터화) 하고, 이를 랜덤하게 고른 후, 여기의 개인을 서베이 하는 경우 이를 Cluster sampling 이라고 할 수 있다. 
   - Multistage cluster sampling:   - Multistage cluster sampling:
   - Stratified in multistage cluster sampling:   - Stratified in multistage cluster sampling:
sampling.1520929171.txt.gz · Last modified: 2018/03/13 16:49 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki