sampling
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
sampling [2018/03/13 16:49] – [Sample statistics] hkimscil | sampling [2020/12/04 22:37] (current) – old revision restored (2020/10/14 14:56) hkimscil | ||
---|---|---|---|
Line 7: | Line 7: | ||
따라서, 연구자는 population에서 일정 대상을 선출하여, | 따라서, 연구자는 population에서 일정 대상을 선출하여, | ||
+ | < | ||
<WRAP box> | <WRAP box> | ||
통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다. | 통계학적인 용어로 수학적으로 정리된 Population의 성격은 parameter라고 하고, Sample 의 성격을 말할 때는 statistics라고 한다. | ||
</ | </ | ||
+ | < | ||
<WRAP box> | <WRAP box> | ||
* Alf Landon 대 Franklin Roosevelt | * Alf Landon 대 Franklin Roosevelt | ||
Line 18: | Line 20: | ||
That same year, George Gallup, an advertising executive who had begun a scientific poll, predicted that Roosevelt would win the election, based on a **quota sample** of 50,000 people. He also predicted that the //Literary Digest// would mis-predict the results. His correct predictions made public opinion polling a critical element of elections for journalists and indeed for politicians. The Gallup Poll would become a staple of future presidential elections, and remains one of the most prominent election polling organizations. | That same year, George Gallup, an advertising executive who had begun a scientific poll, predicted that Roosevelt would win the election, based on a **quota sample** of 50,000 people. He also predicted that the //Literary Digest// would mis-predict the results. His correct predictions made public opinion polling a critical element of elections for journalists and indeed for politicians. The Gallup Poll would become a staple of future presidential elections, and remains one of the most prominent election polling organizations. | ||
-- http:// | -- http:// | ||
+ | |||
+ | < | ||
+ | __Literary Digest지의 여론조사 오류__ | ||
+ | * 1916년 Literary Digest지는 Woodrow Wilson 과 Charles Hughes 대통령 후보자에 관한 여론조사를 통해 당선자를 예측하고 정확히 맞힘 | ||
+ | * 그 이후 4년마다 여론조사를 실시하였고 예측이 잘 맞아 왔음 | ||
+ | * 1936년 Landon vs. Roosevelt 예측에서 크게 실패함 | ||
+ | * 천만명 (10 million)에게 우편서베이를 실시하여 2백3십만 (2.3 million)이 응답을 하였고 | ||
+ | * Landon 57% vs Roosebelt 43% 로 예측함 | ||
+ | * 그러나 Roosebelt 61% 로 승리 | ||
+ | * 틀리게 된 이유로는 Literary Digest지가 설문을 요청한 샘플을 구한 방법이 | ||
+ | * 전화번호부 + 자동차소유주 명부 ([[: | ||
+ | * 그러나, 당시(1936년)에 전화와 자동차를 소유한 사람들은 대부분 중상류층으로 | ||
+ | * 공화당지지자가 대다수 | ||
+ | * 따라서 무작위 샘플이 아닌, biased sample인 결과 | ||
+ | 한편, | ||
+ | * 같은 해에 신생의 작은 여론조사회사는 Roosevelt 가 승리할 것으로 맞힘 | ||
+ | * 이 회사가 George Gallup이라는 청년이 세운 Gallup 사 | ||
+ | * Gallup사는 Quota sampling 방법을 통해서 인구구성비율에 맞는 샘플을 채취함. | ||
+ | * 이를 통해 인구에 회자되면서 현재의 갤럽사로 성장함 | ||
</ | </ | ||
- | {{anchor: | + | < |
이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, | 이렇게 조사의 대상이 되는 population에서 실제로 조사를 할 대상을 선출하는 작업을 샘플링(sampling)한다고 한다. Sampling을 위해서 연구자가 가장 먼저 확보해야 할 것은 population의 리스트이다. 이것을 **sampling frame**이라고 한다. 가령, 연구자가 청소년의 샘플을 확보하기 위해서 교육부의 중고등학교 학생의 명부를 이용하였다면, | ||
Line 36: | Line 57: | ||
==== 원리 | ==== 원리 | ||
* Representativeness (대표성) | * Representativeness (대표성) | ||
- | * ECBS (Equal Chance of Being Selected) | + | * ECoBS (Equal Chance of Being Selected) |
* Sampling bias (샘플링 바이어스) | * Sampling bias (샘플링 바이어스) | ||
* concscious | * concscious | ||
* unconscious | * unconscious | ||
==== 종류 ==== | ==== 종류 ==== | ||
- | - Systematic sampling: | + | |
+ | - with replacement | ||
+ | - without replacement | ||
+ | | ||
* $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size | * $ \displaystyle k = \frac {N}{n} $ where n = sample size, N = population size | ||
- Stratified sampling: [[http:// | - Stratified sampling: [[http:// | ||
+ | - Cluster sampling | ||
+ | * 지도에서 구역을 블럭화(클러스터화) 하고, 이를 랜덤하게 고른 후, 여기의 개인을 서베이 하는 경우 이를 Cluster sampling 이라고 할 수 있다. | ||
- Multistage cluster sampling: | - Multistage cluster sampling: | ||
- Stratified in multistage cluster sampling: | - Stratified in multistage cluster sampling: |
sampling.1520929171.txt.gz · Last modified: 2018/03/13 16:49 by hkimscil