Table of Contents
Unobtrusive Research Methods
Content Analysis
Using existing statistics
Historical/Comparison analysis
Using APIs means
- using existing stats
- content analysis
Content analysis
Barbie (2002)는 “기록된 휴먼 커뮤니케이션을 연구하는 것”을 content analysis라고 정의한다. 즉, “communication artefacts를 연구하는 것”을 의미한다. 예로는 웹페이지, 잡지, 책, 역사서, 시, 신문, 노래, 회화, 연설, 편지, 이메일 메세지, 게시판 메세지, 등등을 들 수 있다.
일종의 커뮤니케이션의 흔적을 좇아서 연구하는 것이므로 커뮤니케이션 연구에 잘 어울리는 연구방법 분야라고도 하겠다. 가령, 일본과 한국간의 공식적인 서신을 연구하여, 역사적으로 독도라는 섬이 언제부터 일본의 관심을 끌게 되었는가를 연구해 볼 수 있다. 혹은 1960년대의 미국대중가요와 2010년대의 대중가요의 가사를 비교분석하여 전자가 사회풍자적이었는가를 살펴볼 수 있다.
가장 요긴하고 많이 쓰이는 분석 방법은 mass media의 내용분석을 하는 것이 있다. Wells는 1891년에 미국 남부 흑인들이 린치를 당한 이유로 백인여성의 겁탈이라는 대중적인 믿음을 확인하려 하였다. 이전 10년 동안 신문에 보도된 린치사건 (728건)을 모아 분석하고 기사내용의 기소여부와 실제 유죄판결 여부를 조사한 결과 기소는 1/3이 이루어졌고, 유죄판결은 이들 중 소수에 불과했다는 사실을 알아내었다 (Reinharz, 1992).
또한, television의 폭력성이 청소년에게 미치는 영향이라는 연구분야에서 당연히 지나야할 연구 방법이 television contents의 폭력성을 측정(measure)하는 것이다.
E.g. 1. Cultivation Theory
E.g. 2. Agenda setting의 이론도 거슬러 올라가 보면, 매체의 내용(신문과 지역 방송)에서 중요하다고 하는 사안들과 지역주민이 중요하다고 생각하는 사안을 비교 분석한 것이므로, 전자는 내용 분석을 후자는 주민을 서베이 한것이다. 좀 더 구체적으로 말하면, M. McCombs과 Donald L. Shaw는 Chapel-Hill이라는 지역에서 5개의 신문, 2개의 뉴스잡지, 2개의 브로드캐스팅(방송국) 등의 콘텐츠를 대상으로 내용 분석을 한 후에 15개의 범주를 추리고, 그것을 중요한 범주(중요범주)와 그렇지 않은 범주(주변범주)로 나눈 후, 이것이 지역 주민들의 생각과 일치하는 지를 상관관계를 측정함으로써 밝혀 내었다.
또 다른 예로는
- 대기업이 소유한 신문매체는 신문내용에서 모기업을 어떻게 다루는가?
- 정치후보자의 연설수준(혹은 내용)과 당선과의 관계?
- 1960년대 영국의 대중가요가 독일의 그것보다 풍자적이었는가?
이전에 언급이 되었듯이 CA의 경우도, conceptualization 과 operationalization을 거쳐서 연구에 사용된 개념, 구성 등의 의미가 명확히 전달되도록 해야 한다. 가령, 15개의 범주 중에서 정치분야란 무엇을 의미하며, 미디어 내용 중에서 이것을 추출하기 위해서 구체적으로 어떤 기준 혹은 장치를 적용했는지를 밝혀야 한다. 주요범주와 주변범주의 구분은 어떤 뜻을 지니며, 이런 분류는 어떤 장치를 이용해서 하였는 지도 마찬가지이다 (추측으로는… (읽은 바 없음…), 기사 지면의 길이(신문의 경우), 혹은 시간 (radio, television broadcasting의 경우)를 재서 어느 기준을 넘은 것들을 중요범주, 그 외의 것들을 주변범주라고 하였을 듯 하다).
CA에 있어서 분석단위 는 좀 더 중요한 의미를 지닌다. 즉, 어떤 것을 살펴보는가에 따라서 자료의 내용이 달라 질 수도 있기 때문이다. 가령, 연구자가 population으로 분류한 특정한 종류의 책 내용을 분석한다고 하면, 연구자가 책 자체를 unit of analysis로 할 것인지, 책의 chapter를 단위로 할 것인지, 아니면, paragraph를 택할 것인지, 아니면, 문장을 택할 것인지 등에 따라서 데이터의 내용도 달라질 뿐만 아니라, 분석의 결과도 달라질 것이다.
다른 연구와 마찬가지로 unit of analysis 가 정해지면, 적절한 샘플링 을 하여야 한다. 가령, sentence를 분석하는 경우, 책들의 모든 sentence를 분석하는 것은 너무 많은 노력과 시간을 투자해야 하기 때문이다 (적절한 Sampling 방법에 관해서는 Sampling 섹션을 참조).
또한 모집단의 성격을 잘 알아야 한다. 방송에 나타나는 광고가 분석단위라면 언제 광고가 나타나는지, 언제 사람들이 TV를 시청하는지 등에 대한 지식을 반영항 샘플링 작업을 해야 할 것이다.
평일 낮 시간대는 전적으로 연속 멜로드라마로만 편성되어 있는데, 이 시간대를 분석대상으로 선정한 이유는 이 시간대에 여성들의 시청률이 가장 높기 때문이다. 한편, 주말 낮 시간대는 남성들의 시청률이 가장 높다는 이유에서 분석대상으로 선정했다 . . . . (얼 바비, 2004 p.459)
CA는 서베이와 마찬가지로 데이터의 기록을 위해서 코딩이 필요하다. 연구자 자신이 하는 경우도 있겠지만, 보조 연구원 등을 고용하여 sample로 취한 대상을 읽고(듣고, 보고, 혹은 만지고…) 그 내용을 연구자의 목적에 맞도록 분류해야 한다. coding은 주관적인 요소가 들어갈 여지가 많으므로, 연구자는 보조원이나 coder들을 세심하게 교육시켜야 한다. 일단 coding된 데이터는 각 coder 간에 일관성이 있게 coding이 되었는지를 확인해 봐야 할 필요가 있는데 이를 intercoder realiability 라고 한다.
Manifest content(현재적내용)를 분석한다 함은, 미디어 콘텐츠의 내용 자체를 원칙에 따라서 분석하여 데이터를 취한다는 의미이다. 가령, 미디어의 콘텐츠가 얼마나 erotic한지를 측정한다고 하면, 콘텐츠 중에서 '사랑'이라는 단어가 얼마나 나왔는지를 세어 보고 이를 기록할 수 있다. Manifest content analysis는 명백하고 분명한 coding 방법을 사용한다. 이와는 대조적으로 연구자는 가끔 latent content analysis(잠재적내용분석)를 할 경우가 있다. 이 방법은 연구자 혹은 coder의 주관적인 사고와 판단이 많이 작용한다. 미디어의 내용이 erotic하다는 것을 '사랑'이라는 글자 수와는 상관없이 미디어 내용 중 unit of anlaysis가 함의하고 있는 뜻을 헤아려 그 erotic함을 측정하는 것을 의미한다.
일단 coding의 방침이 서면, conceptualization의 과정과 결과를 기술하고 coding category를 작성하여 문서화 한다. 이 문서는 coder를 교육하는데 사용된다 (coding instruction). 각 coder간에 주관성이 작용한다면, 올바른 coding이 될 수 없으므로, 세밀하게 coder를 교육하도록 하고, 확신을 위해서는 초기 소량의 데이터를 가지고 coding을 한 후 각 coder간의 상관관계를 비교 분석하는 절차를 거치기도 한다 (intercoder reliability).
장점
- 비개입적
- 경제적
E.G.
- R. Stephen Craig (1992). The Effect of Television Day Part on Gender Portrayals in Television Commercials: A Content Analysis. Sex Roles, 26: 197. doi:10.1007/BF00289707 PDF
Gender portrayals in 2,209 network television commercials were content
analyzed. To compare differences between three day parts, the sample was
chosen from three time periods.“ daytime, when the audience is mostly women;
evening prime time, when the sex of the audience is more evenly distributed,”
and weekend afternoon sportscasts, when men are a large percentage of the
audience. The results indicate large and consistent differences in the way men
and women are portrayed in these three day parts, with almost all comparisons
reaching significance at the. 05 level. Although ads in all day parts tended to
portray men in stereotypical roles of authority and dominance, those on
weekends tended to emphasize escape from home and family. The findings of
earlier studies which did not consider day part differences may now have to
be reevaluated.
등장인물 | 평일 | 저녁 | 주말 |
성인남성 | 40 | 52 | 80 |
성인여성 | 60 | 48 | 20 |
계 | 100 | 100 | 100 |
a All numbers except N represent column percentages. Chisquare2 (2, N = 1431) = 185.1, p < .001. |
Links
- http://matthewlombard.com/reliability/index_print.html: Practical Resources for Assessing and Reporting Intercoder Reliability in Content Analysis Research Projects
Analyzing existing statistics
통계청 등의 기관에서 발행된 기존의 통계를 분석하는 방법을 말한다. 역사적으로 오래된 것으로는 Durkheim의 자살연구가 있다. Durkheim은 자살에 관한 통계기록을 역사적으로 분석하여, 근대사회의 자살이 사회적으로 어떤 의미가 있는가에 대한 연구를 한 적이 있다. 종교적인 변인 (protestant vs. catholic), 성별, 나이, 경제적 여건, 문화적 발전 등등을 변인으로 하여, 자살과 이 변인들간의 관계를 규명하려는 시도였다.
- 연별로 안정적임
- 여름에 많음 (기후온화 지역? – 그러나 유럽남부보다 중부가 더 많음)
- 정치적 불안정 시기 - 사회균형의 파괴 - 자살
- 국가 별 종교!
- 구교 신교 국가
- 구교 신교 지역
- 아노미
Histroical/Comparative analysis
비교역사분석
오귀스트 콩트(August Comte): 사회학 = 인간사고의 역사적 발달의 마지막 단계(과학)에 해당하는 학문 (종교 - 형이상학 - 과학)
역사적 변천과정에 대한 연구
- E. Durkheim
- 사회진보 - 분업의 증대과정
- K. Marx
- 원시공동체 - 본건시대 - 자본주의지대 - 사회 - 공산
- 변증법적 유물론
- 경제결정론
- 계급투쟁론
- 농노 대 귀족(왕, 성직자)
- 노동자 대 자본가
- M Weber
- The Protestant Ethics and the Spirit of Capitalism (1905)
- 정신 - 시대
- 캘빈파 - 캘빈니즘
- 근검, 절약, 절제, 절욕 . . .
- 국제경찰: 인터폴공조를 둘러싼 정부(관료적 관리) vs 경찰(독립)
- Ross Perrow: 미국의 이해. 대법원의 판결 (대기업 위주, 섬유, 철도산업의 보호) - 미국식 민주주의의 발전
APIs
Using open api example in Data Science Research