Variable의 종류에는 4 가지가 있다. Variable에 대해서 이야기 하기 전에 특성(attributes)에 대한 설명을 먼저 하겠다. 특성이란 변수가 가지는 변인의 범위를 의미한다고 가정한다. 가령 성별
이라는 변수는 남자
와 여자
라는 범위의 범주를 갖는다. 수학시험의 attributes는 0점에서 100점까지의 점수범위라는 범주를 갖는다.
남성
와 여성
으로 구분되며, 이 두 attributes에는 수적 가치가 내재되어 있지 않다. 설령, 연구자가 자의적으로 {남성
→ 0
| 여성
→ 1
} 이라는 번호를 부여했다고 하더라도, 이 번호는 가치를 나타내기 위한 것이 아니라, 단순히 두 attributes를 구분하기 위한 편의상의 장치일 뿐이다. 따라서 Nominal 변수를 가지고 더하기, 빼기 등의 사칙연산을 시도하는 것은 무의미하다.순서
를 가질 때, 이것을 ordinal variable이라고 한다. 가령, 마라톤 주자의 등수를 1등, 2등, 3등, 4등, 5등으로 나누는 것은 1-5등까지의 순서에 의미를 둔 변인의 구분이다. 주의할 점은 각 등간의 가치는 일정하지 않다는 것을 전제로 한다. 즉, ordinal variable을 만족하기 위해서 1등과 2등의 간격이 2등과 3등의 간격과 같아야 할 필요는 없다.Intent to Donate (for those who have not yet signed a card): M = 4.69, SD = - 22, alpha = .89 1 = Not at all 7 = Absolutely true I have considered the possibility of 1__2__3__4__5__6__7 becoming an organ donor. I have been meaning to sign an organ 1__2__3__4__5__6__7 donor card. I do not intend to sign an organ 1__2__3__4__5__6__7 donor card. At some time in the future, I plan to 1__2__3__4__5__6__7 sign an organ donor card.
의미
를 측정하는 것인데, 이는 Osgood에 의해서 개발된 오래된 관행이다. Osgood은 의미를 분별하기 위해서 위와 같은 척도를 개발 사용하고 이 방법의 타당성에 대해서 심도깊은 연구를 하였는데, 그의 연구는 대체로 reliability와 validity가 높은 것으로 인정되고 있다. 좀 더 구체적으로 말하면, Osgood은 이런 종류의 데이터를 수집하고 이를 Factor analysis와 MDS 기법으로 그래프화하여 각 등간의 정도(거리)가 유사함을 설득하였다. 이 방법을 Semantic Differential Measurement라고 한다. 따라서 이와 같은 방법의 문항은 interval 변수를 다루는 것으로 취급한다. 0
은 참된 0
의 의미(무, 없음, nothing-ness)를 갖는다. 주머니 속의 현금에서 현금======0이 의미하는 것은 현금이 없음을 의미하므로 ration variable이라고 할 수 있다. 그러나, 위의 예에서 온도계에 있어서의 0은 온도가 없음을 의미하지는 않으므로 온도는 interval variable이지 ratio variable이 아니라고 하겠다. NOIR
로 외우기도 한다. 어떤 변수를 어떤 종류로 수집, 기록할 것인가?
는 (conventional한 경우를 제외하고는) 연구자의 판단에 좌우된다. 그렇지만, 높은 차원의 변수는 낮은 차원의 변수(R에서 N)로 변환이 가능하다는 것을 염두에 두도록 한다. 가령, 몸무게와 CA(Communication Apprehension)에 관심을 가진 연구자가 연구 샘플에서 몸무게(Kg)를 구했다고 가정을 하면, 연구자는 몸무게 데이터를 낮은 수준의 Ordinal 변수로 변화시켜 사용할 수 있다 (비만/보통/마름의 세가지 유형의 체격). 그러나, 반대의 경우는 불가능하다. 즉, 처음 개인 데이터를 기록할 때 비만/보통/마름 세가지의 유형으로 기록했다면, 이 기록을 바탕으로 Interval 혹은 ratio 변수를 얻어내는 것은 불가능하다. Measurement is the process of assigning numbers to objects in such a way that properties of the objects are reflected in the numbers themselves. There are four different measures.
Why such distinctions? That is because “certain quantitative analysis techniques require variables that meet certain minimum levels of measurement. To the extent that the variables to be examined in your research project are limited to a particular level of measurement – say, ordinal – you should plan your analytical techniques accordingly” (Babbie, - 98, p.143). One interesting point is that “in moving sequentially from nominal to ratio level data, the measurement scale contains the same information as the previous scale(s) while simultaneously adding a new piece of information (Weiss & Leets, - 98, p.18).
Here is another point about level of measurement. The difference between Interval and Ratio could be disregarded for this particular course.
Level of Measurement | Properties |
---|---|
Nominal | Indicates differences among the attributes of the variable |
Ordinal | Indicates differences among the attributes of the variable Indicates the direction of the differences (e.g., more than or less than) |
Interval | Indicates differences among the attributes of the variable Indicates the direction of the differences (e.g., more than or less than) Indicates the amount of difference in equal intervals of the variable |
Ratio | Indicates differences among the attributes of the variable Indicates the direction of the differences (e.g., more than or less than) Indicates the amount of difference in equal intervals of the variable) Contains an absolute zero |
Source: Bartz, A. (1999). Basic statistical concepts. NJ: Prentice-Hall. (p.11)
As you can see, more information is added into the higher level of measurement. We may think that it would be always better if we use the highest level of measurement – when we measure a variable. However, many variables used in social research are in fact ordinal, or even nominal – and sometimes interval. The only convenience for the higher level of measurement is that it can go down. That is, you can use interval variable as nominal variable. You cannot do this in the reversed way, however. The main reason for the distinction is that, as mentioned before, it helps us incorporate statistical methods such as chi-square test, t-test, regression analysis, etc.