User Tools

Site Tools


descriptive_statistics

Descriptive Statistics

Data 혹은 자료를 기술하는 (describe) 통계를 말한다. 데이터 내의 측정된 변인 자체의 특징을 기술하는 것을 말하고 변인과 변인 간의 관계 등을 판단하는 것을 말하는 것은 아니다. “측정된 변인 자체의 특징”을 흔히 통계치라고 (statistics) 하는데, 이를 살펴보는 것을 말한다고 이해 하면 된다.

변인과 변인 간의 관계를 설펴보는 것은 가설에서 사용되는 계산방법이 (통계방법) 적용되는 것을 의미한다. 짧게 언급하면 가설은 흔히 변인들 간의 “차이”나 (difference) “연관”을 (association) 살펴보게 되므로 언제나 둘 이상의 변인 간의 관계에 대한 선언이 관여되어 있어야 한다. 더 자세한 것은 hypothesis를 참조하라.

e.g.

아래는 R에 탑재되어 있는 trees라는 데이터인데 나무의 둘레와 (girth) 키 (height), 그리고 볼륨에 (volume) 관한 데이터가 기록되어 있다. 각 변인 (Girth, Height, Volume)의

  • minimum 값 (min)
  • median 값 (median)
  • mean 값 (mean)
  • max 값 (max) 등을 구해준다.
> trees
   Girth Height Volume
1    8.3     70   10.3
2    8.6     65   10.3
3    8.8     63   10.2
4   10.5     72   16.4
5   10.7     81   18.8
6   10.8     83   19.7
7   11.0     66   15.6
8   11.0     75   18.2
9   11.1     80   22.6
10  11.2     75   19.9
11  11.3     79   24.2
12  11.4     76   21.0
13  11.4     76   21.4
14  11.7     69   21.3
15  12.0     75   19.1
16  12.9     74   22.2
17  12.9     85   33.8
18  13.3     86   27.4
19  13.7     71   25.7
20  13.8     64   24.9
21  14.0     78   34.5
22  14.2     80   31.7
23  14.5     74   36.3
24  16.0     72   38.3
25  16.3     77   42.6
26  17.3     81   55.4
27  17.5     82   55.7
28  17.9     80   58.3
29  18.0     80   51.5
30  18.0     80   51.0
31  20.6     87   77.0
> 
> summary(trees)
     Girth           Height       Volume     
 Min.   : 8.30   Min.   :63   Min.   :10.20  
 1st Qu.:11.05   1st Qu.:72   1st Qu.:19.40  
 Median :12.90   Median :76   Median :24.20  
 Mean   :13.25   Mean   :76   Mean   :30.17  
 3rd Qu.:15.25   3rd Qu.:80   3rd Qu.:37.30  
 Max.   :20.60   Max.   :87   Max.   :77.00  
descriptive_statistics.txt · Last modified: 2021/03/04 09:14 by hkimscil