b:head_first_statistics:visualization
no way to compare when less than two revisions
Differences
This shows you the differences between two versions of the page.
Next revision | |||
— | b:head_first_statistics:visualization [2019/10/10 01:27] – created hkimscil | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | 정보의 시각화: 첫인상 | ||
+ | * {{: | ||
+ | |||
+ | * Scatter plot | ||
+ | < | ||
+ | attach(mtcars) | ||
+ | plot(wt, mpg, main=" | ||
+ | | ||
+ | | ||
+ | |||
+ | {{: | ||
+ | |||
+ | explanatory (설명) variable at x axis | ||
+ | response (반응) at y axis | ||
+ | |||
+ | But, it does mean __no causal relationship__ between the two variables. Association between two does not guarantee a causal relationship. | ||
+ | |||
+ | Drawing a line among the data. | ||
+ | < | ||
+ | abline(lm(mpg~wt), | ||
+ | lines(lowess(wt, | ||
+ | {{: | ||
+ | |||
+ | |||
+ | A bit more fancy line | ||
+ | < | ||
+ | # by Number of Car Cylinders | ||
+ | library(car) | ||
+ | scatterplot(mpg ~ wt | cyl, data=mtcars, | ||
+ | | ||
+ | | ||
+ | | ||
+ | {{: | ||
+ | |||
+ | Line can be: | ||
+ | |||
+ | **__관계의 방향 (direction)__** | ||
+ | ^ 관계의 방향 | ||
+ | | {{: | ||
+ | |||
+ | |||
+ | **__관계의 모양 (shape)__** | ||
+ | ^ 관계의 모양 | ||
+ | | {{: | ||
+ | |||
+ | **__관계의 정도 (힘)__** | ||
+ | ^ 관계의 정도 (힘) ^^ | ||
+ | | [{{: | ||
+ | | [{{: | ||
+ | <WRAP clear /> | ||
+ | Pearson' | ||
+ | __Relations, | ||
+ | [{{: | ||
+ | <WRAP clear /> | ||
+ | |||
+ | __Interpretation with limited range__ | ||
+ | [{{: | ||
+ | [{{: | ||
+ | 데이터의 [[Range]]에 대한 판단에 신중해야 한다. 왜냐 하면, 데이터의 어느 곳을 자르느냐에 따라서 r 값이 심하게 변하기 때문이다. | ||
+ | <WRAP clear /> | ||
+ | __Outliers__ | ||
+ | [{{: | ||
+ | [{{: | ||
+ | 위의 설명과 관련하여, | ||
+ | [{{: | ||
+ | |||
+ | make it sure that there is __no data entry error__. | ||
+ | {{: | ||
+ | |||
+ | |||
+ | <WRAP clear /> | ||
+ | |||
+ | see | ||
+ | https:// | ||
+ | * Histogram | ||
+ | {{: | ||
+ | * Life expectancy data: {{: | ||
+ | |||
+ | < | ||
+ | le <- as.data.frame(read.csv(" | ||
+ | colnames(le)[1] <- " | ||
+ | lea <- le$X2017 | ||
+ | leb <- lea[complete.cases(lea)] | ||
+ | hist(leb, color=" | ||
+ | </ | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | [{{: | ||
+ | |||
+ | box plot | ||
+ | < | ||
+ | # Boxplot of MPG by Car Cylinders | ||
+ | boxplot(mpg~cyl, | ||
+ | main=" | ||
+ | xlab=" | ||
+ | ylab=" | ||
+ | </ | ||
+ | {{: | ||
+ | |||
b/head_first_statistics/visualization.txt · Last modified: 2023/09/11 08:11 by hkimscil