User Tools

Site Tools


c:ps1-1:2019:schedule

Class page

Week01 (Sep 2, 4)

ideas and concepts

Introduction to Prob and Stats 1
Monty Hall problem:

세 개의 문 중에 하나를 선택하여 문 뒤에 있는 선물을 가질 수 있는 게임쇼에 참가했다. 한 문 뒤에는 자동차가 있고, 나머지 두 문 뒤에는 염소가 있다. 이때 어떤 사람이 예를 들어 1번 문을 선택했을 때, 게임쇼 진행자는 3번 문을 열어 문뒤에 염소가 있음을 보여주면서 1번 대신 2번을 선택하겠냐고 물었다. 참가자가 자동차를 가지려할 때 원래 선택했던 번호를 바꾸는 것이 유리할까?

Monty Hall Simulation

Assignment

Week02 (Sep 9, 11)

ideas and concepts

정보의 시각화: 첫인상

  • Scatter plot
# Simple Scatterplot
attach(mtcars)
plot(wt, mpg, main="Scatterplot Example",
   xlab="Car Weight ", ylab="Miles Per Gallon ", 
   pch=19)

explanatory (설명) variable at x axis
response (반응) at y axis

But, it does mean no causal relationship between the two variables. Association between two does not guarantee a causal relationship.

Drawing a line among the data.

# Add fit lines
abline(lm(mpg~wt), col="red") # regression line (y~x)
lines(lowess(wt,mpg), col="blue") # lowess line (x,y)

A bit more fancy line

# Enhanced Scatterplot of MPG vs. Weight
# by Number of Car Cylinders
library(car)
scatterplot(mpg ~ wt | cyl, data=mtcars,
   xlab="Weight of Car", ylab="Miles Per Gallon",
   main="Enhanced Scatter Plot",
   labels=row.names(mtcars))

Line can be:

관계의 방향 (direction)

관계의 방향

관계의 모양 (shape)

관계의 모양

관계의 정도 (힘)

관계의 정도 (힘)
Figure_4-1
Figure 4-2
Figure_4-3
Figure 4-4

Pearson's r 의 의미
Relations, not cause-effect

Figure 6. Correlation And Causation

상관관계 계수는 단순히 두 변인 (x, y) 간의 관계가 있다는 것을 알려줄 뿐, 왜 그 관계가 있는지는 설명하지 않는다. 바꿔 말하면, 충분한 r 값을 구했다고 해서 이 값이 두 변인 간의 '원인'과 '결과'의 관계를 말한다고 이야기 하면 안된다. 예를 들면 아이스크림의 판매량과 성범죄가 서로 상관관계에 있다고 해서, 전자가 후자의 원인이라고 단정할 수 있는 근거는 없다. 이는 연구자의 논리적인 판단 혹은 이론적인 판단에 따른다.

Interpretation with limited range

Figure_7._Correlation_And_Range
Figure_7._Correlation_And_Range

데이터의 Range에 대한 판단에 신중해야 한다. 왜냐 하면, 데이터의 어느 곳을 자르느냐에 따라서 r 값이 심하게 변하기 때문이다.

Outliers

Figure_7._Correlation_And_Extreme_Data
Figure_7._Correlation_And_Extreme_Data

위의 설명과 관련하여, 만약에 아주 심한 Outlier가 존재한다면 두 변인 간의 상관관계에 심한 영향을 준다.

make it sure that there is no data entry error.
r.crime.scatterplot.for.single.by.state.jpg

see
https://www.gapminder.org/answers/how-does-income-relate-to-life-expectancy/

  • Histogram

le <- as.data.frame(read.csv("http://commres.net/wiki/_media/life.exp.csv", header=T))
colnames(le)[1] <- "c.code" # not really necessary. But, sometimes imported first characters are broken.
lea <- le$X2017
leb <- lea[complete.cases(lea)]
hist(leb, color="grey")
Life expectancy in 2017
Distribution of temperature
skewness
modality

box plot

# Boxplot of MPG by Car Cylinders
boxplot(mpg~cyl,data=mtcars, 
    main="Car Milage Data",
    xlab="Number of Cylinders",
    ylab="Miles Per Gallon")

Assignment

Week03 (Sep 16, 18)

ideas and concepts

중심적 경향 측정하기

Assignment

Week04 (Sep 23, 25)

변이와 분포 측정하기

ideas and concepts

Assignment

Week05 (Sep 30, Oct 2)

확률 계산하기

ideas and concepts

Assignment

Week06 (Oct 7, 9)

이산확률분포

ideas and concepts

Assignment

Week07 (Oct 14, 16)

순열과 조합

ideas and concepts

Assignment

Week08 (Oct 21, 23)

Mid-term period

Week09 (Oct 28, 30)

ideas and concepts

기하, 이항, 푸아송 분포

Assignment

Week10 (Nov 4, 6)

정규분포 1

ideas and concepts

Assignment

Week11 (Nov 11, 13)

ideas and concepts

정규분포 2

Assignment

Week12 (Nov 18, 20)

통계 표본

ideas and concepts

Assignment

Week13 (Nov 25, 27)

ideas and concepts

모집단과 표본 추정

Assignment

Week14 (Dec 2, 4)

신뢰구간 설정

Week15 (Dec 9, 11)

가설검증 이용하기

Week16 (Dec 16, 18)

Final-term

c/ps1-1/2019/schedule.txt · Last modified: 2019/09/16 10:24 by hkimscil