|
2016/11/23 09:47 |
Hyo Kim |
Analysis of Covariance
with lm function
> library(Cars93)
> lm.model4 <- lm(Cars93$MPG.city ~ Cars93$EngineSize + Cars93$Price + Cars93$DriveTrain)
> summary… |
|
2016/11/16 09:46 |
Hyo Kim |
Oneway ANOVA
Twoway ANOVA
statistics r analysis_of_variance anova |
|
2018/12/06 06:14 |
Hyo Kim |
<https://www.guru99.com/r-apply-sapply-tapply.html>
statistics r r_function apply |
|
2017/06/05 08:20 |
Hyo Kim |
<http://score.sports.media.daum.net/record/baseball/kbo/brnk.daum>
<http://www.koreabaseball.com/Record/Player/HitterBasic/Basic1.aspx>
#Part 2 - 도전 미션 3-1 … |
|
2018/12/04 01:49 |
Hyo Kim |
chi square test
# read the data
df <- read.csv("https://goo.gl/j6lRXD")
# summarize data to table
table(df$treatment, df$improvement)
… |
|
2016/03/06 14:52 |
Hyo Kim |
Degrees of Freedom (df)
어떤 모집단에서 샘플을 취하였다면, 그 샘플의 평균과 분산 값은 그 모집단의, 그것들과 일치할 수는 없지만, 비슷해야 할 것이다. 따라서, 흔히 우리는 샘플의 평균과 분산값을 가지고 모집단의 그것을 추정하게 된다. 모집단의 분산을 구하는 공식… |
|
2016/04/02 01:42 |
Hyo Kim |
See anova, repeated measure anova
Factorial ANOVA
t-test와 ANOVA의 섹션까지 다룬것은 모두 하나의 독립변인(Independent Variable)과 하나의 종속변인(Dependent Variable) 간의 관계에 대한 규명을 하는 것이… |
|
2016/04/26 18:35 |
Hyo Kim |
Influence
Influence, Outlier, Leverage 측정 혹은 발견 (detection)은 모두 outlier의 일종으로 생각할 수 있다. 독립변인의 한 케이스를 제거했을 때, b 값이 상당하게 변하는 경우에 그 케이스의 영향력(influential)이 높다고 한다. |
|
2015/09/15 09:17 |
Hyo Kim |
Level of Variables
Variable의 종류에는 4 가지가 있다. Variable에 대해서 이야기 하기 전에 특성(attributes)에 대한 설명을 먼저 하겠다. 특성이란 변수가 가지는 변인의 범위를 의미한다고 가정한다. 가령 |
|
2016/04/26 18:21 |
Hyo Kim |
Linearity
회귀분석에 있어서 중요한 것은 IV와 DV 간의 관계가 '선형적' 이어야 한다는 것이다. 두 변인 간에 비선형적인 관계가 있다면 회귀분석은 이 관계를 무시한다.
GRAPH
/SCATTERPLOT(BIVAR)=poverty WITH crime
/MISSI… |
|
2019/09/18 07:40 |
Hyo Kim |
Logistic Regression
Log의 성질
Logistic Regression Tutorial
$$ y = b_{0} + b_{1}x $$
$$ p = \frac{1} {1 + e^{-y}} $$
$$ ln(\frac{p}{1-p}) = b_{0} + b_{1}x $$
… |
|
2016/03/06 04:59 |
Hyo Kim |
Mean
$$
\bar{X} = \frac {\sum\limits_{i=1}^n X_i}{n}
$$
* $\bar{X}$ = 표본평균
* $n$ = 관측치의 수 (샘플 숫자)
* $X_i$ = 관측치
* Nominal, Ordinal 측정치에는 사용할 수 없음
… |
|
2016/03/06 05:01 |
Hyo Kim |
Median
중앙값(중위수)는 자료 (데이터)를 크기 순으로 배열할 때의 중앙에 위치하는 값을 의미한다. 중앙값은 ordinal, interval, ratio 측정수준에 사용할 수 있다.
e.g.,
(19, 20, 20, 100, 20, 21, 21, 24, 104, 19)
… |
|
2016/04/27 06:36 |
Hyo Kim |
Multicollinearity and Singularity
변인들 간의 상관관계가 극한 정도로 이루어질 때 multicollinearity가 있다고 한다. 예를 들어 IQ score와 수학점수는 상당한 상관관계에 있을 것이다. 이 두 변인은 서로 비숫한 대상(현상)을 측정한 것이기 … |
|
2016/04/08 20:41 |
Hyo Kim |
Multiple Regression
See also Regression 혹은 단순회귀
Simple regression과 (단순회귀) mutiple regression (다중회귀) 분석은 하나의 종속변인과 다른 독립변인들(복수에 주의) 간의 관계에 대해서 살펴볼 때 사용되는 보편적인… |
|
2016/05/04 06:35 |
Hyo Kim |
Outliers e.g.,
This is further reading for detecting outliers, adopted from <http://www.ats.ucla.edu/stat/spss/webbooks/reg/chapter2/spssreg2.htm> .
… |
|
2021/03/04 09:27 |
Hyo Kim |
Parameters
모집단(population)의 통계학적 특징을 parameter라고 한다. 가령 population의 평균 ($ \mu $), 표준편차 ($ \sigma $) 등을 모수치라고 (parameter) 한다. 샘플의 특징은 통계치라고 (statistics) 하는데 샘플… |
|
2016/03/06 06:13 |
Hyo Kim |
Population
Population 혹은 모집단이라 함은 연구자가 관심의 대상으로 하는 전체 집단을 말한다. 예를 들어서 '미디어 교육'과 청소년들의 '게임중독성' 간의 관계에 관해서 연구자가 관심을 갖는다면 |
|
2020/03/09 19:14 |
Hyo Kim |
Print
> pi
[1] 3.141593
> sqrt(2)
[1] 1.414214
When you enter expressions like that, R evaluates the expression and then implicitly calls the print function… |
|
2016/09/21 07:39 |
Hyo Kim |
Print
> pi
[1] 3.141593
> sqrt(2)
[1] 1.414214
When you enter expressions like that, R evaluates the expression and then implicitly calls the print function… |
|
2016/04/08 06:12 |
Hyo Kim |
r
상관관계 데이터 사람 X Y A 1 1 B 1 3 C 3 2 D 4 5 E 6 4 F 7 5 G 8 7
상관관계이란 (correlation) 두 변인 간의 관계를 측정하고 묘사하기 위한 … |
|
2015/11/03 09:23 |
Hyo Kim |
Regression 회귀분석
See also Multiple Regression 다변량회귀분석
두 변인 간의 상관관계가 완전하다면 (r=1.0 혹은 r=-1.0) 변인 간의 상관관계에 의한 그래프는 아래와 같을 것이다.
$$Y = a + bX $$
여기서, a는 절편이라고 (inte… |
|
2016/03/06 07:11 |
Hyo Kim |
Sample
사회과학자가 모집단을 연구할 수 있는 가장 좋은 방법은 모집단을 대표하는 성질을 가진 집단을 연구하여 이에 대한 분석을 통해서 모집단의 성격을 추론하는 (Inferential Statistics) 것이다. 이와 같이 모집단을 대표하여 뽑혀진 집단을 Sample이라고 한다. |
|
2018/09/18 07:42 |
Hyo Kim |
Variables
[Status of Frustrator]: Read an article
변인(variables)은 조작화된 개념이다. 조작화는 Conceptualization과 Operationalization을 의미하므로, 결국 변인은 측정할 수 있는 혹은 측정이 된 (Opera… |
|
2015/10/05 13:58 |
Hyo Kim |
가설 (hypotheses)
연구문제와는 약간 다르지만 비슷한 성격을 갖는 것으로 가설이 (hypothesis) 있다. 연구문제는 두 개념 간의 관계에 대한 질문으로 만들어지지만, 가설은 이 관계에 대한 답을 선언하는 형식으로 만들어 진다. 좀 복잡하게 말하면, 가설은 $ \bar{X… |