User Tools

Site Tools


tag:statistics

TAG: statistics

2016/11/23 09:47 Hyo Kim Analysis of Covariance with lm function > library(Cars93) > lm.model4 <- lm(Cars93$MPG.city ~ Cars93$EngineSize + Cars93$Price + Cars93$DriveTrain) > summary…
2016/11/16 09:46 Hyo Kim Oneway ANOVA Twoway ANOVA statistics r analysis_of_variance anova
2018/12/06 06:14 Hyo Kim <https://www.guru99.com/r-apply-sapply-tapply.html> statistics r r_function apply
2017/06/05 08:20 Hyo Kim <http://score.sports.media.daum.net/record/baseball/kbo/brnk.daum> <http://www.koreabaseball.com/Record/Player/HitterBasic/Basic1.aspx> #Part 2 - 도전 미션 3-1 …
2018/12/04 01:49 Hyo Kim chi square test # read the data df <- read.csv("https://goo.gl/j6lRXD") # summarize data to table table(df$treatment, df$improvement) …
2016/03/06 14:52 Hyo Kim Degrees of Freedom (df) 어떤 모집단에서 샘플을 취하였다면, 그 샘플의 평균과 분산 값은 그 모집단의, 그것들과 일치할 수는 없지만, 비슷해야 할 것이다. 따라서, 흔히 우리는 샘플의 평균과 분산값을 가지고 모집단의 그것을 추정하게 된다. 모집단의 분산을 구하는 공식…
2016/04/02 01:42 Hyo Kim See anova, repeated measure anova Factorial ANOVA t-test와 ANOVA의 섹션까지 다룬것은 모두 하나의 독립변인(Independent Variable)과 하나의 종속변인(Dependent Variable) 간의 관계에 대한 규명을 하는 것이…
2016/04/26 18:35 Hyo Kim Influence Influence, Outlier, Leverage 측정 혹은 발견 (detection)은 모두 outlier의 일종으로 생각할 수 있다. 독립변인의 한 케이스를 제거했을 때, b 값이 상당하게 변하는 경우에 그 케이스의 영향력(influential)이 높다고 한다.
2015/09/15 09:17 Hyo Kim Level of Variables Variable의 종류에는 4 가지가 있다. Variable에 대해서 이야기 하기 전에 특성(attributes)에 대한 설명을 먼저 하겠다. 특성이란 변수가 가지는 변인의 범위를 의미한다고 가정한다. 가령 <a name="Nominal">Nomina…
2016/04/26 18:21 Hyo Kim Linearity 회귀분석에 있어서 중요한 것은 IV와 DV 간의 관계가 '선형적' 이어야 한다는 것이다. 두 변인 간에 비선형적인 관계가 있다면 회귀분석은 이 관계를 무시한다. GRAPH /SCATTERPLOT(BIVAR)=poverty WITH crime /MISSI…
2019/09/18 07:40 Hyo Kim Logistic Regression Log의 성질 Logistic Regression Tutorial Logistic Regression Details Pt1: Coefficients Logistic Regression Details Pt 2: Maximum Lik…
2016/03/06 04:59 Hyo Kim Mean * = 표본평균 * = 관측치의 수 (샘플 숫자) * = 관측치 * Nominal, Ordinal 측정치에는 사용할 수 없음 * 극단치 (extreme value, outlier )가 영향을 지대하게 미침. More about Mean
2016/03/06 05:01 Hyo Kim Median 중앙값(중위수)는 자료 (데이터)를 크기 순으로 배열할 때의 중앙에 위치하는 값을 의미한다. 중앙값은 ordinal, interval, ratio 측정수준에 사용할 수 있다. e.g., (19, 20, 20, 100, 20, 21, 21, 24, 104, 19)
2016/04/27 06:36 Hyo Kim Multicollinearity and Singularity 변인들 간의 상관관계가 극한 정도로 이루어질 때 multicollinearity가 있다고 한다. 예를 들어 IQ score와 수학점수는 상당한 상관관계에 있을 것이다. 이 두 변인은 서로 비숫한 대상(현상)을 측정한 것이기 …
2016/04/08 20:41 Hyo Kim Multiple Regression See also Regression 혹은 단순회귀 Simple regression과 (단순회귀) mutiple regression (다중회귀) 분석은 하나의 종속변인과 다른 독립변인들(복수에 주의) 간의 관계에 대해서 살펴볼 때 사용되는 보편적인…
2016/05/04 06:35 Hyo Kim Outliers e.g., This is further reading for detecting outliers, adopted from <http://www.ats.ucla.edu/stat/spss/webbooks/reg/chapter2/spssreg2.htm> . …
2020/03/09 19:14 Hyo Kim Print > pi [1] 3.141593 > sqrt(2) [1] 1.414214 When you enter expressions like that, R evaluates the expression and then implicitly calls the print function…
2016/09/21 07:39 Hyo Kim Print > pi [1] 3.141593 > sqrt(2) [1] 1.414214 When you enter expressions like that, R evaluates the expression and then implicitly calls the print function…
2016/04/08 06:12 Hyo Kim r 상관관계 데이터 사람 X Y <[Figure 1]correlation scatterplot> A 1 1 B 1 3 C 3 2 D 4 5 E 6 4 F 7 5 G 8 7 상관관계이란 (c…
2015/11/03 09:23 Hyo Kim Regression 회귀분석 See also Multiple Regression 다변량회귀분석 두 변인 간의 상관관계가 완전하다면 (r=1.0 혹은 r=-1.0) 변인 간의 상관관계에 의한 그래프는 아래와 같을 것이다. 여기서, a는 절편이라고 (intercept) 하고, b는…
2018/09/18 07:42 Hyo Kim Variables [Status of Frustrator]: Read an article 변인(variables)은 조작화된 개념이다. 조작화는 Conceptualization과 Operationalization을 의미하므로, 결국 변인은 측정할 수 있는 (Operationalize…
2015/10/05 13:58 Hyo Kim 가설 (hypotheses) 연구문제와는 약간 다르지만 비슷한 성격을 갖는 것으로 가설이 (hypothesis) 있다. 연구문제는 두 개념 간의 관계에 대한 질문으로 만들어지지만, 가설은 이 관계에 대한 답을 선언하는 형식으로 만들어 진다. 좀 복잡하게 말하면, 가설은