User Tools

Site Tools


tag:statistics

TAG: statistics

2016/11/23 09:47Hyo KimAnalysis of Covariance with lm function > library(Cars93) > lm.model4 <- lm(Cars93$MPG.city ~ Cars93$EngineSize + Cars93$Price + Cars93$DriveTrain) > summary…
2016/11/16 09:46Hyo KimANOVA in R # # 3 샘플 종류 추출 # A, B, C 학년에 따라서 욕하는 정도가 달라질것이라는 # 가설 set.seed(201) rnorm2 <- function(n,mean,sd){ mean+sd*scale(rnorm(n)) } A <- rnorm2(16, 26, s…
2018/12/06 06:14Hyo Kim<https://www.guru99.com/r-apply-sapply-tapply.html> statistics r r_function apply
2017/06/05 08:20Hyo Kim<http://score.sports.media.daum.net/record/baseball/kbo/brnk.daum> <http://www.koreabaseball.com/Record/Player/HitterBasic/Basic1.aspx> #Part 2 - 도전 미션 3-1 …
2018/12/04 01:49Hyo Kimchi square test # read the data df <- read.csv("https://goo.gl/j6lRXD") # summarize data to table table(df$treatment, df$improvement) …
2016/03/06 14:52Hyo KimDegrees of Freedom (df) 어떤 모집단에서 샘플을 취하였다면, 그 샘플의 평균과 분산 값은 그 모집단의, 그것들과 일치할 수는 없지만, 비슷해야 할 것이다. 따라서, 흔히 우리는 샘플의 평균과 분산값을 가지고 모집단의 그것을 추정하게 된다. 모집단의 분산을 구하는 공식…
2016/04/02 01:42Hyo KimSee anova, repeated measure anova Factorial ANOVA t-test와 ANOVA의 섹션까지 다룬것은 모두 하나의 독립변인(Independent Variable)과 하나의 종속변인(Dependent Variable) 간의 관계에 대한 규명을 하는 것이…
2016/04/26 18:35Hyo KimInfluence Influence, Outlier, Leverage 측정 혹은 발견 (detection)은 모두 outlier의 일종으로 생각할 수 있다. 독립변인의 한 케이스를 제거했을 때, b 값이 상당하게 변하는 경우에 그 케이스의 영향력(influential)이 높다고 한다.
2015/09/15 09:17Hyo KimLevel of Variables Variable의 종류에는 4 가지가 있다. Variable에 대해서 이야기 하기 전에 특성(attributes)에 대한 설명을 먼저 하겠다. 특성이란 변수가 가지는 변인의 범위를 의미한다고 가정한다. 가령
2016/04/26 18:21Hyo KimLinearity 회귀분석에 있어서 중요한 것은 IV와 DV 간의 관계가 '선형적' 이어야 한다는 것이다. 두 변인 간에 비선형적인 관계가 있다면 회귀분석은 이 관계를 무시한다. GRAPH /SCATTERPLOT(BIVAR)=poverty WITH crime /MISSI…
2019/09/18 07:40Hyo KimLogistic Regression <https://www.bookdown.org/rwnahhas/RMPH/blr-orlr.html> data: <https://www.bookdown.org/rwnahhas/RMPH/appendix-nsduh.html#appendix-nsduh> e…
2016/03/06 04:59Hyo KimMean $$ \bar{X} = \frac {\sum\limits_{i=1}^n X_i}{n} $$ * $\bar{X}$ = 표본평균 * $n$ = 관측치의 수 (샘플 숫자) * $X_i$ = 관측치 * Nominal, Ordinal 측정치에는 사용할 수 없음 …
2016/03/06 05:01Hyo KimMedian 중앙값(중위수)는 자료 (데이터)를 크기 순으로 배열할 때의 중앙에 위치하는 값을 의미한다. 중앙값은 ordinal, interval, ratio 측정수준에 사용할 수 있다. e.g., (19, 20, 20, 100, 20, 21, 21, 24, 104, 19) …
2016/04/27 06:36Hyo KimMulticollinearity and Singularity 변인들 간의 상관관계가 극한 정도로 이루어질 때 multicollinearity가 있다고 한다. 예를 들어 IQ score와 수학점수는 상당한 상관관계에 있을 것이다. 이 두 변인은 서로 비숫한 대상(현상)을 측정한 것이기 …
2016/04/08 20:41Hyo KimMultiple Regression See also Regression 혹은 단순회귀 Simple regression과 (단순회귀) mutiple regression (다중회귀) 분석은 하나의 종속변인과 다른 독립변인들(복수에 주의) 간의 관계에 대해서 살펴볼 때 사용되는 보편적인…
2016/05/04 06:35Hyo KimOutliers e.g., This is further reading for detecting outliers, adopted from <http://www.ats.ucla.edu/stat/spss/webbooks/reg/chapter2/spssreg2.htm> . …
2021/03/04 09:27Hyo KimParameters 모집단(population)의 통계학적 특징을 parameter라고 한다. 가령 population의 평균 ($ \mu $), 표준편차 ($ \sigma $) 등을 모수치라고 (parameter) 한다. 샘플의 특징은 통계치라고 (statistics) 하는데 샘플…
2016/03/06 06:13Hyo KimPopulation Population 혹은 모집단이라 함은 연구자가 관심의 대상으로 하는 전체 집단을 말한다. 예를 들어서 '미디어 교육'과 청소년들의 '게임중독성' 간의 관계에 관해서 연구자가 관심을 갖는다면
2020/03/09 19:14Hyo KimPrint > pi [1] 3.141593 > sqrt(2) [1] 1.414214 When you enter expressions like that, R evaluates the expression and then implicitly calls the print function…
2016/09/21 07:39Hyo KimPrint > pi [1] 3.141593 > sqrt(2) [1] 1.414214 When you enter expressions like that, R evaluates the expression and then implicitly calls the print function…
2016/04/08 06:12Hyo Kimr 상관관계 데이터 사람 X Y A 1 1 B 1 3 C 3 2 D 4 5 E 6 4 F 7 5 G 8 7 상관관계이란 (correlation) 두 변인 간의 관계를 측정하고 묘사하기 위한 …
2015/11/03 09:23Hyo KimRegression 회귀분석 See also Multiple Regression 다변량회귀분석 두 변인 간의 상관관계가 완전하다면 (r=1.0 혹은 r=-1.0) 변인 간의 상관관계에 의한 그래프는 아래와 같을 것이다. $$Y = a + bX $$ 여기서, a는 절편이라고 (inte…
2016/03/06 07:11Hyo KimSample 사회과학자가 모집단을 연구할 수 있는 가장 좋은 방법은 모집단을 대표하는 성질을 가진 집단을 연구하여 이에 대한 분석을 통해서 모집단의 성격을 추론하는 (Inferential Statistics) 것이다. 이와 같이 모집단을 대표하여 뽑혀진 집단을 Sample이라고 한다.
2018/09/18 07:42Hyo KimVariables [Status of Frustrator]: Read an article 변인(variables)은 조작화된 개념이다. 조작화는 Conceptualization과 Operationalization을 의미하므로, 결국 변인은 측정할 수 있는 혹은 측정이 된 (Opera…
2015/10/05 13:58Hyo Kim가설 (hypotheses) 연구문제와는 약간 다르지만 비슷한 성격을 갖는 것으로 가설이 (hypothesis) 있다. 연구문제는 두 개념 간의 관계에 대한 질문으로 만들어지지만, 가설은 이 관계에 대한 답을 선언하는 형식으로 만들어 진다. 좀 복잡하게 말하면, 가설은 $ \bar{X…

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki