This is an old revision of the document!
Table of Contents
Week01 (March 4, 7)
ideas and concepts
Introduction to the class
- Install R in your class computer
- Refer to this page
리서처는 젊은이와 (Younger Adults) 중년층의 (Older Adults) 개인간에는 생에 대한 만족도에 차이가 있을 것이라고 생각하고 이를 검증하는 테스트를 진행하려고 한다. 사전 리서치 결과 Life satisfaction을 측정하는 테스트가 있다는 것을 파악하고 이를 사용하기로 하였다.
대학생의 성적은 졸업 후 직장의 월급의 양(액수)와 관련이 있을 것이라고 생각하고 이를 증명하고자 한다.
- Theories 참조
- 연구문제와 가설 참조
- 연구문제 (research question)
- 개념 (concept) vs 개념 (concept)
- concepts, ideas, etc.
Assignment
Week02: (March 11, 14)
- 1.1 맥락의 중요성 숙지할 것
- 차이와 관계성 (difference vs. association) 등등
- 아래 ideas and concepts section 참조.
ideas and concepts
학생 A는 성별에 따라 영화 취향이 다르다고 생각한다. 예를 들어, 남자는 대체적으로 액션 영화를 좋아하고 여자는 로맨스 영화를 좋아한다고 생각한다. 학생 A의 주장을 증명할 수 있는 방법을 찾아보자.
- HOW?
요즘 남성 여성 구분 없이 자기관리를 위해 화장품 및 장신구 구매가 기하급수적으로 늘어나고 있다. 이에 들어가는 비용도 정말 만만치 않다. 그런데 A씨는 자신이 꾸미지 않아도 본인이 충분히 괜찮다고 하고 B씨는 자기관리를 하지 않으면 본인의 삶에 만족하지 못한다고 한다. 자기관리 비용에 따른 자기만족도 차이를 증명하기 위한 방법은?
연구문제와 가설 참조
위의 문서를 꼭 읽어야 합니다.
연구설계
- 연역 대. 귀납 (induction vs. deduction)
- 연구문제 (research question)
- 가설 (hypothesis)
- 차이와 연관 가설 참조
- Difference
- Association
-
- 속성 (attributes): 측정수준: 척도의 4가지 유형 참조 (p.78).
- 종류와 숫자 (교재 참조: 불연속 vs. 연속)
- NOIR (교재 참조: 명명, 서열, 간격, 비율척도)
- Types of Variable 변인의 종류
- Dependent
- Independent
- Control
- Moderating (Intervening)
- eg.,
- IV, DV: 부모의 교육수준 –> 자녀의 수능점수
- moderating: 부모의 수입수준의 개입
- control: 부모의 교육수준 (대학원 이상으로 콘트롤, 15년 이상)
- intervening: 학생의 성별
- 그렇다면 어떤 가설과 연구문제가 적절한가?
- Sampling
- ECOBS
- Probability sampling
- Non-probability sampling
- Sample vs Population
Assignment 2
- Please write hypotheses like the ones that we discussed in the class.
- And describe how you are going to collect data and how you will be summarizing the outcome.
Week03 (March 18, 21)
ideas and concepts
Assignment
Week04 (March 25, 28)
ideas and concepts
Ch. 5, 6, 7, 8
- 평균편차
-
- 모집단분산
- text 부분: 추정치로서의 평균과 변량(분산)
- 표준편차 Standard Deviation
- 계산공식 분산계산공식
optical_illusion <- c(1.73, 1.06, 2.03, 1.40, .95, 1.13, 1.41, 1.73, 1.63, 1.56) > mean(optical_illusion) [1] 1.463 > var(optical_illusion) [1] 0.1160678 > sqrt(var(optical_illusion)) [1] 0.3406872 > stem(optical_illusion) The decimal point is at the | 0 | 9 1 | 1144 1 | 6677 2 | 0 > median(optical_illusion) [1] 1.485 > mode(optical_illusion) [1] "numeric"
- 정상분포 (정규분포) Normal Distribution
- 표준점수 z score
정상 성인이 10초동안 두드리는 속도의 분포가 평균 59, 표준편차 7인 정상분포를 취한다고 한다. 이 때, 한 환자가 10초 동안 45번을 두드린다고 하는데, 이 환자는 정상인걸까 아니면 정상 성인이 아닌 것일까?
finger_tap<-rnorm(n=10000, m=59, sd=7) hist(finger_tap)
see normal distribution table
or use R (qnorm, pnorm)
.05 (5%)에 들때의 z score? = -1.645
qnorm(0.95) [1] 1.644854
(혹은 .025(2.5%)일 경우 = -1.96 =about -2)
qnorm(0.975) [1] 1.959964
그렇다면, 이 환자의 z score 는?
z-score = (45-59) / 7 = -2
z=-2 일때 분포확률 = 2.28% = 0.0228
> pnorm(-2) [1] 0.02275013
How to look at “Normal” person? within .05? or .01? = 기각수준, 유의도수준
Please note that this is a hypothetical test for one individual (not a sample) against population.
- 가설검증 (Hypothesis testing)
- 영가설(null hypothesis)
- 연구가설, 대립가설 (research hypothesis, alternative hypothesis)
-
- type I error
- type II error
YSR (Youth Self-Report Inventory) 의 우울/불안 척도 ( $ \mu = 50, \sigma = 10 $ )
다섯 아이의 평균 = 56 일때, 이 아이들의 정상정도에 대한 가설 검증
- 절차를 옆사람에게 설명하시오.
> 10/sqrt(5) [1] 4.47
Assignment
- The more time people spend using social media, the less they read books.
- Drinking energy drinks makes people more aggressive.
- Taking a nap in the afternoon makes people more focused for the rest of the day.
- Spending time with a family dog decreases the amount of stress someone is feeling.
- Eating breakfast in the morning increases the ability to learn in school.
Week05 (April 1, 4)
ideas and concepts
Assignment
Quiz 1 on the next Wednesday
Week06 (April 8, 11)
ideas and concepts
Quiz on April 11
ANOVA
Repeated Measure ANOVA
Factorial ANOVA
Assignment
Week07 (April 15, 18)
시험범위
Mid term 범위:
- Ch. 1, 2,
3,4, 5, 6,7, 8 - + z-test
Mid term 이후 시험:
- Ch. 5, 6,
7,8 + - Ch. 12, 13, 14, 15 (효과크기 15.3 이후 제외), 16
ideas and concepts
Assignment
Week08 (April 22, 25)
Mid-term period
Week09 (April 29, May 1)
ideas and concepts
Factorial ANOVA
Repeated Measure ANOVA – in a future week
Assignment
Week10 (May 6, 9)
ideas and concepts
Children's day
Budah Birthday
Assignment
Week11 (May 13, 16)
ideas and concepts
Assignment
Week12 (May 20, 23)
ideas and concepts
- Variance = SStotal / df
- SStot = sum of error squared predicted by mean alone
- SSresidual
- Regression line
- a and b in $ \hat{Y} = a + b X $
- $b = {SP} / {SS_{X}}$
- $a = \overline{Y} - b {\overline{X}}$
- error squared predicted by regression line
- SSregression = error squared overcome by regression line
- SStot = SSregression + SSresidual
- If SSregression is big enough, we can say
- X's contribution to explain y's variation is significant
- How to determine that? → F test
- $\text{F test} = MS_{\text{regression}} / MS_{\text{total}} $
- with $\text{df}_{\text{regression}} = k - 1$ ; and
- $\text{df}_{\text{total}} = n - 1$
- $\text{R}^{\text{2}} = \text{SS}_{\text{reg}} / \text{SS}_{\text{tot}}$
- will be clear with multiple regression
- degrees of freedom을 고려한 R2 = adjusted R2
- addition of IVs will always increase R2.
- should be penalized (or adjusted)
- so, when R2 = 1 - (SSres/SStot), use
- SSres → SSres/dfres
- dfres = n - p - 1
- p = number of IVs
- if p increases, the calculated value will be decreased, which will give you adjusted R2 value.
- SStot → SStotal/dftot
- dftot = n - 1
- meaning of t test for slope b
- Suppose that in $ \hat{Y} = a + b_{1} X_{1} + b_{2} X_{2} $, Xs are not correlated to each other, and X is not contributing anything to Y's variance,
- we can say that b = 0.
- This is a null hypothesis for testing b
- Actual test for determining the contribution of bs is t-test
- t = b1 - b / SEb
- $\displaystyle \text{SE}_{\text{b}} = \frac{s_{\text{est}}}{\sqrt{SSX}}$
Multiple Regression
Sequential Regression
Using Dummy Variables
Week13 (May 27, 30)
ideas and concepts
Assignment
Announcement
Quiz: 6/4
- F-test
- Regression
기본적으로 위를 포함하지만, 위를 이해하기 위해서는
-
- types of variable 등등을 이해해야 합니다.
또한 위를 포함하는 교재의 범위는
- Ch 4: one sample t-test
- Ch 5: paired sample t-test
- Ch 7: two sample t-test
- Ch 12: one-way ANOVA
- Ch 14: two-way ANOVA
- Ch 9: correlation analysis
- Ch 10: simple linear regression
- Ch 11: multiple regression
Week14 (June 3, 6)
6일 현충일
In continuation with ANOVA, Factorial ANOVA
Repeated Measures ANOVA
post hoc test
Effect size for ANOVA
Week15 (June 10, 13)
13일, 지방선거일
week15
Quiz: 지난 번 범위 + regression 부분 일체
- F-test
- regression
-
- 무엇부터_라는_문제와 determining_ivs_role 부분 포함.
- using dummy variables: 기본적인 논리를 중심으로 이해하세요.
기본적으로 위를 포함하지만, 위를 이해하기 위해서는
-
- types of variable 등등을 이해해야 합니다.
또한 위를 포함하는 교재의 범위는
- Ch 12: 신뢰한계에 대해서는 수업중에 다루지 않았으므로 마지막 퀴즈에서도 제외합니다.
- Ch 13, Ch 14
Ch 15:- Ch 16:
- 단일하지 않은 표본크기 포함
- 다중비교(post hoc 혹은 multiple comparison techniques) 포함 (단 퀴즈에서 수학적인 것은 다루지 않습니다).
- 효과크기 중 에타제곱에 해당하는 부분만 포함 (에타제곱, 파샬에타제곱,
오메가) - 결과보고하기 포함 (다루지 않았으나 숙지하시기 바랍니다)
- Ch 17 (factorial)
- 효과크기 중 에타제곱이 아닌 부분은 (r-가족, 오메가 제곱 등) 제외
- 17.7 제외
- 17.8, 17.9 포함
- Ch 18 (repeated measures anova)
Week16 (June 17, 20)
Final-term