User Tools

Site Tools


c:ms:2019:schedule

Class page

Week01 (March 4, 7)

ideas and concepts

Introduction to the class

  • Install R in your class computer

리서처는 젊은이와 (Younger Adults) 중년층의 (Older Adults) 개인간에는 생에 대한 만족도에 차이가 있을 것이라고 생각하고 이를 검증하는 테스트를 진행하려고 한다. 사전 리서치 결과 Life satisfaction을 측정하는 테스트가 있다는 것을 파악하고 이를 사용하기로 하였다.

대학생의 성적은 졸업 후 직장의 월급의 양(액수)와 관련이 있을 것이라고 생각하고 이를 증명하고자 한다.

Assignment

Week02: (March 11, 14)

  • 1.1 맥락의 중요성 숙지할 것
  • 차이와 관계성 (difference vs. association) 등등
  • 아래 ideas and concepts section 참조.

ideas and concepts

학생 A는 성별에 따라 영화 취향이 다르다고 생각한다. 예를 들어, 남자는 대체적으로 액션 영화를 좋아하고 여자는 로맨스 영화를 좋아한다고 생각한다. 학생 A의 주장을 증명할 수 있는 방법을 찾아보자.

  • HOW?

요즘 남성 여성 구분 없이 자기관리를 위해 화장품 및 장신구 구매가 기하급수적으로 늘어나고 있다. 이에 들어가는 비용도 정말 만만치 않다. 그런데 A씨는 자신이 꾸미지 않아도 본인이 충분히 괜찮다고 하고 B씨는 자기관리를 하지 않으면 본인의 삶에 만족하지 못한다고 한다. 자기관리 비용에 따른 자기만족도 차이를 증명하기 위한 방법은?

연구문제와 가설 참조
위의 문서를 꼭 읽어야 합니다.
연구설계

  • 연역 대. 귀납 (induction vs. deduction)
  • 연구문제 (research question)
  • 가설 (hypothesis)
    • 차이와 연관 가설 참조
    • Difference
    • Association
    • 속성 (attributes): 측정수준: 척도의 4가지 유형 참조 (p.78).
    • 종류와 숫자 (교재 참조: 불연속 vs. 연속)
    • NOIR (교재 참조: 명명, 서열, 간격, 비율척도)
  • Types of Variable 변인의 종류
    • Dependent
    • Independent
    • Control
    • Moderating (Intervening)
    • eg.,
      • IV, DV: 부모의 교육수준 –> 자녀의 수능점수
      • moderating: 부모의 수입수준의 개입
      • control: 부모의 교육수준 (대학원 이상으로 콘트롤, 15년 이상)
      • intervening: 학생의 성별

Assignment 2

  1. Please write hypotheses like the ones that we discussed in the class.
  2. And describe how you are going to collect data and how you will be summarizing the outcome.
  3. Submit the assignment at this page.

Week03 (March 18, 21)

ideas and concepts

For the lecture content

Assignment

Week04 (March 25, 28)

ideas and concepts

Read and do pdf text file 2.1 to 2.7 in chapter 2 and chapter 3.
Please read chapter 3 and practice in R. We will not cover it in the class.

Chapter 5

optical_illusion <- c(1.73, 1.06, 2.03, 
1.40, .95, 1.13, 1.41, 1.73, 1.63, 1.56)

> mean(optical_illusion)
[1] 1.463

> var(optical_illusion)
[1] 0.1160678

> sqrt(var(optical_illusion))
[1] 0.3406872

> stem(optical_illusion)

  The decimal point is at the |

  0 | 9
  1 | 1144
  1 | 6677
  2 | 0

> median(optical_illusion)
[1] 1.485

> mode(optical_illusion)
[1] "numeric"

정상 성인이 10초동안 두드리는 속도의 분포가 평균 59, 표준편차 7인 정상분포를 취한다고 한다. 이 때, 한 환자가 10초 동안 45번을 두드린다고 하는데, 이 환자는 정상인걸까 아니면 정상 성인이 아닌 것일까?

finger_tap<-rnorm(n=10000, m=59, sd=7) 
hist(finger_tap)

see normal distribution table
or use R (qnorm, pnorm)
.05 (5%)에 들때의 z score? = -1.645

qnorm(0.95)
[1] 1.644854

(혹은 .025(2.5%)일 경우 = -1.96 =about -2)

qnorm(0.975)
[1] 1.959964

그렇다면, 이 환자의 z score 는?
z-score = (45-59) / 7 = -2

z=-2 일때 분포확률 = 2.28% = 0.0228

> pnorm(-2)
[1] 0.02275013

How to look at “Normal” person? within .05? or .01? = 기각수준, 유의도수준

Please note that this is a hypothetical test for one individual (not a sample) against population.

  • 가설검증 (Hypothesis testing)
    • 영가설(null hypothesis)
    • 연구가설, 대립가설 (research hypothesis, alternative hypothesis)
    • type I error
    • type II error

YSR (Youth Self-Report Inventory) 의 우울/불안 척도 ( $ \mu = 50, \sigma = 10 $ )
다섯 아이의 평균 = 56 일때, 이 아이들의 정상정도에 대한 가설 검증

  • 절차를 옆사람에게 설명하시오.
> 10/sqrt(5)
[1] 4.47

Assignment

Please do textbook exercise (p.39)

  • 2-1
  • 2-7, 2-8, 2.9
  • 2.25a, b

Please submit the homework at ajoubb assignment page.

Week05 (April 1, 4)

ideas and concepts

Week05 materials

Assignment

Quiz 1 on the next Wednesday
The quiz covers:
week 1 - week 5: t-test까지

  • Lecture notes의 가설 부분:
    • 가설, 가설의 요건
    • 조작화
  • 가설의 종류
  • 가설의 종류에 따른 정리법
  • 연역 vs 귀납
  • 가설 and 가설검증부분
  • mean, median, mode
    • tb: Chapter 4: 최빈치, 중앙값, 평균, 집중경향
    • probability,
      • Systematic Sampling:
      • Stratified Sampling:
      • Multistage Cluster Sampling:
      • Stratified in Multistage Cluster Sampling:
    • non-probability sampling,
      • Convenience
      • Quota sampling
      • Stratified quota sampling
  • variances: sample variance, population variance
  • standard deviation 표준편차 (tb: Ch 5:변산성: 평균편차, 변량, 표준편차, 계산공식, 추정치로서의 평균과 변량)
  • normal distribution: (tb: Ch 6: 정상분포, 표준정상분포)
  • sampling distribution (tb: Ch 8: 표집분포, 표준오차, 가설검증, 영가설, 검증통계치와 검증통계치의 표집분포, 정상분포를 이용한 가설검증, 1종/2종 오류, 일방/양방검증)
  • standard score (tb: Ch 6: z와 관련된 측정치들)
  • hypothesis testing: null hypothesis, research hypothesis
  • types of error: type I and type II error
    • tb Ch12:
      • 통계보기
        • t의 표집분포
        • z와 t의 비교
        • 신뢰구간
    • tb Ch12:
      • 평균의 표집분포,
      • $\sigma$를 알고있을 때 평균에 대한 가설검증,
      • $\sigma$를 모를 때,
      • t의 크기에 영향을 미치는 요인들과 H0에 대한 결정,
      • 두 번째 예-달 착시
    • tb Ch13 :
      • 상관표본
      • 예: 차이점수에 적용되는 t-test
        • 차이점수
        • t 통계치
        • 자유도
      • 상관표본 사용의 장점과 단점
    • tb Ch14 :
      • 평균 간 차이의 분포
      • 변량의 이질성
      • 분포의 비정상성
      • 두 개 독립표본의 두 번째 예

Week06 (April 8, 11)

ideas and concepts

Quiz on April 11
ANOVA
Repeated Measure ANOVA
Factorial ANOVA

Assignment

Week07 (April 15, 18)

시험범위

Mid term 범위: 이전범위
+ ANOVA
+ Factorial Anova 설명된 부분까지

ideas and concepts

Assignment

Week08 (April 22, 25)

Mid-term period

Week09 (April 29, May 2)

ideas and concepts

Factorial ANOVA
Repeated Measure ANOVA – in a future week
Lecture content

Assignment

Week10 (May 6, 9)

ideas and concepts

Children's day
Budah Birthday

Assignment

Week11 (May 13, 16)

ideas and concepts

Correlation
Regression

Assignment

Week12 (May 20, 23)

ideas and concepts

correlation
Regression

check out the explanation of regression from crashcourse


  • Variance = SStotal / df
  • SStot = sum of error squared predicted by mean alone
  • SSresidual
    • Regression line
    • a and b in $ \hat{Y} = a + b X $
      • $b = {SP} / {SS_{X}}$
      • $a = \overline{Y} - b {\overline{X}}$
    • error squared predicted by regression line
  • SSregression = error squared overcome by regression line
  • SStot = SSregression + SSresidual
  • If SSregression is big enough, we can say
    • X's contribution to explain y's variation is significant
    • How to determine that? → F test
  • $\text{F test} = MS_{\text{regression}} / MS_{\text{total}} $
    • with $\text{df}_{\text{regression}} = k - 1$ ; and
    • $\text{df}_{\text{total}} = n - 1$
  • $\text{R}^{\text{2}} = \text{SS}_{\text{reg}} / \text{SS}_{\text{tot}}$
  • will be clear with multiple regression
    • degrees of freedom을 고려한 R2 = adjusted R2
      • addition of IVs will always increase R2.
      • should be penalized (or adjusted)
      • so, when R2 = 1 - (SSres/SStot), use
        • SSres → SSres/dfres
        • dfres = n - p - 1
        • p = number of IVs
        • if p increases, the calculated value will be decreased, which will give you adjusted R2 value.
        • SStot → SStotal/dftot
        • dftot = n - 1
    • meaning of t test for slope b
      • Suppose that in $ \hat{Y} = a + b_{1} X_{1} + b_{2} X_{2} $, Xs are not correlated to each other, and X is not contributing anything to Y's variance,
      • we can say that b = 0.
      • This is a null hypothesis for testing b
      • Actual test for determining the contribution of bs is t-test
        • t = b1 - b / SEb
        • $\displaystyle \text{SE}_{\text{b}} = \frac{s_{\text{est}}}{\sqrt{SSX}}$

Multiple Regression
Sequential Regression
Using Dummy Variables

Week13 (May 27, 30)

ideas and concepts

Assignment

Announcement

Quiz: 6/4

기본적으로 위를 포함하지만, 위를 이해하기 위해서는

또한 위를 포함하는 교재의 범위는

  • Ch 4: one sample t-test
  • Ch 5: paired sample t-test
  • Ch 7: two sample t-test
  • Ch 12: one-way ANOVA
  • Ch 14: two-way ANOVA
  • Ch 9: correlation analysis
  • Ch 10: simple linear regression
  • Ch 11: multiple regression

Week14 (June 3, 6)

Week15 (June 10, 13)

다음의 요약표는 각 처치 내에 n=20의 표본을 가지는 3개의 처치조건을 비교하는 실험에서 얻은 ANOVA 분석 결과이다. 표 안에 없는 값을 구해 표를 완성 하시오.

자료 SS df MS F
between a b 20 c
within d e f
Total 413 g

Quiz: 지난 번 범위 + regression 부분 일체

기본적으로 위를 포함하지만, 위를 이해하기 위해서는

또한 위를 포함하는 교재의 범위는

  • Ch 12: 신뢰한계에 대해서는 수업중에 다루지 않았으므로 마지막 퀴즈에서도 제외합니다.
  • Ch 13, Ch 14
  • Ch 15:
  • Ch 16:
    • 단일하지 않은 표본크기 포함
    • 다중비교(post hoc 혹은 multiple comparison techniques) 포함 (단 퀴즈에서 수학적인 것은 다루지 않습니다).
    • 효과크기 중 에타제곱에 해당하는 부분만 포함 (에타제곱, 파샬에타제곱, 오메가)
    • 결과보고하기 포함 (다루지 않았으나 숙지하시기 바랍니다)
  • Ch 17 (factorial)
    • 효과크기 중 에타제곱이 아닌 부분은 (r-가족, 오메가 제곱 등) 제외
    • 17.7 제외
    • 17.8, 17.9 포함
  • Ch 18 (repeated measures anova)

Week16 (June 17, 20)

Final-term

c/ms/2019/schedule.txt · Last modified: 2019/06/13 10:38 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki