[[./|Class page]] ====== Week01 (March 4, 7) ====== ===== ideas and concepts ===== Introduction to the class * Install R in your class computer * Refer to [[/r/getting_started|this page]] 리서처는 젊은이와 (Younger Adults) 중년층의 (Older Adults) 개인간에는 생에 대한 만족도에 차이가 있을 것이라고 생각하고 이를 검증하는 테스트를 진행하려고 한다. 사전 리서치 결과 Life satisfaction을 측정하는 테스트가 있다는 것을 파악하고 이를 사용하기로 하였다. 대학생의 성적은 졸업 후 직장의 월급의 양(액수)와 관련이 있을 것이라고 생각하고 이를 증명하고자 한다. * [[./week01|Week 01 materials]] * [[:Theories]] 참조 * [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] 참조 * 연구문제 ([[:research question]]) * 개념 (concept) vs 개념 (concept) * concepts, ideas, etc. ===== Assignment ===== ====== Week02: (March 11, 14) ====== * 1.1 맥락의 중요성 숙지할 것 * 차이와 관계성 (difference vs. association) 등등 * 아래 ideas and concepts section 참조. ===== ideas and concepts ===== 학생 A는 성별에 따라 영화 취향이 다르다고 생각한다. 예를 들어, 남자는 대체적으로 액션 영화를 좋아하고 여자는 로맨스 영화를 좋아한다고 생각한다. 학생 A의 주장을 증명할 수 있는 방법을 찾아보자. * HOW? 요즘 남성 여성 구분 없이 자기관리를 위해 화장품 및 장신구 구매가 기하급수적으로 늘어나고 있다. 이에 들어가는 비용도 정말 만만치 않다. 그런데 A씨는 자신이 꾸미지 않아도 본인이 충분히 괜찮다고 하고 B씨는 자기관리를 하지 않으면 본인의 삶에 만족하지 못한다고 한다. 자기관리 비용에 따른 자기만족도 차이를 증명하기 위한 방법은? * {{http://fetzer.org/sites/default/files/images/stories/pdf/selfmeasures/Self_Measures_for_Self-Esteem_ROSENBERG_SELF-ESTEEM.pdf|ROSENBERG SELF-ESTEEM SCALE}} [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] 참조 위의 문서를 꼭 읽어야 합니다. 연구설계 * 연역 대. 귀납 (induction vs. deduction) * [[:Research Question|연구문제]] (research question) * [[:Conceptualization]] * [[:Operationalization]] * [[:Hypothesis|가설]] (hypothesis) * **차이와 연관** [[:Hypothesis|가설]] 참조 * Difference * Association * [[:variable|변인 (variable)]] 설명 * 속성 (attributes): [[:level of measurement|측정수준]]: 척도의 4가지 유형 참조 (p.78). * **종류와 숫자** (교재 참조: 불연속 vs. 연속) * NOIR (교재 참조: 명명, 서열, 간격, 비율척도) * [[:Types of Variable]] 변인의 종류 * Dependent * Independent * Control * Moderating (Intervening) * eg., * IV, DV: 부모의 교육수준 --> 자녀의 수능점수 * moderating: 부모의 수입수준의 개입 * control: 부모의 교육수준 (대학원 이상으로 콘트롤, 15년 이상) * intervening: 학생의 성별 * [[https://www.ted.com/talks/sebastian_wernicke_how_to_use_data_to_make_a_hit_tv_show#t-55156|How to use data to make a hit TV show]] * 그렇다면 어떤 가설과 연구문제가 적절한가? * Sampling * [[:Sampling]] * [[:Sampling#sampling frame]] * ECOBS * Probability sampling * [[Systematic Sampling]]: * [[Stratified Sampling]]: * [[Multistage Cluster Sampling]]: * [[Stratified in Multistage Cluster Sampling]]: * Non-probability sampling * [[:Sample frame]] * [[:Sample]] vs [[:Population]] ===== Assignment 2 ===== - Please write hypotheses like the ones that we discussed in the class. - And describe how you are going to collect data and how you will be summarizing the outcome. - Submit the assignment at [[https://eclass2.ajou.ac.kr/webapps/blackboard/content/listContentEditable.jsp?content_id=_311828_1&course_id=_43978_1|this page]]. ====== Week03 (March 18, 21) ====== ===== ideas and concepts ===== [[.schedule/week03|For the lecture content]] ===== Assignment ===== ====== Week04 (March 25, 28) ====== ===== ideas and concepts ===== Read and do {{:r_dso.pdf|pdf text file}} 2.1 to 2.7 in chapter 2 and chapter 3. Please read chapter 3 and practice in R. We will not cover it in the class. * [[:range]] 혹은 [[:range|범위]] * [[:interquartile range]] 혹은 [[:interquartile range|사분위 범위]] Chapter 5 * 평균편차 * 분산 [[:Variance]] 혹은 변량 혹은 변산 * 모집단분산 * 표본분산 [[:why n-1]] [[:degrees of freedom]] 혹은 [[:degrees of freedom|df]] * text 부분: 추정치로서의 평균과 변량(분산) * 표준편차 [[:Standard Deviation]] * 계산공식 [[:c/ms/2018/schedule/week03#variance_calculation_formula|분산계산공식]] optical_illusion <- c(1.73, 1.06, 2.03, 1.40, .95, 1.13, 1.41, 1.73, 1.63, 1.56) > mean(optical_illusion) [1] 1.463 > var(optical_illusion) [1] 0.1160678 > sqrt(var(optical_illusion)) [1] 0.3406872 > stem(optical_illusion) The decimal point is at the | 0 | 9 1 | 1144 1 | 6677 2 | 0 > median(optical_illusion) [1] 1.485 > mode(optical_illusion) [1] "numeric" * 정상분포 (정규분포) [[:Normal Distribution]] * 표준점수 [[:z score]] 정상 성인이 10초동안 두드리는 속도의 분포가 평균 59, 표준편차 7인 정상분포를 취한다고 한다. 이 때, 한 환자가 10초 동안 45번을 두드린다고 하는데, 이 환자는 정상인걸까 아니면 정상 성인이 아닌 것일까? finger_tap<-rnorm(n=10000, m=59, sd=7) hist(finger_tap) see [[https://www.mathsisfun.com/data/standard-normal-distribution-table.html|normal distribution table]] or use R (qnorm, pnorm) .05 (5%)에 들때의 z score? = -1.645 qnorm(0.95) [1] 1.644854 (혹은 .025(2.5%)일 경우 = -1.96 =about -2) qnorm(0.975) [1] 1.959964 그렇다면, 이 환자의 z score 는? z-score = (45-59) / 7 = -2 z=-2 일때 분포확률 = 2.28% = 0.0228 > pnorm(-2) [1] 0.02275013 How to look at "Normal" person? within .05? or .01? = 기각수준, 유의도수준 Please note that this is a hypothetical test for one individual (not a sample) against population. * 가설검증 ([[:Hypothesis testing]]) * 영가설(null hypothesis) * 연구가설, 대립가설 (research hypothesis, alternative hypothesis) * [[:types of error]] * type I error * type II error * [[:central limit theorem]] * [[:sampling distribution]] * [[:standard error]] * [[:z-test]] * [[:t-test]] YSR (Youth Self-Report Inventory) 의 우울/불안 척도 ( $ \mu = 50, \sigma = 10 $ ) 다섯 아이의 평균 = 56 일때, 이 아이들의 정상정도에 대한 가설 검증 * 절차를 옆사람에게 설명하시오. > 10/sqrt(5) [1] 4.47 ===== Assignment ===== Please do textbook exercise (p.39) * 2-1 * 2-7, 2-8, 2.9 * 2.25a, b Please submit the homework at [[https://eclass2.ajou.ac.kr/webapps/blackboard/content/listContentEditable.jsp?content_id=_311828_1&course_id=_43978_1|ajoubb]] assignment page. ====== Week05 (April 1, 4) ====== ===== ideas and concepts ===== [[.schedule/Week05|Week05 materials]] ===== Assignment ===== Quiz 1 on the next Wednesday The quiz covers: week 1 - week 5: t-test까지 * Lecture notes의 가설 부분: * 가설, 가설의 요건 * 조작화 * 가설의 종류 * 가설의 종류에 따른 정리법 * 연역 vs 귀납 * [[:hypothesis|가설]] and [[:hypothesis_testing|가설검증]]부분 * [[:variables|변인]] * [[:types of variables|변인의 종류]] * [[:level of measurement|측정수준]] * [[:mean]], median, mode * tb: Chapter 4: 최빈치, 중앙값, 평균, 집중경향 * [[:Sampling]], * [[:sample]], [[:population]] * probability, * Systematic Sampling: * Stratified Sampling: * Multistage Cluster Sampling: * Stratified in Multistage Cluster Sampling: * non-probability sampling, * Convenience * Quota sampling * Stratified quota sampling * [[:sampling#sampling_frame|sample frame]], etc. * [[:range]], [[:outliers]] * [[:variances]]: sample variance, population variance * [[:standard deviation]] 표준편차 (tb: Ch 5:변산성: 평균편차, 변량, 표준편차, 계산공식, 추정치로서의 평균과 변량) * [[:degrees of freedom]] * [[:sampling]] * [[:normal distribution]]: (tb: Ch 6: 정상분포, 표준정상분포) * [[:sampling distribution]] (tb: Ch 8: 표집분포, 표준오차, 가설검증, 영가설, 검증통계치와 검증통계치의 표집분포, 정상분포를 이용한 가설검증, 1종/2종 오류, 일방/양방검증) * [[:central limit theorem]] * [[:standard error]] * [[:standard score]] (tb: Ch 6: z와 관련된 측정치들) * [[:hypothesis testing]]: null hypothesis, research hypothesis * [[:types of error]]: type I and type II error * [[:z-test]] * tb Ch12: * 통계보기 * t의 표집분포 * z와 t의 비교 * 신뢰구간 * [[:t-test]] * tb Ch12: * 평균의 표집분포, * $\sigma$를 알고있을 때 평균에 대한 가설검증, * $\sigma$를 모를 때, * t의 크기에 영향을 미치는 요인들과 H0에 대한 결정, * 두 번째 예-달 착시 * tb Ch13 : * 상관표본 * 예: 차이점수에 적용되는 t-test * 차이점수 * t 통계치 * 자유도 * 상관표본 사용의 장점과 단점 * tb Ch14 : * 평균 간 차이의 분포 * 변량의 이질성 * 분포의 비정상성 * 두 개 독립표본의 두 번째 예 ====== Week06 (April 8, 11) ====== ===== ideas and concepts ===== Quiz on April 11 [[:ANOVA]] [[:Repeated Measure ANOVA]] [[:Factorial ANOVA]] ===== Assignment ===== ====== Week07 (April 15, 18) ====== ===== 시험범위 ===== Mid term 범위: 이전범위 + [[:ANOVA]] + [[:Factorial Anova]] 설명된 부분까지 ===== ideas and concepts ===== ===== Assignment ===== ====== Week08 (April 22, 25) ====== __**Mid-term period**__ ====== Week09 (April 29, May 2) ====== ===== ideas and concepts ===== [[:Factorial ANOVA]] [[:Repeated Measure ANOVA]] -- in a future week [[:c/ms/2017/schedule/week07|Lecture content]] ===== Assignment ===== ====== Week10 (May 6, 9) ====== ===== ideas and concepts ===== Children's day Budah Birthday ===== Assignment ===== ====== Week11 (May 13, 16) ====== ===== ideas and concepts ===== [[:Correlation]] [[:Regression]] ===== Assignment ===== ====== Week12 (May 20, 23) ====== ===== ideas and concepts ===== [[:correlation]] [[:Regression]] {{youtube>WWqE7YHR4Jc}} check out the explanation of regression from crashcourse ---- * Variance = SStotal / df * SStot = sum of error squared predicted by mean alone * SSresidual * Regression line * a and b in $ \hat{Y} = a + b X $ * $b = {SP} / {SS_{X}}$ * $a = \overline{Y} - b {\overline{X}}$ * error squared predicted by regression line * SSregression = error squared overcome by regression line * SStot = SSregression + SSresidual * If SSregression is **big enough**, we can say * X's contribution to explain y's variation is significant * How to determine that? -> F test * $\text{F test} = MS_{\text{regression}} / MS_{\text{total}} $ * with $\text{df}_{\text{regression}} = k - 1$ ; and * $\text{df}_{\text{total}} = n - 1$ * $\text{R}^{\text{2}} = \text{SS}_{\text{reg}} / \text{SS}_{\text{tot}}$ * will be clear with multiple regression * degrees of freedom을 고려한 R2 = adjusted R2 * addition of IVs will always increase R2. * should be penalized (or adjusted) * so, when R2 = 1 - (SSres/SStot), use * SSres -> SSres/dfres * dfres = n - p - 1 * p = number of IVs * if p increases, the calculated value will be decreased, which will give you adjusted R2 value. * SStot -> SStotal/dftot * dftot = n - 1 * meaning of t test for slope b * Suppose that in $ \hat{Y} = a + b_{1} X_{1} + b_{2} X_{2} $, Xs are not correlated to each other, and X is not contributing anything to Y's variance, * we can say that b = 0. * This is a null hypothesis for testing b * Actual test for determining the contribution of bs is t-test * t = b1 - b / SEb * $\displaystyle \text{SE}_{\text{b}} = \frac{s_{\text{est}}}{\sqrt{SSX}}$ [[:Multiple Regression]] [[:Sequential Regression]] [[:Using Dummy Variables]] [[:r:t-test|t-test in r]] [[:r:anova]] * [[:r:oneway anova]] in r * [[:r:twoway anova]] in r [[:r:linear regression]] in r [[:r:multiple regression]] in r ===== Assignment ===== ====== Week13 (May 27, 30) ====== ===== ideas and concepts ===== ===== Assignment ===== ===== Announcement ===== Quiz: 6/4 * [[:t-test]] * F-test * [[:ANOVA]] * [[:Factorial ANOVA]] * [[:Repeated Measures ANOVA]] * [[:Effect size for ANOVA]] * Regression * [[:correlation]] * [[:regression]] * [[:multiple regression]] 기본적으로 위를 포함하지만, 위를 이해하기 위해서는 * [[:standard deviation]] * [[:variance]] * [[:central limit theorem]] * [[:sampling distribution]] * [[:standard error]] * [[:hypothesis testing]] * [[:z-test]] * [[:types of error]] * [[:variable]] * [[:types of variable]] 등등을 이해해야 합니다. 또한 위를 포함하는 교재의 범위는 * Ch 4: one sample t-test * Ch 5: paired sample t-test * Ch 7: two sample t-test * Ch 12: one-way ANOVA * Ch 14: two-way ANOVA * Ch 9: correlation analysis * Ch 10: simple linear regression * Ch 11: multiple regression ====== Week14 (June 3, 6) ====== 6일 현충일 In continuation with [[:ANOVA]], [[:Factorial ANOVA]] [[:Repeated Measures ANOVA]] [[:post hoc test]] [[:Effect size for ANOVA]] ====== Week15 (June 10, 13) ====== 다음의 요약표는 각 처치 내에 n=20의 표본을 가지는 3개의 처치조건을 비교하는 실험에서 얻은 ANOVA 분석 결과이다. 표 안에 없는 값을 구해 표를 완성 하시오. | 자료 | SS | df | MS | F | | between | a | b | 20 | c | | within | d | e | f | | | Total | 413 | g | | | Quiz: 지난 번 범위 + regression 부분 일체 * [[:t-test]] * F-test * [[:ANOVA]] * [[:Factorial ANOVA]] * [[:Repeated Measures ANOVA]] * [[:Effect size for ANOVA]] * regression * [[:regression]] * [[:multiple regression]] * [[:multiple_regression#무엇부터_라는_문제]]와 [[:multiple_regression#determining_ivs_role]] 부분 포함. * [[:using dummy variables]]: 기본적인 논리를 중심으로 이해하세요. 기본적으로 위를 포함하지만, 위를 이해하기 위해서는 * [[:standard deviation]] * [[:variance]] * [[:central limit theorem]] * [[:sampling distribution]] * [[:standard error]] * [[:hypothesis testing]] * [[:z-test]] * [[:types of error]] * [[:variable]] * [[:types of variable]] 등등을 이해해야 합니다. 또한 위를 포함하는 교재의 범위는 * Ch 12: 신뢰한계에 대해서는 수업중에 다루지 않았으므로 마지막 퀴즈에서도 제외합니다. * Ch 13, Ch 14 * Ch 15: * Ch 16: * 단일하지 않은 표본크기 포함 * 다중비교(post hoc 혹은 multiple comparison techniques) 포함 (단 퀴즈에서 수학적인 것은 다루지 않습니다). * 효과크기 중 에타제곱에 해당하는 부분만 포함 (에타제곱, 파샬에타제곱, 오메가) * 결과보고하기 포함 (다루지 않았으나 숙지하시기 바랍니다) * Ch 17 (factorial) * 효과크기 중 에타제곱이 아닌 부분은 (r-가족, 오메가 제곱 등) 제외 * 17.7 제외 * 17.8, 17.9 포함 * Ch 18 (repeated measures anova) * ====== Week16 (June 17, 20) ====== __**Final-term**__