[[./|Class page]] multivariate statistics in R network analysis in R * A User’s Guide to Network Analysis in R (Use R!) * Statistical Analysis of Network Data with R (Use R!) 2014th Edition [[https://lagunita.stanford.edu]] [[https://campus.datacamp.com/courses/network-analysis-in-r|Network Analysis in R]] using igraph package -- from Datacamp [[https://campus.datacamp.com/courses/marketing-analytics-in-r-statistical-modeling/|Marketing analysis in r statistics]] from Datacamp 금, 화 9시 ====== Week01 ====== (Sep 2, 6) ===== ideas and concepts ===== * [[https://www.youtube.com/watch?v=YblmPrNv3sM|Installing R]] * [[https://www.youtube.com/watch?v=Gzgk2K8inIQ|R use 1]] * [[https://www.youtube.com/watch?v=zBJfXRlUwdI|R use 2]] Using [[:theories]] * [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] and * making [[:hypothesis|hypotheses]] Installing R Using a data set: mtcars ===== Assignment ===== ====== Week02 ====== (Sep 9, 13) ===== Concepts and ideas ===== 동영상 시청. 아래 동영상은 교재의 2장 이후를 다루는 내용이면서 계산적인 통계에 대해서 공부하기 위해서 꼭 필요한 내용이므로 숙지하시기 바랍니다. 동영상이 길어서 이 부분은 3주차에도 계속 시청합니다. * [[https://www.youtube.com/watch?v=-q1VZz7PHf8|통계: 개괄적 소개 1]] * [[https://www.youtube.com/watch?v=Z7XMMgLLfrQ|통계: 개괄적 소개 2]] * [[https://www.youtube.com/watch?v=dQ1CYnuU_6s|통계: 개괄적 소개 3]] * 제2장. 여러분이 . . . = 통계관련 개념 개관 * [[:Research Question]] * [[:Hypothesis]] * Educated guess (via theories) * Difference * Association * Variables (vs. ideas, concepts, and constructs) * [[:Operationalization]] * [[:Variables]], * [[:level of measurement]] * [[:level of measurement#Nominal]] * [[:level of measurement#Ordinal]] * [[:level of measurement#Interval]] * [[:level of measurement#Ratio]] * [[:Types of Variables]] * see [[http://chohongjoong.com/gnu4/bbs/board.php?bo_table=board02&wr_id=311&sfl=&stx=&sst=wr_datetime&sod=desc&sop=and&page=1|this blog]] written in Korean * [[:Independent Variable|IV]] 독립변인 * [[:Dependent Variable|DV]] 종속변인 * Control variable 제어변인 * Mediator (Intervening) variable 매개변인 * 제2장 * 통계적모형과 ([[:model]]) 적합성 (model fit) * 간단한 예로서의 [[:mean|평균]] (mean) * 제곱합 (오차의제곱합, 혹은 이탈의제곱합 혹은 deviation score의제곱합) * [[:variance|분산]] * 모집단 추정을 위해서 [[:why n-1|n-1 사용을 하는 이유]] * [[:degrees of freedom|자유도]] * [[:Standard Deviation|표준편차]] * [[:z_score]] * 샘플평균들의 집합 * [[:Sampling Distribution]] 혹은 Distribution of Sample Means * Standard Deviation of Sample Means * [[:Standard Error]], 표준오차 * Central Limit Theorem ([[:Central Limit Theorem]]) * 예측에서의 (평균이 어디에서 나올까의 예측) 신뢰구간 * 검정통계 $$ \text{Inferential Statistics} = \frac {\text{Effects}} {\text{Error}} $$ 실제차이를 랜덤차이로 나눈 비율 {{:c:ma:2022:pasted:20220906-201156.png?340}} \begin{eqnarray*} s^2 & = \frac {SS}{df} \\ \sqrt{s^2} & = s \end{eqnarray*} ===== Assignment ===== ====== Week03 ====== (Sep 16, 20) ===== Activities ===== Group self-registration at [[https://eclass2.ajou.ac.kr/ultra/courses/_76280_1/cl/outline|ABB]] Group membership adjustment ===== Concepts and ideas ===== * [[https://www.youtube.com/watch?v=cpdTptIl3Eg|분산에서 왜 n-1로 나누는가? 1 ]] * [[https://www.youtube.com/watch?v=SZwy-cgU40E|분산에서 왜 n-1로 나누는가? 2 ]] * [[https://www.youtube.com/watch?v=BUTvS4XVDkg|분산에서 왜 n-1로 나누는가? 3 ]] * [[https://www.youtube.com/watch?v=YYWwmHgX4Yc|자유도]] [[:Degrees of Freedom]] * [[https://www.youtube.com/watch?v=0O_Dkga0HgA|표준편차]] [[:Standard Deviation]] * [[https://www.youtube.com/watch?v=mfImOa3_V1o|표준점수]] [[:Standard Score]] * [[:Standard Error]] * [[:Hypothesis testing]] ===== Assignment ===== Group Assignment 주제: 유튜브 댓글의 제3자효과는 어떻게 나타날까? 주제: 필터버블 효과는 어떻게 나타날까? 위의 주제로 가설을 그룹구성원의 숫자만큼 만드시오. 가설의 변인의종류와 측정수준을 말하시오. ====== Week04 ====== (Sep 23, 27) 영상 Knowledge to understand hypothesis testing * [[https://www.youtube.com/watch?v=gmnes_O8dSM|Sampling distribution]] or Distribution of the sample mean or Distsribution of sample means * [[:Sampling distribution]] * [[https://www.youtube.com/watch?v=ffnQPTIwryM|Mean and variance of sampling distribution]] * [[https://www.youtube.com/watch?v=-FehYptG-tY|Standard error and hypothesis testing]] * [[:hypothesis testing]] [[:t-test]] * [[https://www.youtube.com/watch?v=3a_Opcy037k|t-test, 4 kinds of]] * [[https://www.youtube.com/watch?v=zHxytKBNloM|types of (hypothesis testing) error]] * [[https://www.youtube.com/watch?v=--Omqk9KHbw|t-test in R]] ---- ===== Class Activity ===== out of class * intervene -- * inter + ven(e) = between + come * prevent * convention * convene * revenue * venue : place people to come * convenient : to come together -> suit -> fit * adventure : things about to happen (곧 일어날 일) * invention : into + come : about to know : discovered * event ---- ==== Hypothesis ==== * 가설 만들어 보기 * No need to read [[:theories]] * [[:the third person effect]] * [[:Spiral of Silence]] * 원 이론은 사람들은 다른 사람들의 생각, 의견에 대한 파악이 * 무의식적이지만 체계적으로 혼돈없이 잘 일어날 것을 가정한다. * 그렇다면 이것이 온라인에서는 어떨까? * 온라인에서 소수의 아이디어를 가진 사람이나 집단이 * 다수인 양 한다면 이것이 오프라인에 일어날 때 보다 * 더 효과적이지 않을까? * 위의 생각에 기반한 가설은 어떻게 세울 수 있을까? * [[:cognitive dissonance]] * Read [[:hypothesis]] * [[http://behavioralsciencewriting.blogspot.kr/2011/09/how-to-write-hypothesis.html|how to write hypothesis]] at behavioral science writing. * One sample hypothesis [[http://www.socialresearchmethods.net/kb/hypothes.php|Hypothesis]] at www.socialresearchmethods.net
* Is your hypothesis based on your research on a topic? * Can your hypothesis be tested? * Does your hypothesis include independent and dependent variables? from https://www.verywellmind.com/what-is-a-hypothesis-2795239 * kinds of hypothesis * Identifying IV and DV (and Intervening Variable) * measurement ([[:operationalization]] :: 조작화)
* Students who eat breakfast will perform better on a math exam than students who do not eat breakfast * Identify and its level of measurement (lom, 측정수준): * IV * IV's lom * DV * DV's lom {{:c:ma:2022:pasted:20220920-084047.png}} {{:c:ma:2022:pasted:20220920-084213.png}} {{:c:ma:2022:pasted:20220920-084249.png}} in [[https://koreascience.kr/article/JAKO201028552429564.pdf]] ===== Concepts and ideas =====
===== Assignment ===== Assignment for all * Read [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설]] * Read [[:research question]] * Read [[:hypothesis]] Group assignment 1 (ma.22.w04.ga.id.var) * 파일로 과제를 제출할 경우, ma.22.w04.ga.id.g그룹번호.docx 와 (예, ma.21.w04.ga.id.g02.odc) 같이 제출하세요. * [[:Hypothesis]] 문서의 [[:hypothesis#예]]의 "제3자 효과이론과 침묵의 나선이론 연계성" 논문을 읽고 가설을 기술하시오. * 각 가설의 독립변인(Independent variables), 종속변인 (dependent variables) 등을 나열하시오. * 이 논문에 사용된 이론은 무엇인지 기술하고 설명하시오. Group assignment 2 (ma.22.w04.ga.making.ttest.h) 가설 만들어 보기 t-test (ma.22.w04.ga.making.ttest.h) -- t-test 동영상 시청을 마치고 하세요. * 파일제출시에는 ma.22.w04.ga.making.ttest.h.g10.docx와 같이 하세요. * 모집단 평균과 표준편차를 알고 있을 경우의 가설 * 두번째 종류는 생략 * 모집단의 파라미터를 모르는 두 집단의 평균과 표준편차만을 알고 있을 경우의 가설 * 반복측정 가설 ====== Week05 (Sep 30, Oct 4) ====== ===== ideas and concepts ===== 영상 * [[https://www.youtube.com/watch?v=sK02oxyItHc|ANOVA (F-test) 원리]] * [[https://www.youtube.com/watch?v=DP4rCJdnD4c|ANOVA post-hoc test와 R에서의 예]] * [[https://www.youtube.com/watch?v=rQIQ-P_VQHU|Factorial ANOVA]] * [[https://www.youtube.com/watch?v=Uz_DYDlEPEc|Factorial ANOVA 예 (R 포함)]] 문서 + 텍스트 * [[:ANOVA]] * [[:Factorial ANOVA]] ===== Assignment ===== Group assignment 2 (w05.ga.finding.r.articles) * Read * [[:Hypothesis]], * [[:Types of Variables]], * [[:Level of Measurement]], * [[:Operationalization]] * 그룹의 관심사에 어울리는 F-test 가설을 만드시오 * ma.22.ga.w05.mk.anova.hyp * 첫번째 가설은 One-way ANOVA * 두번째 가설은 Two-way ANOVA * 세번째 가설은 One-way repeated measure ANOVA 가설이어야 합니다. * 각 가설은 제시되면서 그 근거가 간단히 설명되어야 합니다. * IV, DV를 밝히고, 각 변인이 어떻게 측정되었는지 (될 것인지) 밝히시오. * 9일까지 완성, 제출하세요 ====== Week06 ====== (Oct 7, 11) 첫번째 퀴즈 * 10월 7일 * 오픈시간: 9:00-3:00 * 퀴즈시간: 약 60-70분 (바뀔 수 있습니다) * 퀴즈문제: 약 50문제 (바뀔 수 있습니다) * 범위: 처음부터 - 5주차 반까지; 그리고 교재 제2장까지 * 5주차 반까지란? ANOVA와 Post hoc test 까지 (즉, Factorial ANOVA와 예 제외) * 10월 7일 온라인 미팅 없습니다. * [[sample questions]] ===== ideas and concepts ===== ===== Assignment ===== - Public opinion in online environments ((refer to {{:public.opinion.theories.introduction.pdf}} )) * [[:Spiral of Silence]] * [[:Pluralistic Ignorance]] * [[:The Third Person Effect]] * etc. 여론형성과 관련된 사회학적 혹은 사회심리학적 이론을 찾아보고 소개하기, 예로 위의 세가지. 얼마전 사회현상을 어떻게 설명하면 좋을까에 대해서 논의정리하기? 정확한 온라인 환경에서의 여론파악을 위해서 어떤 것이 필요할까? * 혹은 다른 문제에 대해서 (. . . 조에 따른 . . .) - Hypotheses * Multiple regression hypotheses. * Google Survey Questions ====== Week07 ====== (Oct 14, 18) 영상 시청 (8주차까지 볼 동영상입니다) * [[https://www.youtube.com/watch?v=4XLkoalGkms |Variance and Covariance]] * [[https://www.youtube.com/watch?v=9iRb7hBUjSU |Correlation (r) and Regression Analysis]] * [[https://www.youtube.com/watch?v=sXZ3yzJVbRo |Simple Regression e.g.1]] * [[https://www.youtube.com/watch?v=CbV-a5uL8OQ |Simple Regression e.g.2]] * [[https://www.youtube.com/watch?v=Dc67qlz1yKM |Multiple Regression, Intro]] * [[https://www.youtube.com/watch?v=n9sainZvAqA |Multiple Regression, e.g ]] ===== ideas and concepts ===== [[:correlation]] [[:regression]] [[:multiple regression]] * [[:r:correlation|correlation in r]] * [[:r:multiple regression|multiple regression in r]] ---- 이하는 다음 주에 [[:Partial and semipartial correlation]] [[:using dummy variables]] [[:Statistical Regression Methods]] [[:Sequential Regression]] ===== Activity ===== * 데이터 불러오기 dat <- read.csv("http://commres.net/wiki/_media/regression01-bankaccount.csv") * 살피기 ''str(dat)'' * 가설만들기 : 독립변인으로 fammember를, 종속변인으로 account를 (통장갯수를) * ? * 변인관련 실습 * DV의 SS 값은 무엇인가? * DV의 df 값은 무엇인가? * DV의 Variance는 무엇인가? * IV와 DV의 Covariance 구하기 * SP? * df? * correlation coefficient값은? * SSreg 값은? * SSres 값은? * r square 값은? * F test 값은? * Regression test dat.lm <- lm(account~fammember, data=dat) ===== Assignment ===== 8주차 퀴즈 (2번째) 10월 25일 화A교시 범위: 처음부터 - Simple regression 까지 (e.g.2 까지) ====== Week08 ====== (Oct 21, 25) __**Mid-term period**__ 한 연구자가 Performance와 각성(arousal) 간의 관계에 대한 연구를 하였다. 연구자는 문제를 해결하는 능력을 측정하는 실험을 아래와 같이 하여, 정리하였다. {{:c:ma:2021:pasted:20211021-091855.jpeg}} {{:c:ma:2021:pasted:20211021-091425.jpeg?350}} {{:c:ma:2021:pasted:20211021-091819.jpeg?350}} ====== Week09 ====== (Oct 28, Nov 1) ===== ideas and concepts ===== 영상 * [[https://www.youtube.com/watch?v=3OUw6ZlUU9k|Partial and Semipartial Correlation]] in Multiple Regression * [[https://www.youtube.com/watch?v=lmvSW3Kemfk|Semipartial Correlation]] in Multiple Regression * [[https://www.youtube.com/watch?v=uG8VD0HYuHw|Dummy Variables]] in Multiple Regression * [[https://www.youtube.com/watch?v=Hkvohwi_Rfs|Beta Coefficient]] in Multiple Regression ---- [[:correlation]] [[:regression]] [[:multiple regression]] * [[:r:correlation|correlation in r]] * [[:r:multiple regression|multiple regression in r]] [[:Partial and semipartial correlation]] [[:using dummy variables]] [[:Statistical Regression Methods]] [[:Sequential Regression]] ===== Activity ===== [[:Multiple Regression Exercise]] ===== Assignment ===== ====== Week10 ====== (Nov 4, 8) 영상: [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]] 문서 [[:Mediation Analysis]] [[:r:Path Analysis]] in R ===== ideas and concepts ===== [[:factor analysis]] ===== Assignment ===== ====== Week11 ====== (Nov 11, 15) ===== ideas and concepts ===== 영상시청 * [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]] (요인분석) 문서 * [[:Factor Analysis]] ===== Assignment ===== ====== Week12 ====== (Nov 18, 22) ===== ideas and concepts ===== ===== Assignment ===== The 3rd Quiz * Nov. 25 (금) * 처음부터 - multiple regression, mediation analysis, path analysis * partial, semi-partial correlation * dummy variables * beta coefficient * mediation analysis * path analysis [[../factor analysis assignment]] ====== Week13 ====== (Nov 25, 29) ===== ideas and concepts ===== [[:social network analysis]] [[:r:social network analysis tutorial]] [[:r:social network analysis|sna in r]] [[:sna_eg_stanford|Stanford University egs.]] ===== announcement ===== ===== Assignment ===== ====== Week14 ====== (Dec 2, 6) {{:insurance.csv}} * [[:t-test]] * [[:ANOVA]] * [[:factorial ANOVA]] * [[:correlation]] * [[:regression]] Some R outputs will be used to ask the related concepts and ideas (the above). For the next quiz * the above + * [[:multiple regression]] * [[:partial and semipartial correlation]] * [[:using dummy variables]] * [[:factor analysis]] ====== Week15 ====== (Dec 9, 13) [[:Mediation Analysis]] ====== Week16 ====== (Dec 16, 20) __**Final-term**__ covers: 계산문제를 제외하고 어떤 상황에서 어떤 통계방법을 써야하는지에 대해서와 아웃풋을 해석하거나 아웃풋에서 답을 유추하는 문제 등은 아래 범위에서 나올 수 있습니다. t-test, ANOVA, Factorial ANOVA 그 외에 수업시간에 다룬 부분은 또한 포함합니다. correlation regression multiple regression partial and semipartial correlation using dummy variables factor analysis [[:social network analysis]] [[:r:social network analysis tutorial|sna tutorial]] [[:r:social network analysis|sna in r]] [[:sna_eg_stanford:lab06|SNA e.g. lab 06]] Some R outputs will be used to ask the related concepts and ideas (the above).