[[./|Class page]]
multivariate statistics in R
network analysis in R
* A User’s Guide to Network Analysis in R (Use R!)
* Statistical Analysis of Network Data with R (Use R!) 2014th Edition
[[https://lagunita.stanford.edu]]
[[https://campus.datacamp.com/courses/network-analysis-in-r|Network Analysis in R]] using igraph package -- from Datacamp
[[https://campus.datacamp.com/courses/marketing-analytics-in-r-statistical-modeling/|Marketing analysis in r statistics]] from Datacamp
금, 화 9시
====== Week01 ======
(Sep 2, 6)
===== ideas and concepts =====
* [[https://www.youtube.com/watch?v=YblmPrNv3sM|Installing R]]
* [[https://www.youtube.com/watch?v=Gzgk2K8inIQ|R use 1]]
* [[https://www.youtube.com/watch?v=zBJfXRlUwdI|R use 2]]
Using [[:theories]]
* [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] and
* making [[:hypothesis|hypotheses]]
Installing R
Using a data set: mtcars
===== Assignment =====
====== Week02 ======
(Sep 9, 13)
===== Concepts and ideas =====
동영상 시청. 아래 동영상은 교재의 2장 이후를 다루는 내용이면서 계산적인 통계에 대해서 공부하기 위해서 꼭 필요한 내용이므로 숙지하시기 바랍니다. 동영상이 길어서 이 부분은 3주차에도 계속 시청합니다.
* [[https://www.youtube.com/watch?v=-q1VZz7PHf8|통계: 개괄적 소개 1]]
* [[https://www.youtube.com/watch?v=Z7XMMgLLfrQ|통계: 개괄적 소개 2]]
* [[https://www.youtube.com/watch?v=dQ1CYnuU_6s|통계: 개괄적 소개 3]]
* 제2장. 여러분이 . . . = 통계관련 개념 개관
* [[:Research Question]]
* [[:Hypothesis]]
* Educated guess (via theories)
* Difference
* Association
* Variables (vs. ideas, concepts, and constructs)
* [[:Operationalization]]
* [[:Variables]],
* [[:level of measurement]]
* [[:level of measurement#Nominal]]
* [[:level of measurement#Ordinal]]
* [[:level of measurement#Interval]]
* [[:level of measurement#Ratio]]
* [[:Types of Variables]]
* see [[http://chohongjoong.com/gnu4/bbs/board.php?bo_table=board02&wr_id=311&sfl=&stx=&sst=wr_datetime&sod=desc&sop=and&page=1|this blog]] written in Korean
* [[:Independent Variable|IV]] 독립변인
* [[:Dependent Variable|DV]] 종속변인
* Control variable 제어변인
* Mediator (Intervening) variable 매개변인
* 제2장
* 통계적모형과 ([[:model]]) 적합성 (model fit)
* 간단한 예로서의 [[:mean|평균]] (mean)
* 제곱합 (오차의제곱합, 혹은 이탈의제곱합 혹은 deviation score의제곱합)
* [[:variance|분산]]
* 모집단 추정을 위해서 [[:why n-1|n-1 사용을 하는 이유]]
* [[:degrees of freedom|자유도]]
* [[:Standard Deviation|표준편차]]
* [[:z_score]]
* 샘플평균들의 집합
* [[:Sampling Distribution]] 혹은 Distribution of Sample Means
* Standard Deviation of Sample Means
* [[:Standard Error]], 표준오차
* Central Limit Theorem ([[:Central Limit Theorem]])
* 예측에서의 (평균이 어디에서 나올까의 예측) 신뢰구간
* 검정통계
$$ \text{Inferential Statistics} = \frac {\text{Effects}} {\text{Error}} $$
실제차이를 랜덤차이로 나눈 비율
{{:c:ma:2022:pasted:20220906-201156.png?340}}
\begin{eqnarray*}
s^2 & = \frac {SS}{df} \\
\sqrt{s^2} & = s
\end{eqnarray*}
===== Assignment =====
====== Week03 ======
(Sep 16, 20)
===== Activities =====
Group self-registration at [[https://eclass2.ajou.ac.kr/ultra/courses/_76280_1/cl/outline|ABB]]
Group membership adjustment
===== Concepts and ideas =====
* [[https://www.youtube.com/watch?v=cpdTptIl3Eg|분산에서 왜 n-1로 나누는가? 1 ]]
* [[https://www.youtube.com/watch?v=SZwy-cgU40E|분산에서 왜 n-1로 나누는가? 2 ]]
* [[https://www.youtube.com/watch?v=BUTvS4XVDkg|분산에서 왜 n-1로 나누는가? 3 ]]
* [[https://www.youtube.com/watch?v=YYWwmHgX4Yc|자유도]] [[:Degrees of Freedom]]
* [[https://www.youtube.com/watch?v=0O_Dkga0HgA|표준편차]] [[:Standard Deviation]]
* [[https://www.youtube.com/watch?v=mfImOa3_V1o|표준점수]] [[:Standard Score]]
* [[:Standard Error]]
* [[:Hypothesis testing]]
===== Assignment =====
Group Assignment
주제: 유튜브 댓글의 제3자효과는 어떻게 나타날까?
주제: 필터버블 효과는 어떻게 나타날까?
위의 주제로 가설을 그룹구성원의 숫자만큼 만드시오.
가설의 변인의종류와 측정수준을 말하시오.
====== Week04 ======
(Sep 23, 27)
영상
Knowledge to understand hypothesis testing
* [[https://www.youtube.com/watch?v=gmnes_O8dSM|Sampling distribution]] or Distribution of the sample mean or Distsribution of sample means
* [[:Sampling distribution]]
* [[https://www.youtube.com/watch?v=ffnQPTIwryM|Mean and variance of sampling distribution]]
* [[https://www.youtube.com/watch?v=-FehYptG-tY|Standard error and hypothesis testing]]
* [[:hypothesis testing]]
[[:t-test]]
* [[https://www.youtube.com/watch?v=3a_Opcy037k|t-test, 4 kinds of]]
* [[https://www.youtube.com/watch?v=zHxytKBNloM|types of (hypothesis testing) error]]
* [[https://www.youtube.com/watch?v=--Omqk9KHbw|t-test in R]]
----
===== Class Activity =====
out of class
* intervene --
* inter + ven(e) = between + come
* prevent
* convention
* convene
* revenue
* venue : place people to come
* convenient : to come together -> suit -> fit
* adventure : things about to happen (곧 일어날 일)
* invention : into + come : about to know : discovered
* event
----
==== Hypothesis ====
* 가설 만들어 보기
* No need to read [[:theories]]
* [[:the third person effect]]
* [[:Spiral of Silence]]
* 원 이론은 사람들은 다른 사람들의 생각, 의견에 대한 파악이
* 무의식적이지만 체계적으로 혼돈없이 잘 일어날 것을 가정한다.
* 그렇다면 이것이 온라인에서는 어떨까?
* 온라인에서 소수의 아이디어를 가진 사람이나 집단이
* 다수인 양 한다면 이것이 오프라인에 일어날 때 보다
* 더 효과적이지 않을까?
* 위의 생각에 기반한 가설은 어떻게 세울 수 있을까?
* [[:cognitive dissonance]]
* Read [[:hypothesis]]
* [[http://behavioralsciencewriting.blogspot.kr/2011/09/how-to-write-hypothesis.html|how to write hypothesis]] at behavioral science writing.
* One sample hypothesis [[http://www.socialresearchmethods.net/kb/hypothes.php|Hypothesis]] at www.socialresearchmethods.net
* Is your hypothesis based on your research on a topic?
* Can your hypothesis be tested?
* Does your hypothesis include independent and dependent variables?
from https://www.verywellmind.com/what-is-a-hypothesis-2795239
* kinds of hypothesis
* Identifying IV and DV (and Intervening Variable)
* measurement ([[:operationalization]] :: 조작화)
* Students who eat breakfast will perform better on a math exam than students who do not eat breakfast
* Identify and its level of measurement (lom, 측정수준):
* IV
* IV's lom
* DV
* DV's lom
{{:c:ma:2022:pasted:20220920-084047.png}}
{{:c:ma:2022:pasted:20220920-084213.png}}
{{:c:ma:2022:pasted:20220920-084249.png}}
in [[https://koreascience.kr/article/JAKO201028552429564.pdf]]
===== Concepts and ideas =====
===== Assignment =====
Assignment for all
* Read [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설]]
* Read [[:research question]]
* Read [[:hypothesis]]
Group assignment 1 (ma.22.w04.ga.id.var)
* 파일로 과제를 제출할 경우, ma.22.w04.ga.id.g그룹번호.docx 와 (예, ma.21.w04.ga.id.g02.odc) 같이 제출하세요.
* [[:Hypothesis]] 문서의 [[:hypothesis#예]]의 "제3자 효과이론과 침묵의 나선이론 연계성" 논문을 읽고 가설을 기술하시오.
* 각 가설의 독립변인(Independent variables), 종속변인 (dependent variables) 등을 나열하시오.
* 이 논문에 사용된 이론은 무엇인지 기술하고 설명하시오.
Group assignment 2 (ma.22.w04.ga.making.ttest.h)
가설 만들어 보기
t-test (ma.22.w04.ga.making.ttest.h) -- t-test 동영상 시청을 마치고 하세요.
* 파일제출시에는 ma.22.w04.ga.making.ttest.h.g10.docx와 같이 하세요.
* 모집단 평균과 표준편차를 알고 있을 경우의 가설
* 두번째 종류는 생략
* 모집단의 파라미터를 모르는 두 집단의 평균과 표준편차만을 알고 있을 경우의 가설
* 반복측정 가설
====== Week05 (Sep 30, Oct 4) ======
===== ideas and concepts =====
영상
* [[https://www.youtube.com/watch?v=sK02oxyItHc|ANOVA (F-test) 원리]]
* [[https://www.youtube.com/watch?v=DP4rCJdnD4c|ANOVA post-hoc test와 R에서의 예]]
* [[https://www.youtube.com/watch?v=rQIQ-P_VQHU|Factorial ANOVA]]
* [[https://www.youtube.com/watch?v=Uz_DYDlEPEc|Factorial ANOVA 예 (R 포함)]]
문서 + 텍스트
* [[:ANOVA]]
* [[:Factorial ANOVA]]
===== Assignment =====
Group assignment 2 (w05.ga.finding.r.articles)
* Read
* [[:Hypothesis]],
* [[:Types of Variables]],
* [[:Level of Measurement]],
* [[:Operationalization]]
* 그룹의 관심사에 어울리는 F-test 가설을 만드시오
* ma.22.ga.w05.mk.anova.hyp
* 첫번째 가설은 One-way ANOVA
* 두번째 가설은 Two-way ANOVA
* 세번째 가설은 One-way repeated measure ANOVA 가설이어야 합니다.
* 각 가설은 제시되면서 그 근거가 간단히 설명되어야 합니다.
* IV, DV를 밝히고, 각 변인이 어떻게 측정되었는지 (될 것인지) 밝히시오.
* 9일까지 완성, 제출하세요
====== Week06 ======
(Oct 7, 11)
첫번째 퀴즈
* 10월 7일
* 오픈시간: 9:00-3:00
* 퀴즈시간: 약 60-70분 (바뀔 수 있습니다)
* 퀴즈문제: 약 50문제 (바뀔 수 있습니다)
* 범위: 처음부터 - 5주차 반까지; 그리고 교재 제2장까지
* 5주차 반까지란? ANOVA와 Post hoc test 까지 (즉, Factorial ANOVA와 예 제외)
* 10월 7일 온라인 미팅 없습니다.
* [[sample questions]]
===== ideas and concepts =====
===== Assignment =====
- Public opinion in online environments ((refer to {{:public.opinion.theories.introduction.pdf}} ))
* [[:Spiral of Silence]]
* [[:Pluralistic Ignorance]]
* [[:The Third Person Effect]]
* etc. 여론형성과 관련된 사회학적 혹은 사회심리학적 이론을 찾아보고 소개하기, 예로 위의 세가지. 얼마전 사회현상을 어떻게 설명하면 좋을까에 대해서 논의정리하기? 정확한 온라인 환경에서의 여론파악을 위해서 어떤 것이 필요할까?
* 혹은 다른 문제에 대해서 (. . . 조에 따른 . . .)
- Hypotheses
* Multiple regression hypotheses.
* Google Survey Questions
====== Week07 ======
(Oct 14, 18)
영상 시청 (8주차까지 볼 동영상입니다)
* [[https://www.youtube.com/watch?v=4XLkoalGkms |Variance and Covariance]]
* [[https://www.youtube.com/watch?v=9iRb7hBUjSU |Correlation (r) and Regression Analysis]]
* [[https://www.youtube.com/watch?v=sXZ3yzJVbRo |Simple Regression e.g.1]]
* [[https://www.youtube.com/watch?v=CbV-a5uL8OQ |Simple Regression e.g.2]]
* [[https://www.youtube.com/watch?v=Dc67qlz1yKM |Multiple Regression, Intro]]
* [[https://www.youtube.com/watch?v=n9sainZvAqA |Multiple Regression, e.g ]]
===== ideas and concepts =====
[[:correlation]]
[[:regression]]
[[:multiple regression]]
* [[:r:correlation|correlation in r]]
* [[:r:multiple regression|multiple regression in r]]
----
이하는 다음 주에
[[:Partial and semipartial correlation]]
[[:using dummy variables]]
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
===== Activity =====
* 데이터 불러오기
dat <- read.csv("http://commres.net/wiki/_media/regression01-bankaccount.csv")
* 살피기 ''str(dat)''
* 가설만들기 : 독립변인으로 fammember를, 종속변인으로 account를 (통장갯수를)
* ?
* 변인관련 실습
* DV의 SS 값은 무엇인가?
* DV의 df 값은 무엇인가?
* DV의 Variance는 무엇인가?
* IV와 DV의 Covariance 구하기
* SP?
* df?
* correlation coefficient값은?
* SSreg 값은?
* SSres 값은?
* r square 값은?
* F test 값은?
* Regression test
dat.lm <- lm(account~fammember, data=dat)
===== Assignment =====
8주차 퀴즈 (2번째)
10월 25일 화A교시
범위: 처음부터 - Simple regression 까지 (e.g.2 까지)
====== Week08 ======
(Oct 21, 25)
__**Mid-term period**__
한 연구자가 Performance와 각성(arousal) 간의 관계에 대한 연구를 하였다. 연구자는 문제를 해결하는 능력을 측정하는 실험을 아래와 같이 하여, 정리하였다.
{{:c:ma:2021:pasted:20211021-091855.jpeg}}
{{:c:ma:2021:pasted:20211021-091425.jpeg?350}}
{{:c:ma:2021:pasted:20211021-091819.jpeg?350}}
====== Week09 ======
(Oct 28, Nov 1)
===== ideas and concepts =====
영상
* [[https://www.youtube.com/watch?v=3OUw6ZlUU9k|Partial and Semipartial Correlation]] in Multiple Regression
* [[https://www.youtube.com/watch?v=lmvSW3Kemfk|Semipartial Correlation]] in Multiple Regression
* [[https://www.youtube.com/watch?v=uG8VD0HYuHw|Dummy Variables]] in Multiple Regression
* [[https://www.youtube.com/watch?v=Hkvohwi_Rfs|Beta Coefficient]] in Multiple Regression
----
[[:correlation]]
[[:regression]]
[[:multiple regression]]
* [[:r:correlation|correlation in r]]
* [[:r:multiple regression|multiple regression in r]]
[[:Partial and semipartial correlation]]
[[:using dummy variables]]
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
===== Activity =====
[[:Multiple Regression Exercise]]
===== Assignment =====
====== Week10 ======
(Nov 4, 8)
영상: [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]]
문서
[[:Mediation Analysis]]
[[:r:Path Analysis]] in R
===== ideas and concepts =====
[[:factor analysis]]
===== Assignment =====
====== Week11 ======
(Nov 11, 15)
===== ideas and concepts =====
영상시청
* [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]] (요인분석)
문서
* [[:Factor Analysis]]
===== Assignment =====
====== Week12 ======
(Nov 18, 22)
===== ideas and concepts =====
===== Assignment =====
The 3rd Quiz
* Nov. 25 (금)
* 처음부터 - multiple regression, mediation analysis, path analysis
* partial, semi-partial correlation
* dummy variables
* beta coefficient
* mediation analysis
* path analysis
[[../factor analysis assignment]]
====== Week13 ======
(Nov 25, 29)
===== ideas and concepts =====
[[:social network analysis]]
[[:r:social network analysis tutorial]]
[[:r:social network analysis|sna in r]]
[[:sna_eg_stanford|Stanford University egs.]]
===== announcement =====
===== Assignment =====
====== Week14 ======
(Dec 2, 6)
{{:insurance.csv}}
* [[:t-test]]
* [[:ANOVA]]
* [[:factorial ANOVA]]
* [[:correlation]]
* [[:regression]]
Some R outputs will be used to ask the related concepts and ideas (the above).
For the next quiz
* the above +
* [[:multiple regression]]
* [[:partial and semipartial correlation]]
* [[:using dummy variables]]
* [[:factor analysis]]
====== Week15 ======
(Dec 9, 13)
[[:Mediation Analysis]]
====== Week16 ======
(Dec 16, 20)
__**Final-term**__ covers:
계산문제를 제외하고 어떤 상황에서 어떤 통계방법을 써야하는지에 대해서와 아웃풋을 해석하거나 아웃풋에서 답을 유추하는 문제 등은 아래 범위에서 나올 수 있습니다.
t-test, ANOVA, Factorial ANOVA
그 외에 수업시간에 다룬 부분은 또한 포함합니다.
correlation
regression
multiple regression
partial and semipartial correlation
using dummy variables
factor analysis
[[:social network analysis]]
[[:r:social network analysis tutorial|sna tutorial]]
[[:r:social network analysis|sna in r]]
[[:sna_eg_stanford:lab06|SNA e.g. lab 06]]
Some R outputs will be used to ask the related concepts and ideas (the above).