https://bit.ly/3K61enT
아래는 미디어통계 줌미팅 스케쥴입니다. 참조하세요. 수업등록한 학생은 아주비비의 줌링크를 이용하면 확실합니다. 미등록학생 중 수업에 관심이 있는 학생은 아주비비 접속을 할 수 없으므로 아래 링크를 통해서 수업참관을 하시고 정정요청을 하시기 바랍니다.
Hyo Kim이(가) 예약된 Zoom 회의에 귀하를 초대합니다.
주제: DGMD231_ 미디어통계(M031-1)
시간: 2022년 3월 3일 10:20 오전 서울
매주 월, 목에, 2022년 6월 20일 까지, 32개 되풀이 항목
2022년 3월 3일 10:20 오전
2022년 3월 7일 10:20 오전
2022년 3월 10일 10:20 오전
2022년 3월 14일 10:20 오전
2022년 3월 17일 10:20 오전
2022년 3월 21일 10:20 오전
2022년 3월 24일 10:20 오전
2022년 3월 28일 10:20 오전
2022년 3월 31일 10:20 오전
2022년 4월 4일 10:20 오전
2022년 4월 7일 10:20 오전
2022년 4월 11일 10:20 오전
2022년 4월 14일 10:20 오전
2022년 4월 18일 10:20 오전
2022년 4월 21일 10:20 오전
2022년 4월 25일 10:20 오전
2022년 4월 28일 10:20 오전
2022년 5월 2일 10:20 오전
2022년 5월 5일 10:20 오전
2022년 5월 9일 10:20 오전
2022년 5월 12일 10:20 오전
2022년 5월 16일 10:20 오전
2022년 5월 19일 10:20 오전
2022년 5월 23일 10:20 오전
2022년 5월 26일 10:20 오전
2022년 5월 30일 10:20 오전
2022년 6월 2일 10:20 오전
2022년 6월 6일 10:20 오전
2022년 6월 9일 10:20 오전
2022년 6월 13일 10:20 오전
2022년 6월 16일 10:20 오전
2022년 6월 20일 10:20 오전
다음 iCalendar(.ics) 파일을 다운로드하고 일정 시스템으로 가져오십시오.
매주: https://ajou-ac-kr.zoom.us/meeting/tZcqcOGgqDorEte9fiPae9jzslKv-qAdjOQe/ics?icsToken=98tyKuGrqTwiEtKUsRGERpwqB4_CWfzwpn5cj7dYxRnsMyFWOwnsJe5pJP9uMdza
Zoom 회의 참가
https://ajou-ac-kr.zoom.us/j/83778861183?pwd=NjAyWTRXMGRRdCtGR2xlZnhrbnlnQT09
회의 ID: 837 7886 1183
암호: 649200
통계에 대한 기초적인 이해
가설과 가설검증
* 가설의 종류와 그 종류에 따른 통계분석법
* z-test
* t-test
* ANOVA
* Factorial ANOVA
* correlation
* regression
* multiple regression
* factor analysis
* . . .
* 위를 위해서 꼭 이해해야 할 것들
* Variance
* Standard Deviation
* Standard Error (Standard Deviation of Sample Means)
* Hypothesis Testing
R Cookbook
[[:b:r cookbook:getting_started|Chapter 1 Getting Started and Getting Help]]
[[:b:r cookbook:basics|Chapter 2 Some Basics]]
[[:b:r cookbook:navigating|Chapter 3 Navigating the Software]]
[[:b:r cookbook:input output|Chapter 4 Input and Output]]
[[:b:r cookbook:data structures|Chapter 5 Data Structures]]
[[:b:r cookbook:data transformations|Chapter 6 Data Transformations]]
[[:b:r cookbook:strings and dates|Chapter 7 Strings and Dates]]
[[:b:r cookbook:probability|Chapter 8 Probability]]
[[:b:r cookbook:general statistics|Chapter 9 General Statistics]]
[[:b:r cookbook:graphics|Chapter 10 Graphics]]
[[:b:r cookbook:linear regression and ANOVA|Chapter 11 Linear Regression and ANOVA]]
[[:b:r cookbook:useful tricks|Chapter 12 Useful Tricks]]
[[:b:r cookbook:beyond basic numerics and statistics|Chapter 13 Beyond Basic Numerics and Statistics]]
[[:b:r cookbook:times series analysis|Chapter 14 Time Series Analysis]]
[[../2018|이전 페이지]]
====== Week01 ======
Course Introduction --> [[../2021|syllabus]]
===== ideas and concepts =====
수업 서베이 있습니다. 서베이참여 필요.
* [[https://bit.ly/3a96nd2|Class survey 참여]]: 조별활동과 연구주제에 대한 결정과 관련하여 첫 시간에 클래스서베이를 진행합니다. 참여할 [[https://bit.ly/3a96nd2|서베이 주소]]는 https://bit.ly/3a96nd2 입니다. 서베이주소에 걸린 링크를 클릭하셔도 됩니다.
동영상 (R 관련)
* [[https://youtu.be/6ExajWI_r2w]] 수업소개
* [[https://youtu.be/J8e5dEH8K_Q]] 서베이 참여 설명
* [[https://youtu.be/KYQFY8c2ePI]] R 과 R studio 인스톨
* [[https://youtu.be/qCeTcvWBDNY]] R studio 기초 설명
Introduction to R and others
- Downloading and Installing R
- [[:the_r_project_for_statistical_computing]]
- [[:r]], [[:r:getting started]]
- Starting R
- Entering Commands
- Exiting from R
- Interrupting R
- Viewing the Supplied Documentation
- Getting Help on a Function
- Searching the Supplied Documentation
- Getting Help on a Package
- Searching the Web for Help
- Finding Relevant Functions and Packages
- Searching the Mailing Lists
- Submitting Questions to the Mailing Lists
동영상 (통계관련 샘플링에 대한 설명)
*[[https://youtu.be/1hJm0O-RY4Q]] Sampling 과 관련된 아이디어와 용어 설명
기본용어
기술통계 ([[:descriptive statistics]])
추론통계 ([[:inferential statistics]])
아래의 개념은 [[:sampling|샘플링]] 문서를 먼저 볼것
* 전집 ([[:population]])
* 표본 ([[:sample]])
* 모수치 ([[:sampling#parameter_statistics|parameter]])
* 통계치 ([[:sampling#parameter_statistics|statistics]])
* sampling methods
* probability
* non-probability
가설 ([[:hypothesis]])
* 차이와 연관 (difference and association)
변인 ([[:variables]])
* [[:types of variables]]
* [[:level of measurement]]
===== Assignment =====
====== Week02 ======
===== Concepts and ideas =====
[[:Sampling]]
[[:Hypothesis|가설]]
[[https://youtu.be/k1sdZtdeDu0|지난 동영상 리캡 및 가설에 대한 소개]]
[[https://youtu.be/gLWjVDl2_6o|가설에 대한 소개 및 설명]]
[[https://youtu.be/Q9cradIrY2M|가설이 만들어지는 이유]]
[[https://youtu.be/hvTnKaX6wSg|가설의 예]]
[[https://youtu.be/eno5USKD34U|변인의 종류와 변인측정의수준]]
Some [[:b:r cookbook:basics|basics]]
- Introduction
- Printing Something
- Setting Variables
- Listing Variables
- Deleting Variables
- Creating a Vector
- Computing Basic Statistics
- Creating Sequences
- Comparing Vectors
- Selecting Vector Elements
- Performing Vector Arithmetic
- Getting Operator Precedence Right
- Defining a Function
- Typing Less and Accomplishing More
- Avoiding Some Common Mistakes
----
from the previous lecture (research question and hypothesis)
* [[:Research Question]]s (or Problems)
* Two ideas guided by theories
* Questions on their relationships
* Conceptualization
* [[:Hypothesis]]
* Educated guess (via theories)
* Difference
* Association
* [[:Variables]] (vs. ideas, concepts, and constructs)
* [[:Operationalization]]
* [[:Types of Variables]]
* [[:Independent Variable|IV]]
* [[:Dependent Variable|DV]]
* Control variable
* Mediating (Intervening) variable
* [[:Level of Measurement]]
===== Assignment =====
====== Week03 ======
[[./groups#fin_grouping|그룹핑]] 최종
* [[https://docs.google.com/forms/d/e/1FAIpQLSeWbweTONo5BkR5HEsfEH9D6nzdFsa8TmeN4jxJKWtRF6hs_g/viewform|class survey]] on meeting schedule
3주차 온라인 강의 동영상은 4주에 걸쳐서 보시기 바랍니다. 즉, 4주 중에 따로 동영상 올리지 않습니다.
* [[https://www.youtube.com/watch?v=nluWkZZ8zM8| MS the 3rd Week 012: the Basic (R cookbook)]] 32:00
* [[https://www.youtube.com/watch?v=IEr7MM4vpEU| MS the 3rd Week 013: Navigating the R]] 12:31
* [[https://www.youtube.com/watch?v=TPSApVNCM_c| MS the 3rd Week 014: Mean, Median, Mode (Howell, Ch. 4 Part)]] 16:17
* https://youtu.be/JvpOJPCBQkQ : R cookbook: data structure
-----
* [[https://youtu.be/_ynGzFFmm7U]] Howell Ch 4. Variance 01: Introduction (DS, error, and SS)
* [[https://youtu.be/HugtyhU7Im8]] Howell Ch. 4. Variance 02: Variance for sample and n-1
* [[https://youtu.be/RE6DSk1DcJI]] 왜 분산에는 n-1을 사용하는가? (직관적인 이해)
* [[https://youtu.be/PrPoOCW3v1s]] n-1 증명
* [[https://youtu.be/Ssznnbdj5Lg]] Degrees of freedom
* [[https://youtu.be/valhVpf-haY]] Standard deviation
-----
Howell, Ch. 4 내용 중 [[:Variance]]와 (분산) [[:Standard deviation]]은 (표준편차는) 이후 통계 검증방법을 이해하는데 기초가 되는 중요한 내용이니 꼭 숙지하시기 바랍니다.
===== Concepts and ideas =====
[[:b:r cookbook:navigating|Navigating]] software
- Introduction
- Getting and Setting the Working Directory
- Saving Your Workspace
- Viewing Your Command History
- Saving the Result of the Previous Command
- Displaying the Search Path
- Accessing the Functions in a Package
- Accessing Built-in Datasets
- Viewing the List of Installed Packages
- Installing Packages from CRAN
- Setting a Default CRAN Mirror
- Suppressing the Startup Message
- Running a Script
- Running a Batch Script
- Getting and Setting Environment Variables
- Locating the R Home Directory
- Customizing R
[[:Mean]]
[[:Mode]]
[[:Median]]
[[:Variance]]
[[:Standard Deviation]]
+-1 sd = 68% = +-1 sd
+-2 sd = 95% = +-1.96 sd
+-3 sd = 99% (99.7%) = +-3 sd
표준점수 (unit with a standard deviation) = [[:z score]]
[[:Sampling distribution]] via random [[:sampling]]
[[:Central Limit Theorem]]
===== Assignment =====
====== Week04 ======
{{hypothesis.test.R}}
===== Class Activity =====
문서
* [[:Sampling]]
* [[:Hypothesis]]
* [[:Variables]]
* [[:Types of Variables]]
* [[:Level of Measurement]]
* [[:Operationalization]]
* [[:Conceptualization]]
* [[:Mean]], [[:Median]], [[:Mode]]
* [[:Variance]], [[:Standard Deviation]]
* [[:Sampling Distribution]]
* [[:Central Limit Theorem]]
* [[:Sampling Distribution in R]]
동영상 시청
* https://youtu.be/Qaxj6LZ-iL0 : sampling distribution
* https://youtu.be/0RZJbZtzs6s : sampling distribution e.g. in R
* https://youtu.be/AbeIQvJJ5Vw : mean and variance (standard deviation) in sampling distribution (샘플평균들의 집합에서의 평균과 분산 (표준편차))
* https://youtu.be/zFdbt2XoeM4 : CLT (central limit theorem) and standard error 중심극한정리와 표준오차
* https://youtu.be/Udp-4MLAlvc : Testing hypothesis based on CLT principle CLT에 근거를 둔 가설의 검증
* [[:sampling distribution in r]]
Lecture materials for this week
===== Concepts and ideas =====
[[:b:r cookbook:input_output|Input and output]]
- Introduction
- Entering Data from the Keyboard
- Printing Fewer Digits (or More Digits)
- Redirecting Output to a File
- Listing Files
- Dealing with “Cannot Open File” in Windows
- Reading Fixed-Width Records
- Reading Tabular Data Files
- Reading from CSV Files
- Writing to CSV Files
- Reading Tabular or CSV Data from the Web
- Reading Data from HTML Tables
- Reading Files with a Complex Structure
- Reading from MySQL Databases
- Saving and Transporting Objects
===== Assignment =====
다음 주차 (제5주차) 월요일 시간 (두번째 시간) 퀴즈 있습니다.
퀴즈 범위는
* 5주차까지 언급된 모든 동영상
* R 과 관련해서는 동영상 내용만 포함합니다.
* 시험문제는 4지선다 혹은 단답식 답입니다.
* 문제는 모두 50문제 정도이고 오픈북 상태에서의 시험이므로 50분정도의 제한시간을 둡니다. 즉, 일단 시작한 시험은 50분 후에 닫힙니다. 시험문제 수와 시간은 바뀔 수 있습니다.
* 시험문제는 월요일 10시반부터 6시까지 오픈될 예정입니다. 일단 시작된 시험은 제한시간 내에 풀어야 합니다.
====== Week05 ======
===== Announcement Quiz 01 =====
===== Concepts and ideas =====
이번 주 동영상
* https://youtu.be/hX0mbKm6M4s : z-test (z 테스트)
* https://youtu.be/06xTY1cVtb8 : z score (표준점수)
* https://youtu.be/aG8X6EUu7xI : probability in R (R에서의 확률분포함수들)
* [[:Hypothesis testing]]
* [[:z-test]]
* r 에서 qnorm(proportion) pnorm(z-score) function 이해 필요
* [[:z_score]] 참조
* [[:types of error]]
[[:b:r cookbook:Data Structures]]
- Introduction
- Appending Data to a Vector
- Inserting Data into a Vector
- Understanding the Recycling Rule
- Creating a Factor (Categorical Variable)
- Combining Multiple Vectors into One Vector and a Factor
- Creating a List
- Selecting List Elements by Position
- Selecting List Elements by Name
- Building a Name/Value Association List
- Removing an Element from a List
- Flatten a List into a Vector
- Removing NULL Elements from a List
- Removing List Elements Using a Condition
- Initializing a Matrix
- Performing Matrix Operations
- Giving Descriptive Names to the Rows and Columns of a Matrix
- Selecting One Row or Column from a Matrix
- Initializing a Data Frame from Column Data
- Initializing a Data Frame from Row Data
- Appending Rows to a Data Frame
- Preallocating a Data Frame
- Selecting Data Frame Columns by Position
- Selecting Data Frame Columns by Name
- Selecting Rows and Columns More Easily
- Changing the Names of Data Frame Columns
- Editing a Data Frame
- Removing NAs from a Data Frame
- Excluding Columns by Name
- Combining Two Data Frames
- Merging Data Frames by Common Column
- Accessing Data Frame Contents More Easily
- Converting One Atomic Value into Another
- Converting One Structured Data Type into Another
===== Assignment =====
====== Week06 ======
===== Concepts and ideas =====
동영상
* t-test
* https://youtu.be/Eje8lR8EXPc t-test: Intro
* https://youtu.be/BL9TZbDUVWg t-test: One sample t-test
* https://youtu.be/E7QUCYRcbM0 t-test: Independent samples t-test; repeated measure t-test 일부
* https://youtu.be/CV-DY9xdxtc t-test: Repeated measure t-test 계속
* 관련 문서: [[:t-test]]
* [[:r:t-test|t-test in r]]
* r 에서, qt(proportion, df), pt(t-score, df) function 이해 필요
* [[:r/probability?s[]=qnorm]] 참조
[[:b:r_cookbook:probability|Probability calculation in R]] <- Probability in R cookbook (텍스트북)
또한 R에서 데이터를 (테이블 혹은 어레이) 이용하여 function을 적용하는 것에 대해서 잘 익혀두시기 바랍니다. 이는 R cookbook의 아래 내용에 해당이 됩니다 (특히 sapply, tapply, by 등)
[[:b:r cookbook:Data Transformations]]
- Introduction
- Splitting a Vector into Groups
- Applying a Function to Each List Element
- Applying a Function to Every Row
- Applying a Function to Every Column
- Applying a Function to Groups of Data
- Applying a Function to Groups of Rows
- Applying a Function to Parallel Vectors or Lists
Strings and Dates
===== Announcement =====
===== Activities =====
조별활동:
각 조는 아래를 돌려보고 그 결과를 그룹저널에 기록하시오.
그리고 왜 이와 같은 결과가 나왔는지를 설명하시오.
set.seed(101)
s1.n <- 1600
s1 <- rnorm(s1.n, 102, 15)
s1.m <- mean(s1)
s1.m
s1.sd <- sd(s1)
s1.sd
p.mu <- 100
p.sd <- 15
t.test(s1, mu=p.mu)
set.seed(101)
s2.n <- 50
s2 <- rnorm(50, 102, 15)
s2.m <- mean(s2)
s2.m
s2.sd <- sd(s2)
s2.sd
p.mu <- 100
p.sd <- 15
t.test(s2, mu=p.mu)
====== Week07 ======
===== Concepts and ideas =====
7주차 동영상
ANOVA
* https://youtu.be/bNK5iIjAoHI : Intro to ANOVA (F-test)
* https://youtu.be/L9ns0vuvWJ8 : principles of ANOVA
* https://youtu.be/xOixsz4Qkz0 : ANOVA, calculation based on the priciple
* https://youtu.be/kyVXFS3jts4 : post-hoc test / t-test vs. ANOVA
위키페이지 참조
* [[:ANOVA]]
* [[:Factorial ANOVA]]
* [[:repeated measures anova]]
[[:b:r cookbook:Probability]]
- Introduction
- Counting the Number of Combinations
- Generating Combinations
- Generating Random Numbers
- Generating Reproducible Random Numbers
- Generating a Random Sample
- Generating Random Sequences
- Randomly Permuting a Vector
- Calculating Probabilities for Discrete Distributions
- Calculating Probabilities for Continuous Distributions
- Converting Probabilities to Quantiles
- Plotting a Density Function
===== Assignment =====
----
* 가설 만들어 보기
* t-test를 할 수 있는 가설
* ANOVA 테스트를 할 수 있는 가설
* 각 가설에 대해서
* IV, DV를 밝힐 것
* 측정수준을 설명할 것
===== 8주차 퀴즈 =====
* 25일 월요일 10시반 오픈됩니다.
* 모두 같은 시간에 봅니다.
* 퀴즈제한시간은 60-75분입니다.
* 현재까지는 50-60문제입니다.
* 퀴즈문제가 조정되어 추가되거나 감소되면 시간이 조금 변할 수 있습니다.
* 범위는 첫번재 퀴즈 범위 더하기 6, 7주차 내요입니다.
====== Week08 ======
시험기간
보강영상 수업
====== Week09 ======
===== Concepts and ideas =====
9주차 동영상
* https://youtu.be/IpuyWhk1R9g : Factorial ANOVA
* https://youtu.be/UuJhej1eJJI : Factorial ANOVA by hand
* https://youtu.be/rl6zs1lK0BE : Factorial ANOVA egs.
[[:Factorial ANOVA]]
R script: https://github.com/hkimscil/ms/blob/main/anova.R
[[:r:anova]] in R
[[:b:r cookbook:General Statistics]]
- Introduction
- Summarizing Your Data
- Calculating Relative Frequencies
- Tabulating Factors and Creating Contingency Tables
- Testing Categorical Variables for Independence
- Calculating Quantiles (and Quartiles) of a Dataset
- Inverting a Quantile
- Converting Data to Z-Scores
- Testing the Mean of a Sample (t Test)
- Forming a Confidence Interval for a Mean
- Forming a Confidence Interval for a Median
- Testing a Sample Proportion
- Forming a Confidence Interval for a Proportion
- Testing for Normality
- Testing for Runs
- Comparing the Means of Two Samples
- Comparing the Locations of Two Samples Nonparametrically
- Testing a Correlation for Significance
- Testing Groups for Equal Proportions
- Performing Pairwise Comparisons Between Group Means
- Testing Two Samples for the Same Distribution
vene . . . go or come
intervene
* intervenient
convene
* convention
* convent
* convenient
contravene
prevent
advent
circumvent
===== Assignment =====
====== Week10 ======
===== Concepts and ideas =====
10주차 동영상입니다.
동영상 (총 5 개)
* https://youtu.be/vwxdhllHM-8 : Repeated Measures ANOVA, Intro
* https://youtu.be/L_jzB650Llo : Repeated Measures ANOVA in R
----
* https://youtu.be/Cj7mxGBrIU8 : Correlations 01
* https://youtu.be/oYKFeuAn140 : Correlations 02
* https://youtu.be/aHdb4j3ybX8 : Spearman (Rank ordered) Correlation
[[:repeated measure ANOVA]]
[[:correlation]]
===== Assignment =====
과제 . . . .
__ms.ga.w10.doing.anova.groupID__
* 아주비비에 그룹제출 제시되어 있음
* 목요일까지 제출 (May 12)
* R에 탑재되어 있는 데이터 중의 하나는 ToothGrowth이다. 이 데이터는 기니아피그의 이빨길이를 측정한 것인데 비타민 C를 먹인 효과를 보는 것이다. 데이터에 대한 설명은 ?ToothGrowth 로 살펴볼 수 있다.
* 비타민의 효과에 대한 ANOVA를 (oneway ANOVA) 수행하고 그 스크립트와 결과를 카피하여 그룹과제에 올리고 분석한 결과를 설명하시오. 분석 결과에는
* 가설
* 스크립트
* 아웃풋
* 해석이 포함되어야 합니다.
* 비타민과 복용량의 효과에 대한 factorial ANOVA를 수행하고 그 스크립트와 결과를 카피한 후, 그룹 과제에 올리고 분석하시오. 결과에는
* 가설과
* 스크립트 (명령어)
* 아웃풋
* 해석이 포함되어야 합니다.
* 과제는 fixed-width font로 쓰여져야 합니다 (예를 들면, courier new).
* 그룹과제로 올린 후 목요일 9시에 모여서 그 과제를 토론 댓글로 올립니다.
* https://eclass2.ajou.ac.kr/webapps/discussionboard/do/message?action=list_messages&course_id=_73948_1&nav=discussion_board_entry&conf_id=_86013_1&forum_id=_90448_1&message_id=_338591_1
====== Week11 ======
===== Concepts and ideas =====
동영상 Regression
- https://youtu.be/68gho4ubOjs : Regression 1. Intro
- https://youtu.be/qXSRgSh1rw0 : Regression 2. e.g. 1
- https://youtu.be/I8wt2W7-Iio : Regression 3. e.g. 2
----
[[:regression]]
[[:multiple regression]]
[[:using dummy variables]]
[[:chi-square test]]
[[:b:r cookbook:probability]]
[[:b:r cookbook:general statistics]]
[[:r:getting started]]
[[:b:r cookbook:basics]]
[[:b:r cookbook:navigating]] in r
[[:b:r cookbook:input output]] in r
[[:b:r cookbook:data structures]]
[[:b:r cookbook:data transformations]]
----
[[r:graphics|Graphics]]
- Introduction
- Creating a Scatter Plot
- Adding a Title and Labels
- Adding a Grid
- Creating a Scatter Plot of Multiple Groups
- Adding a Legend
- Plotting the Regression Line of a Scatter Plot
- Plotting All Variables Against All Other Variables
- Creating One Scatter Plot for Each Factor Level
- Creating a Bar Chart
- Adding Confidence Intervals to a Bar Chart
- Coloring a Bar Chart
- Plotting a Line from x and y Points
- Changing the Type, Width, or Color of a Line
- Plotting Multiple Datasets
- Adding Vertical or Horizontal Lines
- Creating a Box Plot
- Creating One Box Plot for Each Factor Level
- Creating a Histogram
- Adding a Density Estimate to a Histogram
- Creating a Discrete Histogram
- Creating a Normal Quantile-Quantile (Q-Q) Plot
- Creating Other Quantile-Quantile Plots
- Plotting a Variable in Multiple Colors
- Graphing a Function
- Pausing Between Plots
- Displaying Several Figures on One Page
- Opening Additional Graphics Windows
- Writing Your Plot to a File
- Changing Graphical Parameters
===== Assignment =====
과제명: ms.22.w11.ga.covariance.exercise
제출파일명: ms22.w11.ga.covariance.exercise.group##.odc (docx)
과제내용:
아래 데이터를 다운로드 받아서 두 변인 간의 상관관계계수를 구하시오.
{{:income.happiness.csv}}
데이터는 수입과 행복을 측정한 것입니다. 실제 데이터를 살펴보고 R로 읽어 온 후에 R을 이용하여 아래를 구하시오. R에서의 명령어와 아웃풋을 카피/패이스트 하여 제출하시오 (fixed-font를 사용하여).
* 각 변인의 deviation score 값을 구하여 ds.inc 와 ds.hap 에 저장하시오.
* 두 변인의 SP값을 (Sum of Product) 구하여 sp.dat 에 저장하시오.
* 두 변인의 df값을 구하여 df.dat 에 저장하시오.
* 두 변인간 covariance값을 r의 cov 명령어를 이용하여 구하여 cov.dat값에 저장하시오.
* sp.dat / df.dat 값을 구하여 cov.cal 값에 저장하시오.
* cov.cal 과 cov.dat 값이 같은지 비교하시오. (힌트: ''=='' 연산자를 이용하여 확인하시오)
* 각 변인의 standard deviation 값을 구하여 sd.inc, sd.hap에 저장하시오
* 우리가 배운 correlation값을 구하는 공식에 따라서 r 값을 구해서 r.cal 에 저장하시오.
* R의 cor 명령어를 이용하여 correlation coefficient값을 구하여 r.dat 에 저장하시오.
* r.cal 과 r.dat 을 비교하시오.
월요일 수업 전까지 (11주차 2번째 시간 전) 완성하여 제출하세요.
ms.22.w11.ga.diff.main.effect
* 파일로 제출할 경우 파일명은 ms.22.w11.ga.diff.main.effect.group01.odc와 (or .docx) 같이 해서 제출하시오.
* 지난 주 과제에서 종속변인에 대해 (len) 독립변인을 (supp) ANOVA 분석했을 때, 독립변인의 효과가 없다고 나타났다 (즉, 두 그룹 간에 차이가 있다고 밝히는데 실패하였다). 그런데, 같은 변인을 (supp) 다른 독립변인과 (dose) 동시에 고려하여 two way ANOVA 분석을 하였을 때에는 len의 효과가 있는 것으로 분석결과가 나왔다. 왜 이런 분석의 차이가 나타났는지 설명하시오.
====== Week12 ======
===== Concepts and ideas =====
https://docs.google.com/forms/d/19zYMy5OAWCh-Sh2Hn-karoE1aMAY7nLbxpGy4khQcoI
https://docs.google.com/forms/d/1FhvP-2oVgxSoz26GQB0AjVaAm9sJu2SuVmF1Pvl2sSA
영상
* https://youtu.be/LOEinkXaskA : Multiple Regression 01 Intro.
* https://youtu.be/v6LswXPvEWY : Multiple Regression 03 Interpreting ivs
* https://youtu.be/3OUw6ZlUU9k : Parital and semipartial correlations
* https://youtu.be/n9sainZvAqA : Multiple Regression eg in R
* https://youtu.be/tc6wb7fBmiY : Multiple Regression 02 Dummy variables
[[:Multiple regression]]
[[:Partial and semipartial correlation]]
[[:r:Partial and semipartial correlation]] in r space
[[:Using dummy variables]]
Graphics
===== Assignment =====
===== Announcement =====
제3차 퀴즈를 봅니다.
* **13주차 두번째 시간 5월 30일 월요일**
* 사지선다 혹은 단답식
* **오전 10:30 - 11:45 까지**
퀴즈 범위는
stats part
* [[:sampling distribution]]
* [[:central limit theorem]]
* [[:hypothesis testing]]
* [[:z-test]]
* [[:types of error]]
* [[:t-test]]
* [[:ANOVA]]
* [[:Factorial ANOVA]]
* [[:Repeated Measure ANOVA]]
* [[:correlation]]
* [[:Regression]]
* [[:Multiple Regression]] 중에서 Introduction부분까지만 (동영상) -- 관련 위키문서도 거기까지만입니다.
* Using Dummy Variables
* Interpreting IVs
r part
* [[:b/r_cookbook/data_structures|Data structure in r]]
* [[:b:r cookbook:data transformations|Data transformation in r]]
* [[:b:r_cookbook:general statistics]] in r
r은 주로 아웃풋에 대한 질문이 있을 예정입니다. 오픈 북이니 모든 명령어 등을 외울 필요는 없습니다.
====== Week13 ======
===== Concepts and ideas =====
영상보기
* https://youtu.be/AXMtT5cYpZ4 Factor Analysis
문서
* [[:Factor Analysis]],
* [[:Factor Analysis Examples]]
* https://docs.google.com/forms/d/1zlr_Pz-Gr4LSv_pN5-hZmTLALNl5qWBlPyp4g6ZeRCQ
===== Assignment =====
그룹 assignment: independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고, 구글독스를 이용하여 설문문항을 작성하시오. 이를 이용하여 데이터를 수집한 후 검증을 하시오. 검증 결과를 최대한 자세하게 논하시오. 과제는 기본적으로 아래를 수행하여야 합니다.
* 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
* 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
* 구글서베이를 이용하여 서베이 문항을 만듭니다.
* 데이터를 구합니다.
* R을 이용하여 검증합니다.
* 검증 결과를 의미있게 논합니다.
----
과제제출
* 가설 소개와 설명
* independent t-test
* repeated measures t-test
* ANOVA
* Factorial ANOVA
* repeated measures ANOVA
* regression
* multiple regression
* 가설에 따른 설문 문항과 이 때의 IV와 DV 파악 및 측정 수준에 대한 설명
* independent t-test
* repeated measures t-test
* ANOVA
* Factorial ANOVA
* repeated measures ANOVA
* regression
* multiple regression
* 각 가설검증 분석결과 및 논의
* independent t-test
* repeated measures t-test
* ANOVA
* Factorial ANOVA
* repeated measures ANOVA
* regression
* multiple regression
====== Week14 ======
===== Concepts and ideas =====
동영상
* [[https://youtu.be/s6ICBE4vzdw|Social Network Analysis: Introduction]]
[[:Social network analysis|sna, social network analysis]]
[[:r:Social network analysis tutorial| sna tutorial in r]]
ANOVA
Linear Regression and ANOVA
http://commres.net/wiki/text_mining_example_with_korean_songs
===== Assignment =====
**그룹과제 내용수정 최종 ----**
__그룹과제 내용을 아래와 같이 수정합니다.__
과제명: ms22.ga.w14.hyp.test
파일이름: 예, ms22.ga.w14.hyp.test.g03.odc
deadline: June/20 Monday 오전 10:30분까지
그룹 assignment:
* independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고,
* MS WORD를 이용하여 각 가설에 대응하는 설문문항을 모두 작성하시오.
* 각 가설에 대응하는 데이터를 자의적으로 만든 후 검증을 하시오.
* 검증 결과를 논하시오.
과제는 기본적으로 아래를 수행하여야 합니다.
* MS Word를 이용하여 작성합니다 (아래한글 제외)
* 가설만들기:
* 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
* 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
* 가설들은 서로 연관되어 있어도 좋습니다. 가령, 한 이론에서 파생된 t-test와 ANOVA 가설등.
* 아래 통계테스트에 대응하는 가설을 모두 만들어야 합니다
* Independent t-test
* Repeated measures t-test
* ANOVA
* Factorial ANOVA
* Repeated measures ANOVA
* Regression
* Multiple Regression
* 설문문항 만들기
* 각 가설의 IV와 DV 파악 및 측정 수준에 대한 설명
* 가설에 대한 설문문항 작성: 각 가설에 대응하는 서베이 문항을 만들어야 합니다. 서베이문항은 다음을 포함합니다.
* 각 가설을 (7개, indepedent t-test, repeated measures t-test, ANOVA, etc.) 검증할 수 있는 문항들
* 데이터 수집
* **데이터는 수집할 필요가 없습니다.**
* 각 그룹 아래 가설에 해당하는 데이터를 **인위적으로 만들어** 테스트합니다. 혹은 기존에 존재하는 데이터를 활용해도 됩니다.
* (인위적으로 만들) 응답자 수는 최소 30명으로 합니다. 즉, 30명의 데이터를 인위적으로 만듭니다.
* 가설의 검증
* R을 이용하여 가설을 검증합니다.
* R 코드와 아웃풋을 MS Word에 기록합니다
* MS Word에서 R코드와 아웃풋에 사용되는 폰트는 fixed width로 합니다 (courier, courier new와 같은)
* 결론 쓰기
* 검증 결과를 의미있게 논합니다.
* 가설을 만드는데 사용된 이론이나 아이디어와 연관지어 의미있는 결론을 도출해 냅니다.
====== Week15 ======
===== Concepts and Ideas =====
[[:factor_analysis#excersize|Factor analysis exc.]]
Video
[[https://www.youtube.com/watch?v=s6ICBE4vzdw|sna 소개]]
* [[https://www.youtube.com/watch?v=md4m9VF4e8M|사회관계망연구, 개념과 연구대상소개]]
* [[https://www.youtube.com/watch?v=TyM6omXoDQo|사회관계망연구, 예]]
* [[https://www.youtube.com/watch?v=PBGEL5MVUY4|사회관계망연구, 예. CONCOR QAP]]
* [[https://www.youtube.com/watch?v=pp0UZpGldNQ|사회관계망연구, 예. Johnson's hierarchical Textmining]]
[[:Social network analysis]]
* [[:text mining]]
* [[:c/itamc/2017#eg_1|text mining examle]]
*
[[:r:Social network analysis tutorial]] in R
===== Assignment =====
====== Week16 ======
__**Final-term**__
* 마지막 퀴즈
* 퀴즈 시간은 10:30 - 10:35 입니다. 퀴즈 시간은 한정되어 있습니다. 연장이나 늦게 제출되지 않도록 할 예정입니다. 75분이 제한시간일 예정이지만 약간 바뀔 수도 있습니다.
* 범위는 다음과 같습니다.
* Statistics
* [[:sampling distribution]]
* [[:central limit theorem]]
* [[:hypothesis testing]]
* [[:z-test]]
* [[:types of error]]
* [[:t-test]]
* [[:ANOVA]]
* [[:Factorial ANOVA]]
* [[:Repeated Measure ANOVA]]
* [[:correlation]]
* [[:Regression]]
* [[:Multiple Regression]]
* [[:Factor Analysis]]
* [[:Social Network Analysis]]
* R related (교재가 다루지는 않지만 이번학기 중에 다루었던)
* [[:r:t-test]]
* [[:r:anova]] and factorial anova
* repeated measure anova
* [[:r:correlation]]
* regression and [[:r:multiple regression]]
* [[:r:factor analysis]]
* R 관련 문제는 아웃풋을 이해하는지에 치중을 하시고, 명령어를 어떻게 사용하는지에 대해서도 알아두어야 합니다. 오픈북이므로 교재나 그외의 것을 참조해도 됩니다.