User Tools

Site Tools


c:ms:2022:schedule


https://bit.ly/3K61enT

아래는 미디어통계 줌미팅 스케쥴입니다. 참조하세요. 수업등록한 학생은 아주비비의 줌링크를 이용하면 확실합니다. 미등록학생 중 수업에 관심이 있는 학생은 아주비비 접속을 할 수 없으므로 아래 링크를 통해서 수업참관을 하시고 정정요청을 하시기 바랍니다.

Hyo Kim이(가) 예약된 Zoom 회의에 귀하를 초대합니다.

주제: DGMD231_ 미디어통계(M031-1)
시간: 2022년 3월 3일 10:20 오전 서울

      매주 월, 목에, 2022년 6월 20일 까지, 32개 되풀이 항목
      2022년 3월 3일  10:20 오전
      2022년 3월 7일  10:20 오전
      2022년 3월 10일  10:20 오전
      2022년 3월 14일  10:20 오전
      2022년 3월 17일  10:20 오전
      2022년 3월 21일  10:20 오전
      2022년 3월 24일  10:20 오전
      2022년 3월 28일  10:20 오전
      2022년 3월 31일  10:20 오전
      2022년 4월 4일  10:20 오전
      2022년 4월 7일  10:20 오전
      2022년 4월 11일  10:20 오전
      2022년 4월 14일  10:20 오전
      2022년 4월 18일  10:20 오전
      2022년 4월 21일  10:20 오전
      2022년 4월 25일  10:20 오전
      2022년 4월 28일  10:20 오전
      2022년 5월 2일  10:20 오전
      2022년 5월 5일  10:20 오전
      2022년 5월 9일  10:20 오전
      2022년 5월 12일  10:20 오전
      2022년 5월 16일  10:20 오전
      2022년 5월 19일  10:20 오전
      2022년 5월 23일  10:20 오전
      2022년 5월 26일  10:20 오전
      2022년 5월 30일  10:20 오전
      2022년 6월 2일  10:20 오전
      2022년 6월 6일  10:20 오전
      2022년 6월 9일  10:20 오전
      2022년 6월 13일  10:20 오전
      2022년 6월 16일  10:20 오전
      2022년 6월 20일  10:20 오전

다음 iCalendar(.ics) 파일을 다운로드하고 일정 시스템으로 가져오십시오.
매주: https://ajou-ac-kr.zoom.us/meeting/tZcqcOGgqDorEte9fiPae9jzslKv-qAdjOQe/ics?icsToken=98tyKuGrqTwiEtKUsRGERpwqB4_CWfzwpn5cj7dYxRnsMyFWOwnsJe5pJP9uMdza

Zoom 회의 참가
https://ajou-ac-kr.zoom.us/j/83778861183?pwd=NjAyWTRXMGRRdCtGR2xlZnhrbnlnQT09

회의 ID: 837 7886 1183
암호: 649200

통계에 대한 기초적인 이해
가설과 가설검증

  • 가설의 종류와 그 종류에 따른 통계분석법
    • z-test
    • t-test
    • ANOVA
    • Factorial ANOVA
    • correlation
    • regression
    • multiple regression
    • factor analysis
    • . . .
  • 위를 위해서 꼭 이해해야 할 것들
    • Variance
    • Standard Deviation
    • Standard Error (Standard Deviation of Sample Means)
    • Hypothesis Testing

R Cookbook
Chapter 1 Getting Started and Getting Help
Chapter 2 Some Basics
Chapter 3 Navigating the Software
Chapter 4 Input and Output
Chapter 5 Data Structures
Chapter 6 Data Transformations
Chapter 7 Strings and Dates
Chapter 8 Probability
Chapter 9 General Statistics
Chapter 10 Graphics
Chapter 11 Linear Regression and ANOVA
Chapter 12 Useful Tricks
Chapter 13 Beyond Basic Numerics and Statistics
Chapter 14 Time Series Analysis

이전 페이지

Week01

Course Introduction –> syllabus

ideas and concepts

수업 서베이 있습니다. 서베이참여 필요.

동영상 (R 관련)

Introduction to R and others

  1. Downloading and Installing R
  2. Starting R
  3. Entering Commands
  4. Exiting from R
  5. Interrupting R
  6. Viewing the Supplied Documentation
  7. Getting Help on a Function
  8. Searching the Supplied Documentation
  9. Getting Help on a Package
  10. Searching the Web for Help
  11. Finding Relevant Functions and Packages
  12. Searching the Mailing Lists
  13. Submitting Questions to the Mailing Lists

동영상 (통계관련 샘플링에 대한 설명)

기본용어
기술통계 (descriptive statistics)
추론통계 (inferential statistics)
아래의 개념은 샘플링 문서를 먼저 볼것

  • sampling methods
    • probability
    • non-probability

가설 (hypothesis)

  • 차이와 연관 (difference and association)

변인 (variables)

Assignment

Week02

Concepts and ideas

Sampling
가설
지난 동영상 리캡 및 가설에 대한 소개
가설에 대한 소개 및 설명
가설이 만들어지는 이유
가설의 예
변인의 종류와 변인측정의수준

Some basics

  1. Introduction
  2. Printing Something
  3. Setting Variables
  4. Listing Variables
  5. Deleting Variables
  6. Creating a Vector
  7. Computing Basic Statistics
  8. Creating Sequences
  9. Comparing Vectors
  10. Selecting Vector Elements
  11. Performing Vector Arithmetic
  12. Getting Operator Precedence Right
  13. Defining a Function
  14. Typing Less and Accomplishing More
  15. Avoiding Some Common Mistakes

from the previous lecture (research question and hypothesis)

Assignment

Week03

그룹핑 최종

3주차 온라인 강의 동영상은 4주에 걸쳐서 보시기 바랍니다. 즉, 4주 중에 따로 동영상 올리지 않습니다.

—–

—–
Howell, Ch. 4 내용 중 Variance와 (분산) Standard deviation은 (표준편차는) 이후 통계 검증방법을 이해하는데 기초가 되는 중요한 내용이니 꼭 숙지하시기 바랍니다.

Concepts and ideas

Navigating software

  1. Introduction
  2. Getting and Setting the Working Directory
  3. Saving Your Workspace
  4. Viewing Your Command History
  5. Saving the Result of the Previous Command
  6. Displaying the Search Path
  7. Accessing the Functions in a Package
  8. Accessing Built-in Datasets
  9. Viewing the List of Installed Packages
  10. Installing Packages from CRAN
  11. Setting a Default CRAN Mirror
  12. Suppressing the Startup Message
  13. Running a Script
  14. Running a Batch Script
  15. Getting and Setting Environment Variables
  16. Locating the R Home Directory
  17. Customizing R

Mean
Mode
Median
Variance
Standard Deviation

+-1 sd = 68% = +-1 sd
+-2 sd = 95% = +-1.96 sd
+-3 sd = 99% (99.7%) = +-3 sd

표준점수 (unit with a standard deviation) = z score

Sampling distribution via random sampling
Central Limit Theorem

Assignment

Week04

hypothesis.test.r

Class Activity

문서

동영상 시청

Lecture materials for this week

Concepts and ideas

Input and output

  1. Introduction
  2. Entering Data from the Keyboard
  3. Printing Fewer Digits (or More Digits)
  4. Redirecting Output to a File
  5. Listing Files
  6. Dealing with “Cannot Open File” in Windows
  7. Reading Fixed-Width Records
  8. Reading Tabular Data Files
  9. Reading from CSV Files
  10. Writing to CSV Files
  11. Reading Tabular or CSV Data from the Web
  12. Reading Data from HTML Tables
  13. Reading Files with a Complex Structure
  14. Reading from MySQL Databases
  15. Saving and Transporting Objects

Assignment

다음 주차 (제5주차) 월요일 시간 (두번째 시간) 퀴즈 있습니다.
퀴즈 범위는

  • 5주차까지 언급된 모든 동영상
  • R 과 관련해서는 동영상 내용만 포함합니다.
  • 시험문제는 4지선다 혹은 단답식 답입니다.
  • 문제는 모두 50문제 정도이고 오픈북 상태에서의 시험이므로 50분정도의 제한시간을 둡니다. 즉, 일단 시작한 시험은 50분 후에 닫힙니다. 시험문제 수와 시간은 바뀔 수 있습니다.
  • 시험문제는 월요일 10시반부터 6시까지 오픈될 예정입니다. 일단 시작된 시험은 제한시간 내에 풀어야 합니다.

Week05

Announcement Quiz 01

Concepts and ideas

이번 주 동영상

Data Structures

  1. Introduction
  2. Appending Data to a Vector
  3. Inserting Data into a Vector
  4. Understanding the Recycling Rule
  5. Creating a Factor (Categorical Variable)
  6. Combining Multiple Vectors into One Vector and a Factor
  7. Creating a List
  8. Selecting List Elements by Position
  9. Selecting List Elements by Name
  10. Building a Name/Value Association List
  11. Removing an Element from a List
  12. Flatten a List into a Vector
  13. Removing NULL Elements from a List
  14. Removing List Elements Using a Condition
  15. Initializing a Matrix
  16. Performing Matrix Operations
  17. Giving Descriptive Names to the Rows and Columns of a Matrix
  18. Selecting One Row or Column from a Matrix
  19. Initializing a Data Frame from Column Data
  20. Initializing a Data Frame from Row Data
  21. Appending Rows to a Data Frame
  22. Preallocating a Data Frame
  23. Selecting Data Frame Columns by Position
  24. Selecting Data Frame Columns by Name
  25. Selecting Rows and Columns More Easily
  26. Changing the Names of Data Frame Columns
  27. Editing a Data Frame
  28. Removing NAs from a Data Frame
  29. Excluding Columns by Name
  30. Combining Two Data Frames
  31. Merging Data Frames by Common Column
  32. Accessing Data Frame Contents More Easily
  33. Converting One Atomic Value into Another
  34. Converting One Structured Data Type into Another

Assignment

Week06

Concepts and ideas

동영상

Probability calculation in R ← Probability in R cookbook (텍스트북)

또한 R에서 데이터를 (테이블 혹은 어레이) 이용하여 function을 적용하는 것에 대해서 잘 익혀두시기 바랍니다. 이는 R cookbook의 아래 내용에 해당이 됩니다 (특히 sapply, tapply, by 등)

Data Transformations

  1. Introduction
  2. Splitting a Vector into Groups
  3. Applying a Function to Each List Element
  4. Applying a Function to Every Row
  5. Applying a Function to Every Column
  6. Applying a Function to Groups of Data
  7. Applying a Function to Groups of Rows
  8. Applying a Function to Parallel Vectors or Lists

Strings and Dates

Announcement

Activities

조별활동:
각 조는 아래를 돌려보고 그 결과를 그룹저널에 기록하시오.
그리고 왜 이와 같은 결과가 나왔는지를 설명하시오.

set.seed(101)
s1.n <- 1600
s1 <- rnorm(s1.n, 102, 15)
s1.m <- mean(s1)
s1.m
s1.sd <- sd(s1)
s1.sd
p.mu <- 100
p.sd <- 15

t.test(s1, mu=p.mu)
set.seed(101)
s2.n <- 50
s2 <- rnorm(50, 102, 15)
s2.m <- mean(s2)
s2.m
s2.sd <- sd(s2)
s2.sd
p.mu <- 100
p.sd <- 15

t.test(s2, mu=p.mu)

Week07

Concepts and ideas

7주차 동영상
ANOVA

위키페이지 참조

Probability

  1. Introduction
  2. Counting the Number of Combinations
  3. Generating Combinations
  4. Generating Random Numbers
  5. Generating Reproducible Random Numbers
  6. Generating a Random Sample
  7. Generating Random Sequences
  8. Randomly Permuting a Vector
  9. Calculating Probabilities for Discrete Distributions
  10. Calculating Probabilities for Continuous Distributions
  11. Converting Probabilities to Quantiles
  12. Plotting a Density Function

Assignment


  • 가설 만들어 보기
    • t-test를 할 수 있는 가설
    • ANOVA 테스트를 할 수 있는 가설
    • 각 가설에 대해서
      • IV, DV를 밝힐 것
      • 측정수준을 설명할 것

8주차 퀴즈

  • 25일 월요일 10시반 오픈됩니다.
  • 모두 같은 시간에 봅니다.
  • 퀴즈제한시간은 60-75분입니다.
  • 현재까지는 50-60문제입니다.
  • 퀴즈문제가 조정되어 추가되거나 감소되면 시간이 조금 변할 수 있습니다.
  • 범위는 첫번재 퀴즈 범위 더하기 6, 7주차 내요입니다.

Week08

시험기간
보강영상 수업

Week09

Concepts and ideas

9주차 동영상

Factorial ANOVA
R script: https://github.com/hkimscil/ms/blob/main/anova.R
anova in R

General Statistics

  1. Introduction
  2. Summarizing Your Data
  3. Calculating Relative Frequencies
  4. Tabulating Factors and Creating Contingency Tables
  5. Testing Categorical Variables for Independence
  6. Calculating Quantiles (and Quartiles) of a Dataset
  7. Inverting a Quantile
  8. Converting Data to Z-Scores
  9. Testing the Mean of a Sample (t Test)
  10. Forming a Confidence Interval for a Mean
  11. Forming a Confidence Interval for a Median
  12. Testing a Sample Proportion
  13. Forming a Confidence Interval for a Proportion
  14. Testing for Normality
  15. Testing for Runs
  16. Comparing the Means of Two Samples
  17. Comparing the Locations of Two Samples Nonparametrically
  18. Testing a Correlation for Significance
  19. Testing Groups for Equal Proportions
  20. Performing Pairwise Comparisons Between Group Means
  21. Testing Two Samples for the Same Distribution

vene . . . go or come

intervene

  • intervenient

convene

  • convention
  • convent
  • convenient

contravene
prevent
advent
circumvent

Assignment

Week10

Concepts and ideas

10주차 동영상입니다.
동영상 (총 5 개)

—-

repeated measure ANOVA
correlation

Assignment

과제 . . . .
ms.ga.w10.doing.anova.groupID

  • 아주비비에 그룹제출 제시되어 있음
  • 목요일까지 제출 (May 12)
  • R에 탑재되어 있는 데이터 중의 하나는 ToothGrowth이다. 이 데이터는 기니아피그의 이빨길이를 측정한 것인데 비타민 C를 먹인 효과를 보는 것이다. 데이터에 대한 설명은 ?ToothGrowth 로 살펴볼 수 있다.
  • 비타민의 효과에 대한 ANOVA를 (oneway ANOVA) 수행하고 그 스크립트와 결과를 카피하여 그룹과제에 올리고 분석한 결과를 설명하시오. 분석 결과에는
    • 가설
    • 스크립트
    • 아웃풋
    • 해석이 포함되어야 합니다.
  • 비타민과 복용량의 효과에 대한 factorial ANOVA를 수행하고 그 스크립트와 결과를 카피한 후, 그룹 과제에 올리고 분석하시오. 결과에는
    • 가설과
    • 스크립트 (명령어)
    • 아웃풋
    • 해석이 포함되어야 합니다.
  • 과제는 fixed-width font로 쓰여져야 합니다 (예를 들면, courier new).
  • 그룹과제로 올린 후 목요일 9시에 모여서 그 과제를 토론 댓글로 올립니다.

Week11

Concepts and ideas

동영상 Regression

  1. https://youtu.be/68gho4ubOjs : Regression 1. Intro
  2. https://youtu.be/qXSRgSh1rw0 : Regression 2. e.g. 1
  3. https://youtu.be/I8wt2W7-Iio : Regression 3. e.g. 2

regression
multiple regression
using dummy variables

chi-square test
probability
general statistics

getting started
basics
navigating in r
input output in r
data structures
data transformations


Graphics

  1. Introduction
  2. Creating a Scatter Plot
  3. Adding a Title and Labels
  4. Adding a Grid
  5. Creating a Scatter Plot of Multiple Groups
  6. Adding a Legend
  7. Plotting the Regression Line of a Scatter Plot
  8. Plotting All Variables Against All Other Variables
  9. Creating One Scatter Plot for Each Factor Level
  10. Creating a Bar Chart
  11. Adding Confidence Intervals to a Bar Chart
  12. Coloring a Bar Chart
  13. Plotting a Line from x and y Points
  14. Changing the Type, Width, or Color of a Line
  15. Plotting Multiple Datasets
  16. Adding Vertical or Horizontal Lines
  17. Creating a Box Plot
  18. Creating One Box Plot for Each Factor Level
  19. Creating a Histogram
  20. Adding a Density Estimate to a Histogram
  21. Creating a Discrete Histogram
  22. Creating a Normal Quantile-Quantile (Q-Q) Plot
  23. Creating Other Quantile-Quantile Plots
  24. Plotting a Variable in Multiple Colors
  25. Graphing a Function
  26. Pausing Between Plots
  27. Displaying Several Figures on One Page
  28. Opening Additional Graphics Windows
  29. Writing Your Plot to a File
  30. Changing Graphical Parameters

Assignment

과제명: ms.22.w11.ga.covariance.exercise
제출파일명: ms22.w11.ga.covariance.exercise.group##.odc (docx)
과제내용:
아래 데이터를 다운로드 받아서 두 변인 간의 상관관계계수를 구하시오.
income.happiness.csv
데이터는 수입과 행복을 측정한 것입니다. 실제 데이터를 살펴보고 R로 읽어 온 후에 R을 이용하여 아래를 구하시오. R에서의 명령어와 아웃풋을 카피/패이스트 하여 제출하시오 (fixed-font를 사용하여).

  • 각 변인의 deviation score 값을 구하여 ds.inc 와 ds.hap 에 저장하시오.
  • 두 변인의 SP값을 (Sum of Product) 구하여 sp.dat 에 저장하시오.
  • 두 변인의 df값을 구하여 df.dat 에 저장하시오.
  • 두 변인간 covariance값을 r의 cov 명령어를 이용하여 구하여 cov.dat값에 저장하시오.
  • sp.dat / df.dat 값을 구하여 cov.cal 값에 저장하시오.
  • cov.cal 과 cov.dat 값이 같은지 비교하시오. (힌트: == 연산자를 이용하여 확인하시오)
  • 각 변인의 standard deviation 값을 구하여 sd.inc, sd.hap에 저장하시오
  • 우리가 배운 correlation값을 구하는 공식에 따라서 r 값을 구해서 r.cal 에 저장하시오.
  • R의 cor 명령어를 이용하여 correlation coefficient값을 구하여 r.dat 에 저장하시오.
  • r.cal 과 r.dat 을 비교하시오.

월요일 수업 전까지 (11주차 2번째 시간 전) 완성하여 제출하세요.

ms.22.w11.ga.diff.main.effect

  • 파일로 제출할 경우 파일명은 ms.22.w11.ga.diff.main.effect.group01.odc와 (or .docx) 같이 해서 제출하시오.
  • 지난 주 과제에서 종속변인에 대해 (len) 독립변인을 (supp) ANOVA 분석했을 때, 독립변인의 효과가 없다고 나타났다 (즉, 두 그룹 간에 차이가 있다고 밝히는데 실패하였다). 그런데, 같은 변인을 (supp) 다른 독립변인과 (dose) 동시에 고려하여 two way ANOVA 분석을 하였을 때에는 len의 효과가 있는 것으로 분석결과가 나왔다. 왜 이런 분석의 차이가 나타났는지 설명하시오.

Week12

Assignment

Announcement

제3차 퀴즈를 봅니다.

  • 13주차 두번째 시간 5월 30일 월요일
  • 사지선다 혹은 단답식
  • 오전 10:30 - 11:45 까지

퀴즈 범위는
stats part

r part

r은 주로 아웃풋에 대한 질문이 있을 예정입니다. 오픈 북이니 모든 명령어 등을 외울 필요는 없습니다.

Week13

Concepts and ideas

영상보기

Assignment

그룹 assignment: independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고, 구글독스를 이용하여 설문문항을 작성하시오. 이를 이용하여 데이터를 수집한 후 검증을 하시오. 검증 결과를 최대한 자세하게 논하시오. 과제는 기본적으로 아래를 수행하여야 합니다.

  • 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
    • 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
  • 구글서베이를 이용하여 서베이 문항을 만듭니다.
    • 데이터를 구합니다.
  • R을 이용하여 검증합니다.
  • 검증 결과를 의미있게 논합니다.

—-
과제제출

  • 가설 소개와 설명
    • independent t-test
    • repeated measures t-test
    • ANOVA
    • Factorial ANOVA
    • repeated measures ANOVA
    • regression
    • multiple regression
  • 가설에 따른 설문 문항과 이 때의 IV와 DV 파악 및 측정 수준에 대한 설명
    • independent t-test
    • repeated measures t-test
    • ANOVA
    • Factorial ANOVA
    • repeated measures ANOVA
    • regression
    • multiple regression
  • 각 가설검증 분석결과 및 논의
    • independent t-test
    • repeated measures t-test
    • ANOVA
    • Factorial ANOVA
    • repeated measures ANOVA
    • regression
    • multiple regression

Week14

Assignment

Week15

Assignment

그룹과제 내용수정 최종 —-
그룹과제 내용을 아래와 같이 수정합니다.

그룹 assignment:

  • independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고,
  • MS WORD를 이용하여 각 가설에 대응하는 설문문항을 모두 작성하시오.
  • 각 가설에 대응하는 데이터를 자의적으로 만든 후 검증을 하시오.
  • 검증 결과를 자세하게 논하시오.

과제는 기본적으로 아래를 수행하여야 합니다.

  • MS Word를 이용하여 작성합니다 (아래한글 제외)
  • 가설만들기:
    • 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
      • 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
      • 가설들은 서로 연관되어 있어도 좋습니다. 가령, 한 이론에서 파생된 t-test와 ANOVA 가설등.
      • 아래 통계테스트에 대응하는 가설을 모두 만들어야 합니다
        • Independent t-test
        • Repeated measures t-test
        • ANOVA
        • Factorial ANOVA
        • Repeated measures ANOVA
        • Regression
        • Multiple Regression
  • 설문문항 만들기
    • 각 가설의 IV와 DV 파악 및 측정 수준에 대한 설명
    • 가설에 대한 설문문항 작성: 각 가설에 대응하는 서베이 문항을 만들어야 합니다. 서베이문항은 다음을 포함합니다.
    • 각 가설을 (7개, indepedent t-test, repeated measures t-test, ANOVA, etc.) 검증할 수 있는 문항들
  • 데이터 수집
    • 데이터는 수집할 필요가 없습니다.
    • 각 그룹 아래 가설에 해당하는 데이터를 인위적으로 만들어 테스트합니다. 혹은 기존에 존재하는 데이터를 활용해도 됩니다.
    • (인위적으로 만들) 응답자 수는 최소 30명으로 합니다. 즉, 30명의 데이터를 인위적으로 만듭니다.
  • 가설의 검증
    • R을 이용하여 가설을 검증합니다.
    • R 코드와 아웃풋을 MS Word에 기록합니다
    • MS Word에서 R코드와 아웃풋에 사용되는 폰트는 fixed width로 합니다 (courier, courier new와 같은)
  • 결론 쓰기
    • 검증 결과를 의미있게 논합니다.
    • 가설을 만드는데 사용된 이론이나 아이디어와 연관지어 의미있는 결론을 도출해 냅니다.

Week16

Final-term

c/ms/2022/schedule.txt · Last modified: 2022/05/19 11:09 by hkimscil