User Tools

Site Tools


c:ms:2020:schedule

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
c:ms:2020:schedule [2020/06/26 15:37] – [Week16 (June 22, 25)] hkimscilc:ms:2020:schedule [2021/03/02 09:42] (current) – [Week01 (Mar 16, 19)] hkimscil
Line 69: Line 69:
 <WRAP half column> <WRAP half column>
 ===== Assignment ===== ===== Assignment =====
 +첫째주 숙제. 
 +   * class survey - [[https://bit.ly/3a96nd2]]
 +   * 만약에 조사방법론 수업을 동시에 듣고 있다면 지금 서베이 외에 동일한 서베이를 다시 한번 더 해야 합니다 (이 경우 마지막 질문은 생략가능). 조원 구성을 위해서 필요합니다. 
 +
 </WRAP> </WRAP>
 ====== Week02 (Mar. 23, 26) ====== ====== Week02 (Mar. 23, 26) ======
 <WRAP half column> <WRAP half column>
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
- 
- 
 <WRAP box> <WRAP box>
 Some [[:b:r cookbook:basics|basics]] Some [[:b:r cookbook:basics|basics]]
Line 487: Line 489:
 <WRAP half column> <WRAP half column>
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
-Do the following 
-<code>S1 <- c(89, 85, 85, 86, 88, 89, 86, 82, 96, 85, 93, 91,  
-        98, 87, 94, 77, 87, 98, 85, 89, 95, 85, 93, 93,  
-        97, 71, 97, 93, 75, 68, 98, 95, 79, 94, 98, 95) 
-S2 <- c(60, 98, 94, 95, 99, 97, 100, 73, 93, 91, 98,  
-        86, 66, 83, 77, 97, 91, 93, 71, 91, 95, 100,  
-        72, 96, 91, 76, 100, 97, 99, 95, 97, 77, 94,  
-        99, 88, 100, 94, 93, 86) 
-S3 <- c(95, 86, 90, 90, 75, 83, 96, 85, 83, 84, 81, 98,  
-        77, 94, 84, 89, 93, 99, 91, 77, 95, 90, 91, 87,  
-        85, 76, 99, 99, 97, 97, 97, 77, 93, 96, 90, 87,  
-        97, 88) 
-S4 <- c(67, 93, 63, 83, 87, 97, 96, 92, 93, 96, 87, 90,  
-        94, 90, 82, 91, 85, 93, 83, 90, 87, 99, 94, 88,  
-        90, 72, 81, 93, 93, 94, 97, 89, 96, 95, 82, 97) 
- 
-scores <- list(S1=S1,S2=S2,S3=S3,S4=S4)</code> 
- 
-  * find means for each element in "scores" in a list format 
-  * find standard deviation for each element in "scores" in a data frame format 
-  * find variance  for each element in "scores" in a data frame format without using "var" function 
- 
-<code>longdata<- c(-1.850152, -1.406571, -1.0104817, -3.7170704,  
-           -0.2804896, 0.9496313, 1.346517, -0.1580926, 1.6272786,  
-           -2.4483321, -0.5407272, -1.708678, -0.3480616, -0.2757667,  
-           -1.2177024)</code> 
-  * make "longdata" to a matrix whose size is  3 by 5 
-  * name columns "trial1, trial2, . . . . trial5" 
-  * name rows "subject1, subject2, subject3" 
-  * get means for each subject  
-  * attach the above data to the matrix data and name it "longtemp." 
-  * get standard deviation for each trial 
-  * attach the above data to the matrix data, "longtemp." 
- 
- 
-<code>suburbs <- read.csv("http://commres.net/wiki/_export/code/r/data_transformations?codeblock=15", head=T, sep=" ")</code> 
-  * get subrubs data  as the above 
-  * get population means by each state (listed in the data, suburbs) 
-    * use aggregate and refer to the below e.g. 
-<code>attach(Cars93) 
-aggregate(MPG.city ~ Origin, Cars93, mean)</code> 
-  * get population sum by each county with  tapply function.  
-  * tapply(number, byfactor, function) 
-  * how many counties are there? 
-  * Use Cars93 data, get MPG.city mean by Origin. 
- 
-__Using pnorm, qnorm__ 
-pnorm : get proportion out of normal distribution whose characteristics are mean and sd 
-<code>pnorm(84, mean=72, sd=15.2, lower.tail=FALSE)</code> 
-  * What is the value of  the below? 
-<code>pnorm(1)</code> 
-  * How would you get 68, 95, 99% from pnorm 
-      * use ?pnorm and see the default option 
- 
-  * generate 10 random numbers with runif function 
- 
-<code>year <- c(1900:2016)     # years in vector year 
-world.series <- data.frame(year)</code> 
-  * get 10 year samples out of world.series data with "sample" command 
-  * how would you get the sample sample again latter? 
- 
-<code>pnorm(110, mean=100, sd=10)</code> 
-  * What would be the result from the above? 
- 
-<code>library(MASS)       # load the MASS package  
-tbl = table(survey$Smoke, survey$Exer)  
-tbl                 # the contingency table</code>  
- 
-<code>summary(tbl) 
-</code> 
-  * read the above output and interpret 
-  * what about the below one? 
-<code>chisq.test(tbl)  
-</code> 
- 
-see first [[:chi-square test]] 
-see [[:b:r cookbook:chi-square test]] in r document space for more 
- 
-<code> library(MASS) 
- cardata <- data.frame(Cars93$Origin, Cars93$Type) 
- cardata 
-</code> 
-  * Can you say the types of cars are different by the Origins? 
- 
-<code>dur <- faithful$eruptions 
-dur</code> 
-  * make the above data into z-score (zdur). 
-  * get mean of the zdur 
-  * get sd of the zdur 
- 
-<code> 
-set.seed(1123) 
-x <- rnorm(50, mean=100, sd=15) 
-</code> 
-  * test x against population  mean 95. 
-  * test x against population  mean 99. 
-  * are they different from each other? 
-  * what would you do if you want to see the different result from the  second one? 
- 
-<code>a = c(65, 78, 88, 55, 48, 95, 66, 57, 79, 81) 
- 
-> t.test(a, mu=60) 
- 
- One Sample t-test 
- 
-data:  a 
-t = 2.3079, df = 9, p-value = 0.0464 
-alternative hypothesis: true mean is not equal to 60 
-95 percent confidence interval: 
- 60.22187 82.17813 
-sample estimates: 
-mean of x  
-     71.2  
-</code> 
-  * find the t critical value with function qt.  
-  * explain what happens in the next code 
-  * read (or remind) what pnorm and qnorm do. 
-<code>> s <- sd(x) 
-> m <- mean(x) 
-> n <- length(x) 
-> n 
-[1] 50 
-> m 
-[1] 96.00386 
-> s 
-[1] 17.38321 
-> SE <- s / sqrt(n) 
-> SE 
-[1] 2.458358 
-> E <- qt(.975, df=n-1)*SE 
-> E 
-[1] 4.940254 
-> m + c(-E, E) 
-[1]  91.0636 100.9441 
-> </code> 
- 
- 
-  * what's wrong with the below? 
-<code>t.test(x)</code> 
- 
-<code>> mtcars</code> 
-  * using aggregate, get mean for each trnas. type. 
-  * compare the difference of mileage between auto and manual cars. 
-    * use t.test (two sample) 
-    * "use var.equal=T" option 
- 
-<code>a = c(175, 168, 168, 190, 156, 181, 182, 175, 174, 179) 
-b = c(185, 169, 173, 173, 188, 186, 175, 174, 179, 180) 
-</code> 
-  * stack them into data c 
-  * convert colnames into score and trans 
-  * t.test score by trans with var.equal option true.  
-  * aov test 
-  * see  t.test t value, t = -0.9474 and F value,  F = ? 
  
 </WRAP> </WRAP>
Line 752: Line 600:
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
 +===== Assignment =====
 +<color #ed1c24>**그룹과제 내용수정 ----**</color>
 +__그룹과제 내용을 아래와 같이 수정합니다.__
 +
 +그룹 assignment: 
 +  * independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고, 
 +  * MS WORD를 이용하여 각 가설에 대응하는 설문문항을 모두 작성하시오. 
 +  * 아래 가설에 대응하는 데이터를 자의적으로 만든 후 검증을 하시오. 
 +    * Independent t-test
 +    * ANOVA
 +    * Factorial ANOVA
 +    * Multiple Regression
 +  * 검증 결과를 자세하게 논하시오. 
 +
 +과제는 기본적으로 아래를 수행하여야 합니다.
 +  * MS Word를 이용하여 작성합니다 (아래한글 제외)
 +  * 가설만들기:    
 +    * 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
 +      * 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
 +      * 가설들은 서로 연관되어 있어도 좋습니다. 가령, 한 이론에서 파생된 t-test와 ANOVA 가설등.
 +      * 아래 통계테스트에 대응하는 가설을 모두 만들어야 합니다
 +        * Independent t-test
 +        * Repeated measures t-test
 +        * ANOVA
 +        * Factorial ANOVA
 +        * Repeated measures ANOVA
 +        * Regression
 +        * Multiple Regression
 +  * 설문문항 만들기
 +    * 각 가설에 대응하는 서베이 문항을 만들어야 합니다. 서베이문항은 다음을 포함합니다.
 +    * 각 가설을 (7개, indepedent t-test, repeated measures t-test, ANOVA, etc.) 검증할 수 있는 문항들 
 +  * 데이터 수집
 +    * <color #ed1c24>**데이터는 구글서베이를 이용하여 수집하지 않습니다.**</color>
 +    * 각 그룹 아래 가설에 해당하는 데이터를 <color #ed1c24>**인위적으로 만들어**</color> 테스트합니다. 
 +    * (인위적으로 만들) 응답자 수는 최소 30명으로 합니다. 즉, 30명의 데이터를 인위적으로 만듭니다.
 +      * Independent t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * Multiple Regression
 +  * 가설의 검증
 +    * R을 이용하여 가설을 검증합니다. 
 +    * R 코드와 아웃풋을 MS Word에 기록합니다 
 +    * MS Word에서 R코드와 아웃풋에 사용되는 폰트는 fixed width로 합니다 (courier, courier new와 같은)
 +    * 분석은 인위적으로 데이터를 만든 가설만을 포함하면 됩니다.
 +      * Independent t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * Multiple Regression (두 가지 이상의 IV 포함한)
 +  * 결론 쓰기
 +    * 검증 결과를 의미있게 논합니다.
 +    * 가설을 만드는데 사용된 이론이나 아이디어와 연관지어 의미있는 결론을 도출해 냅니다.
 +
 +----
 +과제제출
 +  * 가설만들기
 +    * 가설 소개와 설명 (이론이나 논리적인 아이디어에 기반한)
 +    * 각 가설마다 새로운 이론을 사용할 필요는 없습니다.
 +      * independent t-test
 +      * repeated measures t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * repeated measures ANOVA
 +      * regression
 +      * multiple regression
 +  * 변인, 변수 설명과 대응하는 설문문항 작성
 +    * 각 가설의 IV와 DV 파악 및 측정 수준에 대한 설명
 +    * 가설에 대한 설문문항 작성
 +  * 데이터 인위적 수집
 +  * 분석
 +    * 각 가설검증을 위해 사용된 코드 및 아웃풋
 +    * 이에 대한 설명
 +  * 결론
 +    * 검증 결과 논의 
 </WRAP> </WRAP>
 ====== Week16 (June 22, 25) ====== ====== Week16 (June 22, 25) ======
c/ms/2020/schedule.1593153461.txt.gz · Last modified: 2020/06/26 15:37 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki