User Tools

Site Tools


c:ms:2020:schedule

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
c:ms:2020:schedule [2020/06/26 13:23] – [Week14 (June 15, 18)] hkimscilc:ms:2020:schedule [2021/03/02 09:40] hkimscil
Line 69: Line 69:
 <WRAP half column> <WRAP half column>
 ===== Assignment ===== ===== Assignment =====
 +Class survey - [[https://bit.ly/3a96nd2]]
 +
 </WRAP> </WRAP>
 ====== Week02 (Mar. 23, 26) ====== ====== Week02 (Mar. 23, 26) ======
 <WRAP half column> <WRAP half column>
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
- 
- 
 <WRAP box> <WRAP box>
 Some [[:b:r cookbook:basics|basics]] Some [[:b:r cookbook:basics|basics]]
Line 407: Line 407:
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
 [[:multiple regression]] continued. [[:multiple regression]] continued.
-  * [[:multiple regression examples]] 
-[[:sequential regression]] 
-  * for more details we need to look at [[:b:r cookbook:linear regression#eg_3|eg. 3]] in [[:b:r cookbook:linear regression]] in [[:r]] space. 
 [[:using dummy variables]] [[:using dummy variables]]
  
Line 490: Line 487:
 <WRAP half column> <WRAP half column>
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
-Do the following 
-<code>S1 <- c(89, 85, 85, 86, 88, 89, 86, 82, 96, 85, 93, 91,  
-        98, 87, 94, 77, 87, 98, 85, 89, 95, 85, 93, 93,  
-        97, 71, 97, 93, 75, 68, 98, 95, 79, 94, 98, 95) 
-S2 <- c(60, 98, 94, 95, 99, 97, 100, 73, 93, 91, 98,  
-        86, 66, 83, 77, 97, 91, 93, 71, 91, 95, 100,  
-        72, 96, 91, 76, 100, 97, 99, 95, 97, 77, 94,  
-        99, 88, 100, 94, 93, 86) 
-S3 <- c(95, 86, 90, 90, 75, 83, 96, 85, 83, 84, 81, 98,  
-        77, 94, 84, 89, 93, 99, 91, 77, 95, 90, 91, 87,  
-        85, 76, 99, 99, 97, 97, 97, 77, 93, 96, 90, 87,  
-        97, 88) 
-S4 <- c(67, 93, 63, 83, 87, 97, 96, 92, 93, 96, 87, 90,  
-        94, 90, 82, 91, 85, 93, 83, 90, 87, 99, 94, 88,  
-        90, 72, 81, 93, 93, 94, 97, 89, 96, 95, 82, 97) 
- 
-scores <- list(S1=S1,S2=S2,S3=S3,S4=S4)</code> 
- 
-  * find means for each element in "scores" in a list format 
-  * find standard deviation for each element in "scores" in a data frame format 
-  * find variance  for each element in "scores" in a data frame format without using "var" function 
- 
-<code>longdata<- c(-1.850152, -1.406571, -1.0104817, -3.7170704,  
-           -0.2804896, 0.9496313, 1.346517, -0.1580926, 1.6272786,  
-           -2.4483321, -0.5407272, -1.708678, -0.3480616, -0.2757667,  
-           -1.2177024)</code> 
-  * make "longdata" to a matrix whose size is  3 by 5 
-  * name columns "trial1, trial2, . . . . trial5" 
-  * name rows "subject1, subject2, subject3" 
-  * get means for each subject  
-  * attach the above data to the matrix data and name it "longtemp." 
-  * get standard deviation for each trial 
-  * attach the above data to the matrix data, "longtemp." 
- 
- 
-<code>suburbs <- read.csv("http://commres.net/wiki/_export/code/r/data_transformations?codeblock=15", head=T, sep=" ")</code> 
-  * get subrubs data  as the above 
-  * get population means by each state (listed in the data, suburbs) 
-    * use aggregate and refer to the below e.g. 
-<code>attach(Cars93) 
-aggregate(MPG.city ~ Origin, Cars93, mean)</code> 
-  * get population sum by each county with  tapply function.  
-  * tapply(number, byfactor, function) 
-  * how many counties are there? 
-  * Use Cars93 data, get MPG.city mean by Origin. 
- 
-__Using pnorm, qnorm__ 
-pnorm : get proportion out of normal distribution whose characteristics are mean and sd 
-<code>pnorm(84, mean=72, sd=15.2, lower.tail=FALSE)</code> 
-  * What is the value of  the below? 
-<code>pnorm(1)</code> 
-  * How would you get 68, 95, 99% from pnorm 
-      * use ?pnorm and see the default option 
- 
-  * generate 10 random numbers with runif function 
- 
-<code>year <- c(1900:2016)     # years in vector year 
-world.series <- data.frame(year)</code> 
-  * get 10 year samples out of world.series data with "sample" command 
-  * how would you get the sample sample again latter? 
- 
-<code>pnorm(110, mean=100, sd=10)</code> 
-  * What would be the result from the above? 
- 
-<code>library(MASS)       # load the MASS package  
-tbl = table(survey$Smoke, survey$Exer)  
-tbl                 # the contingency table</code>  
- 
-<code>summary(tbl) 
-</code> 
-  * read the above output and interpret 
-  * what about the below one? 
-<code>chisq.test(tbl)  
-</code> 
- 
-see first [[:chi-square test]] 
-see [[:b:r cookbook:chi-square test]] in r document space for more 
- 
-<code> library(MASS) 
- cardata <- data.frame(Cars93$Origin, Cars93$Type) 
- cardata 
-</code> 
-  * Can you say the types of cars are different by the Origins? 
- 
-<code>dur <- faithful$eruptions 
-dur</code> 
-  * make the above data into z-score (zdur). 
-  * get mean of the zdur 
-  * get sd of the zdur 
- 
-<code> 
-set.seed(1123) 
-x <- rnorm(50, mean=100, sd=15) 
-</code> 
-  * test x against population  mean 95. 
-  * test x against population  mean 99. 
-  * are they different from each other? 
-  * what would you do if you want to see the different result from the  second one? 
- 
-<code>a = c(65, 78, 88, 55, 48, 95, 66, 57, 79, 81) 
- 
-> t.test(a, mu=60) 
- 
- One Sample t-test 
- 
-data:  a 
-t = 2.3079, df = 9, p-value = 0.0464 
-alternative hypothesis: true mean is not equal to 60 
-95 percent confidence interval: 
- 60.22187 82.17813 
-sample estimates: 
-mean of x  
-     71.2  
-</code> 
-  * find the t critical value with function qt.  
-  * explain what happens in the next code 
-  * read (or remind) what pnorm and qnorm do. 
-<code>> s <- sd(x) 
-> m <- mean(x) 
-> n <- length(x) 
-> n 
-[1] 50 
-> m 
-[1] 96.00386 
-> s 
-[1] 17.38321 
-> SE <- s / sqrt(n) 
-> SE 
-[1] 2.458358 
-> E <- qt(.975, df=n-1)*SE 
-> E 
-[1] 4.940254 
-> m + c(-E, E) 
-[1]  91.0636 100.9441 
-> </code> 
- 
- 
-  * what's wrong with the below? 
-<code>t.test(x)</code> 
- 
-<code>> mtcars</code> 
-  * using aggregate, get mean for each trnas. type. 
-  * compare the difference of mileage between auto and manual cars. 
-    * use t.test (two sample) 
-    * "use var.equal=T" option 
- 
-<code>a = c(175, 168, 168, 190, 156, 181, 182, 175, 174, 179) 
-b = c(185, 169, 173, 173, 188, 186, 175, 174, 179, 180) 
-</code> 
-  * stack them into data c 
-  * convert colnames into score and trans 
-  * t.test score by trans with var.equal option true.  
-  * aov test 
-  * see  t.test t value, t = -0.9474 and F value,  F = ? 
  
 </WRAP> </WRAP>
Line 697: Line 540:
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
 ANOVA ANOVA
-[[:r:oneway anova]] 
-[[:b:r cookbook:twoway anova]] 
-[[:b:r cookbook:linear regression]] 
-[[:b:r cookbook:multiple regression]] 
-[[:partial and semipartial correlation]] 
- 
-[[:statistical regression methods]] 
-[[:sequential_regression]] 
- 
-  
-[[:factor analysis]] 
- 
 Linear Regression and ANOVA Linear Regression and ANOVA
 http://commres.net/wiki/text_mining_example_with_korean_songs http://commres.net/wiki/text_mining_example_with_korean_songs
Line 767: Line 598:
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
 +===== Assignment =====
 +<color #ed1c24>**그룹과제 내용수정 ----**</color>
 +__그룹과제 내용을 아래와 같이 수정합니다.__
 +
 +그룹 assignment: 
 +  * independent t-test, repeated measures t-test, ANOVA, Factorial ANOVA, repeated measures ANOVA, regression, multiple regression 와 관련된 가설을 만들고, 
 +  * MS WORD를 이용하여 각 가설에 대응하는 설문문항을 모두 작성하시오. 
 +  * 아래 가설에 대응하는 데이터를 자의적으로 만든 후 검증을 하시오. 
 +    * Independent t-test
 +    * ANOVA
 +    * Factorial ANOVA
 +    * Multiple Regression
 +  * 검증 결과를 자세하게 논하시오. 
 +
 +과제는 기본적으로 아래를 수행하여야 합니다.
 +  * MS Word를 이용하여 작성합니다 (아래한글 제외)
 +  * 가설만들기:    
 +    * 가설은 일반상식, 알고있는 사회과학 이론 등에 기반을 해서 만듭니다
 +      * 가설작성에는 가설에 대한 설명이 포함되어야 합니다. 즉, 가설만 만들어서는 부족합니다.
 +      * 가설들은 서로 연관되어 있어도 좋습니다. 가령, 한 이론에서 파생된 t-test와 ANOVA 가설등.
 +      * 아래 통계테스트에 대응하는 가설을 모두 만들어야 합니다
 +        * Independent t-test
 +        * Repeated measures t-test
 +        * ANOVA
 +        * Factorial ANOVA
 +        * Repeated measures ANOVA
 +        * Regression
 +        * Multiple Regression
 +  * 설문문항 만들기
 +    * 각 가설에 대응하는 서베이 문항을 만들어야 합니다. 서베이문항은 다음을 포함합니다.
 +    * 각 가설을 (7개, indepedent t-test, repeated measures t-test, ANOVA, etc.) 검증할 수 있는 문항들 
 +  * 데이터 수집
 +    * <color #ed1c24>**데이터는 구글서베이를 이용하여 수집하지 않습니다.**</color>
 +    * 각 그룹 아래 가설에 해당하는 데이터를 <color #ed1c24>**인위적으로 만들어**</color> 테스트합니다. 
 +    * (인위적으로 만들) 응답자 수는 최소 30명으로 합니다. 즉, 30명의 데이터를 인위적으로 만듭니다.
 +      * Independent t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * Multiple Regression
 +  * 가설의 검증
 +    * R을 이용하여 가설을 검증합니다. 
 +    * R 코드와 아웃풋을 MS Word에 기록합니다 
 +    * MS Word에서 R코드와 아웃풋에 사용되는 폰트는 fixed width로 합니다 (courier, courier new와 같은)
 +    * 분석은 인위적으로 데이터를 만든 가설만을 포함하면 됩니다.
 +      * Independent t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * Multiple Regression (두 가지 이상의 IV 포함한)
 +  * 결론 쓰기
 +    * 검증 결과를 의미있게 논합니다.
 +    * 가설을 만드는데 사용된 이론이나 아이디어와 연관지어 의미있는 결론을 도출해 냅니다.
 +
 +----
 +과제제출
 +  * 가설만들기
 +    * 가설 소개와 설명 (이론이나 논리적인 아이디어에 기반한)
 +    * 각 가설마다 새로운 이론을 사용할 필요는 없습니다.
 +      * independent t-test
 +      * repeated measures t-test
 +      * ANOVA
 +      * Factorial ANOVA
 +      * repeated measures ANOVA
 +      * regression
 +      * multiple regression
 +  * 변인, 변수 설명과 대응하는 설문문항 작성
 +    * 각 가설의 IV와 DV 파악 및 측정 수준에 대한 설명
 +    * 가설에 대한 설문문항 작성
 +  * 데이터 인위적 수집
 +  * 분석
 +    * 각 가설검증을 위해 사용된 코드 및 아웃풋
 +    * 이에 대한 설명
 +  * 결론
 +    * 검증 결과 논의 
 </WRAP> </WRAP>
 ====== Week16 (June 22, 25) ====== ====== Week16 (June 22, 25) ======
 <WRAP half column> <WRAP half column>
 __**Final-term**__ __**Final-term**__
 +  * July 02. 목요일 Quiz 봅니다. 
 +  * 퀴즈 시간은 12:00 - 5:00 입니다. 퀴즈 시간은 한정되어 있습니다. 연장이나 늦게 제출되지 않도록 할 예정입니다. 60분이 제한시간이면 이 시간이 지나면 자동제출됩니다.
 +  * 범위는 다음과 같습니다. 
 +    * t-test
 +    * ANOVA
 +    * Repeated measure ANOVA
 +    * Factorial ANOVA
 +    * correlation
 +    * Regression
 +    * Multiple regression
 +      * Using dummy variable 
 +      * Interpreting IVs roles
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
c/ms/2020/schedule.txt · Last modified: 2021/03/02 09:42 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki