User Tools

Site Tools


c:ms:2024:schedule

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
c:ms:2024:schedule [2024/03/25 08:51] – [Week05] hkimscilc:ms:2024:schedule [2024/06/12 08:49] (current) – [Week16] hkimscil
Line 381: Line 381:
 ====== Week04 ====== ====== Week04 ======
 <WRAP half column> <WRAP half column>
-다음 주 수요일 (5주차 두번째시간) 퀴즈 있습니다.  +동영상 시청
-퀴즈 범위는  +
-  * 5주차까지 언급된 모든 동영상 +
-  * R 과 관련해서는 동영상 내용만 포함합니다.  +
-문서 +
-  * [[:Sampling]]  +
-  * [[:Hypothesis]] +
-  * [[:Variables]] +
-    * [[:Types of Variables]] +
-    * [[:Level of Measurement]] +
-  * [[:Operationalization]] +
-  * [[:Conceptualization]] +
-  * [[:Mean]], [[:Median]], [[:Mode]] +
-  * [[:Variance]], [[:Standard Deviation]] +
-  * [[:Sampling Distribution]] +
-  * [[:Central Limit Theorem]] +
-  * [[:Sampling Distribution in R]]+
  
-  * 시험문제는 4지선다 혹은 단답식 답입니다.  +  * https://youtu.be/Qaxj6LZ-iL0 : sampling distribution 
-  * 문제는 모두 50문제 도입니다.+  * https://youtu.be/0RZJbZtzs6s : sampling distribution e.g. in R 
 +  * https://youtu.be/AbeIQvJJ5Vw : mean and variance (standard deviation) in sampling distribution (샘플평균들의 집합에서의 평균과 분산 (표준편차)) 
 +  * https://youtu.be/zFdbt2XoeM4 : CLT (central limit theorem) and standard error 중심극한리와 표준오차 
 +  * https://youtu.be/Udp-4MLAlvc : Testing hypothesis based on CLT principle CLT에 근거를 둔 가설의 검증  
 + 
 + 
 +  * [[:sampling distribution in r]] 
  
 ===== Class Activity ===== ===== Class Activity =====
Line 428: Line 418:
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
 +{{:c:ms:2023:pasted:20230329-102748.jpeg}}
 +아래 두번째 그림은 population의 평균이 102 일 때
 +400명을 (1600명이 아니라) 샘플로 취했을 때의 
 +샘플평균들의 집합을 그린것입니다. 
 +{{:c:ms:2023:pasted:20230329-102811.jpeg}}
 +
  
 ===== Assignment ===== ===== Assignment =====
 +===== Announcement Quiz 01 =====
 +다음 주 수요일 (5주차 두번째시간) 퀴즈 있습니다. 
 +퀴즈 범위는 
 +  * 5주차까지 언급된 모든 동영상
 +  * R 과 관련해서는 동영상 내용만 포함합니다. 
 +문서
 +  * [[:Sampling]] 
 +  * [[:Hypothesis]]
 +  * [[:Variables]]
 +    * [[:Types of Variables]]
 +    * [[:Level of Measurement]]
 +  * [[:Operationalization]]
 +  * [[:Conceptualization]]
 +  * [[:Mean]], [[:Median]], [[:Mode]]
 +  * [[:Variance]], [[:Standard Deviation]]
 +  * [[:Sampling Distribution]]
 +  * [[:Central Limit Theorem]]
 +  * [[:Sampling Distribution in R]]
 +
 +  * 시험문제는 4지선다 혹은 단답식 답입니다. 
 +  * 문제는 모두 50문제 정도입니다.
 +
  
 </WRAP> </WRAP>
Line 435: Line 453:
 ====== Week05 ====== ====== Week05 ======
 <WRAP half column> <WRAP half column>
-===== Announcement Quiz 01 ===== 
 <WRAP box> <WRAP box>
 </WRAP> </WRAP>
Line 476: Line 493:
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
-{{:c:ms:2023:pasted:20230329-102748.jpeg}} +===== Assignment ===== 
-아래 두번째 그림은 population의 평균이 102 일 때 + 
-400명을 (1600명이 아니라) 샘플로 취했을 때의  +</WRAP>
-샘플평균들의 집합을 그린것입니다.  +
-{{:c:ms:2023:pasted:20230329-102811.jpeg}}+
  
 <code> <code>
Line 492: Line 507:
 m.tg <- mean(treated.group) m.tg <- mean(treated.group)
 m.tg m.tg
 +
 +# H1: m.tg =\ mu.pop (100) ?
 +# H0: if m.tg =\ mu.pop (100) 
 +# then
 +# n=16 Xbar ~ N(mu.pop, 25/4) 
 +# 즉 Xbar집합의 분산은 6.25 
 +# 표준편차는 (표준오차, se) 2.5
 +# 따라서 Xbar 집합의 평균을 중심으로한 
 +# 95% 범위는 pop.mu +- 2*(se)
 +# 즉, 100중 95는 95 ~ 105 사이에서 샘플의 평균이 나와야 함
 +# 즉, m.tg는 위의 범위에서 나와야 함. 그러나
 +# 나머지 5%는 95 밑이나 105 위에서 나올 수도 있음
 +# 그런데, m.tg = 113.0706
 +# 이를 근거로 영가설을 부정하고 
 +# 검증하고자 하는 연구가설을 채택함
 +# 즉, treated group 과 모집단의 평균은 다르다. 혹은 
 +# treated group은 모집단에서 추출될 수 있는 샘플이 아니라
 +# 다른 모집단에 속한 샘플이다 (95% 확신, 5% 에러마진)
 +se <- sqrt((sd.pop^2)/16)
 +qnorm(0.975,mean=100,sd=se)
 +# [1] 104.8999
 +qnorm(0.025,mean=100,sd=se)
 +# [1] 95.10009
 +
 +# 그렇다면 mu.tg 값이 나올 확률은 몇일까?
 +pnorm(mu.tg, mean=100, sd=se)
 +# [1] 0.9999999
 +sscore <- (m.tg-mu.pop)/se
 +sscore
 +# [1] 5.22823 
 +1-pnorm(sscore,0,1)
 +# [1] 8.557037e-08
 +a <- 1-pnorm(sscore,0,1)
 +b <- pnorm(-sscore,0,1)
 +a
 +# [1] 8.557037e-08
 +b
 +# [1] 8.557037e-08
 +a+b
 +# [1] 1.711407e-07
  
 # install.packages("BSDA") # install.packages("BSDA")
Line 523: Line 578:
 </code> </code>
  
-===== Assignment =====+<code> 
 +> z.test(treated.group, mu=mu.pop, sigma.x=sd.pop)  
 + 
 + One-sample z-Test 
 + 
 +data:  treated.group 
 +5.2282, p-value 1.711e-07 
 +alternative hypothesis: true mean is not equal to 100 
 +95 percent confidence interval: 
 + 108.1707 117.9705 
 +sample estimates: 
 +mean of x  
 + 113.0706  
 + 
 +>  
 +# 위에서 . . . . z 값이 +_2 밖이면 영가설을 부정하고  
 +# 연구가설을 채택하게 된다 
 +</code> 
 + 
 +<code> 
 +# 샘플 숫자가 작을 경우 위의 +-2 점수가 정확하지 
 +# 않기 때문에 보정을 해주게 된다. 이 보정된 값은 
 +# 샘플의 숫자에 따라서 (degrees of freedom) 달 
 +# 라지게 된다 
 +</code> 
 +[[:t-test]] 
 +[[:t distribution table]] 
 +[[:r:t-test]] in R 
  
-</WRAP> 
  
 ====== Week06 ====== ====== Week06 ======
Line 552: Line 634:
 <WRAP half column> <WRAP half column>
 [[./schedule/week06 t-test and anova note]] [[./schedule/week06 t-test and anova note]]
 +<code>
 +# pnorm
 +# qnorm
 +# pt
 +# qt
 +percentage <- .975
 +df <- 99
 +t.critical <- qt(percentage, df) # sample size = df + 1 일 때, 95%에 해당하는 점수는?
 +t.critical
 +
 +t.calculated <- 3.6
 +df <- 8
 +pt(t.calculated, df) 
 +
 +</code>
 ===== Announcement ===== ===== Announcement =====
 ===== Assignment ===== ===== Assignment =====
 </WRAP> </WRAP>
 +
  
 ====== Week07 ====== ====== Week07 ======
Line 606: Line 704:
 ===== 8주차 퀴즈 ===== ===== 8주차 퀴즈 =====
 8주차 정기시험기간 중에 2차 퀴즈 8주차 정기시험기간 중에 2차 퀴즈
-  * 4월26일, 09:00 ~ (A, B교시)+  * 시간  
 +    * 09:00 ~ (A, B교시)
   * 범위   * 범위
     * 처음부터 One-way ANOVA test with post hoc test 까지 (R square에 대한 설명포함)     * 처음부터 One-way ANOVA test with post hoc test 까지 (R square에 대한 설명포함)
Line 630: Line 729:
 ====== Week08 ====== ====== Week08 ======
 시험기간 시험기간
-보강영상 수업 
  
 ====== Week09 ====== ====== Week09 ======
Line 689: Line 787:
  
 ===== Assignment ===== ===== Assignment =====
-그룹 assignment week09 
-{{:r:cookies.xlsx}} --> 2-way ANOVA test 계산해보기 
-{{:r:repeated_measures_anova_eg.xlsx}} --> Repeated measure ANOVA 계산해보기 ([[:Repeated Measure ANOVA]] 참조). 
-과제 첫 번째 문제는 Repeated measure ANOVA 입니다. Factorial ANOVA가 아닙니다.  
-<code> 
-patient drug1 drung2 drug3 
-1 30 28 16 
-2 14 18 10 
-3 24 20 18 
-4 38 34 20 
-5 26 28 14 
-</code> 
-edited 
-ms.23.ga.w09.anova 
-  - 위 데이터를 엑셀과 같은 스프레드시트 프로그램에 입력하고 F-test를 직접 계산하세요.  
-    * <del>{{:detergent.anova.by.hand.xlsx}} 엑셀의 데이터를 가지고 F-test를 직접 계산하세요.</del>  
-    * 과제는 ms.23.ga.groupID.w09.anova.by.hand.xlsx 파일에 <del>두개의 tab을 만들어</del> 수행하고 제출하세요 
-  - {{:r:twoway.anova.by.hand.xlsx}} 
-    * 위 파일을 다운로드 받아서 anova test를 직접 계산하세요.  
-    * 계산한 결과를 ms.23.ga.groupID.w09.twoway.anova.by.hand.xlsx 파일이름으로 저장하여 업로드하세요. 
-  - {{:r:twoway.anova.by.hand.data.csv}} 파일을 R에서 데이터로 (df) 불러와서 F-test를 수행하세요. 수행한 내용을 캡춰하여 groupID.w.09.twoway.anova.by.hand.data.docx 에 저장하여 업로드하세요. 과제 작성은 fixed font로 해야 합니다. 
-  - 조원과 의논하여 아래를 수행하세요 
-    * Indepdent sample t-test 를 수행할 가설을 전공과 관련하여 만드세요. 
-    * Oneway ANOVA 를 수행할 가설을 전공과 관련하여 만드세요.  
-    * Repeated measure ANOVA 를 수행할 가설을 전공과 관련하여 만드세요. 
-    * Twoway ANOVA 를 수행할 가설을 전공과 관련하여 만드세요.  
-    * ms.23.ga.groupID.w09.making.hypothesis.odc 와 같은 파일 이름으로 저장하여 업로드하세요 
----- 
-===== 소희학생 과제 ===== 
-  * 아래를 수행하세요. 소희학생은 group 13으로 되어 있어서 group 13으로 올리시기 바랍니다.  
-    * [[:t-test]], [[:ANOVA]], [[:repeated measure ANOVA]], [[:factorial ANOVA|twoway ANOVA]] 를 수행할 수 있는 가설을 만드세요.  
-    * 각 가설의 독립변인과 종속변인을 ([[:types of variables]]) 기술하세요. 
-    * 각 변인의 측정수준을 ([[:level of measurement]]) 기술하세요.  
-  * 아래를 수행하세요 
-    * R에서 ''?ToothGrowth'' 를 친 후에 이 데이터가 무엇에 관한 것인지 설명하세요.  
-    * supp를 독립변인으로 하여 가설을 만들고, R에서 검증한 후 (t-test) 결과를 출력하고 (출력은 fixed font로 해야 합니다), 이를 해석하세요. 
-    * dose를 독립변인으로 하여 가설을 만들고, R에서 검증을 한 후에 결과를 출력하고, 이를 해석하세요.  
-    * supp와 dose를 동시에 독립변인으로 하여 R에서 검증을 한 후에 결과를 출력하고, 이를 해석하세요.  
-  * 과제는  ms.23.ga.w09.anova.by.hand 의 과제제출란에 제출하되,  
-  * 파일이름은 ga.g13.w09.hypothesis.testing.docx 로 하여 과제파일을 올리세요.  
 </WRAP> </WRAP>
  
Line 764: Line 822:
  
 [[:repeated measure ANOVA]] [[:repeated measure ANOVA]]
 +  * [[:r:repeated measure ANOVA]] in R
 [[:correlation]] [[:correlation]]
 ---- ----
Line 822: Line 881:
 과제내용: 과제내용:
 아래 데이터를 다운로드 받아서 두 변인 간의 상관관계계수를 구하시오.  아래 데이터를 다운로드 받아서 두 변인 간의 상관관계계수를 구하시오. 
-{{:income.happiness.csv}}+{{:r:income.happiness.csv}} 
 +{{:r:income.happiness.cat.csv}}
 데이터는 수입과 행복을 측정한 것입니다. 실제 데이터를 살펴보고 R로 읽어 온 후에 R을 이용하여 아래를 구하시오. R에서의 명령어와 아웃풋을 카피/패이스트 하여 제출하시오 (fixed-font를 사용하여). 데이터는 수입과 행복을 측정한 것입니다. 실제 데이터를 살펴보고 R로 읽어 온 후에 R을 이용하여 아래를 구하시오. R에서의 명령어와 아웃풋을 카피/패이스트 하여 제출하시오 (fixed-font를 사용하여).
   * 각 변인의 deviation score 값을 구하여 ds.inc 와 ds.hap 에 저장하시오.    * 각 변인의 deviation score 값을 구하여 ds.inc 와 ds.hap 에 저장하시오. 
Line 841: Line 901:
 <WRAP half column> <WRAP half column>
 May 22 (월), 24 (수) May 22 (월), 24 (수)
-[[./schedule/w12.lecture.note]] 
- 
 ===== Announcement ===== ===== Announcement =====
  
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
 +[[:c:ms:regression lecture note for r]]
 동영상 Regression 동영상 Regression
   - https://youtu.be/68gho4ubOjs : Regression 1. Intro   - https://youtu.be/68gho4ubOjs : Regression 1. Intro
Line 855: Line 914:
 [[:b:r cookbook:general statistics]] [[:b:r cookbook:general statistics]]
  
-Graphics 
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
Line 865: Line 923:
 ====== Week13 ====== ====== Week13 ======
 <WRAP half column> <WRAP half column>
-<WRAP box> 
-May 29 (월), 31 (수) 
-<del>May 31 (수)</del>  
-6월 5일 (월) 세번째 퀴즈 
-퀴즈 범위는  
-처음부터 multiple regression까지 
- 
- 
-퀴즈 범위는  
-stats part 
-  * [[:sampling distribution]] 
-  * [[:central limit theorem]] 
-  * [[:hypothesis testing]] 
-  * [[:z-test]] 
-  * [[:types of error]] 
-  * [[:t-test]] 
-  * [[:ANOVA]] 
-  * [[:Factorial ANOVA]] 
-  * [[:Repeated Measure ANOVA]] 
-  * [[:correlation]] 
-  * [[:Regression]] 
-  * [[:Multiple Regression]] 
-  * [[:Interpretation of Multiple Regression]] 
-  * [[:Partial and semipartial correlation]] 
- 
-r part 
-  * [[:b/r_cookbook/data_structures|Data structure in r]] 
-  * [[:b:r cookbook:data transformations|Data transformation in r]] 
-  * [[:b:r_cookbook:general statistics]] in r 
-r은 주로 아웃풋에 대한 질문이 있을 예정입니다. 오픈 북이니 모든 명령어 등을 외울 필요는 없습니다.  
-</WRAP> 
- 
-===== Concepts and ideas ===== 
 영상 영상
   * https://youtu.be/LOEinkXaskA : Multiple Regression 01 Intro.    * https://youtu.be/LOEinkXaskA : Multiple Regression 01 Intro. 
Line 903: Line 928:
   * https://youtu.be/tc6wb7fBmiY : Week13 Multiple Regression 02 Dummy variables    * https://youtu.be/tc6wb7fBmiY : Week13 Multiple Regression 02 Dummy variables 
 </WRAP> </WRAP>
 +
 +[[:c/ms/regression_lecture_note_for_r]]
 +  * [[:correlation]]
 +  * [[:regression]]
 +  * [[:beta coefficients]]
 +[[:c/ms/multiple regression lecture note for r]]
 +[[:multiple regression]]
 +  * [[:r:dummy_variable]]
 +    * option reading [[:using dummy variables]] with spss
 +  * [[:partial and semipartial correlation]]
 +  * [[:sequential regression]]
 +  * <del>[[:statistical regression]]</del> <- 다루지 않습니다
 +
 +===== Concepts and ideas =====
 <WRAP half column> <WRAP half column>
 ===== Assignment ===== ===== Assignment =====
Line 911: Line 950:
 <WRAP half column> <WRAP half column>
 June 5(월), 7(수) June 5(월), 7(수)
-<del>영상보기  +13주차 참조
-  * https://youtu.be/AXMtT5cYpZ4 Factor Analysis +
-</del>+
 ===== Concepts and ideas ===== ===== Concepts and ideas =====
-<del>[[:using dummy variables|Including Dummy variables]]</del> 
-[[:r:dummy variable]] with R 
-[[:interaction effects in regression analysis]] 
-[[:sequential regression]] 
-[[:beta coefficients]] 
-[[:mediation analysis]] 
  
  
Line 936: Line 967:
 <WRAP half column> <WRAP half column>
 June 12, 14 June 12, 14
 +13주차 참조
 </WRAP> </WRAP>
 <WRAP half column> <WRAP half column>
 ===== Assignment ===== ===== Assignment =====
-그룹 assignment: ms.23.ga.w15.multiple.regression.groupID 
-그룹의 아래의 두 개 중 하나를 택하여 수행하시오. 6월 19일까지 완성 (ABB) 
-  - 일 
-    * data: elemapi2.csv 
-    * available at http://commres.net/wiki/_media/r/elemapi2.csv 
-    * api00 을 종속변인으로 하고 관련이 있을 것 같고 흥미로운 변인들을 독립변인으로 하여 (최소한 3개 이상, 그 중 하나는 종류변인이어야 합니다) multiple regression을 디자인 하고 이를 수행한 후 경과와 결과를 보고하시오 
-    * api00을 종속변인으로 하고 두 개의 독립변인으로 avg_ed와 mealcat 두 개를 골라서 interaction을 포함한 regression을 수행한 후 경과와 결과를 보고하시오.   
-   - 이  
-    * data: College (in ISLR package in R)  
-      * data에 대한 정보 
-      * ''library(ISLR)'' 후 ''?College'' 
-    * 종속변인 하나를 골라서 다른 독립변인들을(최소 3개 이상) 가지고 Regression을 수행한 후 경과와 결과를 보고하시오. 
-    * 위에서의 종속변인과 두개의 독립변인을 골라서 (숫자+숫자 혹은 숫자+종류) interaction 효과를 포함하는 Regression을 한 후에 경과와 결과를 보고하시오 
- 
- 
- 
  
 </WRAP> </WRAP>
Line 977: Line 993:
     * [[:Regression]]     * [[:Regression]]
     * [[:Multiple Regression]]     * [[:Multiple Regression]]
 +      * [[:partial and semipartial correlation]]
       * [[:beta coefficients]]       * [[:beta coefficients]]
       * [[:r:dummy variable]]       * [[:r:dummy variable]]
-      * [[:interaction effects in regression analysis]]  
-      * [[:interaction effects in regression analysis]] 
       * [[:sequential regression]]       * [[:sequential regression]]
-      * [[:beta coefficients]]+      * <del>[[:interaction effects in regression analysis]]</del>
  
   * R 관련 문제는 아웃풋을 이해하는지에 치중을 하시면 됩니다. 실제 명령어 사용 등에 대한 문제는 나오지 않습니다.    * R 관련 문제는 아웃풋을 이해하는지에 치중을 하시면 됩니다. 실제 명령어 사용 등에 대한 문제는 나오지 않습니다. 
c/ms/2024/schedule.1711324272.txt.gz · Last modified: 2024/03/25 08:51 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki