User Tools

Site Tools


temp

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
temp [2016/12/12 08:36] hkimsciltemp [2021/07/15 18:24] (current) hkimscil
Line 1: Line 1:
-<code>1.  +{{20210715_174837.jpg}} 
-write.csv(Orange, "Orange.csv")+{{20210715_174929.jpg}} 
 +{{20210715_174822.jpg}} 
 +{{20210715_174746.jpg}}
  
-2.  
-> suburbs <- read.csv("https://goo.gl/0EsHke", sep = "\t") 
-> summary(suburbs) 
-                city         county  state   
- Arlington.Heights: 1   Cook    :7   IL:13   
- Aurora           : 1   Kane    :2   IN: 2   
- Bolingbrook      : 1   Lake(IN):  WI: 1   
- Chicago          : 1   DuPage  :1           
- Cicero           : 1   Kendall :1           
- Elgin            : 1   Kenosha :1           
- (Other)          :10   (Other) :2           
-      pop          
- Min.   :  63348   
- 1st Qu.:  73833   
- Median :  86700   
- Mean   : 265042   
- 3rd Qu.: 103615   
- Max.   :2853114   
-                   
--state = 3 종류 (IL, IN, WI) 
- 
-3.  
-> library(MASS) 
-> Cars93_over30 <- subset(Cars93, subset = c(Cars93$MPG.city >= 30)) 
- 
-4. 
-> g <- split(Cars93$MPG.city, Cars93$Origin) 
-> sapply(g, mean) 
-     USA  non-USA  
-20.95833 23.86667  
- 
-5.  
-> choose(50,3) 
-[1] 19600 
- 
-6.  
-> rnorm(1, mean = 100, sd = 15) 
-[1] 94.57244 
- 
-7-9. 
-> A <- c(19, 20, 24, 30, 31, 32, 30, 27, 22, 25) 
-> B <- c(23, 22, 15, 16, 18, 12, 16, 19, 14, 25) 
- 
-> AB <- data.frame(A,B) 
-> AB 
-    A  B 
-1  19 23 
-2  20 22 
-3  24 15 
-4  30 16 
-5  31 18 
-6  32 12 
-7  30 16 
-8  27 19 
-9  22 14 
-10 25 25 
- 
-> SAB <- stack(AB) 
- 
-> SAB 
-   values ind 
-1      19   A 
-2      20   A 
-3      24   A 
-4      30   A 
-5      31   A 
-6      32   A 
-7      30   A 
-8      27   A 
-9      22   A 
-10     25   A 
-11     23   B 
-12     22   B 
-13     15   B 
-14     16   B 
-15     18   B 
-16     12   B 
-17     16   B 
-18     19   B 
-19     14   B 
-20     25   B 
- 
-> summary(SAB) 
-     values     ind    
- Min.   :12.0   A:10   
- 1st Qu.:17.5   B:10   
- Median :22.0          
- Mean   :22.0          
- 3rd Qu.:25.5          
- Max.   :32.0  
- 
- 
- 
- 
- 
-7. 독립변인: 이미지 연상 이용 유무 
-8. 종속변인: 기억한 단어의 수 
-9. 종류 
-10. 숫자 
-11. 이미지 연상 이용 유무에 따라 기억한 단어의 수가 다를 것이다. 
- 
-12. 9 
-13. 9 
- 
-14. 26 
-15. 18 
-> tapply(SAB$values, SAB$ind, mean) 
-  
-26 18  
- 
- 
-> tapply(SAB$values, SAB$ind, var) 
-              B  
-22.22222 17.77778  
- 
-SS = var * df 이므로 
- 
-16.  
-> 22.22222 * 9 
-[1] 200 
- 
-17.  
-> 17.77778  * 9 
-[1] 160 
- 
-18. 
- 
- t.test(values~ind, var.eqaul = T) 
- 
- Welch Two Sample t-test 
- 
-data:  values by ind 
-t = 4, df = 17.78, p-value = 0.0008577 
-alternative hypothesis: true difference in means is not equal to 0 
-95 percent confidence interval: 
-  3.794434 12.205566 
-sample estimates: 
-mean in group A mean in group B  
-             26              18  
- 
-19.  
-t = 4 
- 
-20. 
-> a1 <- rnorm(20, mean = 200, sd = 15) 
-> a2 <- rnorm(20, mean = 190, sd = 15) 
-> a <- data.frame(a1,a2) 
- 
-> t.test(a$a1, a$a2) 
- 
- Welch Two Sample t-test 
- 
-data:  a$a1 and a$a2 
-t = 0.63759, df = 36.79, p-value = 0.5277 
-alternative hypothesis: true difference in means is not equal to 0 
-95 percent confidence interval: 
- -6.002291 11.512736 
-sample estimates: 
-mean of x mean of y  
- 194.3748  191.6196  
- 
--영가설: 두 집단 간의 평균에 차이가 없다. 
--두 집단 간 평균에 대한 t test를 시행했을 때, p-value가 0.5277로 0.05보다 크기 때문에 영가설을 기각할 수 없다. (유의수준: 95%) 
--따라서, 두 집단 간의 평균에 차이가 있다고 할 수 없다. 
- 
- 
-21. 
-> t.test(a1, mu = 190) 
- 
- One Sample t-test 
- 
-data:  a1 
-t = 1.5823, df = 19, p-value = 0.1301 
-alternative hypothesis: true mean is not equal to 190 
-95 percent confidence interval: 
- 188.5881 200.1615 
-sample estimates: 
-mean of x  
- 194.3748  
- 
--영가설: a1은 평균이 190이다. 
--t-test 결과, p-value가 0.1301로 0.05보다 크기 때문에 영가설을 기각할 수 없다. (유의수준: 95%) 
--따라서 a1의 평균이 모집단 평균(190)과 차이가 있다고 할 수 없다. 
- 
- 
-22. 
-> a3 <- rnorm(1000, mean = 200, sd = 15) 
-> t.test(a3, mu = 190) 
- 
- One Sample t-test 
- 
-data:  a3 
-t = 20.307, df = 999, p-value < 2.2e-16 
-alternative hypothesis: true mean is not equal to 190 
-95 percent confidence interval: 
- 198.9785 200.8994 
-sample estimates: 
-mean of x  
- 199.9389  
- 
--영가설: a3는 평균이 190이다. 
--t-test 결과, p-value < 0.05이므로 영가설을 기각한다. (유의수준: 95%) 
--따라서 a3의 평균이 모집단 평균(190)과 차이가 있다고 할 수 있다. 
- 
-23~30. 
- 
-> summary(InsectSprays) 
-     count       spray  
- Min.   : 0.00   A:12   
- 1st Qu.: 3.00   B:12   
- Median : 7.00   C:12   
- Mean   : 9.50   D:12   
- 3rd Qu.:14.25   E:12   
- Max.   :26.00   F:12   
- 
-> InsectSprays 
-   count spray 
-1     10     A 
-2      7     A 
-3     20     A 
-4     14     A 
-5     14     A 
-6     12     A 
-7     10     A 
-8     23     A 
-9     17     A 
-10    20     A 
-11    14     A 
-12    13     A 
-13    11     B 
-14    17     B 
-15    21     B 
-16    11     B 
-17    16     B 
-18    14     B 
-19    17     B 
-20    17     B 
-21    19     B 
-22    21     B 
-23         B 
-24    13     B 
-25         C 
-26         C 
-27         C 
-28         C 
-29         C 
-30         C 
-31         C 
-32         C 
-33         C 
-34         C 
-35         C 
-36         C 
-37         D 
-38         D 
-39    12     D 
-40         D 
-41         D 
-42         D 
-43         D 
-44         D 
-45         D 
-46         D 
-47         D 
-48         D 
-49         E 
-50         E 
-51         E 
-52         E 
-53         E 
-54         E 
-55         E 
-56         E 
-57         E 
-58         E 
-59         E 
-60         E 
-61    11     F 
-62         F 
-63    15     F 
-64    22     F 
-65    15     F 
-66    16     F 
-67    13     F 
-68    10     F 
-69    26     F 
-70    26     F 
-71    24     F 
-72    13     F 
- 
-23.  
-InsectSpray는 spray의 종류(spray)에 따른 곤충 박멸 수(count)의 데이터 프레임이다. 
- 
-24. 
-> tapply(InsectSprays$count, InsectSprays$spray, mean) 
-        A                                  
-14.500000 15.333333  2.083333  4.916667  3.500000  
-        F  
-16.666667  
- 
-> tapply(InsectSprays$count, InsectSprays$spray, var) 
-        A                                  
-22.272727 18.242424  3.901515  6.265152  3.000000  
-        F  
-38.606061  
- 
- 
-25. 
-> a <- aov(InsectSprays$count~InsectSprays$spray) 
-> a 
-Call: 
-   aov(formula = InsectSprays$count ~ InsectSprays$spray) 
- 
-Terms: 
-                InsectSprays$spray Residuals 
-Sum of Squares            2668.833  1015.167 
-Deg. of Freedom                  5        66 
- 
-Residual standard error: 3.921902 
-Estimated effects may be unbalanced 
- 
-> summary(a) 
-                   Df Sum Sq Mean Sq F value Pr(>F)     
-InsectSprays$spray  5   2669   533.8    34.7 <2e-16 *** 
-Residuals          66   1015    15.4                    
---- 
-Signif. codes:   
-0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
- 
-- 영가설 벌레 구충 효과에 차이가 없다. 
-- F value가 0.05보다 작으므로, 영가설을 기각한다. (유의수준 : 95%) 
-- (df = 71) 
-- 따라서 벌레 구충 효과에 차이가 있다고 할 수있다. 
- 
-26. 
-> TukeyHSD(a) 
-  Tukey multiple comparisons of means 
-    95% family-wise confidence level 
- 
-Fit: aov(formula = InsectSprays$count ~ InsectSprays$spray) 
- 
-$`InsectSprays$spray` 
-           diff        lwr       upr     p adj 
-B-A   0.8333333  -3.866075  5.532742 0.9951810 
-C-A -12.4166667 -17.116075 -7.717258 0.0000000 
-D-A  -9.5833333 -14.282742 -4.883925 0.0000014 
-E-A -11.0000000 -15.699409 -6.300591 0.0000000 
-F-A   2.1666667  -2.532742  6.866075 0.7542147 
-C-B -13.2500000 -17.949409 -8.550591 0.0000000 
-D-B -10.4166667 -15.116075 -5.717258 0.0000002 
-E-B -11.8333333 -16.532742 -7.133925 0.0000000 
-F-B   1.3333333  -3.366075  6.032742 0.9603075 
-D-C   2.8333333  -1.866075  7.532742 0.4920707 
-E-C   1.4166667  -3.282742  6.116075 0.9488669 
-F-C  14.5833333   9.883925 19.282742 0.0000000 
-E-D  -1.4166667  -6.116075  3.282742 0.9488669 
-F-D  11.7500000   7.050591 16.449409 0.0000000 
-F-E  13.1666667   8.467258 17.866075 0.0000000 
- 
-아래의 두 그룹 간에 차이가 있다고 할 수 있다. 
-A, B, F 
-C, D, E 
- 
-27. ToothGrowth는 supp와 dose에 따라 len이 어떤 영향을 받는지 설명하는 데이터프레임이다.(Factorial Design) 
-비타민의 용량(dose) 
-비타민 투여방법 (supp) - VC, OJ 
-ginea pic의 이빨길이 (len) 
- 
-28.  
-> ToothGrowth$dose = factor(ToothGrowth$dose, 
-                     levels=c(0.5,1.0,2.0), 
-                     labels=c("low","med","high")) 
-> summary(ToothGrowth) 
-      len        supp      dose    
- Min.   : 4.20   OJ:30   low :20   
- 1st Qu.:13.07   VC:30   med :20   
- Median :19.25           high:20   
- Mean   :18.81                     
- 3rd Qu.:25.27                     
- Max.   :33.90 
- 
-29. 
-> aov.out = aov(len ~ supp * dose, data=ToothGrowth) 
-> summary(aov.out) 
-            Df Sum Sq Mean Sq F value   Pr(>F)     
-supp          205.3   205.3  12.317 0.000894 *** 
-dose         1 2224.3  2224.3 133.415  < 2e-16 *** 
-supp:dose    1   88.9    88.9   5.333 0.024631 *   
-Residuals   56  933.6    16.7                      
---- 
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
- 
-supp의 효과와  
-dose의 효과가 각각 있으면  
-상호작용 효과 또한 존재한다.  
- 
- 
-30 
-> TukeyHSD(aov.out, "dose") 
-  Tukey multiple comparisons of means 
-    95% family-wise confidence level 
- 
-Fit: aov(formula = len ~ supp * dose, data = ToothGrowth) 
- 
-$dose 
-           diff       lwr       upr   p adj 
-med-low   9.130  6.362488 11.897512 0.0e+00 
-high-low 15.495 12.727488 18.262512 0.0e+00 
-high-med  6.365  3.597488  9.132512 2.7e-06 
- 
-세개의 dose 집단은 각각 다르다.  
-두 개의 supp 집단은 각각 다르다.  
- 
- 
- 
- 
-</code> 
temp.txt · Last modified: 2021/07/15 18:24 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki