User Tools

Site Tools


temp

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
temp [2016/12/12 08:34] hkimsciltemp [2021/07/15 18:24] (current) hkimscil
Line 1: Line 1:
-<code>1.  +{{20210715_174837.jpg}} 
-write.csv(Orange, "Orange.csv")+{{20210715_174929.jpg}} 
 +{{20210715_174822.jpg}} 
 +{{20210715_174746.jpg}}
  
-2.  
-> suburbs <- read.csv("https://goo.gl/0EsHke", sep = "\t") 
-> summary(suburbs) 
-                city         county  state   
- Arlington.Heights: 1   Cook    :7   IL:13   
- Aurora           : 1   Kane    :2   IN: 2   
- Bolingbrook      : 1   Lake(IN):  WI: 1   
- Chicago          : 1   DuPage  :1           
- Cicero           : 1   Kendall :1           
- Elgin            : 1   Kenosha :1           
- (Other)          :10   (Other) :2           
-      pop          
- Min.   :  63348   
- 1st Qu.:  73833   
- Median :  86700   
- Mean   : 265042   
- 3rd Qu.: 103615   
- Max.   :2853114   
-                   
--state = 3 종류 (IL, IN, WI) 
- 
-3.  
-> library(MASS) 
-> Cars93_over30 <- subset(Cars93, subset = c(Cars93$MPG.city >= 30)) 
- 
-4. 
-> g <- split(Cars93$MPG.city, Cars93$Origin) 
-> sapply(g, mean) 
-     USA  non-USA  
-20.95833 23.86667  
- 
-5.  
-> choose(50,3) 
-[1] 19600 
- 
-6.  
-> rnorm(1, mean = 100, sd = 15) 
-[1] 94.57244 
- 
-7-9. 
-> A <- c(19, 20, 24, 30, 31, 32, 30, 27, 22, 25) 
-> B <- c(23, 22, 15, 16, 18, 12, 16, 19, 14, 25) 
- 
-> AB <- data.frame(A,B) 
-> AB 
-    A  B 
-1  19 23 
-2  20 22 
-3  24 15 
-4  30 16 
-5  31 18 
-6  32 12 
-7  30 16 
-8  27 19 
-9  22 14 
-10 25 25 
- 
-> SAB <- stack(AB) 
- 
-> SAB 
-   values ind 
-1      19   A 
-2      20   A 
-3      24   A 
-4      30   A 
-5      31   A 
-6      32   A 
-7      30   A 
-8      27   A 
-9      22   A 
-10     25   A 
-11     23   B 
-12     22   B 
-13     15   B 
-14     16   B 
-15     18   B 
-16     12   B 
-17     16   B 
-18     19   B 
-19     14   B 
-20     25   B 
- 
-> summary(SAB) 
-     values     ind    
- Min.   :12.0   A:10   
- 1st Qu.:17.5   B:10   
- Median :22.0          
- Mean   :22.0          
- 3rd Qu.:25.5          
- Max.   :32.0  
- 
- 
- 
- 
- 
-7. 독립변인: 이미지 연상 이용 유무 
-8. 종속변인: 기억한 단어의 수 
-9. 종류 
-10. 숫자 
-11. 이미지 연상 이용 유무에 따라 기억한 단어의 수가 다를 것이다. 
- 
-12. 9 
-13. 9 
- 
-14. 26 
-15. 18 
-> tapply(SAB$values, SAB$ind, mean) 
-  
-26 18  
- 
- 
-> tapply(SAB$values, SAB$ind, var) 
-              B  
-22.22222 17.77778  
- 
-SS = var. df이므로 
- 
-16.  
-22.22222 * 9 
- 
-17.  
-17.77778  * 9 
- 
-18. 
- 
- t.test(values~ind, var.eqaul = T) 
- 
- Welch Two Sample t-test 
- 
-data:  values by ind 
-t = 4, df = 17.78, p-value = 0.0008577 
-alternative hypothesis: true difference in means is not equal to 0 
-95 percent confidence interval: 
-  3.794434 12.205566 
-sample estimates: 
-mean in group A mean in group B  
-             26              18  
- 
-19.  
-t = 4 
- 
-20. 
-> a1 <- rnorm(20, mean = 200, sd = 15) 
-> a2 <- rnorm(20, mean = 190, sd = 15) 
-> a <- data.frame(a1,a2) 
- 
-> t.test(a$a1, a$a2) 
- 
- Welch Two Sample t-test 
- 
-data:  a$a1 and a$a2 
-t = 0.63759, df = 36.79, p-value = 0.5277 
-alternative hypothesis: true difference in means is not equal to 0 
-95 percent confidence interval: 
- -6.002291 11.512736 
-sample estimates: 
-mean of x mean of y  
- 194.3748  191.6196  
- 
--영가설: 두 집단 간의 평균에 차이가 없다. 
--두 집단 간 평균에 대한 t test를 시행했을 때, p-value가 0.5277로 0.05보다 크기 때문에 영가설을 기각할 수 없다. (유의수준: 95%) 
--따라서, 두 집단 간의 평균에 차이가 있다고 할 수 없다. 
- 
- 
-21. 
-> t.test(a1, mu = 190) 
- 
- One Sample t-test 
- 
-data:  a1 
-t = 1.5823, df = 19, p-value = 0.1301 
-alternative hypothesis: true mean is not equal to 190 
-95 percent confidence interval: 
- 188.5881 200.1615 
-sample estimates: 
-mean of x  
- 194.3748  
- 
--영가설: a1은 평균이 190이다. 
--t-test 결과, p-value가 0.1301로 0.05보다 크기 때문에 영가설을 기각할 수 없다. (유의수준: 95%) 
--따라서 a1의 평균이 모집단 평균(190)과 차이가 있다고 할 수 없다. 
- 
- 
-22. 
-> a3 <- rnorm(1000, mean = 200, sd = 15) 
-> t.test(a3, mu = 190) 
- 
- One Sample t-test 
- 
-data:  a3 
-t = 20.307, df = 999, p-value < 2.2e-16 
-alternative hypothesis: true mean is not equal to 190 
-95 percent confidence interval: 
- 198.9785 200.8994 
-sample estimates: 
-mean of x  
- 199.9389  
- 
--영가설: a3는 평균이 190이다. 
--t-test 결과, p-value < 0.05이므로 영가설을 기각한다. (유의수준: 95%) 
--따라서 a3의 평균이 모집단 평균(190)과 차이가 있다고 할 수 있다. 
- 
-23~30. 
- 
-> summary(InsectSprays) 
-     count       spray  
- Min.   : 0.00   A:12   
- 1st Qu.: 3.00   B:12   
- Median : 7.00   C:12   
- Mean   : 9.50   D:12   
- 3rd Qu.:14.25   E:12   
- Max.   :26.00   F:12   
- 
-> InsectSprays 
-   count spray 
-1     10     A 
-2      7     A 
-3     20     A 
-4     14     A 
-5     14     A 
-6     12     A 
-7     10     A 
-8     23     A 
-9     17     A 
-10    20     A 
-11    14     A 
-12    13     A 
-13    11     B 
-14    17     B 
-15    21     B 
-16    11     B 
-17    16     B 
-18    14     B 
-19    17     B 
-20    17     B 
-21    19     B 
-22    21     B 
-23         B 
-24    13     B 
-25         C 
-26         C 
-27         C 
-28         C 
-29         C 
-30         C 
-31         C 
-32         C 
-33         C 
-34         C 
-35         C 
-36         C 
-37         D 
-38         D 
-39    12     D 
-40         D 
-41         D 
-42         D 
-43         D 
-44         D 
-45         D 
-46         D 
-47         D 
-48         D 
-49         E 
-50         E 
-51         E 
-52         E 
-53         E 
-54         E 
-55         E 
-56         E 
-57         E 
-58         E 
-59         E 
-60         E 
-61    11     F 
-62         F 
-63    15     F 
-64    22     F 
-65    15     F 
-66    16     F 
-67    13     F 
-68    10     F 
-69    26     F 
-70    26     F 
-71    24     F 
-72    13     F 
- 
-23.  
-InsectSpray는 spray의 종류(spray)에 따른 곤충 박멸 수(count)의 데이터 프레임이다. 
- 
-24. 
-> tapply(InsectSprays$count, InsectSprays$spray, mean) 
-        A                                  
-14.500000 15.333333  2.083333  4.916667  3.500000  
-        F  
-16.666667  
- 
-> tapply(InsectSprays$count, InsectSprays$spray, var) 
-        A                                  
-22.272727 18.242424  3.901515  6.265152  3.000000  
-        F  
-38.606061  
- 
- 
-25. 
-> a <- aov(InsectSprays$count~InsectSprays$spray) 
-> a 
-Call: 
-   aov(formula = InsectSprays$count ~ InsectSprays$spray) 
- 
-Terms: 
-                InsectSprays$spray Residuals 
-Sum of Squares            2668.833  1015.167 
-Deg. of Freedom                  5        66 
- 
-Residual standard error: 3.921902 
-Estimated effects may be unbalanced 
- 
-> summary(a) 
-                   Df Sum Sq Mean Sq F value Pr(>F)     
-InsectSprays$spray  5   2669   533.8    34.7 <2e-16 *** 
-Residuals          66   1015    15.4                    
---- 
-Signif. codes:   
-0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
- 
-- 영가설 벌레 구충 효과에 차이가 없다. 
-- F value가 0.05보다 작으므로, 영가설을 기각한다. (유의수준 : 95%) 
-- (df = 71) 
-- 따라서 벌레 구충 효과에 차이가 있다고 할 수있다. 
- 
-26. 
-> TukeyHSD(a) 
-  Tukey multiple comparisons of means 
-    95% family-wise confidence level 
- 
-Fit: aov(formula = InsectSprays$count ~ InsectSprays$spray) 
- 
-$`InsectSprays$spray` 
-           diff        lwr       upr     p adj 
-B-A   0.8333333  -3.866075  5.532742 0.9951810 
-C-A -12.4166667 -17.116075 -7.717258 0.0000000 
-D-A  -9.5833333 -14.282742 -4.883925 0.0000014 
-E-A -11.0000000 -15.699409 -6.300591 0.0000000 
-F-A   2.1666667  -2.532742  6.866075 0.7542147 
-C-B -13.2500000 -17.949409 -8.550591 0.0000000 
-D-B -10.4166667 -15.116075 -5.717258 0.0000002 
-E-B -11.8333333 -16.532742 -7.133925 0.0000000 
-F-B   1.3333333  -3.366075  6.032742 0.9603075 
-D-C   2.8333333  -1.866075  7.532742 0.4920707 
-E-C   1.4166667  -3.282742  6.116075 0.9488669 
-F-C  14.5833333   9.883925 19.282742 0.0000000 
-E-D  -1.4166667  -6.116075  3.282742 0.9488669 
-F-D  11.7500000   7.050591 16.449409 0.0000000 
-F-E  13.1666667   8.467258 17.866075 0.0000000 
- 
-아래의 두 그룹 간에 차이가 있다고 할 수 있다. 
-A, B, F 
-C, D, E 
- 
-27. ToothGrowth는 supp와 dose에 따라 len이 어떤 영향을 받는지 설명하는 데이터프레임이다.(Factorial Design) 
-비타민의 용량(dose) 
-비타민 투여방법 (supp) - VC, OJ 
-ginea pic의 이빨길이 (len) 
- 
-28.  
-> ToothGrowth$dose = factor(ToothGrowth$dose, 
-                     levels=c(0.5,1.0,2.0), 
-                     labels=c("low","med","high")) 
-> summary(ToothGrowth) 
-      len        supp      dose    
- Min.   : 4.20   OJ:30   low :20   
- 1st Qu.:13.07   VC:30   med :20   
- Median :19.25           high:20   
- Mean   :18.81                     
- 3rd Qu.:25.27                     
- Max.   :33.90 
- 
-29. 
-> aov.out = aov(len ~ supp * dose, data=ToothGrowth) 
-> summary(aov.out) 
-            Df Sum Sq Mean Sq F value   Pr(>F)     
-supp          205.3   205.3  12.317 0.000894 *** 
-dose         1 2224.3  2224.3 133.415  < 2e-16 *** 
-supp:dose    1   88.9    88.9   5.333 0.024631 *   
-Residuals   56  933.6    16.7                      
---- 
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
- 
-supp의 효과와  
-dose의 효과가 각각 있으면  
-상호작용 효과 또한 존재한다.  
- 
- 
-30 
-> TukeyHSD(aov.out, "dose") 
-  Tukey multiple comparisons of means 
-    95% family-wise confidence level 
- 
-Fit: aov(formula = len ~ supp * dose, data = ToothGrowth) 
- 
-$dose 
-           diff       lwr       upr   p adj 
-med-low   9.130  6.362488 11.897512 0.0e+00 
-high-low 15.495 12.727488 18.262512 0.0e+00 
-high-med  6.365  3.597488  9.132512 2.7e-06 
- 
-세개의 dose 집단은 각각 다르다.  
-두 개의 supp 집단은 각각 다르다.  
- 
- 
- 
- 
-</code> 
temp.txt · Last modified: 2021/07/15 18:24 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki