multicolinearity

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
multicolinearity [2018/12/26 02:37] hkimscilmulticolinearity [2018/12/26 02:49] (current) – [regression test with factors] hkimscil
Line 36: Line 36:
  
 <code> <code>
-F-statistic: 74.91 on 1 and 58 DF,  p-value: 4.939e-12 
- 
-> set.seed(1) 
-> x1 <- rnorm(25) 
-> x2 <- rnorm(25, x1) 
-> y <- x1-x2 + rnorm(25) 
-> pairs( cbind(y,x1,x2) ) 
-> cor( cbind(y,x1,x2) ) 
-                     x1         x2 
-y   1.00000000 0.08089276 -0.2575073 
-x1  0.08089276 1.00000000  0.7872474 
-x2 -0.25750727 0.78724740  1.0000000 
-> summary(lm(y~x1)) 
- 
-Call: 
-lm(formula = y ~ x1) 
- 
-Residuals: 
-    Min      1Q  Median      3Q     Max  
--2.3178 -0.9417  0.1974  0.7032  2.6812  
- 
-Coefficients: 
-            Estimate Std. Error t value Pr(>|t|) 
-(Intercept)   0.1145     0.2687   0.426    0.674 
-x1            0.1106     0.2841   0.389    0.701 
- 
-Residual standard error: 1.322 on 23 degrees of freedom 
-Multiple R-squared:  0.006544, Adjusted R-squared:  -0.03665  
-F-statistic: 0.1515 on 1 and 23 DF,  p-value: 0.7007 
- 
-> summary(lm(y~x2)) 
- 
-Call: 
-lm(formula = y ~ x2) 
- 
-Residuals: 
-     Min       1Q   Median       3Q      Max  
--1.88739 -0.93086  0.06246  0.58728  2.94566  
- 
-Coefficients: 
-            Estimate Std. Error t value Pr(>|t|) 
-(Intercept)   0.1920     0.2604   0.737    0.469 
-x2           -0.2927     0.2290  -1.278    0.214 
- 
-Residual standard error: 1.282 on 23 degrees of freedom 
-Multiple R-squared:  0.06631, Adjusted R-squared:  0.02571  
-F-statistic: 1.633 on 1 and 23 DF,  p-value: 0.214 
- 
-> summary(lm(y~x1+x2)) 
- 
-Call: 
-lm(formula = y ~ x1 + x2) 
- 
-Residuals: 
-     Min       1Q   Median       3Q      Max  
--1.94803 -0.92496 -0.03868  0.42155  2.17441  
- 
-Coefficients: 
-            Estimate Std. Error t value Pr(>|t|)    
-(Intercept)   0.1541     0.2347   0.657   0.5181    
-x1            1.0194     0.4016   2.539   0.0187 *  
-x2           -0.9602     0.3340  -2.875   0.0088 ** 
---- 
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
- 
-Residual standard error: 1.153 on 22 degrees of freedom 
-Multiple R-squared:  0.2779, Adjusted R-squared:  0.2122  
-F-statistic: 4.232 on 2 and 22 DF,  p-value: 0.02785 
- 
-> cor(x1,x2) 
-[1] 0.7872474 
-> cor.test(x1,x2) 
- 
- Pearson's product-moment correlation 
- 
-data:  x1 and x2 
-t = 6.1227, df = 23, p-value = 3.026e-06 
-alternative hypothesis: true correlation is not equal to 0 
-95 percent confidence interval: 
- 0.5691639 0.9018451 
-sample estimates: 
-      cor  
-0.7872474  
- 
-> cps <- read.csv("http://commres.net/wiki/_export/code/r/data?codeblock=7", header = T, sep = "\t") 
-> cps 
-    癤풽ducation south sex experience union  wage age race 
-1              8               21      5.10  35    2 
-2              9               42      4.95  57    3 
-3             12                1      6.67  19    3 
-4             12                4      4.00  22    3 
-5             12               17      7.50  35    3 
-6             13                9     1 13.07  28    3 
-7             10               27      4.45  43    3 
-8             12                9     0 19.47  27    3 
-9             16               11     0 13.28  33    3 
-10            12                9      8.75  27    3 
-11            12               17     1 11.35  35    3 
-12            12               19     1 11.50  37    3 
-13                           27      6.50  41    3 
-14                           30      6.25  45    3 
-15                           29     0 19.98  44    3 
-16            12               37      7.30  55    3 
-17                           44      8.00  57    3 
-18            12               26     1 22.20  44    3 
-19            11               16      3.65  33    3 
-20            12               33     0 20.55  51    3 
-21            12               16      5.71  34    3 
-22                           42      7.00  55    1 
-23            12                9      3.75  27    3 
-24            11               14      4.50  31    1 
-25            12               23      9.56  41    3 
-26                           45      5.75  57    3 
-27            12                8      9.36  26    3 
-28            10               30      6.50  46    3 
-29            12                8      3.35  26    3 
-30            12                8      4.75  26    3 
-31            14               13      8.90  33    3 
-32            12               46      4.00  64    3 
-33                           19      4.70  33    3 
-34            17                1      5.00  24    3 
-35            12               19      9.25  37    3 
-36            12               36     0 10.67  54    1 
-37            12               20      7.61  38    1 
-38            12               35     1 10.00  53    1 
-39            12                3      7.50  21    3 
-40            14               10     0 12.20  30    3 
-41            12                0      3.35  18    3 
-42            14               14     1 11.00  34    3 
-43            12               14     0 12.00  32    3 
-44                           16      4.85  31    3 
-45            13                8      4.30  27    3 
-46                           15      6.00  28    3 
-47            16               12     0 15.00  34    3 
-48            10               13      4.85  29    3 
-49                           33      9.00  47    3 
-50            12                9      6.36  27    3 
-51            12                7      9.15  25    3 
-52            16               13     1 11.00  35    3 
-53            12                7      4.50  25    3 
-54            12               16      4.80  34    3 
-55            13                0      4.00  19    3 
-56            12               11      5.50  29    3 
-57            13               17      8.40  36    3 
-58            10               13      6.75  29    3 
-59            12               22     1 10.00  40    1 
-60            12               28      5.00  46    3 
-61            11               17      6.50  34    3 
-62            12               24     1 10.75  42    3 
-63                           55      7.00  64    2 
-64            12                3     0 11.43  21    3 
-65            12                6      4.00  24    1 
-66            10               27      9.00  43    3 
-67            12               19     1 13.00  37    1 
-68            12               19     1 12.22  37    3 
-69            12               38      6.28  56    3 
-70            10               41      6.75  57    1 
-71            11                3      3.35  20    1 
-72            14               20     1 16.00  40    3 
-73            10               15      5.25  31    3 
-74                            8      3.50  22    2 
-75                           39      4.22  53    3 
-76                           43      3.00  55    2 
-77            11               25      4.00  42    3 
-78            12               11     1 10.00  29    3 
-79            12               12      5.00  30    1 
-80            12               35     1 16.00  53    3 
-81            14               14     0 13.98  34    3 
-82            12               16     1 13.26  34    3 
-83            10               44      6.10  60    3 
-84            16               13      3.75  35    3 
-85            13                8      9.00  27    1 
-86            12               13      9.45  31    3 
-87            11               18      5.50  35    3 
-88            12               18      8.93  36    3 
-89            12                6      6.25  24    3 
-90            11               37      9.75  54    3 
-    occupation sector marr 
-1            6      1    1 
-2            6      1    1 
-3            6      1    0 
-4            6      0    0 
-5            6      0    1 
-6            6      0    0 
-7            6      0    0 
-8            6      0    0 
-9            6      1    1 
-10                0    0 
-11                0    1 
-12                1    0 
-13                0    1 
-14                0    0 
-15                0    1 
-16                2    1 
-17                0    1 
-18                1    1 
-19                0    0 
-20                0    1 
-21                1    1 
-22                1    1 
-23                0    0 
-24                0    1 
-25                0    1 
-26                1    1 
-27                1    1 
-28                0    1 
-29                1    1 
-30                0    1 
-31                0    0 
-32                0    0 
-33                0    1 
-34                0    0 
-35                1    0 
-36                0    0 
-37                2    1 
-38                2    1 
-39                0    0 
-40                1    1 
-41                0    0 
-42                1    1 
-43                1    1 
-44                1    1 
-45                2    0 
-46                1    1 
-47                1    1 
-48                0    0 
-49                0    1 
-50                1    1 
-51                0    1 
-52                1    1 
-53                1    1 
-54                1    1 
-55                0    0 
-56                1    0 
-57                1    0 
-58                1    1 
-59                1    0 
-60                1    1 
-61                0    0 
-62                2    1 
-63                1    1 
-64                2    0 
-65                1    0 
-66                2    1 
-67                1    1 
-68                2    1 
-69                1    1 
-70                1    1 
-71                1    0 
-72                0    1 
-73                0    1 
-74                1    1 
-75                1    1 
-76                1    1 
-77                1    1 
-78                0    1 
-79                0    1 
-80                1    1 
-81                0    0 
-82                0    1 
-83                1    0 
-84                0    0 
-85                1    0 
-86                1    0 
-87                0    1 
-88                0    1 
-89                0    0 
-90                1    1 
- [ reached getOption("max.print") -- omitted 444 rows ] 
-> head(cps) 
-  癤풽ducation south sex experience union  wage age race 
-1            8               21      5.10  35    2 
-2            9               42      4.95  57    3 
-3           12                1      6.67  19    3 
-4           12                4      4.00  22    3 
-5           12               17      7.50  35    3 
-6           13                9     1 13.07  28    3 
-  occupation sector marr 
-1          6      1    1 
-2          6      1    1 
-3          6      1    0 
-4          6      0    0 
-5          6      0    1 
-6          6      0    0 
-> colnames(cps) <- c("education") 
-> head(cps) 
-  education NA NA NA NA    NA NA NA NA NA NA 
-1          0  1 21  0  5.10 35  2  6  1  1 
-2          0  1 42  0  4.95 57  3  6  1  1 
-3        12  0  0  1  0  6.67 19  3  6  1  0 
-4        12  0  0  4  0  4.00 22  3  6  0  0 
-5        12  0  0 17  0  7.50 35  3  6  0  1 
-6        13  0  0  9  1 13.07 28  3  6  0  0 
-> cps <- read.csv("http://commres.net/wiki/_export/code/r/data?codeblock=7", header = T, sep = "\t") 
-> head(cps) 
-  education south sex experience union  wage age race 
-1                       21      5.10  35    2 
-2                       42      4.95  57    3 
-3        12                1      6.67  19    3 
-4        12                4      4.00  22    3 
-5        12               17      7.50  35    3 
-6        13                9     1 13.07  28    3 
-  occupation sector marr 
-1          6      1    1 
-2          6      1    1 
-3          6      1    0 
-4          6      0    0 
-5          6      0    1 
-6          6      0    0 
-> cps2 <- read.csv("http://commres.net/wiki/_export/code/r/data?codeblock=7", header = T, sep = "\t") 
-> head(cps2) 
-  education south sex experience union  wage age race 
-1                       21      5.10  35    2 
-2                       42      4.95  57    3 
-3        12                1      6.67  19    3 
-4        12                4      4.00  22    3 
-5        12               17      7.50  35    3 
-6        13                9     1 13.07  28    3 
-  occupation sector marr 
-1          6      1    1 
-2          6      1    1 
-3          6      1    0 
-4          6      0    0 
-5          6      0    1 
-6          6      0    0 
-> cps2 <- read.csv("http://commres.net/wiki/_media/cps_85_wages.csv", header = T, sep = "\t") 
-> head(cps2) 
-  education south sex experience union  wage age race 
-1                       21      5.10  35    2 
-2                       42      4.95  57    3 
-3        12                1      6.67  19    3 
-4        12                4      4.00  22    3 
-5        12               17      7.50  35    3 
-6        13                9     1 13.07  28    3 
-  occupation sector marr 
-1          6      1    1 
-2          6      1    1 
-3          6      1    0 
-4          6      0    0 
-5          6      0    1 
-6          6      0    0 
-> fit_model1 = lm(log(data1$Wage) ~., data = cps) 
-Error in eval(predvars, data, env) : object 'data1' not found 
-> fit_model1 = lm(log(cps$Wage) ~., data = cps) 
-Error in log(cps$Wage) : non-numeric argument to mathematical function 
-> str(cps) 
-'data.frame': 534 obs. of  11 variables: 
- $ education : int  8 9 12 12 12 13 10 12 16 12 ... 
- $ south     : int  0 0 0 0 0 0 1 0 0 0 ... 
- $ sex       : int  1 1 0 0 0 0 0 0 0 0 ... 
- $ experience: int  21 42 1 4 17 9 27 9 11 9 ... 
- $ union     : int  0 0 0 0 0 1 0 0 0 0 ... 
- $ wage      : num  5.1 4.95 6.67 4 7.5 ... 
- $ age       : int  35 57 19 22 35 28 43 27 33 27 ... 
- $ race      : int  2 3 3 3 3 3 3 3 3 3 ... 
- $ occupation: int  6 6 6 6 6 6 6 6 6 6 ... 
- $ sector    : int  1 1 1 0 0 0 0 0 1 0 ... 
- $ marr      : int  1 1 0 0 1 0 0 0 1 0 ... 
-> head(cps) 
-  education south sex experience union  wage age race 
-1                       21      5.10  35    2 
-2                       42      4.95  57    3 
-3        12                1      6.67  19    3 
-4        12                4      4.00  22    3 
-5        12               17      7.50  35    3 
-6        13                9     1 13.07  28    3 
-  occupation sector marr 
-1          6      1    1 
-2          6      1    1 
-3          6      1    0 
-4          6      0    0 
-5          6      0    1 
-6          6      0    0 
-> log(cps$wage) 
-  [1] 1.6292405 1.5993876 1.8976199 1.3862944 2.0149030 
-  [6] 2.5703195 1.4929041 2.9688748 2.5862591 2.1690537 
- [11] 2.4292177 2.4423470 1.8718022 1.8325815 2.9947318 
- [16] 1.9878743 2.0794415 3.1000923 1.2947272 3.0228609 
- [21] 1.7422190 1.9459101 1.3217558 1.5040774 2.2575877 
- [26] 1.7491999 2.2364453 1.8718022 1.2089603 1.5581446 
- [31] 2.1860513 1.3862944 1.5475625 1.6094379 2.2246236 
- [36] 2.3674361 2.0294632 2.3025851 2.0149030 2.5014360 
- [41] 1.2089603 2.3978953 2.4849066 1.5789787 1.4586150 
- [46] 1.7917595 2.7080502 1.5789787 2.1972246 1.8500284 
- [51] 2.2137539 2.3978953 1.5040774 1.5686159 1.3862944 
- [56] 1.7047481 2.1282317 1.9095425 2.3025851 1.6094379 
- [61] 1.8718022 2.3749058 1.9459101 2.4362415 1.3862944 
- [66] 2.1972246 2.5649494 2.5030740 1.8373700 1.9095425 
- [71] 1.2089603 2.7725887 1.6582281 1.2527630 1.4398351 
- [76] 1.0986123 1.3862944 2.3025851 1.6094379 2.7725887 
- [81] 2.6376277 2.5847520 1.8082888 1.3217558 2.1972246 
- [86] 2.2460147 1.7047481 2.1894164 1.8325815 2.2772673 
- [91] 1.9065751 2.0515563 1.0473190 1.2089603 2.9947318 
- [96] 2.1400662 2.2772673 2.7080502 2.0794415 2.4203681 
-[101] 2.6390573 2.3025851 1.8718022 2.2854389 2.9177707 
-[106] 2.5257286 3.2580965 2.6390573 2.3513753 2.3978953 
-[111] 2.5233258 2.5257286 2.7080502 1.7917595 2.2512918 
-[116] 1.6094379 1.3217558 2.5313130 1.9286187 1.7047481 
-[121] 1.9459101 1.5040774 1.8718022 2.4849066 1.6094379 
-[126] 1.8718022 1.9169226 2.1690537 1.3217558 1.5040774 
-[131] 1.7917595 1.7047481 2.5649494 1.7316555 1.5686159 
-[136] 1.9459101 1.6582281 1.2089603 2.1400662 1.7917595 
-[141] 1.9095425 2.1849270 2.6539459 2.3776926 2.1860513 
-[146] 2.0149030 1.5040774 2.4203681 2.5989791 1.7917595 
-[151] 1.5303947 2.3589654 1.6094379 2.1041342 1.8325815 
-[156] 2.1400662 3.2180755 2.8124102 1.8325815 1.5151272 
-[161] 2.4203681 3.0563569 2.5376572 2.0149030 2.3272777 
-[166] 1.2089603 2.5989791 1.5769147 3.2691886 1.8840347 
-[171] 3.7954892 2.7080502 2.4203681 1.9459101 2.3025851 
-[176] 2.6762155 2.9957323 3.1135153 1.2919837 2.3627390 
-[181] 3.2180755 1.7917595 2.9444390 2.5802168 3.1135153 
-[186] 2.7080502 1.9286187 2.4714836 2.7813007 2.6354795 
-[191] 2.5771819 1.6677068 1.5040774 2.3025851 2.3025851 
-[196] 2.3025851 2.2375131 1.7578579 2.8825636 0.0000000 
-[201] 2.1747517 2.1972246 2.8992214 2.0554050 2.3627390 
-[206] 1.5040774 2.8478121 2.3513753 2.2213750 2.7080502 
-[211] 3.1135153 1.5151272 2.1972246 2.5900171 2.7080502 
-[216] 2.0149030 1.4469190 2.5257286 1.6351057 1.2089603 
-[221] 2.4078456 1.3454724 1.8562980 1.7155981 2.3025851 
-[226] 1.7316555 2.4423470 1.2527630 1.2089603 1.5581446 
-[231] 2.9947318 1.2527630 1.3862944 1.9459101 1.8325815 
-[236] 1.5040774 2.6595600 1.6094379 2.6210388 2.6181255 
-[241] 2.0149030 1.3350011 1.6094379 2.2428351 1.7047481 
-[246] 1.3217558 1.2527630 1.7578579 2.4849066 1.6094379 
-[251] 2.1690537 2.3025851 2.1400662 2.1552445 2.1972246 
-[256] 1.7047481 2.4078456 2.3025851 1.6486586 2.0794415 
-[261] 1.2697605 1.6486586 2.4570214 2.4265711 2.0149030 
-[266] 1.7047481 1.6094379 2.0476928 1.6582281 2.1972246 
-[271] 2.2669579 1.6505799 1.9459101 2.4981519 1.6582281 
-[276] 2.3340838 1.2089603 2.0412203 2.2159373 2.1317968 
-[281] 1.3862944 1.4182774 1.0986123 1.4469190 2.0188950 
-[286] 2.3542283 1.6094379 2.7100482 2.4203681 1.8325815 
-[291] 1.2527630 1.9242487 2.5257286 2.4849066 1.7917595 
-[296] 2.2512918 1.4109870 2.3446863 1.6094379 2.0399208 
-[301] 1.7047481 1.8562980 2.5257286 1.8325815 2.0794415 
-[306] 2.2617631 2.2082744 2.0149030 1.6094379 1.9459101 
-[311] 1.2669476 2.1400662 1.5040774 2.0643279 1.6582281 
-[316] 1.6094379 2.2332350 2.3513753 2.0149030 2.2512918 
-[321] 2.2617631 1.7698546 2.3997118 1.6094379 1.7263317 
-[326] 2.5257286 2.3804716 1.6863990 1.9459101 1.5238800 
-[331] 1.7917595 2.4604432 1.7263317 1.7047481 1.5789787 
-[336] 1.9095425 1.4469190 1.7491999 1.2527630 1.2089603 
-[341] 2.3627390 2.0794415 1.5581446 2.1400662 2.1804175 
-[346] 2.0794415 1.7917595 1.9657128 1.2237754 1.7917595 
-[351] 1.3217558 2.1849270 1.4701758 2.5726122 1.4701758 
-[356] 1.2527630 1.3350011 1.6601310 1.2089603 2.7887081 
-[361] 1.4469190 1.5040774 2.0794415 1.3862944 2.0744290 
-[366] 1.3862944 1.4231083 1.7833912 1.2809338 2.1690537 
-[371] 1.2237754 1.4539530 1.6770966 1.6094379 2.0347056 
-[376] 1.9373018 2.0149030 1.2809338 0.5596158 1.2383742 
-[381] 2.2648832 2.1388890 2.1961128 1.2947272 1.2527630 
-[386] 1.2325603 1.7047481 1.9358598 1.2556160 1.3217558 
-[391] 1.4279160 2.2586332 2.6858046 2.5257286 1.7047481 
-[396] 1.6389967 2.0794415 1.7630170 1.2089603 1.9459101 
-[401] 2.3025851 2.0794415 1.9286187 1.7137979 2.0149030 
-[406] 2.1894164 2.1972246 1.2527630 1.7526721 3.2188758 
-[411] 1.9242487 1.8718022 1.3217558 1.2527630 1.5040774 
-[416] 0.6981347 1.4279160 2.5649494 1.3812818 2.0149030 
-[421] 2.5741378 1.3862944 1.3737156 2.5649494 2.1972246 
-[426] 1.5151272 2.2512918 1.5040774 2.1690537 2.3025851 
-[431] 2.8903718 3.2180755 2.4890647 3.0910425 2.1690537 
-[436] 3.1000923 2.8478121 1.7917595 2.0869136 2.2235419 
-[441] 2.4849066 2.3617970 1.7422190 2.3025851 2.8622009 
-[446] 2.7080502 2.0515563 2.0541237 2.3025851 3.2180755 
-[451] 2.3302003 2.7080502 2.4849066 2.3589654 1.7664417 
-[456] 2.4176979 2.1471002 2.6311692 1.7422190 2.7593768 
-[461] 2.0149030 2.4203681 1.8164521 2.5989791 1.8325815 
-[466] 1.8718022 2.4849066 2.1400662 2.0794415 1.7491999 
-[471] 2.7555697 2.2884862 2.6034302 1.6863990 1.8325815 
-[476] 1.7047481 1.6094379 1.8325815 1.7491999 3.0204249 
-[481] 1.6094379 1.9459101 2.8903718 2.4849066 3.0155349 
-[486] 3.1000923 2.7985001 2.1552445 2.9642416 2.6390573 
-[491] 2.3025851 2.7694588 2.9957323 2.3025851 3.2180755 
-[496] 2.4203681 3.1280755 2.3223877 2.3025851 2.6390573 
-[501] 2.5257286 1.7561323 3.2180755 1.4701758 2.4203681 
-[506] 1.8976199 2.0794415 2.8992214 2.4849066 2.1849270 
-[511] 2.2512918 2.6137395 2.4849066 2.7080502 2.5392370 
-[516] 1.9987736 2.7447035 2.0082140 1.8325815 1.8325815 
-[521] 2.2375131 3.1135153 2.0149030 1.9459101 1.7491999 
-[526] 2.0373166 2.5257286 2.7725887 2.4672517 2.4300984 
-[531] 1.8082888 3.1463051 2.9897142 2.7330680 
 > lm1 = lm(log(cps$wage) ~., data = cps) > lm1 = lm(log(cps$wage) ~., data = cps)
 > summary(lm1) > summary(lm1)
Line 546: Line 65:
 Multiple R-squared:  0.3185, Adjusted R-squared:  0.3054  Multiple R-squared:  0.3185, Adjusted R-squared:  0.3054 
 F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16 F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16
 +</code>
  
-> plot(lm1) +<code> 
-Hit <Returnto see next plot:  +plot(lm1) 
-Hit <Return> to see next plot:  +</code
-Hit <Return> to see next plot:  +{{lm1.plot1.png?300}}{{lm1.plot2.png?300}} 
-Hit <Return> to see next plot:  +{{lm1.plot3.png?300}}{{lm1.plot4.png?300}} 
-Warning messages: + 
-1: not plotting observations with leverage one: + 
-  444  +<code>
-2: not plotting observations with leverage one: +
-  444  +
->  +
- +
-+
 > library(corrplot) > library(corrplot)
-corrplot 0.84 loaded 
- 
 > cps.cor = cor(cps) > cps.cor = cor(cps)
-> corrplot.mixed(cps.cor, lower.col = “black”, number.cex = .7) +> corrplot.mixed(cps.cor, lower.col = "black"
-Error: unexpected input in "corrplot.mixed(cps.cor, lower.col = ? +</code
-> corrplot.mixed(cps.cor, lower.col = "black", number.cex = .7+{{cps.corrplot.png?500}}
-install.packages("mctest") +
-Installing package into ‘C:/Users/Hyo/Documents/R/win-library/3.5’ +
-(as ‘lib’ is unspecified) +
-trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/mctest_1.2.zip' +
-Content type 'application/zip' length 68474 bytes (66 KB) +
-downloaded 66 KB+
  
-package ‘mctest’ successfully unpacked and MD5 sums checked +<code> 
- +> install.packages("mctest")
-The downloaded binary packages are in +
- C:\Users\Hyo\AppData\Local\Temp\RtmpofABMJ\downloaded_packages+
 > library(mctest) > library(mctest)
-> omcdiag(cps[,c(1:5,7:11)], cps$wage) +omcdiag(cps[,c(-6)], cps$wage) # or "omcdiag(cps[,c(1:5,7:11)], cps$wage)" will work as well.
  
 Call: Call:
-omcdiag(x = cps[, c(1:5, 7:11)], y = cps$wage)+omcdiag(x = cps[, c(-6)], y = cps$wage)
  
  
Line 598: Line 103:
 0 --> COLLINEARITY is not detected by the test 0 --> COLLINEARITY is not detected by the test
  
-head(str) +>  
-                          +</code>
-1 function (object, ...)  +
-2 UseMethod("str"       +
-> head(cps) +
-  education south sex experience union  wage age race occupation sector marr +
-1                       21      5.10  35    2          6      1    1 +
-2                       42      4.95  57    3          6      1    1 +
-3        12                1      6.67  19    3          6      1    0 +
-4        12                4      4.00  22    3          6      0    0 +
-5        12               17      7.50  35    3          6      0    1 +
-6        13                9     1 13.07  28    3          6      0    0 +
-> omcdiag(cps[,c(-6)], cps$wage)  +
- +
-Call: +
-omcdiag(x = cps[, c(-6)], y = cps$wage) +
- +
- +
-Overall Multicollinearity Diagnostics +
- +
-                       MC Results detection +
-Determinant |X'X|:         0.0001         1 +
-Farrar Chi-Square:      4833.5751         1 +
-Red Indicator:             0.1983         0 +
-Sum of Lambda Inverse: 10068.8439         1 +
-Theil's Method:            1.2263         1 +
-Condition Number:        739.7337         1 +
- +
-1 --> COLLINEARITY is detected by the test  +
-0 --COLLINEARITY is not detected by the test+
  
 +<code>
 > imcdiag(cps[,c(-6)],cps$wage)  > imcdiag(cps[,c(-6)],cps$wage) 
  
Line 658: Line 136:
 * use method argument to check which regressors may be the reason of collinearity * use method argument to check which regressors may be the reason of collinearity
 =================================== ===================================
-pcor(cps[,c(-6)],method = “pearson”)$estimate  +>  
-Error: unexpected input in "pcor(cps[,c(-6)],method = ? +</code
-pcor(cps[,c(-6)], method = "pearson")$estimate  + 
-              education        south          sex  experience        union         age         race   occupation +<code>
-education   1.000000000 -0.031750193  0.051510483 -0.99756187 -0.007479144  0.99726160  0.017230877  0.029436911 +
-south      -0.031750193  1.000000000 -0.030152499 -0.02231360 -0.097548621  0.02152507 -0.111197596  0.008430595 +
-sex         0.051510483 -0.030152499  1.000000000  0.05497703 -0.120087577 -0.05369785  0.020017315 -0.142750864 +
-experience -0.997561873 -0.022313605  0.054977034  1.00000000 -0.010244447  0.99987574  0.010888486  0.042058560 +
-union      -0.007479144 -0.097548621 -0.120087577 -0.01024445  1.000000000  0.01223890 -0.107706183  0.212996388 +
-age         0.997261601  0.021525073 -0.053697851  0.99987574  0.012238897  1.00000000 -0.010803310 -0.044140293 +
-race        0.017230877 -0.111197596  0.020017315  0.01088849 -0.107706183 -0.01080331  1.000000000  0.057539374 +
-occupation  0.029436911  0.008430595 -0.142750864  0.04205856  0.212996388 -0.04414029  0.057539374  1.000000000 +
-sector     -0.021253493 -0.021518760 -0.112146760 -0.01326166 -0.013531482  0.01456575  0.006412099  0.314746868 +
-marr       -0.040302967  0.030418218  0.004163264 -0.04097664  0.068918496  0.04509033  0.055645964 -0.018580965 +
-                 sector         marr +
-education  -0.021253493 -0.040302967 +
-south      -0.021518760  0.030418218 +
-sex        -0.112146760  0.004163264 +
-experience -0.013261665 -0.040976643 +
-union      -0.013531482  0.068918496 +
-age         0.014565751  0.045090327 +
-race        0.006412099  0.055645964 +
-occupation  0.314746868 -0.018580965 +
-sector      1.000000000  0.036495494 +
-marr        0.036495494  1.000000000 +
-pcor(cps[,c(-6)],method = “pearson”)$estimate  +
-Error: unexpected input in "pcor(cps[,c(-6)],method = ? +
-> pcor(cps[,c(-6)], method = "pearson")$estimate  +
-              education        south          sex  experience        union         age         race +
-education   1.000000000 -0.031750193  0.051510483 -0.99756187 -0.007479144  0.99726160  0.017230877 +
-south      -0.031750193  1.000000000 -0.030152499 -0.02231360 -0.097548621  0.02152507 -0.111197596 +
-sex         0.051510483 -0.030152499  1.000000000  0.05497703 -0.120087577 -0.05369785  0.020017315 +
-experience -0.997561873 -0.022313605  0.054977034  1.00000000 -0.010244447  0.99987574  0.010888486 +
-union      -0.007479144 -0.097548621 -0.120087577 -0.01024445  1.000000000  0.01223890 -0.107706183 +
-age         0.997261601  0.021525073 -0.053697851  0.99987574  0.012238897  1.00000000 -0.010803310 +
-race        0.017230877 -0.111197596  0.020017315  0.01088849 -0.107706183 -0.01080331  1.000000000 +
-occupation  0.029436911  0.008430595 -0.142750864  0.04205856  0.212996388 -0.04414029  0.057539374 +
-sector     -0.021253493 -0.021518760 -0.112146760 -0.01326166 -0.013531482  0.01456575  0.006412099 +
-marr       -0.040302967  0.030418218  0.004163264 -0.04097664  0.068918496  0.04509033  0.055645964 +
-             occupation       sector         marr +
-education   0.029436911 -0.021253493 -0.040302967 +
-south       0.008430595 -0.021518760  0.030418218 +
-sex        -0.142750864 -0.112146760  0.004163264 +
-experience  0.042058560 -0.013261665 -0.040976643 +
-union       0.212996388 -0.013531482  0.068918496 +
-age        -0.044140293  0.014565751  0.045090327 +
-race        0.057539374  0.006412099  0.055645964 +
-occupation  1.000000000  0.314746868 -0.018580965 +
-sector      0.314746868  1.000000000  0.036495494 +
-marr       -0.018580965  0.036495494  1.000000000 +
-> pcor(cps[,c(-6)], method = "pearson")$estimate  +
-              education        south          sex  experience        union         age         race +
-education   1.000000000 -0.031750193  0.051510483 -0.99756187 -0.007479144  0.99726160  0.017230877 +
-south      -0.031750193  1.000000000 -0.030152499 -0.02231360 -0.097548621  0.02152507 -0.111197596 +
-sex         0.051510483 -0.030152499  1.000000000  0.05497703 -0.120087577 -0.05369785  0.020017315 +
-experience -0.997561873 -0.022313605  0.054977034  1.00000000 -0.010244447  0.99987574  0.010888486 +
-union      -0.007479144 -0.097548621 -0.120087577 -0.01024445  1.000000000  0.01223890 -0.107706183 +
-age         0.997261601  0.021525073 -0.053697851  0.99987574  0.012238897  1.00000000 -0.010803310 +
-race        0.017230877 -0.111197596  0.020017315  0.01088849 -0.107706183 -0.01080331  1.000000000 +
-occupation  0.029436911  0.008430595 -0.142750864  0.04205856  0.212996388 -0.04414029  0.057539374 +
-sector     -0.021253493 -0.021518760 -0.112146760 -0.01326166 -0.013531482  0.01456575  0.006412099 +
-marr       -0.040302967  0.030418218  0.004163264 -0.04097664  0.068918496  0.04509033  0.055645964 +
-             occupation       sector         marr +
-education   0.029436911 -0.021253493 -0.040302967 +
-south       0.008430595 -0.021518760  0.030418218 +
-sex        -0.142750864 -0.112146760  0.004163264 +
-experience  0.042058560 -0.013261665 -0.040976643 +
-union       0.212996388 -0.013531482  0.068918496 +
-age        -0.044140293  0.014565751  0.045090327 +
-race        0.057539374  0.006412099  0.055645964 +
-occupation  1.000000000  0.314746868 -0.018580965 +
-sector      0.314746868  1.000000000  0.036495494 +
-marr       -0.018580965  0.036495494  1.000000000+
 > round(pcor(cps[,c(-6)], method = "pearson")$estimate,4)  > round(pcor(cps[,c(-6)], method = "pearson")$estimate,4) 
            education   south     sex experience   union     age    race occupation  sector    marr            education   south     sex experience   union     age    race occupation  sector    marr
Line 743: Line 152:
 sector       -0.0213 -0.0215 -0.1121    -0.0133 -0.0135  0.0146  0.0064     0.3147  1.0000  0.0365 sector       -0.0213 -0.0215 -0.1121    -0.0133 -0.0135  0.0146  0.0064     0.3147  1.0000  0.0365
 marr         -0.0403  0.0304  0.0042    -0.0410  0.0689  0.0451  0.0556    -0.0186  0.0365  1.0000 marr         -0.0403  0.0304  0.0042    -0.0410  0.0689  0.0451  0.0556    -0.0186  0.0365  1.0000
 +
 +</code>
 +
 +<code>
 > lm2 = lm(log(cps$wage) ~ . -age , data = cps) > lm2 = lm(log(cps$wage) ~ . -age , data = cps)
 > summary(lm2) > summary(lm2)
Line 772: Line 185:
 F-statistic: 27.11 on 9 and 524 DF,  p-value: < 2.2e-16 F-statistic: 27.11 on 9 and 524 DF,  p-value: < 2.2e-16
  
-> anova(lm1, lm2) 
-Analysis of Variance Table 
- 
-Model 1: log(cps$wage) ~ education + south + sex + experience + union +  
-    age + race + occupation + sector + marr 
-Model 2: log(cps$wage) ~ (education + south + sex + experience + union +  
-    age + race + occupation + sector + marr) - age 
-  Res.Df    RSS Df Sum of Sq      F Pr(>F) 
-1    523 101.17                            
-2    524 101.28 -1  -0.11518 0.5954 0.4407 
-> anova(lm2, lm1) 
-Analysis of Variance Table 
- 
-Model 1: log(cps$wage) ~ (education + south + sex + experience + union +  
-    age + race + occupation + sector + marr) - age 
-Model 2: log(cps$wage) ~ education + south + sex + experience + union +  
-    age + race + occupation + sector + marr 
-  Res.Df    RSS Df Sum of Sq      F Pr(>F) 
-1    524 101.28                            
-2    523 101.17  1   0.11518 0.5954 0.4407 
 > summary(lm1) > summary(lm1)
  
Line 821: Line 214:
 F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16 F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16
  
-corrplot.mixed(cps.cor, lower.col = "black", number.cex = 1) +>  
-lm3 = lm(log(cps$wage) ~ . -age -education , data = cps) +</code>
-summary(lm3)+
  
-Call: +====== regression test with factors ====== 
-lm(formula log(cps$wage) ~ . - age - education, data cps) +<code> 
- +cps$sex <- factor(cps$sex) 
-Residuals: +> cps$union <factor(cps$union
-     Min       1Q   Median       3Q      Max  +> cps$race <factor(cps$race
--2.35385 -0.34226 -0.02236  0.30725  1.84988  +cps$sector <- factor(cps$sector
- +cps$occupation <- factor(cps$occupation
-Coefficients: +> cps$marr <- factor(cps$marr)
-             Estimate Std. Error t value Pr(>|t|)     +
-(Intercept)  1.974436   0.114881  17.187  2e-16 *** +
-south       -0.171508   0.047380  -3.620 0.000323 *** +
-sex         -0.232997   0.044517  -5.234 2.40e-07 *** +
-experience   0.003031   0.001818   1.667 0.096145 .   +
-union        0.238528   0.058518   4.076 5.29e-05 *** +
-race         0.079273   0.031761   2.496 0.012870 *   +
-occupation  -0.036678   0.014348  -2.556 0.010858 *   +
-sector       0.050525   0.043105   1.172 0.241675     +
-marr         0.105542   0.046719   2.259 0.024286 *   +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 0.4915 on 525 degrees of freedom +
-Multiple R-squared:  0.1456, Adjusted R-squared:  0.1326  +
-F-statistic: 11.18 on 8 and 525 DF,  p-value: 1.177e-14 +
- +
-> lm3 = lm(log(cps$wage) ~ . -age -experience , data = cps+
-summary(lm3) +
- +
-Call: +
-lm(formula = log(cps$wage) ~ . age - experience, data = cps) +
- +
-Residuals: +
-    Min      1Q  Median      3Q     Max  +
--2.1519 -0.3309  0.0034  0.3028  1.8315  +
- +
-Coefficients: +
-            Estimate Std. Error t value Pr(>|t|)     +
-(Intercept)  0.95654    0.15028   6.365 4.26e-10 *** +
-education    0.07650    0.00787   9.721  < 2e-16 *** +
-south       -0.11579    0.04411  -2.625 0.008912 **  +
-sex         -0.20108    0.04097  -4.908 1.23e-06 *** +
-union        0.23924    0.05369   4.456 1.02e-05 *** +
-race         0.05157    0.02943   1.752 0.080287 .   +
-occupation  -0.01719    0.01339  -1.283 0.199910     +
-sector       0.10996    0.03982   2.762 0.005953 **  +
-marr         0.13980    0.04171   3.352 0.000861 *** +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 0.4537 on 525 degrees of freedom +
-Multiple R-squared:  0.2721, Adjusted R-squared:  0.261  +
-F-statistic: 24.53 on 8 and 525 DF,  p-value: 2.2e-16 +
- +
-factor() +
-factor(0) +
-Levels:  +
-> factor(cps$sex, levels= c("male", "female") +
-+ ) +
-  [1] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
- [21] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
- [41] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
- [61] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
- [81] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[101] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[121] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[141] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[161] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[181] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[201] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[221] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[241] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[261] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[281] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[301] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[321] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[341] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[361] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[381] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[401] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[421] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[441] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[461] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[481] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[501] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-[521] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> +
-Levels: male female +
-> cps <- read.csv("http://commres.net/wiki/_media/cps_85_wages.csv", header = T, sep = "\t")+
 > str(cps) > str(cps)
 'data.frame': 534 obs. of  11 variables: 'data.frame': 534 obs. of  11 variables:
  $ education : int  8 9 12 12 12 13 10 12 16 12 ...  $ education : int  8 9 12 12 12 13 10 12 16 12 ...
  $ south     : int  0 0 0 0 0 0 1 0 0 0 ...  $ south     : int  0 0 0 0 0 0 1 0 0 0 ...
- $ sex       : int  1 1 0 0 0 0 0 0 0 0 ...+ $ sex       : Factor w/ 2 levels "0","1": 2 2 1 1 1 1 1 1 1 1 ...
  $ experience: int  21 42 1 4 17 9 27 9 11 9 ...  $ experience: int  21 42 1 4 17 9 27 9 11 9 ...
- $ union     : int  0 0 0 0 0 1 0 0 0 0 ...+ $ union     : Factor w/ 2 levels "0","1": 1 1 1 1 1 2 1 1 1 1 ...
  $ wage      : num  5.1 4.95 6.67 4 7.5 ...  $ wage      : num  5.1 4.95 6.67 4 7.5 ...
  $ age       : int  35 57 19 22 35 28 43 27 33 27 ...  $ age       : int  35 57 19 22 35 28 43 27 33 27 ...
- $ race      : int  2 3 3 3 3 3 3 3 3 3 ... + $ race      : Factor w/ 3 levels "1","2","3": 2 3 3 3 3 3 3 3 3 3 ... 
- $ occupation: int  6 6 6 6 6 6 6 6 6 6 ... + $ occupation: Factor w/ 6 levels "1","2","3","4",..: 6 6 6 6 6 6 6 6 6 6 ... 
- $ sector    : int  1 1 1 0 0 0 0 0 1 0 ... + $ sector    : Factor w/ 3 levels "0","1","2"2 2 2 1 1 1 1 1 2 1 ... 
- $ marr      int  1 1 0 0 0 0 0 0 ... + $ marr      : Factor w/ 2 levels "0","1": 2 2 1 1 1 1 1 2 1 ...
-> head(cps) +
-  education south sex experience union  wage age race occupation sector marr +
-        8               21      5.10  35                     1 +
-2                       42      4.95  57    3          6      1    1 +
-3        12                1      6.67  19    3          6      1    0 +
-4        12                4      4.00  22    3          6      0    0 +
-5        12               17      7.50  35    3          6      0    1 +
-6        13                9     1 13.07  28    3          6      0    0 +
-> factor(cps$sex) +
-  [1] 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 +
- [53] 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 +
-[105] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 +
-[157] 0 0 0 1 1 0 1 0 1 0 0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 1 0 1 +
-[209] 1 0 0 1 0 0 0 0 1 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 1 0 1 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 1 1 1 +
-[261] 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 0 1 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 0 +
-[313] 1 0 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 0 1 0 1 1 +
-[365] 1 0 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 0 1 1 1 1 1 1 0 0 1 1 0 0 0 0 1 0 0 0 +
-[417] 1 0 1 1 1 0 1 0 0 1 1 0 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 1 0 0 1 0 0 1 1 1 1 0 0 0 1 1 0 0 1 1 1 0 1 1 1 1 +
-[469] 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0 0 1 0 1 1 1 +
-[521] 0 0 0 0 1 1 0 0 1 0 1 1 0 0 +
-Levels0 1 +
-> cps <- factor(cps$sex) +
-> str(cps) +
- Factor w/ 2 levels "0","1": 2 2 1 1 1 1 1 1 1 1 ... +
-> cps <- read.csv("http://commres.net/wiki/_media/cps_85_wages.csv", header = T, sep = "\t"+
-> factor(cps$sex) +
-  [1] 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 +
- [53] 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 +
-[105] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 +
-[157] 0 0 0 1 1 0 1 0 1 0 0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 1 0 1 +
-[209] 1 0 0 1 0 0 0 0 1 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 1 0 1 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 1 1 1 +
-[261] 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 0 1 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 0 +
-[313] 1 0 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 0 1 0 1 1 +
-[365] 1 0 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 0 1 1 1 1 1 1 0 0 1 1 0 0 0 0 1 0 0 0 +
-[417] 1 0 1 1 1 0 1 0 0 1 1 0 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 1 0 0 1 0 0 1 1 1 1 0 0 0 1 1 0 0 1 1 1 0 1 1 1 1 +
-[469] 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0 0 1 0 1 1 1 +
-[521] 0 0 0 0 1 1 0 0 1 0 1 1 0 0 +
-Levels: 0 1 +
-> str(cps) +
-'data.frame': 534 obs. of  11 variables: +
- $ education : int  8 9 12 12 12 13 10 12 16 12 ... +
- $ south     : int  0 0 0 0 0 0 1 0 0 0 ... +
- $ sex       : int  1 1 0 0 0 0 0 0 0 0 ... +
- $ experience: int  21 42 1 4 17 9 27 9 11 9 ... +
- $ union     : int  0 0 0 0 0 1 0 0 0 0 ... +
- $ wage      : num  5.1 4.95 6.67 4 7.5 ... +
- $ age       : int  35 57 19 22 35 28 43 27 33 27 ... +
- $ race      : int  3 3 3 3 3 3 3 3 3 ... +
- $ occupation: int  6 6 6 6 6 6 6 6 6 6 ... +
- $ sector    : int  1 1 0 0 0 0 0 1 0 ... +
- $ marr      : int  1 1 0 0 1 0 0 0 1 0 ... +
-> factor(cps$sex) +
-  [1] 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 +
- [53] 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 +
-[105] 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 +
-[157] 0 0 0 1 1 0 1 0 1 0 0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 1 0 1 +
-[209] 1 0 0 1 0 0 0 0 1 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 1 0 1 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 1 1 1 +
-[261] 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 0 1 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 0 +
-[313] 1 0 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 0 1 0 1 1 +
-[365] 1 0 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 0 1 1 1 1 1 1 0 0 1 1 0 0 0 0 1 0 0 0 +
-[417] 1 0 1 1 1 0 1 0 0 1 1 0 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 1 0 0 1 0 0 1 1 1 1 0 0 0 1 1 0 0 1 1 1 0 1 1 1 1 +
-[469] 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0 0 1 0 1 1 1 +
-[521] 0 0 0 0 1 1 0 0 1 0 1 1 0 0 +
-Levels: 0 1 +
-> cps$sex <- factor(cps$sex) +
-> cps$union <- factor(cps$union) +
-> cps$race <- factor(cps$race) +
-> cps$sector <- factor(cps$sector) +
-> cps$occupation <- factor(cps$occupation) +
-> cps$marr <- factor(cps$marr) +
-> str(cps)+
 </code> </code>
- 
  
 <code> <code>
-lm1 = lm(log(cps$wage) ~., data = cps) +lm4 = lm(log(cps$wage) ~ . -age, data = cps) 
-> summary(lm1)+> summary(lm4)
  
 Call: Call:
-lm(formula = log(cps$wage) ~ ., data = cps)+lm(formula = log(cps$wage) ~ . - age, data = cps)
  
 Residuals: Residuals:
      Min       1Q   Median       3Q      Max       Min       1Q   Median       3Q      Max 
--2.16246 -0.29163 -0.00469  0.29981  1.98248 +-2.36103 -0.28080  0.00362  0.27793  1.79594 
  
 Coefficients: Coefficients:
              Estimate Std. Error t value Pr(>|t|)                  Estimate Std. Error t value Pr(>|t|)    
-(Intercept)  1.078596   0.687514   1.569 0.117291     +(Intercept)  1.194821   0.181804   6.572 1.21e-10 *** 
-education    0.179366   0.110756   1.619 0.105949     +education    0.066603   0.010060   6.621 8.96e-11 *** 
-south       -0.102360   0.042823  -2.390 0.017187 *   +south       -0.093384   0.041931  -2.227  0.02637 *   
-sex         -0.221997   0.039907  -5.563 4.24e-08 *** +sex1        -0.216934   0.041844  -5.184 3.11e-07 *** 
-experience   0.095822   0.110799   0.865 0.387531     +experience   0.009371   0.001725   5.431 8.63e-08 *** 
-union        0.200483   0.052475   3.821 0.000149 *** +union1       0.211506   0.051218   4.129 4.24e-05 *** 
-age         -0.085444   0.110730  -0.772 0.440671     +race2       -0.033928   0.099051  -0.343  0.73209     
-race         0.050406   0.028531   1.767 0.077865 .   +race3        0.079851   0.057392   1.391  0.16472     
-occupation  -0.007417   0.013109  -0.566 0.571761     +occupation2 -0.364444   0.091500  -3.983 7.78e-05 *** 
-sector       0.091458   0.038736   2.361 0.018589 *   +occupation3 -0.210295   0.076175  -2.761  0.00597 **  
-marr         0.076611   0.041931   1.827 0.068259 .  +occupation4 -0.383882   0.080990  -4.740 2.77e-06 *** 
 +occupation5 -0.050664   0.072717  -0.697  0.48628     
 +occupation6 -0.265348   0.079969  -3.318  0.00097 *** 
 +sector1      0.114857   0.054862   2.094  0.03678 *   
 +sector2      0.093138   0.096514   0.965  0.33499     
 +marr1        0.062211   0.041025   1.516  0.13002    
 --- ---
 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  
-Residual standard error: 0.4398 on 523 degrees of freedom +Residual standard error: 0.4278 on 518 degrees of freedom 
-Multiple R-squared:  0.3185, Adjusted R-squared:  0.3054  +Multiple R-squared:  0.3614, Adjusted R-squared:  0.3429  
-F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16 +F-statistic: 19.54 on 15 and 518 DF,  p-value: < 2.2e-16
-</code> +
- +
-<code> +
-plot(lm1) +
-</code> +
-{{lm1.plot1.png?300}}{{lm1.plot2.png?300}} +
-{{lm1.plot3.png?300}}{{lm1.plot4.png?300}} +
- +
- +
-<code> +
-> library(corrplot) +
-> cps.cor = cor(cps) +
-> corrplot.mixed(cps.cor, lower.col = "black"+
-</code> +
-{{cps.corrplot.png?500}} +
- +
-<code> +
-> install.packages("mctest"+
-> library(mctest) +
-> omcdiag(cps[,c(-6)], cps$wage) # or "omcdiag(cps[,c(1:5,7:11)], cps$wage)" will work as well. +
- +
-Call: +
-omcdiag(x = cps[, c(-6)], y = cps$wage) +
- +
- +
-Overall Multicollinearity Diagnostics +
- +
-                       MC Results detection +
-Determinant |X'X|:         0.0001         1 +
-Farrar Chi-Square:      4833.5751         1 +
-Red Indicator:             0.1983         0 +
-Sum of Lambda Inverse: 10068.8439         1 +
-Theil's Method:            1.2263         1 +
-Condition Number:        739.7337         1 +
- +
-1 --> COLLINEARITY is detected by the test  +
-0 --> COLLINEARITY is not detected by the test+
  
  
-</code> 
  
-<code> 
-> imcdiag(cps[,c(-6)],cps$wage)  
- 
-Call: 
-imcdiag(x = cps[, c(-6)], y = cps$wage) 
- 
- 
-All Individual Multicollinearity Diagnostics Result 
- 
-                 VIF    TOL          Wi          Fi Leamer      CVIF Klein 
-education   231.1956 0.0043  13402.4982  15106.5849 0.0658  236.4725     1 
-south         1.0468 0.9553      2.7264      3.0731 0.9774    1.0707     0 
-sex           1.0916 0.9161      5.3351      6.0135 0.9571    1.1165     0 
-experience 5184.0939 0.0002 301771.2445 340140.5368 0.0139 5302.4188     1 
-union         1.1209 0.8922      7.0368      7.9315 0.9445    1.1464     0 
-age        4645.6650 0.0002 270422.7164 304806.1391 0.0147 4751.7005     1 
-race          1.0371 0.9642      2.1622      2.4372 0.9819    1.0608     0 
-occupation    1.2982 0.7703     17.3637     19.5715 0.8777    1.3279     0 
-sector        1.1987 0.8343     11.5670     13.0378 0.9134    1.2260     0 
-marr          1.0961 0.9123      5.5969      6.3085 0.9551    1.1211     0 
- 
-1 --> COLLINEARITY is detected by the test  
-0 --> COLLINEARITY is not detected by the test 
- 
-education , south , experience , age , race , occupation , sector , marr , coefficient(s) are non-significant may be due to multicollinearity 
- 
-R-square of y on all x: 0.2805  
- 
-* use method argument to check which regressors may be the reason of collinearity 
-=================================== 
- 
 </code> </code>
  
-<code> +<code>> lm5 = lm(log(cps$wage) ~ . -age -race, data = cps) 
-round(pcor(cps[,c(-6)], method = "pearson")$estimate,4)  +> summary(lm5)
-           education   south     sex experience   union     age    race occupation  sector    marr +
-education     1.0000 -0.0318  0.0515    -0.9976 -0.0075  0.9973  0.0172     0.0294 -0.0213 -0.0403 +
-south        -0.0318  1.0000 -0.0302    -0.0223 -0.0975  0.0215 -0.1112     0.0084 -0.0215  0.0304 +
-sex           0.0515 -0.0302  1.0000     0.0550 -0.1201 -0.0537  0.0200    -0.1428 -0.1121  0.0042 +
-experience   -0.9976 -0.0223  0.0550     1.0000 -0.0102  0.9999  0.0109     0.0421 -0.0133 -0.0410 +
-union        -0.0075 -0.0975 -0.1201    -0.0102  1.0000  0.0122 -0.1077     0.2130 -0.0135  0.0689 +
-age           0.9973  0.0215 -0.0537     0.9999  0.0122  1.0000 -0.0108    -0.0441  0.0146  0.0451 +
-race          0.0172 -0.1112  0.0200     0.0109 -0.1077 -0.0108  1.0000     0.0575  0.0064  0.0556 +
-occupation    0.0294  0.0084 -0.1428     0.0421  0.2130 -0.0441  0.0575     1.0000  0.3147 -0.0186 +
-sector       -0.0213 -0.0215 -0.1121    -0.0133 -0.0135  0.0146  0.0064     0.3147  1.0000  0.0365 +
-marr         -0.0403  0.0304  0.0042    -0.0410  0.0689  0.0451  0.0556    -0.0186  0.0365  1.0000 +
- +
-</code> +
- +
-<code> +
-> lm2 = lm(log(cps$wage) ~ . -age , data = cps) +
-> summary(lm2)+
  
 Call: Call:
-lm(formula = log(cps$wage) ~ . - age, data = cps)+lm(formula = log(cps$wage) ~ . - age - race, data = cps)
  
 Residuals: Residuals:
      Min       1Q   Median       3Q      Max       Min       1Q   Median       3Q      Max 
--2.16044 -0.29073 -0.00505  0.29994  1.97997 +-2.34366 -0.28169 -0.00017  0.29179  1.81158 
  
 Coefficients: Coefficients:
              Estimate Std. Error t value Pr(>|t|)                  Estimate Std. Error t value Pr(>|t|)    
-(Intercept)  0.562676   0.160116   3.514 0.000479 *** +(Intercept)  1.224289   0.172070   7.115 3.73e-12 *** 
-education    0.094135   0.008188  11.497  < 2e-16 *** +education    0.068838   0.009912   6.945 1.14e-11 *** 
-south       -0.103071   0.042796  -2.408 0.016367 *   +south       -0.102588   0.041668  -2.462 0.014139 *   
-sex         -0.220344   0.039834  -5.532 5.02e-08 *** +sex1        -0.213602   0.041842  -5.105 4.65e-07 *** 
-experience   0.010335   0.001746   5.919 5.86e-09 *** +experience   0.009494   0.001723   5.510 5.65e-08 *** 
-union        0.199987   0.052450   3.813 0.000154 *** +union1       0.202720   0.051009   3.974 8.06e-05 *** 
-race         0.050643   0.028519   1.776 0.076345 .   +occupation2 -0.355381   0.091448  -3.886 0.000115 *** 
-occupation  -0.006971   0.013091  -0.532 0.594619     +occupation3 -0.209820   0.076149  -2.755 0.006068 **  
-sector       0.091022   0.038717   2.351 0.019094 *   +occupation4 -0.385680   0.080855  -4.770 2.40e-06 *** 
-marr         0.075152   0.041872   1.795 0.073263  +occupation5 -0.047694   0.072746  -0.656 0.512351     
 +occupation6 -0.254277   0.079781  -3.187 0.001523 **  
 +sector1      0.111458   0.054845   2.032 0.042636 *   
 +sector2      0.099777   0.096481   1.034 0.301541     
 +marr1        0.065464   0.041036   1.595 0.111257    
 --- ---
 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  
-Residual standard error: 0.4397 on 524 degrees of freedom +Residual standard error: 0.4283 on 520 degrees of freedom 
-Multiple R-squared:  0.3177, Adjusted R-squared:  0.306  +Multiple R-squared:  0.3573, Adjusted R-squared:  0.3412  
-F-statistic: 27.11 on and 524 DF,  p-value: < 2.2e-16+F-statistic: 22.24 on 13 and 520 DF,  p-value: < 2.2e-16
  
-> summary(lm1)+>  
 +</code> 
 + 
 +<code>> lm6 = lm(log(cps$wage) ~ . -age -race -occupation -marr -sector, data = cps) 
 +> summary(lm6)
  
 Call: Call:
-lm(formula = log(cps$wage) ~ ., data = cps)+lm(formula = log(cps$wage) ~ . - age - race - occupation - marr -  
 +    sector, data = cps)
  
 Residuals: Residuals:
      Min       1Q   Median       3Q      Max       Min       1Q   Median       3Q      Max 
--2.16246 -0.29163 -0.00469  0.29981  1.98248 +-2.13809 -0.28681 -0.00078  0.29376  1.96678 
  
 Coefficients: Coefficients:
              Estimate Std. Error t value Pr(>|t|)                  Estimate Std. Error t value Pr(>|t|)    
-(Intercept)  1.078596   0.687514   1.569 0.117291     +(Intercept)  0.731792   0.122217   5.988 3.94e-09 *** 
-education    0.179366   0.110756   1.619 0.105949     +education    0.094096   0.007942  11.848  < 2e-16 *** 
-south       -0.102360   0.042823  -2.390 0.017187   +south       -0.111761   0.042857  -2.608 0.009372 **  
-sex         -0.221997   0.039907  -5.563 4.24e-08 *** +sex1        -0.231978   0.039202  -5.918 5.88e-09 *** 
-experience   0.095822   0.110799   0.865 0.387531     +experience   0.011548   0.001680   6.875 1.75e-11 *** 
-union        0.200483   0.052475   3.821 0.000149 *** +union1       0.198360   0.051243   3.871 0.000122 ***
-age         -0.085444   0.110730  -0.772 0.440671     +
-race         0.050406   0.028531   1.767 0.077865 .   +
-occupation  -0.007417   0.013109  -0.566 0.571761     +
-sector       0.091458   0.038736   2.361 0.018589   +
-marr         0.076611   0.041931   1.827 0.068259 .  +
 --- ---
 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  
-Residual standard error: 0.4398 on 523 degrees of freedom +Residual standard error: 0.4433 on 528 degrees of freedom 
-Multiple R-squared:  0.3185, Adjusted R-squared:  0.3054  +Multiple R-squared:  0.3011, Adjusted R-squared:  0.2944  
-F-statistic: 24.44 on 10 and 523 DF,  p-value: < 2.2e-16+F-statistic: 45.49 on and 528 DF,  p-value: < 2.2e-16
  
- 
 > </code> > </code>
- 
-<code> 
-</code> 
- 
-<code> 
-</code> 
- 
-<code> 
-</code> 
- 
- 
multicolinearity.1545759460.txt.gz · Last modified: 2018/12/26 02:37 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki