User Tools

Site Tools


multiple_regression_examples

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revisionBoth sides next revision
multiple_regression_examples [2020/07/06 15:59] – [E.g. 1] hkimscilmultiple_regression_examples [2020/12/01 17:01] – [E.g. 1] hkimscil
Line 185: Line 185:
 이를 위해서 아래를 계획, 수행해본다.  이를 위해서 아래를 계획, 수행해본다. 
  
-  - 독립변인 간의 regression을 수행한다  +  - 각각의 독립변인이 고유하게 미치는 영향력은 (설명력은) 무엇인지를 본다.  
-    * stress의 순수영향력을 보기 위한 것이므로 bmi와의 상관관계 제곱값, 즉, R제곱 값을 구한 +  - 공통설명력은 얼마나 되는지 다.
-    * ''lm.bmi.stress <- lm(bmi ~ stress)'' +
-  - 위의 R제곱기여 분의 를 가지고 종속변인인 happiness에 regression한다.+
  
-<code> +  - 1을 위해서는 각 독립변인과 종속변인인 happiness의 semi-partial correlation값을 구해서 제곱해보면 되겠다.  
-lm.stress.bmi <lm(stress ~ bmi) +  2를 위해서는 두 독립변인을 써서 구했던 r 제곱값에서 위의 1에서 구한 제곱값들을 제외한 나머지를 보면 된겠다
-summary(lm.stress.bmi) +
-</code>+
  
-<code> +  * 결론을 내기 위한 계획을 세우고 실행한다.  
-> lm.stress.bmi <- lm(stress ~ bmi) +  * 이는 아래와 같이 정리할 수 있다
-> summary(lm.stress.bmi)+
  
-Call: +{{:pasted:20201201-170048.png}}
-lm(formula = stress ~ bmi) +
- +
-Residuals: +
-     Min       1Q   Median       3Q      Max  +
--1.17393 -0.35678 -0.01209  0.37939  0.86685  +
- +
-Coefficients: +
-            Estimate Std. Error t value Pr(>|t|)     +
-(Intercept) -1.40167    0.42160  -3.325  0.00248 **  +
-bmi          0.16787    0.01606  10.454 3.58e-11 *** +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 0.5755 on 28 degrees of freedom +
-Multiple R-squared:  0.796, Adjusted R-squared:  0.7888  +
-F-statistic: 109.3 on 1 and 28 DF,  p-value: 3.58e-11 +
-+
-</code> +
- +
-위의 아웃풋에서 우리는 bmi와 stress간의 상관관계는 sqrt(0.796)임을 알 수 있고, stress 총 분산 중, R제곱 값인 .796 (약 80%)를 bmi가 설명하고 있다고 하겠다. 여기서 아래의 코드를 이용하여 residual을 알아볼 수 있다.+
  
 +===== 각각의 독립변인이 고유하게 미치는 영향력은 (설명력은) 무엇인지를 본다 =====
 <code> <code>
-res.lm.stress.bmi <- lm.stress.bmi$residuals +m1 <- 
-res.lm.stress.bmi+
 </code> </code>
  
-<code> 
-> res.lm.stress.bmi <- lm.stress.bmi$residuals 
-> res.lm.stress.bmi 
-                      2            3            4            5            6  
- 0.866854946  0.833281255 -0.351374050  0.665412796  0.463970646  0.245741650  
-                      8            9           10           11           12  
- 0.178594267 -1.006061037 -1.173929495 -0.173929495 -0.358584799 -0.543240104  
-          13           14           15           16           17           18  
--0.576813795  0.339251976  0.322465130 -0.895763866 -0.030058633 -0.030058633  
-          19           20           21           22           23           24  
--0.030058633 -0.214713937 -0.399369241  0.667778142 -0.852614079  0.013091155  
-          25           26           27           28           29           30  
--0.154777303  0.828435851  0.626993701  0.391977859  0.341617322  0.005880405  
- 
-</code> 
  
-삭제 -- 
-이 residuals이 DV (종속변인) 설명에 얼마나 기여하는지를 보기 위해서 regression을 하면 stress 고유분의 영향력을 파악할 수 있다. 그런데 partial correlation의 정의에 따르면 partial correlation은 종속변인 또한 bmi의 영향력을 배제한 부분으로 평가를 해야 한다. 이는 위에서 분석했던 lm.happiness.bmi의 residual이 그것이다. 따라서 아래를 구해둔다. 
  
-<code> 
-res.lm.happiness.bmi <- lm.happiness.bmi$residuals 
-</code> 
--- 삭제 
  
-<code> 
-lm.happiness.reslmstressbmi <- lm(res.lm.happiness.bmi ~ res.lm.stress.bmi) 
-summary(lm.happiness.reslmstressbmi) 
-anova(lm.happiness.reslmstressbmi) 
-</code> 
  
-<code> +'' stress: 8.1% '' 와 '' bmi: 1.78% ''이 독립변인의 고유영향이고 이를 제외한 '' 82.17 - (9.88) = 72.29 '' 가 공통영향력이라고 하겠다.
-> lm.happiness.reslmstressbmi <- lm(happiness ~ res.lm.stress.bmi) +
-> summary(lm.happiness.reslmstressbmi) +
- +
-Call: +
-lm(formula = happiness ~ res.lm.stress.bmi) +
- +
-Residuals: +
-    Min      1Q  Median      3Q     Max  +
--1.9383 -1.2297  0.2170  0.9804  1.9284  +
- +
-Coefficients: +
-                  Estimate Std. Error t value Pr(>|t|)     +
-(Intercept)         2.8333     0.2388  11.865 1.95e-12 *** +
-res.lm.stress.bmi  -0.6781     0.4295  -1.579    0.126     +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 1.308 on 28 degrees of freedom +
-Multiple R-squared:  0.08173, Adjusted R-squared:  0.04894  +
-F-statistic: 2.492 on 1 and 28 DF,  p-value: 0.1256 +
- +
-> anova(lm.happiness.reslmstressbmi) +
-Analysis of Variance Table +
- +
-Response: happiness +
-                  Df Sum Sq Mean Sq F value Pr(>F) +
-res.lm.stress.bmi  1  4.264  4.2638  2.4922 0.1256 +
-Residuals         28 47.903  1.7108                +
->  +
->  +
-</code> +
- +
-<code> +
-Multiple R-squared:  0.08173, Adjusted R-squared:  0.04894  +
-F-statistic: 2.492 on 1 and 28 DF,  p-value: 0.1256 +
-</code> +
- +
-제 반대로 bmi 고유의 설명을 보려면  +
-<code> +
-lm.bmi.stress <lm(bmi~stress) +
-summary(lm.bmi.stress) +
-anova(lm.bmi.stress) +
-res.lm.bmi.stress <- lm.bmi.stress$residuals +
-lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress) +
-summary(lm.happiness.reslmbmistress) +
-anova(lm.happiness.reslmbmistress) +
-</code> +
- +
-<code> +
-> lm.bmi.stress <- lm(bmi~stress) +
-> summary(lm.bmi.stress) +
- +
-Call: +
-lm(formula bmi ~ stress) +
- +
-Residuals: +
-    Min      1Q  Median      3Q     Max  +
--6.2169 -2.0524  0.3411  2.2700  5.2411  +
- +
-Coefficients: +
-            Estimate Std. Error t value Pr(>|t|)     +
-(Intercept)  11.8327     1.4152   8.361 4.27e-09 *** +
-stress        4.7421     0.4536  10.454 3.58e-11 *** +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 3.059 on 28 degrees of freedom +
-Multiple R-squared:  0.796, Adjusted R-squared:  0.7888  +
-F-statistic: 109.3 on 1 and 28 DF,  p-value: 3.58e-11 +
- +
-> anova(lm.bmi.stress) +
-Analysis of Variance Table +
- +
-Response: bmi +
-          Df  Sum Sq Mean Sq F value   Pr(>F)     +
-stress     1 1022.42 1022.42  109.29 3.58e-11 *** +
-Residuals 28  261.95    9.36                      +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
-> res.lm.bmi.stress <- lm.bmi.stress$residuals +
-> lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress) +
-> summary(lm.happiness.reslmbmistress) +
- +
-Call: +
-lm(formula = happiness ~ res.lm.bmi.stress) +
- +
-Residuals: +
-     Min       1Q   Median       3Q      Max  +
--1.97283 -0.94440  0.05897  0.97961  2.29664  +
- +
-Coefficients: +
-                  Estimate Std. Error t value Pr(>|t|)     +
-(Intercept)        2.83333    0.24698  11.472 4.27e-12 *** +
-res.lm.bmi.stress -0.05954    0.08358  -0.712    0.482     +
---- +
-Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 +
- +
-Residual standard error: 1.353 on 28 degrees of freedom +
-Multiple R-squared:  0.0178, Adjusted R-squared:  -0.01728  +
-F-statistic: 0.5074 on 1 and 28 DF,  p-value: 0.4822 +
- +
-> anova(lm.happiness.reslmbmistress) +
-Analysis of Variance Table +
- +
-Response: happiness +
-                  Df Sum Sq Mean Sq F value Pr(>F) +
-res.lm.bmi.stress  1  0.929 0.92851  0.5074 0.4822 +
-Residuals         28 51.238 1.82993      +
-</code> +
- +
-<code> +
-Multiple R-squared:  0.0178, Adjusted R-squared:  -0.01728  +
-F-statistic: 0.5074 on 1 and 28 DF,  p-value: 0.4822 +
-</code>+
  
-stress: 8.1% 
-bmi: 1.78%  
-만이 독립변인의 고유영향력이고 이를 제외한  
-82.17 - (9.88) = 72.29 가 
-공통영향력이라고 하겠다. 
  
  
multiple_regression_examples.txt · Last modified: 2023/10/21 13:26 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki