User Tools

Site Tools


multiple_regression_examples

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
multiple_regression_examples [2020/07/06 13:01] – [E.g. 1] hkimscilmultiple_regression_examples [2020/07/06 15:59] – [E.g. 1] hkimscil
Line 179: Line 179:
  
 </code> </code>
 +R제곱값은 0.80로 (F(1, 28) = 114.8, 2.053e-11) 스트레스만으로도 significant한 결과를 갖는다. 
 +
 +그렇다면 stress 와 bmi가 공통으로 기여하는 부분을 뺀 순수 기여분은 어떻게 될까? 즉, 위의 .80 부분 중 bmi와 공통으로 기여하는 부분을 제외한 나머지는 얼마일까? 보통 이와 같은 작업을 bmi의 (다른 독립변인의) 영향력을 제어하고 (control) 순수기여분만을 살펴본다고 이야기 한다. 
 +
 +이를 위해서 아래를 계획, 수행해본다. 
 +
 +  - 독립변인 간의 regression을 수행한다 
 +    * stress의 순수영향력을 보기 위한 것이므로 bmi와의 상관관계 제곱값, 즉, R제곱 값을 구한다
 +    * ''lm.bmi.stress <- lm(bmi ~ stress)''
 +  - 위의 R제곱기여 분의 나머지를 가지고 종속변인인 happiness에 regression한다.
 +
 +<code>
 +lm.stress.bmi <- lm(stress ~ bmi)
 +summary(lm.stress.bmi)
 +</code>
 +
 +<code>
 +> lm.stress.bmi <- lm(stress ~ bmi)
 +> summary(lm.stress.bmi)
 +
 +Call:
 +lm(formula = stress ~ bmi)
 +
 +Residuals:
 +     Min       1Q   Median       3Q      Max 
 +-1.17393 -0.35678 -0.01209  0.37939  0.86685 
 +
 +Coefficients:
 +            Estimate Std. Error t value Pr(>|t|)    
 +(Intercept) -1.40167    0.42160  -3.325  0.00248 ** 
 +bmi          0.16787    0.01606  10.454 3.58e-11 ***
 +---
 +Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 +
 +Residual standard error: 0.5755 on 28 degrees of freedom
 +Multiple R-squared:  0.796, Adjusted R-squared:  0.7888 
 +F-statistic: 109.3 on 1 and 28 DF,  p-value: 3.58e-11
 +>
 +</code>
 +
 +위의 아웃풋에서 우리는 bmi와 stress간의 상관관계는 sqrt(0.796)임을 알 수 있고, stress 총 분산 중, R제곱 값인 .796 (약 80%)를 bmi가 설명하고 있다고 하겠다. 여기서 아래의 코드를 이용하여 residual을 알아볼 수 있다.
 +
 +<code>
 +res.lm.stress.bmi <- lm.stress.bmi$residuals
 +res.lm.stress.bmi
 +</code>
 +
 +<code>
 +> res.lm.stress.bmi <- lm.stress.bmi$residuals
 +> res.lm.stress.bmi
 +                      2            3            4            5            6 
 + 0.866854946  0.833281255 -0.351374050  0.665412796  0.463970646  0.245741650 
 +                      8            9           10           11           12 
 + 0.178594267 -1.006061037 -1.173929495 -0.173929495 -0.358584799 -0.543240104 
 +          13           14           15           16           17           18 
 +-0.576813795  0.339251976  0.322465130 -0.895763866 -0.030058633 -0.030058633 
 +          19           20           21           22           23           24 
 +-0.030058633 -0.214713937 -0.399369241  0.667778142 -0.852614079  0.013091155 
 +          25           26           27           28           29           30 
 +-0.154777303  0.828435851  0.626993701  0.391977859  0.341617322  0.005880405 
 +
 +</code>
 +
 +삭제 --
 +이 residuals이 DV (종속변인) 설명에 얼마나 기여하는지를 보기 위해서 regression을 하면 stress 고유분의 영향력을 파악할 수 있다. 그런데 partial correlation의 정의에 따르면 partial correlation은 종속변인 또한 bmi의 영향력을 배제한 부분으로 평가를 해야 한다. 이는 위에서 분석했던 lm.happiness.bmi의 residual이 그것이다. 따라서 아래를 구해둔다.
 +
 +<code>
 +res.lm.happiness.bmi <- lm.happiness.bmi$residuals
 +</code>
 +-- 삭제
 +
 +<code>
 +lm.happiness.reslmstressbmi <- lm(res.lm.happiness.bmi ~ res.lm.stress.bmi)
 +summary(lm.happiness.reslmstressbmi)
 +anova(lm.happiness.reslmstressbmi)
 +</code>
 +
 +<code>
 +> lm.happiness.reslmstressbmi <- lm(happiness ~ res.lm.stress.bmi)
 +> summary(lm.happiness.reslmstressbmi)
 +
 +Call:
 +lm(formula = happiness ~ res.lm.stress.bmi)
 +
 +Residuals:
 +    Min      1Q  Median      3Q     Max 
 +-1.9383 -1.2297  0.2170  0.9804  1.9284 
 +
 +Coefficients:
 +                  Estimate Std. Error t value Pr(>|t|)    
 +(Intercept)         2.8333     0.2388  11.865 1.95e-12 ***
 +res.lm.stress.bmi  -0.6781     0.4295  -1.579    0.126    
 +---
 +Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 +
 +Residual standard error: 1.308 on 28 degrees of freedom
 +Multiple R-squared:  0.08173, Adjusted R-squared:  0.04894 
 +F-statistic: 2.492 on 1 and 28 DF,  p-value: 0.1256
 +
 +> anova(lm.happiness.reslmstressbmi)
 +Analysis of Variance Table
 +
 +Response: happiness
 +                  Df Sum Sq Mean Sq F value Pr(>F)
 +res.lm.stress.bmi  1  4.264  4.2638  2.4922 0.1256
 +Residuals         28 47.903  1.7108               
 +
 +
 +</code>
 +
 +<code>
 +Multiple R-squared:  0.08173, Adjusted R-squared:  0.04894 
 +F-statistic: 2.492 on 1 and 28 DF,  p-value: 0.1256
 +</code>
 +
 +이제 반대로 bmi 고유의 설명력을 보려면 
 +<code>
 +lm.bmi.stress <- lm(bmi~stress)
 +summary(lm.bmi.stress)
 +anova(lm.bmi.stress)
 +res.lm.bmi.stress <- lm.bmi.stress$residuals
 +lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress)
 +summary(lm.happiness.reslmbmistress)
 +anova(lm.happiness.reslmbmistress)
 +</code>
 +
 +<code>
 +> lm.bmi.stress <- lm(bmi~stress)
 +> summary(lm.bmi.stress)
 +
 +Call:
 +lm(formula = bmi ~ stress)
 +
 +Residuals:
 +    Min      1Q  Median      3Q     Max 
 +-6.2169 -2.0524  0.3411  2.2700  5.2411 
 +
 +Coefficients:
 +            Estimate Std. Error t value Pr(>|t|)    
 +(Intercept)  11.8327     1.4152   8.361 4.27e-09 ***
 +stress        4.7421     0.4536  10.454 3.58e-11 ***
 +---
 +Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 +
 +Residual standard error: 3.059 on 28 degrees of freedom
 +Multiple R-squared:  0.796, Adjusted R-squared:  0.7888 
 +F-statistic: 109.3 on 1 and 28 DF,  p-value: 3.58e-11
 +
 +> anova(lm.bmi.stress)
 +Analysis of Variance Table
 +
 +Response: bmi
 +          Df  Sum Sq Mean Sq F value   Pr(>F)    
 +stress     1 1022.42 1022.42  109.29 3.58e-11 ***
 +Residuals 28  261.95    9.36                     
 +---
 +Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 +> res.lm.bmi.stress <- lm.bmi.stress$residuals
 +> lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress)
 +> summary(lm.happiness.reslmbmistress)
 +
 +Call:
 +lm(formula = happiness ~ res.lm.bmi.stress)
 +
 +Residuals:
 +     Min       1Q   Median       3Q      Max 
 +-1.97283 -0.94440  0.05897  0.97961  2.29664 
 +
 +Coefficients:
 +                  Estimate Std. Error t value Pr(>|t|)    
 +(Intercept)        2.83333    0.24698  11.472 4.27e-12 ***
 +res.lm.bmi.stress -0.05954    0.08358  -0.712    0.482    
 +---
 +Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 +
 +Residual standard error: 1.353 on 28 degrees of freedom
 +Multiple R-squared:  0.0178, Adjusted R-squared:  -0.01728 
 +F-statistic: 0.5074 on 1 and 28 DF,  p-value: 0.4822
 +
 +> anova(lm.happiness.reslmbmistress)
 +Analysis of Variance Table
 +
 +Response: happiness
 +                  Df Sum Sq Mean Sq F value Pr(>F)
 +res.lm.bmi.stress  1  0.929 0.92851  0.5074 0.4822
 +Residuals         28 51.238 1.82993     
 +</code>
 +
 +<code>
 +Multiple R-squared:  0.0178, Adjusted R-squared:  -0.01728 
 +F-statistic: 0.5074 on 1 and 28 DF,  p-value: 0.4822
 +</code>
 +
 +stress: 8.1%
 +bmi: 1.78% 
 +만이 독립변인의 고유영향력이고 이를 제외한 
 +82.17 - (9.88) = 72.29 가
 +공통영향력이라고 하겠다.
 +
 +
 ====== with Two Predictor Variables ====== ====== with Two Predictor Variables ======
 data file: {{:mlt06.sav}} from http://www.psychstat.missouristate.edu/multibook/mlt06.htm \\ data file: {{:mlt06.sav}} from http://www.psychstat.missouristate.edu/multibook/mlt06.htm \\
multiple_regression_examples.txt · Last modified: 2023/10/21 13:26 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki