multiple_regression_examples
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionNext revisionBoth sides next revision | ||
multiple_regression_examples [2020/07/06 13:01] – [E.g. 1] hkimscil | multiple_regression_examples [2020/07/06 15:59] – [E.g. 1] hkimscil | ||
---|---|---|---|
Line 179: | Line 179: | ||
> | > | ||
</ | </ | ||
+ | R제곱값은 0.80로 (F(1, 28) = 114.8, 2.053e-11) 스트레스만으로도 significant한 결과를 갖는다. | ||
+ | |||
+ | 그렇다면 stress 와 bmi가 공통으로 기여하는 부분을 뺀 순수 기여분은 어떻게 될까? 즉, 위의 .80 부분 중 bmi와 공통으로 기여하는 부분을 제외한 나머지는 얼마일까? | ||
+ | |||
+ | 이를 위해서 아래를 계획, 수행해본다. | ||
+ | |||
+ | - 독립변인 간의 regression을 수행한다 | ||
+ | * stress의 순수영향력을 보기 위한 것이므로 bmi와의 상관관계 제곱값, 즉, R제곱 값을 구한다 | ||
+ | * '' | ||
+ | - 위의 R제곱기여 분의 나머지를 가지고 종속변인인 happiness에 regression한다. | ||
+ | |||
+ | < | ||
+ | lm.stress.bmi <- lm(stress ~ bmi) | ||
+ | summary(lm.stress.bmi) | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | > lm.stress.bmi <- lm(stress ~ bmi) | ||
+ | > summary(lm.stress.bmi) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = stress ~ bmi) | ||
+ | |||
+ | Residuals: | ||
+ | | ||
+ | -1.17393 -0.35678 -0.01209 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) -1.40167 | ||
+ | bmi 0.16787 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 0.5755 on 28 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | > | ||
+ | </ | ||
+ | |||
+ | 위의 아웃풋에서 우리는 bmi와 stress간의 상관관계는 sqrt(0.796)임을 알 수 있고, stress 총 분산 중, R제곱 값인 .796 (약 80%)를 bmi가 설명하고 있다고 하겠다. 여기서 아래의 코드를 이용하여 residual을 알아볼 수 있다. | ||
+ | |||
+ | < | ||
+ | res.lm.stress.bmi <- lm.stress.bmi$residuals | ||
+ | res.lm.stress.bmi | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | > res.lm.stress.bmi <- lm.stress.bmi$residuals | ||
+ | > res.lm.stress.bmi | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | 13 | ||
+ | -0.576813795 | ||
+ | 19 | ||
+ | -0.030058633 -0.214713937 -0.399369241 | ||
+ | 25 | ||
+ | -0.154777303 | ||
+ | > | ||
+ | </ | ||
+ | |||
+ | 삭제 -- | ||
+ | 이 residuals이 DV (종속변인) 설명에 얼마나 기여하는지를 보기 위해서 regression을 하면 stress 고유분의 영향력을 파악할 수 있다. 그런데 partial correlation의 정의에 따르면 partial correlation은 종속변인 또한 bmi의 영향력을 배제한 부분으로 평가를 해야 한다. 이는 위에서 분석했던 lm.happiness.bmi의 residual이 그것이다. 따라서 아래를 구해둔다. | ||
+ | |||
+ | < | ||
+ | res.lm.happiness.bmi <- lm.happiness.bmi$residuals | ||
+ | </ | ||
+ | -- 삭제 | ||
+ | |||
+ | < | ||
+ | lm.happiness.reslmstressbmi <- lm(res.lm.happiness.bmi ~ res.lm.stress.bmi) | ||
+ | summary(lm.happiness.reslmstressbmi) | ||
+ | anova(lm.happiness.reslmstressbmi) | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | > lm.happiness.reslmstressbmi <- lm(happiness ~ res.lm.stress.bmi) | ||
+ | > summary(lm.happiness.reslmstressbmi) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = happiness ~ res.lm.stress.bmi) | ||
+ | |||
+ | Residuals: | ||
+ | Min 1Q Median | ||
+ | -1.9383 -1.2297 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | res.lm.stress.bmi | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 1.308 on 28 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > anova(lm.happiness.reslmstressbmi) | ||
+ | Analysis of Variance Table | ||
+ | |||
+ | Response: happiness | ||
+ | Df Sum Sq Mean Sq F value Pr(>F) | ||
+ | res.lm.stress.bmi | ||
+ | Residuals | ||
+ | > | ||
+ | > | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | </ | ||
+ | |||
+ | 이제 반대로 bmi 고유의 설명력을 보려면 | ||
+ | < | ||
+ | lm.bmi.stress <- lm(bmi~stress) | ||
+ | summary(lm.bmi.stress) | ||
+ | anova(lm.bmi.stress) | ||
+ | res.lm.bmi.stress <- lm.bmi.stress$residuals | ||
+ | lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress) | ||
+ | summary(lm.happiness.reslmbmistress) | ||
+ | anova(lm.happiness.reslmbmistress) | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | > lm.bmi.stress <- lm(bmi~stress) | ||
+ | > summary(lm.bmi.stress) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = bmi ~ stress) | ||
+ | |||
+ | Residuals: | ||
+ | Min 1Q Median | ||
+ | -6.2169 -2.0524 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | stress | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 3.059 on 28 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > anova(lm.bmi.stress) | ||
+ | Analysis of Variance Table | ||
+ | |||
+ | Response: bmi | ||
+ | Df Sum Sq Mean Sq F value | ||
+ | stress | ||
+ | Residuals 28 261.95 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | > res.lm.bmi.stress <- lm.bmi.stress$residuals | ||
+ | > lm.happiness.reslmbmistress <- lm(happiness ~ res.lm.bmi.stress) | ||
+ | > summary(lm.happiness.reslmbmistress) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = happiness ~ res.lm.bmi.stress) | ||
+ | |||
+ | Residuals: | ||
+ | | ||
+ | -1.97283 -0.94440 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | res.lm.bmi.stress -0.05954 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 1.353 on 28 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > anova(lm.happiness.reslmbmistress) | ||
+ | Analysis of Variance Table | ||
+ | |||
+ | Response: happiness | ||
+ | Df Sum Sq Mean Sq F value Pr(>F) | ||
+ | res.lm.bmi.stress | ||
+ | Residuals | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | </ | ||
+ | |||
+ | stress: 8.1% | ||
+ | bmi: 1.78% | ||
+ | 만이 독립변인의 고유영향력이고 이를 제외한 | ||
+ | 82.17 - (9.88) = 72.29 가 | ||
+ | 공통영향력이라고 하겠다. | ||
+ | |||
+ | |||
====== with Two Predictor Variables ====== | ====== with Two Predictor Variables ====== | ||
data file: {{: | data file: {{: |
multiple_regression_examples.txt · Last modified: 2023/10/21 13:26 by hkimscil