partial_and_semipartial_correlation
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
partial_and_semipartial_correlation [2023/05/24 00:09] – [e.g.,] hkimscil | partial_and_semipartial_correlation [2023/05/31 08:56] (current) – [Why overall model is significant while IVs are not?] hkimscil | ||
---|---|---|---|
Line 175: | Line 175: | ||
</ | </ | ||
- | 우리는 이것을 partial correlation이라고 부른다는 것을 알고 있다. 이를 ppcor 패키지를 이용해서 테스트해보면 | + | 우리는 이것을 |
< | < | ||
Line 242: | Line 242: | ||
또한 위의 설명은 [[: | 또한 위의 설명은 [[: | ||
+ | |||
+ | 아래의 결과를 살펴보면 anova() 결과 독립변인들의 p value 들과 summary() 에서의 독립변인들의 p value가 다른 이유가 다르다. | ||
+ | |||
+ | < | ||
+ | # anova()에서의 결과 | ||
+ | acs_k3 | ||
+ | # summary(lm())에서의 결과 | ||
+ | acs_k3 | ||
+ | </ | ||
+ | 아래는 [[: | ||
+ | < | ||
+ | dvar <- read.csv(" | ||
+ | mod <- lm(api00 ~ ell + acs_k3 + avg_ed + meals, data=dvar) | ||
+ | summary(mod) | ||
+ | anova(mod) | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | > dvar <- read.csv(" | ||
+ | > mod <- lm(api00 ~ ell + acs_k3 + avg_ed + meals, data=dvar) | ||
+ | > summary(mod) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = api00 ~ ell + acs_k3 + avg_ed + meals, data = dvar) | ||
+ | |||
+ | Residuals: | ||
+ | | ||
+ | -187.020 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) 709.6388 | ||
+ | ell -0.8434 | ||
+ | acs_k3 | ||
+ | avg_ed | ||
+ | meals -2.9374 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 58.63 on 374 degrees of freedom | ||
+ | (21 observations deleted due to missingness) | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > anova(mod) | ||
+ | Analysis of Variance Table | ||
+ | |||
+ | Response: api00 | ||
+ | | ||
+ | ell 1 4502711 4502711 1309.762 < 2.2e-16 *** | ||
+ | acs_k3 | ||
+ | avg_ed | ||
+ | meals | ||
+ | Residuals 374 1285740 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | > | ||
+ | </ | ||
+ | |||
아래에서 mod2를 보면 | 아래에서 mod2를 보면 | ||
Line 247: | Line 306: | ||
* ell, avg_ed, meals + acs_k3 가 독립변인인데, | * ell, avg_ed, meals + acs_k3 가 독립변인인데, | ||
* 그 순서가 이전 문서의 | * 그 순서가 이전 문서의 | ||
- | * ell, acs_k3, avg_ed, meals에서 바뀐것을 알 수 있다. | + | * ell, acs_k3, avg_ed, meals에서 바뀐것을 알 수 있다 |
+ | * 즉, | ||
+ | * lm(api00 ~ ell + acs_k3 + avg_ed + meals) | ||
+ | * lm(api00 ~ ell + avg_ed + meals + acs_k3) | ||
anova는 독립변인에 대한 영향력을 다른 IV들을 고려하지 않고, 그냥 입력 순서대로 처리하므로, | anova는 독립변인에 대한 영향력을 다른 IV들을 고려하지 않고, 그냥 입력 순서대로 처리하므로, | ||
Line 290: | Line 352: | ||
</ | </ | ||
- | 이는 다른 독립변인들의 순서를 바꾸어도 마찬가지이다. mod3은 mod2에서 meals변인을 맨 앞으로 옮긴 예이다. | + | 이는 다른 독립변인들의 순서를 바꾸어도 마찬가지이다. mod3은 mod2에서 meals변인을 맨 앞으로 옮긴 예이다. |
+ | |||
+ | * mod <- lm(api00 ~ ell + acs_k3 + avg_ed + meals) | ||
+ | * mod2 <- lm(api00 ~ ell + avg_ed + meals + acs_k3) | ||
+ | * mod3 <- lm(api00 ~ meals + ell + avg_ed + acs_k3) | ||
summary(mod), | summary(mod), | ||
< | < | ||
Line 576: | Line 643: | ||
{{pcor.y.x1.x2.v2.png? | {{pcor.y.x1.x2.v2.png? | ||
x2의 영향력을 control한 후에 x1영향력을 보면 64.54%에 달하게 된다. | x2의 영향력을 control한 후에 x1영향력을 보면 64.54%에 달하게 된다. | ||
+ | |||
+ | ====== IV 각각의 설명력의 크기와 합쳐서 regression했을 때의 크기? ====== | ||
+ | see https:// | ||
+ | |||
+ | < | ||
+ | RSS = 3:10 #Right shoe size | ||
+ | LSS = rnorm(RSS, RSS, 0.1) #Left shoe size - similar to RSS | ||
+ | cor(LSS, RSS) # | ||
+ | |||
+ | weights = 120 + rnorm(RSS, 10*RSS, 10) | ||
+ | |||
+ | ##Fit a joint model | ||
+ | m = lm(weights ~ LSS + RSS) | ||
+ | |||
+ | ##F-value is very small, but neither LSS or RSS are significant | ||
+ | summary(m) | ||
+ | </ | ||
+ | |||
+ | |||
+ | < | ||
+ | > LSS = rnorm(RSS, RSS, 0.1) #Left shoe size - similar to RSS | ||
+ | > cor(LSS, RSS) # | ||
+ | [1] 0.9994836 | ||
+ | > | ||
+ | > weights = 120 + rnorm(RSS, 10*RSS, 10) | ||
+ | > | ||
+ | > ##Fit a joint model | ||
+ | > m = lm(weights ~ LSS + RSS) | ||
+ | > | ||
+ | > ##F-value is very small, but neither LSS or RSS are significant | ||
+ | > summary(m) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = weights ~ LSS + RSS) | ||
+ | |||
+ | Residuals: | ||
+ | 1 | ||
+ | | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | LSS -14.162 | ||
+ | RSS | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 7.296 on 5 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > | ||
+ | > ##Fitting RSS or LSS separately gives a significant result. | ||
+ | > summary(lm(weights ~ LSS)) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = weights ~ LSS) | ||
+ | |||
+ | Residuals: | ||
+ | | ||
+ | -6.055 -4.930 -2.925 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | LSS | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 7.026 on 6 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > | ||
+ | </ | ||
+ | |||
partial_and_semipartial_correlation.txt · Last modified: 2023/05/31 08:56 by hkimscil