User Tools

Site Tools


adjusted_r_squared

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
adjusted_r_squared [2016/05/11 07:48]
hkimscil
adjusted_r_squared [2016/05/11 07:48] (current)
hkimscil
Line 37: Line 37:
   * Adjusted R squared 값이 작아지는 경향이 생긴다. ​   * Adjusted R squared 값이 작아지는 경향이 생긴다. ​
   * 그런데, p가 커진다는 것은 독립변인을 자꾸 추가한다는 것인데, 독립변인 모든 X들이 사실은 Y를 설명하는 것이 아니라고 해도, (즉, X와 Y가 이론적인 원인과 결과의 관계를 갖지 않더라도) 자연적으로 R<​sup>​2</​sup>​값은 커지게 된다. 이런 경우를 over-fit 되었다고 한다 (R square 값에 대한 통계적인 테스트(F-test)를 goodness of fit test라고 부르는 것에 상응하여). 그러나, Adjusted R squared 값은 p값이 계산에 작용되기에 (X변인이 추가되고 있는) 어느시점에서 작아지게 된다. 이 작아지는 시점이 over-fit을 피하는 순간이라고 판단하게 된다. ​   * 그런데, p가 커진다는 것은 독립변인을 자꾸 추가한다는 것인데, 독립변인 모든 X들이 사실은 Y를 설명하는 것이 아니라고 해도, (즉, X와 Y가 이론적인 원인과 결과의 관계를 갖지 않더라도) 자연적으로 R<​sup>​2</​sup>​값은 커지게 된다. 이런 경우를 over-fit 되었다고 한다 (R square 값에 대한 통계적인 테스트(F-test)를 goodness of fit test라고 부르는 것에 상응하여). 그러나, Adjusted R squared 값은 p값이 계산에 작용되기에 (X변인이 추가되고 있는) 어느시점에서 작아지게 된다. 이 작아지는 시점이 over-fit을 피하는 순간이라고 판단하게 된다. ​
-<​imgcaption image1|>​{{:​bestsubsetsex.gif|}}</​imgcaption>​+  * <​imgcaption image1|>​{{:​bestsubsetsex.gif|}}</​imgcaption>​
   * 가령 위의 경우, 연구자는 독립변인으로 처음 세가지만 사용할 것을 결정할 수 있는데 이는 Adjusted R 제곱값이 4번째 변인 투입부터 줄기때문이다. 반면에 R 제곱값은 계속 커진다. ​   * 가령 위의 경우, 연구자는 독립변인으로 처음 세가지만 사용할 것을 결정할 수 있는데 이는 Adjusted R 제곱값이 4번째 변인 투입부터 줄기때문이다. 반면에 R 제곱값은 계속 커진다. ​
  
  
adjusted_r_squared.txt · Last modified: 2016/05/11 07:48 by hkimscil