User Tools

Site Tools


outliers

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revisionBoth sides next revision
outliers [2016/05/04 08:20] hkimsciloutliers [2016/05/04 08:24] hkimscil
Line 195: Line 195:
 <WRAP box 600px #333> <WRAP box 600px #333>
 leverage 값을 살펴보는 방법이 아래에 제시된다. leverage 값은 회귀계수 추정치(regression coefficient estimates)에 큰 영향을 주는 값을 말하는데 histogram() 명령어와 outliers() 명령어 옵션으로 활용할 수 있다. 이 값은 일반적으로 (2k+2)/n 를 넘지 않아야 하며, 넘는 다면 아웃라이어로 추정될 수 있으니 주목할 필요가 있다. 여기서 k는 변인의 숫자, n은 케이스 숫자를 말한다. 따라서 (2*3+2)/51 의 계산으로 얻은 .1568 을 넘는 leverage 값을 갖는 케이스를 살펴봐야 한다.  leverage 값을 살펴보는 방법이 아래에 제시된다. leverage 값은 회귀계수 추정치(regression coefficient estimates)에 큰 영향을 주는 값을 말하는데 histogram() 명령어와 outliers() 명령어 옵션으로 활용할 수 있다. 이 값은 일반적으로 (2k+2)/n 를 넘지 않아야 하며, 넘는 다면 아웃라이어로 추정될 수 있으니 주목할 필요가 있다. 여기서 k는 변인의 숫자, n은 케이스 숫자를 말한다. 따라서 (2*3+2)/51 의 계산으로 얻은 .1568 을 넘는 leverage 값을 갖는 케이스를 살펴봐야 한다. 
 +
 +아래의 아웃풋을 보면 fl의 경우에는 stduent deleted residual값은 극단적인 마이너스 값을 갖지만, leverage값은 극단적이 아니므로 fl은 분석에 포함되는 것이 옳은 판단일 수도 있겠다. 그러나, dc의 경우에는 leverage값으로도 극단적이라는 평가를 받게 된다.
 </WRAP> </WRAP>
  
outliers.txt · Last modified: 2017/04/05 07:55 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki