User Tools

Site Tools


regression

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
regression [2018/11/06 08:48] – [E.g., 3. Simple regression: Adjusted R squared & Slope test] hkimscilregression [2019/05/20 08:17] – [E.g., 2. Simple regression] hkimscil
Line 152: Line 152:
 ====== E.g., 1. Simple regression & F-test for goodness of fit ====== ====== E.g., 1. Simple regression & F-test for goodness of fit ======
 Data file: {{:regression01-bankAccount.sav}} Data file: {{:regression01-bankAccount.sav}}
 +{{:regression01-bankaccount.csv}}
 +<code>datavar <- read.csv("http://commres.net/wiki/_media/regression01-bankaccount.csv")</code>
  
 아래는 어느 책에서 쓰인 가상 데이터이다. 통장수와 수입, 그리고 가족 구성원의 숫자가 변인이며 총 10 가구에 대한 정보가 수집된 것이다. 여기서는 이 데이터를 이용하여 위에서 언급된 SS<sub>total</sub> , SS<sub>reg</sub> , SS<sub>res</sub> 에 대한 예를 살펴보도록 한다. 아래는 어느 책에서 쓰인 가상 데이터이다. 통장수와 수입, 그리고 가족 구성원의 숫자가 변인이며 총 10 가구에 대한 정보가 수집된 것이다. 여기서는 이 데이터를 이용하여 위에서 언급된 SS<sub>total</sub> , SS<sub>reg</sub> , SS<sub>res</sub> 에 대한 예를 살펴보도록 한다.
Line 185: Line 187:
  
 ^  __ prediction for y values with__ $\overline{Y}$  ^^^  ^  __ prediction for y values with__ $\overline{Y}$  ^^^ 
-| bankaccount   | error   | error<sup>2</sup>  |  +| bankaccount   | prediction  | error   | error<sup>2</sup>  |  
-| 6   | -2   | 4  |  +| 6   | 8  | -2   | 4  |  
-| 5   | -3   | 9  |  +| 5   | 8  | -3   | 9  |  
-| 7   | -1   | 1  |  +| 7   | 8  | -1   | 1  |  
-| 7   | -1   | 1  |  +| 7   | 8  | -1   | 1  |  
-| 8   | 0   | 0  |  +| 8   | 8  | 0   | 0  |  
-| 10   | 2   | 4  |  +| 10   | 8  | 2   | 4  |  
-| 8   | 0   | 0  |  +| 8   | 8  | 0   | 0  |  
-| 11   | 3   | 9  |  +| 11   | 8  | 3   | 9  |  
-| 9   | 1   | 1  |  +| 9   | 8  | 1   | 1  |  
-| 9   | 1   | 1  |  +| 9   | 8  | 1   | 1  |  
-|  $\overline{Y}=8$      |  $SS_{total} = 30$   +|  $\overline{Y}=8$     |   |  $SS_{total} = 30$   
 <WRAP clear /> <WRAP clear />
 위에서 제곱한 값의 합은? 30이다. 이는 사실, SS (Sum of Square)값이 30이라는 이야기이다. 그리고, 위에서 설명한 것처럼, 이 값은 $ SS_{total} $ 이라고 할 수 있으며 __전체에러__ 변량이라고 할 수 있겠다. 위에서 제곱한 값의 합은? 30이다. 이는 사실, SS (Sum of Square)값이 30이라는 이야기이다. 그리고, 위에서 설명한 것처럼, 이 값은 $ SS_{total} $ 이라고 할 수 있으며 __전체에러__ 변량이라고 할 수 있겠다.
Line 202: Line 204:
 __SS<sub>res</sub> , Residual error__ __SS<sub>res</sub> , Residual error__
 <code> <code>
 +> head(datavar)
 +. . . . 
 +> mod <- lm(bankaccount ~ income, data = datavar)
 +> summary(mod)
 +
 Residuals: Residuals:
     Min      1Q  Median      3Q     Max      Min      1Q  Median      3Q     Max 
Line 279: Line 286:
 |  Model        |  Sum of Squares    df    Mean Square    F    Sig.  |  |  Model        |  Sum of Squares    df    Mean Square    F    Sig.  | 
 |  1.000    |  Regression   | @white: 18.934    | @grey: 1.000    |  18.934    |  13.687    |  0.006    |  1.000    |  Regression   | @white: 18.934    | @grey: 1.000    |  18.934    |  13.687    |  0.006   
-|      Residual   | @orange: 11.066    | @green: 8.000    |  1.383    |        | +|      Residual   | @orange: 11.066    | @green: 8.000    |  1.383          | 
 |      Total   | @yellow: 30.000    |  9.000    |            |  |      Total   | @yellow: 30.000    |  9.000    |            | 
 | a Predictors: (Constant), bankIncome  income \\ b Dependent Variable: bankbook  number of bank  |||||||   | a Predictors: (Constant), bankIncome  income \\ b Dependent Variable: bankbook  number of bank  |||||||  
 +
 +* 1.383 = SS<sub>res</sub> / n-2 = standard error 표준오차 
 +  * standard error = 표준오차는 [[:t-test]]를 배울 때의 t = 차이/se 에서와 같은 의미
 +  * 따라서 MS<sub>regression</sub>인 18.934 를 표준오차로 나눈 값을 F 값이라고 부른다.
 <WRAP clear /> <WRAP clear />
 +
  
 __ SS<sub>total</sub> SS<sub>reg</sub> SS<sub>res</sub> 를 이용한 F-test__ __ SS<sub>total</sub> SS<sub>reg</sub> SS<sub>res</sub> 를 이용한 F-test__
Line 339: Line 351:
  
  
-====== E.g., 2. Simple regression ======+====== E.g., Simple regression ======
 data:  data: 
 {{:acidity.sav}} \\ {{:acidity.sav}} \\
Line 576: Line 588:
  SS<sub>total</sub> = 87.733  SS<sub>total</sub> = 87.733
  r<sup>2</sup> = SS<sub>reg</sub> / SS<sub>total</sub> = 42.462 / 87.733 = .484.  r<sup>2</sup> = SS<sub>reg</sub> / SS<sub>total</sub> = 42.462 / 87.733 = .484.
 +
 +====== e.g. Simple Regression ======
 +{{:AllenMursau.data.csv}}
 +
 +<code>datavar <- read.csv("http://commres.net/wiki/_media/allenmursau.data.csv")
 +</code>
  
 ====== E.g., 3. Simple regression: Adjusted R squared & Slope test ====== ====== E.g., 3. Simple regression: Adjusted R squared & Slope test ======
regression.txt · Last modified: 2023/05/24 08:53 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki