factor_analysis

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
factor_analysis [2022/12/05 23:36] – [Reference] hkimscilfactor_analysis [2025/11/13 01:23] (current) – [Factor solution among many . . .] hkimscil
Line 126: Line 126:
     * fiance (혹은 다른 시험) 점수의 총 분산값은 $F1$과 $F2$의 coefficient(loading)값을 각각 제곱해서 더한 것에     * fiance (혹은 다른 시험) 점수의 총 분산값은 $F1$과 $F2$의 coefficient(loading)값을 각각 제곱해서 더한 것에
     * 에러의 분산값을 더한 것과 같다.      * 에러의 분산값을 더한 것과 같다. 
-  * 여기서 loading 제곱의 합은 regression으로 설명되는 부분이고 +  * 여기서 loading 제곱의 합은 regression으로 설명되는 부분이고 (regression analysis에서 regression part (ss.reg)) 
-  * 에러의 분산값은 어느 factor에도 기여를 하지 못하는 나머지 부분이다.+  * 에러의 분산값은 어느 factor에도 기여를 하지 못하는 나머지 부분이다. (residual part (ss.res))
   * 즉, fiance의 분산값은 $F1$, $F2$가 기여하는 부분과 이 둘에 포함되지 않는 나머지로 나눌 수 있다. 이는 regression에서 explained(regression) variance와 unexplained variance를 이야기 하는 것과 같은 이치이다.    * 즉, fiance의 분산값은 $F1$, $F2$가 기여하는 부분과 이 둘에 포함되지 않는 나머지로 나눌 수 있다. 이는 regression에서 explained(regression) variance와 unexplained variance를 이야기 하는 것과 같은 이치이다. 
   * 앞의 두 coefficient(계수 혹은 factor loading)을 **communality**라고 부른다. 이 이름이 자연스러운 것은 Y의 총분산 중 두 요인($F1$, $F2$)이 __공통적으로__ 기여하는 부분의 분산이기 때문이다.    * 앞의 두 coefficient(계수 혹은 factor loading)을 **communality**라고 부른다. 이 이름이 자연스러운 것은 Y의 총분산 중 두 요인($F1$, $F2$)이 __공통적으로__ 기여하는 부분의 분산이기 때문이다. 
Line 274: Line 274:
 ====== Factor solution among many . . . ====== ====== Factor solution among many . . . ======
    
-| Variable, \\ Y<sub>i</sub>  |  Observed \\ variance, S<sup>2</sup><sub>i</sub>  |  Communality, \\ $\beta^2_{i1} +\beta^2_{i2} $  | +| Variable, \\ Y<sub>i</sub>  |  Observed \\ variance, S<sup>2</sup><sub>i</sub>  |  Communality, \\ $\beta^2_{i1} +\beta^2_{i2} $  |  Specificity, \\   
-| Finance, Y<sub>1</sub>  |  S<sup>2</sup><sub>1</sub>    $\beta^2_{11} +\beta^2_{12} $   | +| Finance, Y<sub>1</sub>  |  S<sup>2</sup><sub>1</sub>    $\beta^2_{11} +\beta^2_{12} $   |  $ \sigma_{i}^{2} $  
-| Marketing, Y<sub>2</sub>  |  S<sup>2</sup><sub>2</sub>  |  $\beta^2_{21} +\beta^2_{22} $  | +| Marketing, Y<sub>2</sub>  |  S<sup>2</sup><sub>2</sub>  |  $\beta^2_{21} +\beta^2_{22} $   | 
-| Policy, Y<sub>3</sub>    S<sup>2</sup><sub>3</sub>  |  $\beta^2_{31} +\beta^2_{32} $  | +| Policy, Y<sub>3</sub>    S<sup>2</sup><sub>3</sub>  |  $\beta^2_{31} +\beta^2_{32} $   | 
-| total  |  T<sub>observed</sub>  |  T<sub>total</sub>  |+| total  |  T<sub>observed</sub>  |  T<sub>total</sub>   |
  
 각 변인의 Observed Variance는 df (즉, n-1)을 사용하는 대신 n을 사용하여 구함.  각 변인의 Observed Variance는 df (즉, n-1)을 사용하는 대신 n을 사용하여 구함. 
Line 458: Line 458:
 | Economics        @lightgreen:0.728  | | Economics        @lightgreen:0.728  |
 | Total            5.617  | | Total            5.617  |
 +===== Specificity =====
 +| Variable  |  Communality  |  Specificity  |
 +| Climate          0.795  |  @lightgray:1-0.795  |
 +| Housing          0.518  |     |
 +| Health          |  0.722  |     |
 +| Crime            0.512  |     |
 +| Transportation  |  0.51       |
 +| Education        0.561  |     |
 +| Arts            |  0.754  |     |
 +| Recreation      |  0.517  |     |
 +| Economics        0.728  |     |
 +| Total            5.617  |     |
  
 ====== Methods (functions) in R ====== ====== Methods (functions) in R ======
Line 469: Line 481:
  
 <code> <code>
-mydata <- read.csv("http://commres.net/wiki/_media/r/dataset_exploratoryfactoranalysis.csv")+my.data <- read.csv("http://commres.net/wiki/_media/r/dataset_exploratoryfactoranalysis.csv")
 # if data as NAs, it is better to omit them: # if data as NAs, it is better to omit them:
 my.data <- na.omit(my.data) my.data <- na.omit(my.data)
factor_analysis.1670283371.txt.gz · Last modified: by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki