User Tools

Site Tools


factor_analysis

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
factor_analysis [2018/12/22 01:51] hkimscilfactor_analysis [2019/09/14 18:50] – [e.g. secu com finance 2007 example] hkimscil
Line 91: Line 91:
 위의 요인이 포함된 regression공식이 갖는 가정은 다음과 같다. 위의 요인이 포함된 regression공식이 갖는 가정은 다음과 같다.
   - $E(e_{i}) = 0, \quad Var(e_{i}) = \sigma^2_{i}$   - $E(e_{i}) = 0, \quad Var(e_{i}) = \sigma^2_{i}$
 +    * error의 분포에 관한 내용이다. 
     * expected value = mean of error terms = 0, with standard deviation = $\sigma_{i}$      * expected value = mean of error terms = 0, with standard deviation = $\sigma_{i}$ 
     * 에러는 평균 0을 중심으로 무작위로 펼쳐져 있는 상태가 가정되므로 위와 같은 성격을 갖는다.     * 에러는 평균 0을 중심으로 무작위로 펼쳐져 있는 상태가 가정되므로 위와 같은 성격을 갖는다.
   - $E(F_{j}) = 0, \quad Var(F_{j}) = 1 $   - $E(F_{j}) = 0, \quad Var(F_{j}) = 1 $
 +    * F는 표준화된 coefficient로  크기가 나타내지는 가상의 인자이다 (factor).
     * Factors are standardized with mean =0, standard deviation = 1. Hence, Var(F) = 1.     * Factors are standardized with mean =0, standard deviation = 1. Hence, Var(F) = 1.
     * factors의 계수를 내기 전의 data는 표준점수 처리가 된 것을 가정한다. 따라서, F의 mean과 standard deviation값은 각각 0과 1이어야 하고, 따라서 F의 variance값 또한 1이 된다.      * factors의 계수를 내기 전의 data는 표준점수 처리가 된 것을 가정한다. 따라서, F의 mean과 standard deviation값은 각각 0과 1이어야 하고, 따라서 F의 variance값 또한 1이 된다. 
Line 1146: Line 1148:
 ====== e.g., 5 ====== ====== e.g., 5 ======
 {{:r:EFA.csv}} {{:r:EFA.csv}}
 +====== e.g. secu com finance 2007 example  ======
 +{{:r:secu_com_finance_2007.csv}}
 +
 +<code>
 +Sys.setlocale("LC_ALL","Korean")
 +secu_com_finance_2007 <- read.csv("http://commres.net/wiki/_media/r/secu_com_finance_2007.csv")
 +secu_com_finance_2007
 +
 +# V1 : 총자본순이익율
 +# V2 : 자기자본순이익율
 +# V3 : 자기자본비율
 +# V4 : 부채비율
 +# V5 : 자기자본회전율
 +
 +# 표준화 변환 (standardization)
 +secu_com_finance_2007 <- transform(secu_com_finance_2007, 
 +    V1_s = scale(V1), 
 +    V2_s = scale(V2), 
 +    V3_s = scale(V3), 
 +    V4_s = scale(V4),
 +    V5_s = scale(V5))
 +
 +# 부채비율(V4_s)을 방향(max(V4_s)-V4_s) 변환
 +secu_com_finance_2007 <- transform(secu_com_finance_2007, V4_s2 = max(V4_s) - V4_s)
 +
 +# variable selection
 +secu_com_finance_2007_2 <- secu_com_finance_2007[,c("company", "V1_s", "V2_s", "V3_s", "V4_s2", "V5_s")]
 + 
 +# Correlation analysis
 +cor(secu_com_finance_2007_2[,-1])
 +
 +round(cor(secu_com_finance_2007_2[,-1]), digits=3) # 반올림
 +
 +# Scatter plot matrix
 +plot(secu_com_finance_2007_2[,-1])
 +
 +# Scree Plot
 +plot(prcomp(secu_com_finance_2007_2[,c(2:6)]), type="l", sub = "Scree Plot")
 +
 +</code>
 +
 +<code>
 +# 요인분석(maximum likelihood factor analysis)
 +# rotation = "varimax"
 +secu_factanal <- factanal(secu_com_finance_2007_2[,2:6], 
 +    factors = 2, 
 +    rotation = "varimax", # "varimax", "promax", "none" 
 +    scores="regression") # "regression", "Bartlett"
 +print(secu_factanal)
 +
 +</code>
 ====== etc.  ====== ====== etc.  ======
 <del>see http://geog.uoregon.edu/bartlein/courses/geog495/lec16.html</del> <del>see http://geog.uoregon.edu/bartlein/courses/geog495/lec16.html</del>
 {{:r:boxes.csv}} {{:r:boxes.csv}}
 {{:r:cities.csv}} {{:r:cities.csv}}
-{{:r:secu_com_finance_2007.csv}}+
 ====== Reference ====== ====== Reference ======
 {{:factor_analysis_lecture_note.pdf|Lecture Note}} from databaser {{:factor_analysis_lecture_note.pdf|Lecture Note}} from databaser
  
factor_analysis.txt · Last modified: 2023/11/06 02:53 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki